Aller au contenu principal

Modération assistée par IA

Statut

Document de doctrine IA — version initiale.

Objectif

La modération assistée par IA doit aider à traiter les contenus plus vite et plus régulièrement, sans remplacer les modérateurs.

Elle sert à détecter, classer, prioriser ou expliquer. Elle ne décide pas seule.

Usages cibles

  • Pré-classer un signalement.
  • Identifier un contenu potentiellement problématique.
  • Détecter incohérence, agressivité ou information sensible.
  • Proposer une catégorie de risque.
  • Suggérer une action possible.
  • Aider à reformuler une demande de correction.
  • Prioriser une file de modération.

Décisions interdites en autonomie

L'IA ne doit pas :

  • supprimer définitivement un contenu ;
  • bannir un utilisateur ;
  • valider une revendication d'acteur ;
  • publier une alerte mairie ;
  • refuser seule une publication sensible ;
  • décider à la place d'une commune ou d'un administrateur.

Sortie attendue

La réponse IA doit être structurée :

  • niveau de risque ;
  • raison courte ;
  • règle concernée si connue ;
  • action suggérée ;
  • niveau de confiance ;
  • besoin de relecture humaine.

Garde-fous

  • Utiliser le contexte minimal.
  • Masquer les données inutiles.
  • Conserver une trace de l'assistance.
  • Ne pas confondre score IA et décision.
  • Permettre au modérateur de contredire l'IA.

État actuel

Le produit contient des statuts de modération, signalements et rôles d'administration. Aucune modération IA livrée n'est confirmée dans le code inspecté.

Cette page définit la cible d'assistance.