Coûts IA
Statut
Document de cadrage financier — version initiale.
Objectif
L'IA peut créer une forte valeur métier pour DMV, mais elle représente aussi un coût variable potentiellement important.
Ce document définit la doctrine financière de suivi et de maîtrise des coûts IA.
Postes de coûts IA
| Poste | Description |
|---|---|
| Tokens entrée | Contexte envoyé aux modèles. |
| Tokens sortie | Contenu généré. |
| Providers | Coûts facturés par Claude, GPT ou autres modèles. |
| Routing | Logique de choix modèle, fallback et orchestration. |
| Logs | Conservation des requêtes, coûts, erreurs et résultats. |
| Monitoring | Suivi latence, qualité, quotas et incidents. |
| Modération | Assistance IA et revue humaine associée. |
| Stockage contexte | Données nécessaires aux assistants métier. |
| Support | Explication, corrections, erreurs et usages abusifs. |
Usages IA concernés
Les coûts IA peuvent provenir de :
- assistant publication ;
- recherche conversationnelle locale ;
- génération PlayLoop ;
- assistance mairie ;
- assistance AssoSuite ;
- modération assistée ;
- génération multi-format ;
- agents spécialisés ;
- résumés et reformulations.
Principes financiers
- Aucun usage IA intensif ne doit être illimité par défaut.
- Le gratuit doit utiliser des modèles low-cost ou des quotas très limités.
- Les offres payantes doivent intégrer des quotas cohérents avec le coût réel.
- Les crédits IA doivent couvrir les usages additionnels.
- Les modèles avancés doivent être réservés aux tâches à forte valeur.
- Les coûts doivent être suivis par app, utilisateur, acteur, commune et cas d'usage lorsque c'est compatible RGPD.
Leviers de maîtrise
| Levier | Effet attendu |
|---|---|
| Quotas | Empêcher les consommations excessives. |
| Crédits IA | Relier usage intensif et financement. |
| Routing modèle | Utiliser le bon modèle au bon coût. |
| Cache | Éviter les appels répétés inutiles. |
| Prompts compacts | Réduire tokens d'entrée. |
| Réponses limitées | Réduire tokens de sortie. |
| Modèles low-cost | Baisser coût des tâches simples. |
| Modèles locaux futurs | Réduire dépendance provider si pertinent. |
État actuel vs cible
| Sujet | État actuel documenté | Vision cible |
|---|---|---|
| Doctrine IA | Documentée dans docs/05-ia. | Mise en œuvre opérationnelle. |
| AI Gateway | Cible stratégique. | Passage obligatoire des apps. |
| Quotas | Doctrine documentée. | Quotas par offre et app. |
| Crédits IA | Source de revenus envisagée. | Achat et suivi de crédits. |
| Modèles locaux | Évoqués comme possibilité future. | À évaluer selon coût/qualité. |
Risques
- Coût par génération supérieur à la valeur perçue.
- Usage gratuit trop ouvert.
- Provider unique trop coûteux ou instable.
- Prompts trop longs.
- Génération PlayLoop en volume non maîtrisé.
- Support élevé lié aux erreurs ou incompréhensions IA.
Points à clarifier
- Prix provider par modèle.
- Coût moyen par cas d'usage.
- Quotas par offre.
- Politique de remboursement crédits IA.
- Niveau de logs acceptable RGPD.
- Seuils d'alerte financière.