
ESN Spécialisée
Coûts IA réduits de 30% en 3 mois
Contexte
Problème
Une ESN de 450 collaborateurs spécialisée en transformation digitale avait intégré des agents IA dans quasiment tous ses processus internes : avant-vente (génération de propositions commerciales), delivery (assistance au code, revue automatisée, documentation), RH (screening CV, onboarding), et support client. Au total, 31 agents IA sur 3 LLM différents, avec une facture tokens + compute qui atteignait 14 000 €/mois — et qui grimpait de 15% chaque trimestre.
Le DG avait une question simple : "Quel est le ROI de chaque agent ?". Personne ne pouvait répondre. Les agents avaient été déployés au fil de l'eau, sans suivi de coût unitaire, sans mesure d'impact, sans gouvernance. Certains agents consommaient des tokens sur GPT-4 pour des tâches que Mistral ou Claude Haiku auraient traitées pour un dixième du prix. D'autres tournaient en continu alors qu'ils n'étaient utilisés que 2 heures par jour. La facture IA était devenue un poste opaque, impossible à optimiser sans visibilité.
Solution
L'audit Ascenzia a cartographié les 31 agents en 5 jours et a immédiatement identifié 3 leviers d'optimisation : 7 agents inactifs ou quasi-inutilisés (coupés dès la semaine suivante, -3 200 €/mois), 9 agents surdimensionnés sur GPT-4 pour des tâches simples (migrés vers Mistral et Claude Haiku, -2 800 €/mois), et 4 agents qui tournaient 24/7 alors qu'ils ne servaient qu'en heures ouvrées (programmation horaire, -1 200 €/mois).
Sentinel Starter a été déployé en 6 semaines — le périmètre le plus léger de la gamme, adapté à une structure de 450 personnes. Le cost tracker par agent a donné au DG ce qu'il demandait : un tableau de bord mensuel qui affiche pour chaque agent le coût (tokens, compute, API calls), l'usage réel (requêtes/jour, heures actives), et une estimation du ROI basée sur le temps économisé par les équipes.
En 3 mois, la facture IA est passée de 14 000 € à 9 800 €/mois — soit -30% — tout en augmentant l'utilisation effective des agents utiles de 25%. Le DG a désormais un reporting automatisé qu'il consulte en 2 minutes chaque lundi matin. Et quand un nouveau besoin d'agent émerge, l'équipe passe par le cockpit Sentinel pour évaluer le coût prévisionnel avant de déployer.
En bref
Secteur
ESN spécialisée
Stack
Sentinel Starter, cost tracker natif, connecteurs GPT + Claude + Mistral, hébergement OVH France
Timeline
5 jours d'audit + 6 semaines de déploiement
Services
Optimisation des Coûts IA
ROI Tracking par Agent
Gouvernance FinOps IA
Gallerie
Verbatim
Nathalie Claude
CTO



