Icon card in brown with abstract mark

ESN Spécialisée

Coûts IA réduits de 30% en 3 mois
Icon card in brown with abstract mark

Contexte

Problème

Une ESN de 450 collaborateurs spécialisée en transformation digitale avait intégré des agents IA dans quasiment tous ses processus internes : avant-vente (génération de propositions commerciales), delivery (assistance au code, revue automatisée, documentation), RH (screening CV, onboarding), et support client. Au total, 31 agents IA sur 3 LLM différents, avec une facture tokens + compute qui atteignait 14 000 €/mois — et qui grimpait de 15% chaque trimestre.

Le DG avait une question simple : "Quel est le ROI de chaque agent ?". Personne ne pouvait répondre. Les agents avaient été déployés au fil de l'eau, sans suivi de coût unitaire, sans mesure d'impact, sans gouvernance. Certains agents consommaient des tokens sur GPT-4 pour des tâches que Mistral ou Claude Haiku auraient traitées pour un dixième du prix. D'autres tournaient en continu alors qu'ils n'étaient utilisés que 2 heures par jour. La facture IA était devenue un poste opaque, impossible à optimiser sans visibilité.

Solution

L'audit Ascenzia a cartographié les 31 agents en 5 jours et a immédiatement identifié 3 leviers d'optimisation : 7 agents inactifs ou quasi-inutilisés (coupés dès la semaine suivante, -3 200 €/mois), 9 agents surdimensionnés sur GPT-4 pour des tâches simples (migrés vers Mistral et Claude Haiku, -2 800 €/mois), et 4 agents qui tournaient 24/7 alors qu'ils ne servaient qu'en heures ouvrées (programmation horaire, -1 200 €/mois).

Sentinel Starter a été déployé en 6 semaines — le périmètre le plus léger de la gamme, adapté à une structure de 450 personnes. Le cost tracker par agent a donné au DG ce qu'il demandait : un tableau de bord mensuel qui affiche pour chaque agent le coût (tokens, compute, API calls), l'usage réel (requêtes/jour, heures actives), et une estimation du ROI basée sur le temps économisé par les équipes.

En 3 mois, la facture IA est passée de 14 000 € à 9 800 €/mois — soit -30% — tout en augmentant l'utilisation effective des agents utiles de 25%. Le DG a désormais un reporting automatisé qu'il consulte en 2 minutes chaque lundi matin. Et quand un nouveau besoin d'agent émerge, l'équipe passe par le cockpit Sentinel pour évaluer le coût prévisionnel avant de déployer.

En bref

Secteur
ESN spécialisée
Stack
Sentinel Starter, cost tracker natif, connecteurs GPT + Claude + Mistral, hébergement OVH France
Timeline
5 jours d'audit + 6 semaines de déploiement
Services

Optimisation des Coûts IA

ROI Tracking par Agent

Gouvernance FinOps IA

-30%

-30%

Coûts infra IA mensuels

Coûts infra IA mensuels

+25%

+25%

Usage effectif des agents

Usage effectif des agents

2 min

2 min

Reporting DG hebdomadaire

Reporting DG hebdomadaire

Gallerie

Verbatim

6 plateformes de monitoring, une par équipe. Deux jours par mois pour consolider un tableau à la main. Sentinel a tout unifié et nos données restent en France. Pour un sous-traitant automobile de rang 1, c'était non négociable.
6 plateformes de monitoring, une par équipe. Deux jours par mois pour consolider un tableau à la main. Sentinel a tout unifié et nos données restent en France. Pour un sous-traitant automobile de rang 1, c'était non négociable.
6 plateformes de monitoring, une par équipe. Deux jours par mois pour consolider un tableau à la main. Sentinel a tout unifié et nos données restent en France. Pour un sous-traitant automobile de rang 1, c'était non négociable.

Nathalie Claude

CTO