--- date: 2026-06-02 tags: [ia, audit, methode, inbox] statut: a-traiter sources: [MIT 2025, Deloitte 2026, Anthropic, McKinsey, BCG, OpenAI Academy, Hypatos, WEF] --- # Audit IA — démarche pour identifier skills et agents ## Ce que dit l'état de l'art (2025-2026) **Les chiffres qui cadrent le sujet :** - MIT 2025 : **95 % des pilotes GenAI** échouent à délivrer un ROI mesurable. 42 % des entreprises abandonnent avant la prod. - BCG : **60 % des investissements** ne génèrent aucune valeur matérielle. Seulement 5 % créent de la valeur à l'échelle. - McKinsey : 88 % des entreprises utilisent l'IA, seules **39 %** voient un impact EBIT. - Étude empirique : les entreprises qui **redessinent** leurs workflows autour de l'IA génèrent **+90 % de revenu** vs celles qui automatisent des tâches isolées. 2,8× plus de chances de haute performance. 44 % d'use cases découverts en plus. **Pourquoi ça échoue :** 1. Mauvaise identification des use cases (biais vers le familier, problèmes qui ne nécessitent pas d'IA). 2. Plus de 50 % des budgets vont sur sales/marketing, alors que le **ROI le plus élevé est en back-office** (finance/AP, compliance, onboarding, support). 3. Automatisation au lieu de redesign — pavage de cowpath. 4. Data readiness sous-estimée. 5. Attentes irréalistes (3-6 mois vs réalité 12-18 mois). 6. Achat externe réussit 67 % du temps, construction interne ~22 %. ## Ce que ça change par rapport à ma première proposition | J'avais proposé | Ce que la recherche corrige | |---|---| | Audit en 3 semaines avant action | **30-day pilots** d'abord. L'audit théorique consomme la fenêtre. | | Douleur + outcomes/JTBD | Ajouter **Shadow AI discovery** (regarder ce que les gens utilisent déjà avec ChatGPT/Copilot — c'est gratuit et c'est le meilleur signal). | | Skill / workflow / agent | Anthropic est plus radical : **code déterministe d'abord**, workflow ensuite, agent en dernier recours. Si tu peux pré-mapper le decision tree, ne fais pas d'agent. | | Toutes zones confondues | **Back-office d'abord.** MIT/Deloitte/Hypatos convergent : finance, compliance, onboarding, IT helpdesk, support. ROI < 12 mois. | | Top-down implicite | **Sideways** : cellule cross-fonctionnelle (Codir + champions frontline). Le bottom-up détecte ce que la direction ne voit pas (les ruptures viennent souvent de là). | | JTBD classique | **JTBD nouvelle génération** à 5 dimensions : delegation scope, trust/verification, error tolerance, workflow compression, operating boundaries. | ## Démarche proposée — 4 mouvements ### M1 — Observer (1 semaine, en parallèle du reste) Trois sources de signal gratuites : - **Shadow AI audit.** Qui dans Seenaps / la DSI / le management utilise déjà ChatGPT, Claude, Copilot, etc. ? Pour quoi ? Combien de temps gagné ? C'est un miroir cognitif : ce que les gens automatisent déjà à la main est ce qu'ils estiment automatisable. Signal le plus fiable. - **Data exhausts.** Où s'accumulent tickets, mails, docs, logs, transcripts non exploités ? Chaque tas est un candidat potentiel. - **Cartographie back-office.** Quels processus à fort volume et faible variance existent : finance, RH, compliance, IT helpdesk, support client Seenaps, onboarding. Pas de cartographie BPM complète — juste l'inventaire des candidats évidents. ### M2 — Interroger (2 semaines) Méthode éprouvée (OpenAI Academy, SAP AppHaus, Kowalah) : - **5 à 10 personnes par périmètre.** Les patterns émergent après 3-4 entretiens dans la même fonction. - **30-45 min, format ouvert.** Ne pas mentionner l'IA — demander le travail réel. - **Questions clés :** - Qu'est-ce qui te prend le plus de temps cette semaine ? - Qu'est-ce que tu repousses, que tu fais à l'arrache, que personne ne veut prendre ? - Qu'est-ce qui est répétitif ? - Où tu utilises déjà ChatGPT (ou autre) pour t'aider, et pour quoi ? - Quand quelque chose foire, qu'est-ce qui aurait permis de l'éviter ? - **4 lentilles d'analyse :** 1. *Customer journey* — où le client attend, se répète, escalade 2. *Employee journey* — bottlenecks manuels, knowledge gaps 3. *Data exhaust* — accumulation non exploitée 4. *Compliance & reporting* — fréquent, douloureux, error-prone - **Croiser avec les outcomes du rôle.** 3-5 résultats clés par fonction (pas activités). Pour chacun, chaîne minimale → coder C (cognitif) / M (mécanique) / R (relationnel, ne pas automatiser). ### M3 — Qualifier (1 semaine) Pour chaque candidat, une **grille JTBD-IA à 5 dimensions** : | Dimension | Question | Implication | |---|---|---| | Delegation scope | L'IA fait tout, assiste, ou éclaire ? | Choix UI : agent autonome, copilote, contexte enrichi | | Variance des inputs | Inputs stables ou variables ? | Stable → code/workflow. Variable → agent. | | Trust & verification | Comment vérifier la sortie ? | Faible vérifiabilité → human in the loop obligatoire | | Error tolerance | Coût d'une erreur ? | Élevé → pilote contrôlé, pas de scale rapide | | Workflow compression | Peut-on **éliminer** la chaîne, pas l'accélérer ? | C'est ici que se cachent les +90 % de gain | Puis trier en 3 paniers : - **Quick wins back-office** (volume, faible variance, vérifiable, ROI < 6 mois) → skill ou workflow - **Compression** (chaînes qu'on peut faire disparaître) → priorité stratégique, à porter en Codir - **Cognitif à forte variance** (analyse, synthèse, décision) → agent assistant, jamais autonome au démarrage Et toujours conserver l'option **« ne pas automatiser »** — pour les moments d'apprentissage, de jugement, de relation. ### M4 — Piloter (4-6 semaines par pilote) - **30-day shadow run** sur 2-3 candidats max, jamais plus en parallèle. - IA tourne en parallèle du travail humain, on compare. - **Métriques business hard** par workflow : temps, taux d'erreur, throughput, satisfaction. Pas de métriques d'adoption (le piège classique). - **Critère go/no-go explicite avant le pilote.** Si pas atteint, on tue. - **Horizon réaliste** : 12-18 mois pour un ROI mesurable à l'échelle. Pas 3-6 mois. ## Gouvernance — sideways Pas top-down pur (rate les micro-opportunités), pas bottom-up pur (manque d'alignement et de gouvernance des risques). - **Cellule cross-fonctionnelle** : 1 sponsor Codir, 3-4 champions frontline (DSI, Seenaps, management, support). - **Cadence** : revue mensuelle des candidats et pilotes en cours. - **Build vs Buy** : par défaut, acheter (67 % de succès vs 22 % en build). Build seulement si différenciant ou pas d'offre. - **Data readiness** check avant tout pilote — c'est la cause #1 d'échec. ## Pièges à éviter (synthèse recherche) 1. **Audit théorique long** au lieu de pilotes courts → l'IA bouge plus vite que ton audit. 2. **Sales/marketing first** → ROI le plus faible. Back-office first. 3. **Agent partout** → workflow chaque fois que possible (plus précis, moins cher, plus contrôlable). 4. **Métriques d'adoption** ("X% des employés utilisent Y") → mesurer le workflow, pas l'usage. 5. **ROI sous 6 mois attendu** → fenêtre réaliste 12-18 mois sur les vrais cas. 6. **Construire** par défaut → acheter d'abord, construire si différenciant. 7. **Oublier la data readiness** → vérifier avant de prototyper. 8. **Top-down pur** → ratera les ruptures vues d'en bas. 9. **Bottom-up pur** → fragmentation, dette, risques compliance. ## Plan d'action concret pour toi | Semaine | Quoi | Avec qui | |---|---|---| | S1 | Shadow AI audit + cartographie back-office DSI/Seenaps | Toi + 1 relai par périmètre | | S2-3 | 5-10 entretiens par périmètre (4 lentilles) | Champions frontline | | S4 | Qualification grille JTBD-IA, tri en 3 paniers | Cellule cross-fonctionnelle | | S5 | Choix de 2-3 pilotes, critères go/no-go | Sponsor Codir | | S6-9 | Shadow runs, métriques hard | Champions + cellule | | S10 | Arbitrage scale / kill / itérer | Codir | ## À trancher avant de lancer - Périmètre du premier audit : DSI seule, Seenaps seule, ou les deux ? *Recommandation : DSI d'abord (back-office par nature, ROI rapide, et tu en es responsable).* - Sponsor Codir : qui porte ? - Budget pilote (achat d'outils + temps des champions) : à provisionner avant S5. ## Sources - [MIT report: 95% of GenAI pilots failing (Fortune)](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/) - [Anthropic — Building Effective Agents](https://www.anthropic.com/research/building-effective-agents) - [Anthropic — workflow vs agent (Shelly Palmer)](https://shellypalmer.com/2026/04/how-anthropic-thinks-about-agents-workflows-and-tasks/) - [Workflow redesign vs task automation (study)](https://agility-at-scale.com/ai/people-change/workflow-redesign-and-intelligent-automation/) - [JTBD updated for AI — 5 dimensions](https://www.data-mania.com/blog/jobs-to-be-done-framework-2026-ai-companies-need-to-change/) - [OpenAI Academy — Use Case Discovery Workshop](https://academy.openai.com/public/clubs/champions-ecqup/resources/team-use-case-brainstorm-playbook-2025-09-15) - [Kowalah — AI Use Case Discovery Interview Template](https://www.kowalah.com/resources/templates/ai-use-case-discovery) - [Hypatos — Agentic AI back-office automation](https://hypatos.ai/guides/agentic-back-office-automation) - [Deloitte — State of AI in the Enterprise 2026](https://www.deloitte.com/us/en/what-we-do/capabilities/applied-artificial-intelligence/content/state-of-ai-in-the-enterprise.html) - [Bottom-up vs top-down (Nagarro)](https://www.nagarro.com/en/blog/ai-transformation-top-down-bottom-up-or-sideways) - [AI use case prioritization framework](https://agility-at-scale.com/ai/strategy/ai-use-case-identification-and-prioritization/) - [Pain points analysis (Siift)](https://siift.ai/blog/pain-points-analysis-solve-business-challenges-ai)