pkm/00-inbox/audit-ia-demarche.md

---
date: 2026-06-02
tags: [ia, audit, methode, inbox]
statut: a-traiter
sources: [MIT 2025, Deloitte 2026, Anthropic, McKinsey, BCG, OpenAI Academy, Hypatos, WEF]
---

# Audit IA — démarche pour identifier skills et agents

## Ce que dit l'état de l'art (2025-2026)

**Les chiffres qui cadrent le sujet :**
- MIT 2025 : **95 % des pilotes GenAI** échouent à délivrer un ROI mesurable. 42 % des entreprises abandonnent avant la prod.
- BCG : **60 % des investissements** ne génèrent aucune valeur matérielle. Seulement 5 % créent de la valeur à l'échelle.
- McKinsey : 88 % des entreprises utilisent l'IA, seules **39 %** voient un impact EBIT.
- Étude empirique : les entreprises qui **redessinent** leurs workflows autour de l'IA génèrent **+90 % de revenu** vs celles qui automatisent des tâches isolées. 2,8× plus de chances de haute performance. 44 % d'use cases découverts en plus.

**Pourquoi ça échoue :**
1. Mauvaise identification des use cases (biais vers le familier, problèmes qui ne nécessitent pas d'IA).
2. Plus de 50 % des budgets vont sur sales/marketing, alors que le **ROI le plus élevé est en back-office** (finance/AP, compliance, onboarding, support).
3. Automatisation au lieu de redesign — pavage de cowpath.
4. Data readiness sous-estimée.
5. Attentes irréalistes (3-6 mois vs réalité 12-18 mois).
6. Achat externe réussit 67 % du temps, construction interne ~22 %.

## Ce que ça change par rapport à ma première proposition

| J'avais proposé | Ce que la recherche corrige |
|---|---|
| Audit en 3 semaines avant action | **30-day pilots** d'abord. L'audit théorique consomme la fenêtre. |
| Douleur + outcomes/JTBD | Ajouter **Shadow AI discovery** (regarder ce que les gens utilisent déjà avec ChatGPT/Copilot — c'est gratuit et c'est le meilleur signal). |
| Skill / workflow / agent | Anthropic est plus radical : **code déterministe d'abord**, workflow ensuite, agent en dernier recours. Si tu peux pré-mapper le decision tree, ne fais pas d'agent. |
| Toutes zones confondues | **Back-office d'abord.** MIT/Deloitte/Hypatos convergent : finance, compliance, onboarding, IT helpdesk, support. ROI < 12 mois. |
| Top-down implicite | **Sideways** : cellule cross-fonctionnelle (Codir + champions frontline). Le bottom-up détecte ce que la direction ne voit pas (les ruptures viennent souvent de là). |
| JTBD classique | **JTBD nouvelle génération** à 5 dimensions : delegation scope, trust/verification, error tolerance, workflow compression, operating boundaries. |

## Démarche proposée — 4 mouvements

### M1 — Observer (1 semaine, en parallèle du reste)

Trois sources de signal gratuites :

- **Shadow AI audit.** Qui dans Seenaps / la DSI / le management utilise déjà ChatGPT, Claude, Copilot, etc. ? Pour quoi ? Combien de temps gagné ? C'est un miroir cognitif : ce que les gens automatisent déjà à la main est ce qu'ils estiment automatisable. Signal le plus fiable.
- **Data exhausts.** Où s'accumulent tickets, mails, docs, logs, transcripts non exploités ? Chaque tas est un candidat potentiel.
- **Cartographie back-office.** Quels processus à fort volume et faible variance existent : finance, RH, compliance, IT helpdesk, support client Seenaps, onboarding. Pas de cartographie BPM complète — juste l'inventaire des candidats évidents.

### M2 — Interroger (2 semaines)

Méthode éprouvée (OpenAI Academy, SAP AppHaus, Kowalah) :

- **5 à 10 personnes par périmètre.** Les patterns émergent après 3-4 entretiens dans la même fonction.
- **30-45 min, format ouvert.** Ne pas mentionner l'IA — demander le travail réel.
- **Questions clés :**
  - Qu'est-ce qui te prend le plus de temps cette semaine ?
  - Qu'est-ce que tu repousses, que tu fais à l'arrache, que personne ne veut prendre ?
  - Qu'est-ce qui est répétitif ?
  - Où tu utilises déjà ChatGPT (ou autre) pour t'aider, et pour quoi ?
  - Quand quelque chose foire, qu'est-ce qui aurait permis de l'éviter ?
- **4 lentilles d'analyse :**
  1. *Customer journey* — où le client attend, se répète, escalade
  2. *Employee journey* — bottlenecks manuels, knowledge gaps
  3. *Data exhaust* — accumulation non exploitée
  4. *Compliance & reporting* — fréquent, douloureux, error-prone
- **Croiser avec les outcomes du rôle.** 3-5 résultats clés par fonction (pas activités). Pour chacun, chaîne minimale → coder C (cognitif) / M (mécanique) / R (relationnel, ne pas automatiser).

### M3 — Qualifier (1 semaine)

Pour chaque candidat, une **grille JTBD-IA à 5 dimensions** :

| Dimension | Question | Implication |
|---|---|---|
| Delegation scope | L'IA fait tout, assiste, ou éclaire ? | Choix UI : agent autonome, copilote, contexte enrichi |
| Variance des inputs | Inputs stables ou variables ? | Stable → code/workflow. Variable → agent. |
| Trust & verification | Comment vérifier la sortie ? | Faible vérifiabilité → human in the loop obligatoire |
| Error tolerance | Coût d'une erreur ? | Élevé → pilote contrôlé, pas de scale rapide |
| Workflow compression | Peut-on **éliminer** la chaîne, pas l'accélérer ? | C'est ici que se cachent les +90 % de gain |

Puis trier en 3 paniers :

- **Quick wins back-office** (volume, faible variance, vérifiable, ROI < 6 mois) → skill ou workflow
- **Compression** (chaînes qu'on peut faire disparaître) → priorité stratégique, à porter en Codir
- **Cognitif à forte variance** (analyse, synthèse, décision) → agent assistant, jamais autonome au démarrage

Et toujours conserver l'option **« ne pas automatiser »** — pour les moments d'apprentissage, de jugement, de relation.

### M4 — Piloter (4-6 semaines par pilote)

- **30-day shadow run** sur 2-3 candidats max, jamais plus en parallèle.
- IA tourne en parallèle du travail humain, on compare.
- **Métriques business hard** par workflow : temps, taux d'erreur, throughput, satisfaction. Pas de métriques d'adoption (le piège classique).
- **Critère go/no-go explicite avant le pilote.** Si pas atteint, on tue.
- **Horizon réaliste** : 12-18 mois pour un ROI mesurable à l'échelle. Pas 3-6 mois.

## Gouvernance — sideways

Pas top-down pur (rate les micro-opportunités), pas bottom-up pur (manque d'alignement et de gouvernance des risques).

- **Cellule cross-fonctionnelle** : 1 sponsor Codir, 3-4 champions frontline (DSI, Seenaps, management, support).
- **Cadence** : revue mensuelle des candidats et pilotes en cours.
- **Build vs Buy** : par défaut, acheter (67 % de succès vs 22 % en build). Build seulement si différenciant ou pas d'offre.
- **Data readiness** check avant tout pilote — c'est la cause #1 d'échec.

## Pièges à éviter (synthèse recherche)

1. **Audit théorique long** au lieu de pilotes courts → l'IA bouge plus vite que ton audit.
2. **Sales/marketing first** → ROI le plus faible. Back-office first.
3. **Agent partout** → workflow chaque fois que possible (plus précis, moins cher, plus contrôlable).
4. **Métriques d'adoption** ("X% des employés utilisent Y") → mesurer le workflow, pas l'usage.
5. **ROI sous 6 mois attendu** → fenêtre réaliste 12-18 mois sur les vrais cas.
6. **Construire** par défaut → acheter d'abord, construire si différenciant.
7. **Oublier la data readiness** → vérifier avant de prototyper.
8. **Top-down pur** → ratera les ruptures vues d'en bas.
9. **Bottom-up pur** → fragmentation, dette, risques compliance.

## Plan d'action concret pour toi

| Semaine | Quoi | Avec qui |
|---|---|---|
| S1 | Shadow AI audit + cartographie back-office DSI/Seenaps | Toi + 1 relai par périmètre |
| S2-3 | 5-10 entretiens par périmètre (4 lentilles) | Champions frontline |
| S4 | Qualification grille JTBD-IA, tri en 3 paniers | Cellule cross-fonctionnelle |
| S5 | Choix de 2-3 pilotes, critères go/no-go | Sponsor Codir |
| S6-9 | Shadow runs, métriques hard | Champions + cellule |
| S10 | Arbitrage scale / kill / itérer | Codir |

## À trancher avant de lancer

- Périmètre du premier audit : DSI seule, Seenaps seule, ou les deux ? *Recommandation : DSI d'abord (back-office par nature, ROI rapide, et tu en es responsable).*
- Sponsor Codir : qui porte ?
- Budget pilote (achat d'outils + temps des champions) : à provisionner avant S5.

## Sources

- [MIT report: 95% of GenAI pilots failing (Fortune)](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/)
- [Anthropic — Building Effective Agents](https://www.anthropic.com/research/building-effective-agents)
- [Anthropic — workflow vs agent (Shelly Palmer)](https://shellypalmer.com/2026/04/how-anthropic-thinks-about-agents-workflows-and-tasks/)
- [Workflow redesign vs task automation (study)](https://agility-at-scale.com/ai/people-change/workflow-redesign-and-intelligent-automation/)
- [JTBD updated for AI — 5 dimensions](https://www.data-mania.com/blog/jobs-to-be-done-framework-2026-ai-companies-need-to-change/)
- [OpenAI Academy — Use Case Discovery Workshop](https://academy.openai.com/public/clubs/champions-ecqup/resources/team-use-case-brainstorm-playbook-2025-09-15)
- [Kowalah — AI Use Case Discovery Interview Template](https://www.kowalah.com/resources/templates/ai-use-case-discovery)
- [Hypatos — Agentic AI back-office automation](https://hypatos.ai/guides/agentic-back-office-automation)
- [Deloitte — State of AI in the Enterprise 2026](https://www.deloitte.com/us/en/what-we-do/capabilities/applied-artificial-intelligence/content/state-of-ai-in-the-enterprise.html)
- [Bottom-up vs top-down (Nagarro)](https://www.nagarro.com/en/blog/ai-transformation-top-down-bottom-up-or-sideways)
- [AI use case prioritization framework](https://agility-at-scale.com/ai/strategy/ai-use-case-identification-and-prioritization/)
- [Pain points analysis (Siift)](https://siift.ai/blog/pain-points-analysis-solve-business-challenges-ai)