pkm/00-inbox/audit-ia-demarche.md
Philippe e3223ef191 S24
2026-06-10 23:15:41 +02:00

145 lines
9.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
date: 2026-06-02
tags: [ia, audit, methode, inbox]
statut: a-traiter
sources: [MIT 2025, Deloitte 2026, Anthropic, McKinsey, BCG, OpenAI Academy, Hypatos, WEF]
---
# Audit IA — démarche pour identifier skills et agents
## Ce que dit l'état de l'art (2025-2026)
**Les chiffres qui cadrent le sujet :**
- MIT 2025 : **95 % des pilotes GenAI** échouent à délivrer un ROI mesurable. 42 % des entreprises abandonnent avant la prod.
- BCG : **60 % des investissements** ne génèrent aucune valeur matérielle. Seulement 5 % créent de la valeur à l'échelle.
- McKinsey : 88 % des entreprises utilisent l'IA, seules **39 %** voient un impact EBIT.
- Étude empirique : les entreprises qui **redessinent** leurs workflows autour de l'IA génèrent **+90 % de revenu** vs celles qui automatisent des tâches isolées. 2,8× plus de chances de haute performance. 44 % d'use cases découverts en plus.
**Pourquoi ça échoue :**
1. Mauvaise identification des use cases (biais vers le familier, problèmes qui ne nécessitent pas d'IA).
2. Plus de 50 % des budgets vont sur sales/marketing, alors que le **ROI le plus élevé est en back-office** (finance/AP, compliance, onboarding, support).
3. Automatisation au lieu de redesign — pavage de cowpath.
4. Data readiness sous-estimée.
5. Attentes irréalistes (3-6 mois vs réalité 12-18 mois).
6. Achat externe réussit 67 % du temps, construction interne ~22 %.
## Ce que ça change par rapport à ma première proposition
| J'avais proposé | Ce que la recherche corrige |
|---|---|
| Audit en 3 semaines avant action | **30-day pilots** d'abord. L'audit théorique consomme la fenêtre. |
| Douleur + outcomes/JTBD | Ajouter **Shadow AI discovery** (regarder ce que les gens utilisent déjà avec ChatGPT/Copilot — c'est gratuit et c'est le meilleur signal). |
| Skill / workflow / agent | Anthropic est plus radical : **code déterministe d'abord**, workflow ensuite, agent en dernier recours. Si tu peux pré-mapper le decision tree, ne fais pas d'agent. |
| Toutes zones confondues | **Back-office d'abord.** MIT/Deloitte/Hypatos convergent : finance, compliance, onboarding, IT helpdesk, support. ROI < 12 mois. |
| Top-down implicite | **Sideways** : cellule cross-fonctionnelle (Codir + champions frontline). Le bottom-up détecte ce que la direction ne voit pas (les ruptures viennent souvent de ). |
| JTBD classique | **JTBD nouvelle génération** à 5 dimensions : delegation scope, trust/verification, error tolerance, workflow compression, operating boundaries. |
## Démarche proposée — 4 mouvements
### M1 — Observer (1 semaine, en parallèle du reste)
Trois sources de signal gratuites :
- **Shadow AI audit.** Qui dans Seenaps / la DSI / le management utilise déjà ChatGPT, Claude, Copilot, etc. ? Pour quoi ? Combien de temps gagné ? C'est un miroir cognitif : ce que les gens automatisent déjà à la main est ce qu'ils estiment automatisable. Signal le plus fiable.
- **Data exhausts.** s'accumulent tickets, mails, docs, logs, transcripts non exploités ? Chaque tas est un candidat potentiel.
- **Cartographie back-office.** Quels processus à fort volume et faible variance existent : finance, RH, compliance, IT helpdesk, support client Seenaps, onboarding. Pas de cartographie BPM complète juste l'inventaire des candidats évidents.
### M2 — Interroger (2 semaines)
Méthode éprouvée (OpenAI Academy, SAP AppHaus, Kowalah) :
- **5 à 10 personnes par périmètre.** Les patterns émergent après 3-4 entretiens dans la même fonction.
- **30-45 min, format ouvert.** Ne pas mentionner l'IA demander le travail réel.
- **Questions clés :**
- Qu'est-ce qui te prend le plus de temps cette semaine ?
- Qu'est-ce que tu repousses, que tu fais à l'arrache, que personne ne veut prendre ?
- Qu'est-ce qui est répétitif ?
- tu utilises déjà ChatGPT (ou autre) pour t'aider, et pour quoi ?
- Quand quelque chose foire, qu'est-ce qui aurait permis de l'éviter ?
- **4 lentilles d'analyse :**
1. *Customer journey* le client attend, se répète, escalade
2. *Employee journey* bottlenecks manuels, knowledge gaps
3. *Data exhaust* accumulation non exploitée
4. *Compliance & reporting* fréquent, douloureux, error-prone
- **Croiser avec les outcomes du rôle.** 3-5 résultats clés par fonction (pas activités). Pour chacun, chaîne minimale coder C (cognitif) / M (mécanique) / R (relationnel, ne pas automatiser).
### M3 — Qualifier (1 semaine)
Pour chaque candidat, une **grille JTBD-IA à 5 dimensions** :
| Dimension | Question | Implication |
|---|---|---|
| Delegation scope | L'IA fait tout, assiste, ou éclaire ? | Choix UI : agent autonome, copilote, contexte enrichi |
| Variance des inputs | Inputs stables ou variables ? | Stable code/workflow. Variable agent. |
| Trust & verification | Comment vérifier la sortie ? | Faible vérifiabilité human in the loop obligatoire |
| Error tolerance | Coût d'une erreur ? | Élevé pilote contrôlé, pas de scale rapide |
| Workflow compression | Peut-on **éliminer** la chaîne, pas l'accélérer ? | C'est ici que se cachent les +90 % de gain |
Puis trier en 3 paniers :
- **Quick wins back-office** (volume, faible variance, vérifiable, ROI < 6 mois) skill ou workflow
- **Compression** (chaînes qu'on peut faire disparaître) priorité stratégique, à porter en Codir
- **Cognitif à forte variance** (analyse, synthèse, décision) agent assistant, jamais autonome au démarrage
Et toujours conserver l'option **« ne pas automatiser »** pour les moments d'apprentissage, de jugement, de relation.
### M4 — Piloter (4-6 semaines par pilote)
- **30-day shadow run** sur 2-3 candidats max, jamais plus en parallèle.
- IA tourne en parallèle du travail humain, on compare.
- **Métriques business hard** par workflow : temps, taux d'erreur, throughput, satisfaction. Pas de métriques d'adoption (le piège classique).
- **Critère go/no-go explicite avant le pilote.** Si pas atteint, on tue.
- **Horizon réaliste** : 12-18 mois pour un ROI mesurable à l'échelle. Pas 3-6 mois.
## Gouvernance — sideways
Pas top-down pur (rate les micro-opportunités), pas bottom-up pur (manque d'alignement et de gouvernance des risques).
- **Cellule cross-fonctionnelle** : 1 sponsor Codir, 3-4 champions frontline (DSI, Seenaps, management, support).
- **Cadence** : revue mensuelle des candidats et pilotes en cours.
- **Build vs Buy** : par défaut, acheter (67 % de succès vs 22 % en build). Build seulement si différenciant ou pas d'offre.
- **Data readiness** check avant tout pilote c'est la cause #1 d'échec.
## Pièges à éviter (synthèse recherche)
1. **Audit théorique long** au lieu de pilotes courts l'IA bouge plus vite que ton audit.
2. **Sales/marketing first** ROI le plus faible. Back-office first.
3. **Agent partout** workflow chaque fois que possible (plus précis, moins cher, plus contrôlable).
4. **Métriques d'adoption** ("X% des employés utilisent Y") mesurer le workflow, pas l'usage.
5. **ROI sous 6 mois attendu** fenêtre réaliste 12-18 mois sur les vrais cas.
6. **Construire** par défaut acheter d'abord, construire si différenciant.
7. **Oublier la data readiness** vérifier avant de prototyper.
8. **Top-down pur** ratera les ruptures vues d'en bas.
9. **Bottom-up pur** fragmentation, dette, risques compliance.
## Plan d'action concret pour toi
| Semaine | Quoi | Avec qui |
|---|---|---|
| S1 | Shadow AI audit + cartographie back-office DSI/Seenaps | Toi + 1 relai par périmètre |
| S2-3 | 5-10 entretiens par périmètre (4 lentilles) | Champions frontline |
| S4 | Qualification grille JTBD-IA, tri en 3 paniers | Cellule cross-fonctionnelle |
| S5 | Choix de 2-3 pilotes, critères go/no-go | Sponsor Codir |
| S6-9 | Shadow runs, métriques hard | Champions + cellule |
| S10 | Arbitrage scale / kill / itérer | Codir |
## À trancher avant de lancer
- Périmètre du premier audit : DSI seule, Seenaps seule, ou les deux ? *Recommandation : DSI d'abord (back-office par nature, ROI rapide, et tu en es responsable).*
- Sponsor Codir : qui porte ?
- Budget pilote (achat d'outils + temps des champions) : à provisionner avant S5.
## Sources
- [MIT report: 95% of GenAI pilots failing (Fortune)](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/)
- [Anthropic — Building Effective Agents](https://www.anthropic.com/research/building-effective-agents)
- [Anthropic — workflow vs agent (Shelly Palmer)](https://shellypalmer.com/2026/04/how-anthropic-thinks-about-agents-workflows-and-tasks/)
- [Workflow redesign vs task automation (study)](https://agility-at-scale.com/ai/people-change/workflow-redesign-and-intelligent-automation/)
- [JTBD updated for AI — 5 dimensions](https://www.data-mania.com/blog/jobs-to-be-done-framework-2026-ai-companies-need-to-change/)
- [OpenAI Academy — Use Case Discovery Workshop](https://academy.openai.com/public/clubs/champions-ecqup/resources/team-use-case-brainstorm-playbook-2025-09-15)
- [Kowalah — AI Use Case Discovery Interview Template](https://www.kowalah.com/resources/templates/ai-use-case-discovery)
- [Hypatos — Agentic AI back-office automation](https://hypatos.ai/guides/agentic-back-office-automation)
- [Deloitte — State of AI in the Enterprise 2026](https://www.deloitte.com/us/en/what-we-do/capabilities/applied-artificial-intelligence/content/state-of-ai-in-the-enterprise.html)
- [Bottom-up vs top-down (Nagarro)](https://www.nagarro.com/en/blog/ai-transformation-top-down-bottom-up-or-sideways)
- [AI use case prioritization framework](https://agility-at-scale.com/ai/strategy/ai-use-case-identification-and-prioritization/)
- [Pain points analysis (Siift)](https://siift.ai/blog/pain-points-analysis-solve-business-challenges-ai)