Audit IA — démarche pour identifier skills et agents

Ce que dit l'état de l'art (2025-2026)

Les chiffres qui cadrent le sujet :

MIT 2025 : 95 % des pilotes GenAI échouent à délivrer un ROI mesurable. 42 % des entreprises abandonnent avant la prod.
BCG : 60 % des investissements ne génèrent aucune valeur matérielle. Seulement 5 % créent de la valeur à l'échelle.
McKinsey : 88 % des entreprises utilisent l'IA, seules 39 % voient un impact EBIT.
Étude empirique : les entreprises qui redessinent leurs workflows autour de l'IA génèrent +90 % de revenu vs celles qui automatisent des tâches isolées. 2,8× plus de chances de haute performance. 44 % d'use cases découverts en plus.

Pourquoi ça échoue :

Mauvaise identification des use cases (biais vers le familier, problèmes qui ne nécessitent pas d'IA).
Plus de 50 % des budgets vont sur sales/marketing, alors que le ROI le plus élevé est en back-office (finance/AP, compliance, onboarding, support).
Automatisation au lieu de redesign — pavage de cowpath.
Data readiness sous-estimée.
Attentes irréalistes (3-6 mois vs réalité 12-18 mois).
Achat externe réussit 67 % du temps, construction interne ~22 %.

Ce que ça change par rapport à ma première proposition

J'avais proposé	Ce que la recherche corrige
Audit en 3 semaines avant action	30-day pilots d'abord. L'audit théorique consomme la fenêtre.
Douleur + outcomes/JTBD	Ajouter Shadow AI discovery (regarder ce que les gens utilisent déjà avec ChatGPT/Copilot — c'est gratuit et c'est le meilleur signal).
Skill / workflow / agent	Anthropic est plus radical : code déterministe d'abord, workflow ensuite, agent en dernier recours. Si tu peux pré-mapper le decision tree, ne fais pas d'agent.
Toutes zones confondues	Back-office d'abord. MIT/Deloitte/Hypatos convergent : finance, compliance, onboarding, IT helpdesk, support. ROI < 12 mois.
Top-down implicite	Sideways : cellule cross-fonctionnelle (Codir + champions frontline). Le bottom-up détecte ce que la direction ne voit pas (les ruptures viennent souvent de là).
JTBD classique	JTBD nouvelle génération à 5 dimensions : delegation scope, trust/verification, error tolerance, workflow compression, operating boundaries.

Démarche proposée — 4 mouvements

M1 — Observer (1 semaine, en parallèle du reste)

Trois sources de signal gratuites :

Shadow AI audit. Qui dans Seenaps / la DSI / le management utilise déjà ChatGPT, Claude, Copilot, etc. ? Pour quoi ? Combien de temps gagné ? C'est un miroir cognitif : ce que les gens automatisent déjà à la main est ce qu'ils estiment automatisable. Signal le plus fiable.
Data exhausts. Où s'accumulent tickets, mails, docs, logs, transcripts non exploités ? Chaque tas est un candidat potentiel.
Cartographie back-office. Quels processus à fort volume et faible variance existent : finance, RH, compliance, IT helpdesk, support client Seenaps, onboarding. Pas de cartographie BPM complète — juste l'inventaire des candidats évidents.

M2 — Interroger (2 semaines)

Méthode éprouvée (OpenAI Academy, SAP AppHaus, Kowalah) :

5 à 10 personnes par périmètre. Les patterns émergent après 3-4 entretiens dans la même fonction.
30-45 min, format ouvert. Ne pas mentionner l'IA — demander le travail réel.
Questions clés :
- Qu'est-ce qui te prend le plus de temps cette semaine ?
- Qu'est-ce que tu repousses, que tu fais à l'arrache, que personne ne veut prendre ?
- Qu'est-ce qui est répétitif ?
- Où tu utilises déjà ChatGPT (ou autre) pour t'aider, et pour quoi ?
- Quand quelque chose foire, qu'est-ce qui aurait permis de l'éviter ?
4 lentilles d'analyse :
1. Customer journey — où le client attend, se répète, escalade
2. Employee journey — bottlenecks manuels, knowledge gaps
3. Data exhaust — accumulation non exploitée
4. Compliance & reporting — fréquent, douloureux, error-prone
Croiser avec les outcomes du rôle. 3-5 résultats clés par fonction (pas activités). Pour chacun, chaîne minimale → coder C (cognitif) / M (mécanique) / R (relationnel, ne pas automatiser).

M3 — Qualifier (1 semaine)

Pour chaque candidat, une grille JTBD-IA à 5 dimensions :

Dimension	Question	Implication
Delegation scope	L'IA fait tout, assiste, ou éclaire ?	Choix UI : agent autonome, copilote, contexte enrichi
Variance des inputs	Inputs stables ou variables ?	Stable → code/workflow. Variable → agent.
Trust & verification	Comment vérifier la sortie ?	Faible vérifiabilité → human in the loop obligatoire
Error tolerance	Coût d'une erreur ?	Élevé → pilote contrôlé, pas de scale rapide
Workflow compression	Peut-on éliminer la chaîne, pas l'accélérer ?	C'est ici que se cachent les +90 % de gain

Puis trier en 3 paniers :

Quick wins back-office (volume, faible variance, vérifiable, ROI < 6 mois) → skill ou workflow
Compression (chaînes qu'on peut faire disparaître) → priorité stratégique, à porter en Codir
Cognitif à forte variance (analyse, synthèse, décision) → agent assistant, jamais autonome au démarrage

Et toujours conserver l'option « ne pas automatiser » — pour les moments d'apprentissage, de jugement, de relation.

M4 — Piloter (4-6 semaines par pilote)

30-day shadow run sur 2-3 candidats max, jamais plus en parallèle.
IA tourne en parallèle du travail humain, on compare.
Métriques business hard par workflow : temps, taux d'erreur, throughput, satisfaction. Pas de métriques d'adoption (le piège classique).
Critère go/no-go explicite avant le pilote. Si pas atteint, on tue.
Horizon réaliste : 12-18 mois pour un ROI mesurable à l'échelle. Pas 3-6 mois.

Gouvernance — sideways

Pas top-down pur (rate les micro-opportunités), pas bottom-up pur (manque d'alignement et de gouvernance des risques).

Cellule cross-fonctionnelle : 1 sponsor Codir, 3-4 champions frontline (DSI, Seenaps, management, support).
Cadence : revue mensuelle des candidats et pilotes en cours.
Build vs Buy : par défaut, acheter (67 % de succès vs 22 % en build). Build seulement si différenciant ou pas d'offre.
Data readiness check avant tout pilote — c'est la cause #1 d'échec.

Pièges à éviter (synthèse recherche)

Audit théorique long au lieu de pilotes courts → l'IA bouge plus vite que ton audit.
Sales/marketing first → ROI le plus faible. Back-office first.
Agent partout → workflow chaque fois que possible (plus précis, moins cher, plus contrôlable).
Métriques d'adoption ("X% des employés utilisent Y") → mesurer le workflow, pas l'usage.
ROI sous 6 mois attendu → fenêtre réaliste 12-18 mois sur les vrais cas.
Construire par défaut → acheter d'abord, construire si différenciant.
Oublier la data readiness → vérifier avant de prototyper.
Top-down pur → ratera les ruptures vues d'en bas.
Bottom-up pur → fragmentation, dette, risques compliance.

Plan d'action concret pour toi

Semaine	Quoi	Avec qui
S1	Shadow AI audit + cartographie back-office DSI/Seenaps	Toi + 1 relai par périmètre
S2-3	5-10 entretiens par périmètre (4 lentilles)	Champions frontline
S4	Qualification grille JTBD-IA, tri en 3 paniers	Cellule cross-fonctionnelle
S5	Choix de 2-3 pilotes, critères go/no-go	Sponsor Codir
S6-9	Shadow runs, métriques hard	Champions + cellule
S10	Arbitrage scale / kill / itérer	Codir

À trancher avant de lancer

Périmètre du premier audit : DSI seule, Seenaps seule, ou les deux ? Recommandation : DSI d'abord (back-office par nature, ROI rapide, et tu en es responsable).
Sponsor Codir : qui porte ?
Budget pilote (achat d'outils + temps des champions) : à provisionner avant S5.

9.7 KiB Raw Blame History Unescape Escape