pkm/00-inbox/audit-ia-demarche.md
Philippe e3223ef191 S24
2026-06-10 23:15:41 +02:00

9.7 KiB
Raw Blame History

date tags statut sources
2026-06-02
ia
audit
methode
inbox
a-traiter
MIT 2025
Deloitte 2026
Anthropic
McKinsey
BCG
OpenAI Academy
Hypatos
WEF

Audit IA — démarche pour identifier skills et agents

Ce que dit l'état de l'art (2025-2026)

Les chiffres qui cadrent le sujet :

  • MIT 2025 : 95 % des pilotes GenAI échouent à délivrer un ROI mesurable. 42 % des entreprises abandonnent avant la prod.
  • BCG : 60 % des investissements ne génèrent aucune valeur matérielle. Seulement 5 % créent de la valeur à l'échelle.
  • McKinsey : 88 % des entreprises utilisent l'IA, seules 39 % voient un impact EBIT.
  • Étude empirique : les entreprises qui redessinent leurs workflows autour de l'IA génèrent +90 % de revenu vs celles qui automatisent des tâches isolées. 2,8× plus de chances de haute performance. 44 % d'use cases découverts en plus.

Pourquoi ça échoue :

  1. Mauvaise identification des use cases (biais vers le familier, problèmes qui ne nécessitent pas d'IA).
  2. Plus de 50 % des budgets vont sur sales/marketing, alors que le ROI le plus élevé est en back-office (finance/AP, compliance, onboarding, support).
  3. Automatisation au lieu de redesign — pavage de cowpath.
  4. Data readiness sous-estimée.
  5. Attentes irréalistes (3-6 mois vs réalité 12-18 mois).
  6. Achat externe réussit 67 % du temps, construction interne ~22 %.

Ce que ça change par rapport à ma première proposition

J'avais proposé Ce que la recherche corrige
Audit en 3 semaines avant action 30-day pilots d'abord. L'audit théorique consomme la fenêtre.
Douleur + outcomes/JTBD Ajouter Shadow AI discovery (regarder ce que les gens utilisent déjà avec ChatGPT/Copilot — c'est gratuit et c'est le meilleur signal).
Skill / workflow / agent Anthropic est plus radical : code déterministe d'abord, workflow ensuite, agent en dernier recours. Si tu peux pré-mapper le decision tree, ne fais pas d'agent.
Toutes zones confondues Back-office d'abord. MIT/Deloitte/Hypatos convergent : finance, compliance, onboarding, IT helpdesk, support. ROI < 12 mois.
Top-down implicite Sideways : cellule cross-fonctionnelle (Codir + champions frontline). Le bottom-up détecte ce que la direction ne voit pas (les ruptures viennent souvent de là).
JTBD classique JTBD nouvelle génération à 5 dimensions : delegation scope, trust/verification, error tolerance, workflow compression, operating boundaries.

Démarche proposée — 4 mouvements

M1 — Observer (1 semaine, en parallèle du reste)

Trois sources de signal gratuites :

  • Shadow AI audit. Qui dans Seenaps / la DSI / le management utilise déjà ChatGPT, Claude, Copilot, etc. ? Pour quoi ? Combien de temps gagné ? C'est un miroir cognitif : ce que les gens automatisent déjà à la main est ce qu'ils estiment automatisable. Signal le plus fiable.
  • Data exhausts. Où s'accumulent tickets, mails, docs, logs, transcripts non exploités ? Chaque tas est un candidat potentiel.
  • Cartographie back-office. Quels processus à fort volume et faible variance existent : finance, RH, compliance, IT helpdesk, support client Seenaps, onboarding. Pas de cartographie BPM complète — juste l'inventaire des candidats évidents.

M2 — Interroger (2 semaines)

Méthode éprouvée (OpenAI Academy, SAP AppHaus, Kowalah) :

  • 5 à 10 personnes par périmètre. Les patterns émergent après 3-4 entretiens dans la même fonction.
  • 30-45 min, format ouvert. Ne pas mentionner l'IA — demander le travail réel.
  • Questions clés :
    • Qu'est-ce qui te prend le plus de temps cette semaine ?
    • Qu'est-ce que tu repousses, que tu fais à l'arrache, que personne ne veut prendre ?
    • Qu'est-ce qui est répétitif ?
    • Où tu utilises déjà ChatGPT (ou autre) pour t'aider, et pour quoi ?
    • Quand quelque chose foire, qu'est-ce qui aurait permis de l'éviter ?
  • 4 lentilles d'analyse :
    1. Customer journey — où le client attend, se répète, escalade
    2. Employee journey — bottlenecks manuels, knowledge gaps
    3. Data exhaust — accumulation non exploitée
    4. Compliance & reporting — fréquent, douloureux, error-prone
  • Croiser avec les outcomes du rôle. 3-5 résultats clés par fonction (pas activités). Pour chacun, chaîne minimale → coder C (cognitif) / M (mécanique) / R (relationnel, ne pas automatiser).

M3 — Qualifier (1 semaine)

Pour chaque candidat, une grille JTBD-IA à 5 dimensions :

Dimension Question Implication
Delegation scope L'IA fait tout, assiste, ou éclaire ? Choix UI : agent autonome, copilote, contexte enrichi
Variance des inputs Inputs stables ou variables ? Stable → code/workflow. Variable → agent.
Trust & verification Comment vérifier la sortie ? Faible vérifiabilité → human in the loop obligatoire
Error tolerance Coût d'une erreur ? Élevé → pilote contrôlé, pas de scale rapide
Workflow compression Peut-on éliminer la chaîne, pas l'accélérer ? C'est ici que se cachent les +90 % de gain

Puis trier en 3 paniers :

  • Quick wins back-office (volume, faible variance, vérifiable, ROI < 6 mois) → skill ou workflow
  • Compression (chaînes qu'on peut faire disparaître) → priorité stratégique, à porter en Codir
  • Cognitif à forte variance (analyse, synthèse, décision) → agent assistant, jamais autonome au démarrage

Et toujours conserver l'option « ne pas automatiser » — pour les moments d'apprentissage, de jugement, de relation.

M4 — Piloter (4-6 semaines par pilote)

  • 30-day shadow run sur 2-3 candidats max, jamais plus en parallèle.
  • IA tourne en parallèle du travail humain, on compare.
  • Métriques business hard par workflow : temps, taux d'erreur, throughput, satisfaction. Pas de métriques d'adoption (le piège classique).
  • Critère go/no-go explicite avant le pilote. Si pas atteint, on tue.
  • Horizon réaliste : 12-18 mois pour un ROI mesurable à l'échelle. Pas 3-6 mois.

Gouvernance — sideways

Pas top-down pur (rate les micro-opportunités), pas bottom-up pur (manque d'alignement et de gouvernance des risques).

  • Cellule cross-fonctionnelle : 1 sponsor Codir, 3-4 champions frontline (DSI, Seenaps, management, support).
  • Cadence : revue mensuelle des candidats et pilotes en cours.
  • Build vs Buy : par défaut, acheter (67 % de succès vs 22 % en build). Build seulement si différenciant ou pas d'offre.
  • Data readiness check avant tout pilote — c'est la cause #1 d'échec.

Pièges à éviter (synthèse recherche)

  1. Audit théorique long au lieu de pilotes courts → l'IA bouge plus vite que ton audit.
  2. Sales/marketing first → ROI le plus faible. Back-office first.
  3. Agent partout → workflow chaque fois que possible (plus précis, moins cher, plus contrôlable).
  4. Métriques d'adoption ("X% des employés utilisent Y") → mesurer le workflow, pas l'usage.
  5. ROI sous 6 mois attendu → fenêtre réaliste 12-18 mois sur les vrais cas.
  6. Construire par défaut → acheter d'abord, construire si différenciant.
  7. Oublier la data readiness → vérifier avant de prototyper.
  8. Top-down pur → ratera les ruptures vues d'en bas.
  9. Bottom-up pur → fragmentation, dette, risques compliance.

Plan d'action concret pour toi

Semaine Quoi Avec qui
S1 Shadow AI audit + cartographie back-office DSI/Seenaps Toi + 1 relai par périmètre
S2-3 5-10 entretiens par périmètre (4 lentilles) Champions frontline
S4 Qualification grille JTBD-IA, tri en 3 paniers Cellule cross-fonctionnelle
S5 Choix de 2-3 pilotes, critères go/no-go Sponsor Codir
S6-9 Shadow runs, métriques hard Champions + cellule
S10 Arbitrage scale / kill / itérer Codir

À trancher avant de lancer

  • Périmètre du premier audit : DSI seule, Seenaps seule, ou les deux ? Recommandation : DSI d'abord (back-office par nature, ROI rapide, et tu en es responsable).
  • Sponsor Codir : qui porte ?
  • Budget pilote (achat d'outils + temps des champions) : à provisionner avant S5.

Sources