Barometre Directions Data 2024 Quantmetry Capgemini V2

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 55

BAROMÈTRE

N°5

DES DIRECTIONS
DATA 2024
PLUS DE 50 DIRIGEANTS
S’EXPRIMENT SUR LEUR
TRAJECTOIRE
DE MATURITÉ DATA ET IA
EXECUTIVE SUMMARY
Comment introduire cette 5ème édition de notre baromètre des Directions
data par un autre sujet que l’IA générative ? Le tsunami a déferlé à une vitesse
inédite pour une technologie qui est rapidement devenue l’une des priorités
des Directions data.
Notre étude qualitative auprès d’une cinquantaine de dirigeants et responsables
data de grandes et moyennes entreprises françaises confirme que le lancement
de ChatGPT, il y a 1 an, a sorti l’IA d’une phase temporaire de désillusion au sein
de plusieurs entreprises. En devenant accessible au grand public via une interface
intuitive, la technologie s’est invitée à l’agenda des directions générales.
Un changement de paradigme qui suscite des attentes fortes et qui a démultiplié
les sollicitations auprès des directions data et DSI : 80% des sondés estiment que
la data gagne en priorité au sein de leur entreprise avec l’essor de l’IA générative.

Sur le sujet, les priorités des dirigeants interrogés se concentrent autour de


4 points :
Lancer rapidement de nouvelles expérimentations pour répondre aux
attentes et se forger de premières convictions sur la valeur des usages et
les choix technologiques. A l’été 2023, 25% des sondés avaient déjà initié
au moins une expérimentation et plus des 2/3 avaient lancé des groupes de
travail stratégique sur le sujet. Des chiffres à considérer sensiblement à la
hausse aujourd’hui. Si les usages potentiels sont nombreux, la majorité des
expérimentations constatées tournent autour des « usages RAG » (Retrieval
Augmented Generation), c’est-à-dire la capacité à récupérer des données
spécifiques à un contexte dans une base de données externe, et à les mettre
à la disposition d’un LLM lorsqu’on lui demande de générer une réponse.
La prochaine vague devrait s’appuyer sur le déploiement d’applications
bureautiques comme Microsoft Copilot mettant la technologie à disposition
de toute l’entreprise.
Former les utilisateurs. Ce déploiement à grand échelle va nécessiter de
traiter l’interaction avec les IA génératives comme une compétence à maîtriser
largement, sous peine de s’exposer à un usage sous-optimal ou à l’inverse
BAROMÈTRE 2024

excessif de la technologie.
Evaluer les risques et en dégager un cadre global. Les craintes des Dirigeants
data se portent notamment sur la fiabilité de modèles, connus pour halluciner,
et dont la performance est difficile à mesurer avec tous les risques (opérations,
financiers, réputation) que cela induit. Ce contexte, ainsi que la publication
de l’AI Act Européen, remet l’IA de confiance au centre des préoccupations.
Construire des IA génératives de confiance est un défi identifié par la majorité
des entreprises, et des premières bonnes pratiques émergent.
Adapter son modèle opérationnel aux spécificités de l’IA générative. Au-
delà des POC et expérimentations qui sont menés actuellement, les sondés
partagent plusieurs interrogations sur les éléments à intégrer pour pouvoir
passer en 2024 de premiers usages en production. Coté technologie, si l’heure
est aux tests, l’évolution des plateformes et outils MLOps commence à peine
chez les acteurs les plus matures.
L’IA générative fait irruption dans un moment où la majorité des Directions data
a globalement atteint un palier de maturité : en moyenne, 60% des usages IA
passent désormais en production et 80% des entreprises ont inscrit la data dans
leur plan stratégique.
Cependant, les Directions data peinent toujours à casser leur plafond de verre
actuel et à avoir un impact fort à l’échelle de l’entreprise et de son modèle d’affaire.
Bien que l’hybridation des modèles organisationnels entre équipe centrale et relais
locaux dans les métiers soit effective, de nombreuses Directions data sont encore
essentiellement dans une position de DOer de la data. Cela provoque à la fois un
goulot d’étranglement autour des usages et des plateformes, et des difficultés à
sortir d’usages « tactiques » et non stratégiques pour l’entreprise.

Dans ce contexte, les Dirigeants data identifient 3 défis pour augmenter leur
impact à l’échelle de l’entreprise et casser ce plafond de verre :
1 — S’inscrire dans les enjeux stratégiques de l’entreprise. Pour réussir, les
sondés identifient plusieurs facteurs clés de succès :
-
Répondre à l’attente du top management et porter une vision
3 — Démultiplier l’impact de la data à l’échelle avec le Data Mesh. Pour accélérer
stratégique sur l’apport de la data dans la transformation de
la mise en production de projets emblématiques, les data office doivent créer
l’entreprise et de son modèle d’affaire ;
un écosystème fertile en mettant à disposition les capacités nécessaires aux
- Rééquilibrer leur offre de service pour mieux se positionner comme différentes parties prenantes. Près de 80% des entreprises commencent
enabler auprès des Directions métiers en demande d’autonomie et à déployer les principes du Data Mesh pour atteindre cet objectif. Mais les
de capacités robustes, mais aussi auprès des DSI et des Directions « projets Data Mesh » émergent encore trop souvent de façon non coordonnée
digitales pour s’intégrer nativement dans leurs grands programmes ; et sans trajectoire commune avec les parties prenantes. Pourtant, plus qu’une
- 
Porter des usages transverses et emblématiques de la donnée transformation technologique, le Data Mesh est avant tout un chamboulement
permettant de se positionner en tierce partie et d’aligner les enjeux organisationnel visant à décentraliser le data management. La majorité
des différentes Directions métiers ; des CDO cherchent à délivrer des résultats rapidement pour maintenir la
dynamique et ne pas rencontrer les mêmes écueils que sur la gouvernance des
- Co-sponsoriser des projets ambitieux Business/Data pour inscrire la
données. Là aussi, quelques bonnes pratiques émergent, s’éloignant du cadre
data dans le modèle d’affaire de l’entreprise à travers des produits
théorique jugé souvent inatteignable pour cibler des victoires accessibles
robustes et matures inscrits dans les processus métiers.
autour des data domains et des data products.
2—P
 iloter la direction data par la valeur. Si l’estimation du ROI en amont des
BAROMÈTRE 2024

projets est devenue courante, à des fins de priorisation et de sponsorship, la Relever ces 3 défis fait d’autant plus de sens que la capacité des organisations
valeur réellement dégagée par les solutions data et IA est encore largement data à tirer pleinement partie des opportunités offertes par l’IA générative va être
méconnue. Seuls 16% des CDO sont responsabilisés sur des objectifs de particulièrement scrutée. Pour de nombreuses entreprises, l’objectif est de faire de
création de valeur chiffrés. La hype autour de l’IA générative et de ses 2024 l’année du passage en production de ces nouveaux usages et du déploiement
promesses de gains de productivité va accélerer la nécessité de mesurer d'outils dans toute l’entreprise, embarquant nativement cette technologie. Cet
réellement la valeur des investissements data. objectif va constituer un « stress test » pour la maturité des organisations data et
Les engagements communs de création de valeur par le métier et la data, la leur capacité à embarquer l’entreprise dans une transformation durable.
Direction financière comme partenaire, et la formalisation d’une méthode
partagée de valorisation sont autant de facteurs clés de succès partagés par les Jonathan CASSAIGNE,
Dirigeants data. Directeur des Expertises de Quantmetry
Présentation du baromètre
08

01 03

SOMMAIRE
L’IA générative au cœur des préoccupations Trois grands défis à relever en 2024 pour
des entreprises adresser l’ensemble des leviers de génération
12 de valeur par la data
64
L’IA générative replace l’IA au cœur des préoccupations 14
des entreprises DÉFI 1 - S’inscrire dans les enjeux stratégiques 66

ZOOM - Qu’est-ce que l’IA générative ? 18 de l’entreprise

SUCESS STORY – Leader dans le secteur de l'ingénierie 70


Les 4 enjeux des Chief Data Officers 22
pour rester dans la course DÉFI 2 - Piloter les Directions data par la valeur 76
La mise en production des IA génératives 28 DÉFI 3 – Démultiplier l’impact à l’échelle avec le Data Mesh 82
soulève de nouveaux défis

SUCESS STORY – Leader dans le secteur de la parfumerie 32

SUCESS STORY – Leader dans le secteur des services 34 Conclusions et perspectives


financiers 92

ZOOM - AI Act & IA de confiance : une accélération pour 36


mitiger les risques règlementaires & opérationnels
Qui sommes-nous ?
102

02
Les organisations se transforment
BAROMÈTRE 2024

pour la data et cherchent désormais


à se transformer par la data
44

Les entreprises maîtrisent l’industrialisation 46


de la data et de l’IA

La data et l'IA sont adoptées par tous 50


dans les entreprises

ZOOM - La data au service des enjeux RSE 52


& développement durable

Les entreprises cherchent désormais à se transformer 56


par la data
PRÉSENTATION
DU BAROMÈTRE
BAROMÈTRE 2024
Un panel de 53 répondants couvrant Postes occupés
principalement 7 secteurs d’activités % de répondants

Chief Data 52 %
Officer
Nous avons interrogé 53 Dirigeants et Responsables data de grandes,
moyennes entreprises et start-up. Au cours d’entretiens, nous avons Leader
évoqué leurs enjeux, leurs organisations, leurs priorités, leurs réussites dans le Data Office 27 %
et leurs difficultés. L’objectif de ces échanges était de : (Head of Governance,
Head of Data Lab…)

Analyser les progrès réalisés depuis notre Baromètre 2022


Relais métier 7%

Faire ressortir les principaux enjeux partagés par la majorité (Data Owner, Data
Manager, Sponsor…)
des directions data

Comprendre comment les directions data abordent ces enjeux IT Lead 7%

Data Science Lead

Présentation du baromètre
5%

Membre de la
2%
Delivery Team
(Data Scientist, Data
Engineer…)

Répartition des entreprises


par secteurs d’activité
Assurance AG2R, April, CCR RE, Groupama, Matmut, SCOR

8% 13 % Banque Arkea, La Banque Postale, BPCE, BNP Paribas, Crédit Mutuel, LCL

Autre GSF, Orange, Santeclair, Sodexo, SNCF


23% 10%
BAROMÈTRE 2024

Chanel, Christian Dior Couture, Danone, Décathlon, ETAM, Eureden,


 iens de consommations/
B
L’Oréal, LSDH, Manutan, Terrena, Ynsect
retail/distribution

17%
Energie / Utilités EDF R&D, Engie, GRTGaz, Orano, Schneider, Technip, Veolia Eau France
12%
Arcelor Mittal, EGIS, Eramet, MBDA, Michelin, Modulaire Group, Plastic Omnium,
Industrie
17% Safran, Saint Gobain, setec

Ministère de la Culture, Ministère de l’Intérieur et des Outre-mer, Pôle Emploi,


Service public
Région Ile-de-France

10 11
- Partie 1 -

L’IA
GÉNÉRATIVE

Partie 1 - L’IA générative


AU CŒUR DES
PRÉOCCUPATIONS
DES ENTREPRISES
BAROMÈTRE 2024

12 13
L'IA générative replace l'IA au cœur

Recherche & synthèse


Les cas d’usage pré-identifiés aujourd’hui et les plus
des préoccupations des entreprises

Interfaces langage
matures sont en grande majorité des sujets de RAG
(Retrieval Augmented Generation) reposant

documentaire
sur les capacités 1 et 3.

Génération
de contenu
Un retour en puissance de l’IA

naturel
Fonction Exemples de cas d’usages
Le lancement de ChatGPT fin 2022 et sa courbe d’adoption plus rapide qu’aucune
autre application numérique avant elle, a ouvert la voie au boom de l’IA générative.
Proposer des designs produit /
Un retour en force de l’IA que même les observateurs les plus avertis n’avaient pas R&D formulations chimiques
anticipé. L’IA se trouve pour la première fois à la portée de tous, accessible en ligne
via une interface intuitive. Analyser les clauses contractuelles /
Achat propositions commerciales
Un changement de paradigme qui a modifié en profondeur les enjeux des directions
data. Dissuadées par un ROI incertain et des difficultés à passer en production, les Générer des rapports d’inspection
entreprises avaient, en 2022, diminué leurs investissements dans l’IA au profit de Supply Chain de flotte sur la base d’enregistrement
projets data moins spectaculaires (BI, Data Quality…). audio terrain
Mais l’IA générative, avec ses promesses de gain de productivité conséquent dans de Analyser les causes racine d’incidents
Production
nombreuses industries et ses premiers usages prometteurs, a remis l’IA au cœur des et proposer des pistes d’amélioration
préoccupations des entreprises et de leurs dirigeants. Développer des scénarios de vente
Marketing & vente hyper-contextualisés

Partie 1 - L’IA générative


Proposer des réponses personnalisées
SAV
3 capacités techniques permettant aux clients via un chatbot

d’envisager de nombreux usages Finance


Automatiser la rédaction
de rapports financiers

Automatiser le cycle d’ingénierie


IT logicielle, (spécifications, développe-
L’IA générative apporte de la valeur via 3 capacités clés ment, support)

Créer des données structurées


1 - Interfaces en langage naturel Data sur la base d’images ou de texte
L’IA générative peut interpréter une consigne exprimée par un utilisateur en langage
Proposer des réponses personnalisées
naturel, par écrit ou à l’oral. Elle facilite ainsi grandement l’interface avec les outils, RH aux employés via un chatbot
applications et services utilisés par les employés, les clients ou les partenaires de
l’entreprise. Assister les employés dans leurs tâches
Autres du quotidien (emails, recherche de
documents….)
BAROMÈTRE 2024

2 - Génération de contenu
Suivant un modèle et/ou des instructions données par l’utilisateur, l’IA générative Capacité essentielle Capacité optionnelle
produit des contenus variés sous la forme de code, d’image, de vidéo ou de texte
par exemple. Le contenu généré s’appuie sur les milliers d’exemples connus par l’IA,
mais il reste inédit car (a) il est produit spécifiquement pour répondre à la requête Leviers de valeur
utilisateur (b) sa création est souvent déterminée de façon partiellement aléatoire.

3 - Recherche & synthèse documentaire • Travailler plus vite


• Être plus créatif
Sur la base d’une requête utilisateur, l’IA générative peut identifier, au sein d’un • Accélérer des processus métier
• Mieux diffuser l’expérience /
EFFICIENCE

corpus, les documents contenant des informations pertinentes, puis s’appuyer sur

QUALITÉ
• Se centrer sur des tâches à plus l’expertise au sein de l’entreprise
leur contenu pour formuler une réponse informée.
haute valeur
• Passer plus de temps sur
Ces trois composants fondamentaux peuvent être déployés dans des solutions • Abaisser le niveau de le perfectionnement que sur
en réponse à de multiples besoins métiers couvrant toutes les fonctions de compétences nécessaires pour le brouillon
l’entreprise. accomplir certaines tâches
14 15
Un mélange d’intérêt, de craintes
et de scepticisme

Les entreprises entament à peine leur appropriation des IA génératives.


Dans l’ensemble, elles cherchent à se forger de premières convictions sur
la valeur, et à avancer avec prudence.

68 25
Parmi eux,

% %
des sondés ont déjà lancé avaient déjà initié
des groupes de travail au moins une expérimentation
Des attentes fortes envers les Directeurs

Partie 1 - L’IA générative


stratégiques ou opérationnels en juillet 2023
sur les IA génératives.
data et DSI
Les principales craintes se portent sur : La promesse d’une IA démocratisée a démultiplié les sollicitations auprès
des Directions data et DSI.
la performance et la robustesse des modèles connus pour halluciner

80
les impacts légaux et la propriété intellectuelle
la dépendance envers les prestataires
les coûts
l’impact sur l’emploi et les compétences
% des sondés estiment que la data gagne
en priorité au sein de leur entreprise
avec l’essor de l’IA générative
BAROMÈTRE 2024

D’un côté, cet intérêt représente l’opportunité d’obtenir un sponsorship et des


budgets, y compris sur les fonctions support jusqu’alors moins actives sur la data
et l’IA. De l’autre, les attentes COMEX et métiers vont mettre à l’épreuve le modèle
opérationnel data mis en place au cours des dernières années. Les Directions data et
Nous nous questionnons sur la manière d’utiliser ces modèles : DSI devront sans doute les faire évoluer autour d’interrogations stratégiques clés:
réentraînement, coût, stockage et sur les problématiques de propriété
intellectuelle.
CDO, secteur banque Quelle ambition ? Comment réussir ?
• Sur quels usages investir ? • Faut-il faire évoluer le socle
• Faut-il prioriser l’IA générative technologique ?
au détriment des autres IA ? • Quelle organisation et quelle
• Comment mitiger les risques gouvernance ?
inhérents à cette technologie ? • Faut-il recruter et former?
16 17
ZOOM

Qu’est-ce que l’IA générative ? - IA - - TS -

Intelligence Artificielle Time Series


Discipline informatique qui vise à créer Branche de l’IA qui se concentre sur les
des systèmes capables de réaliser des séquences de données chronologiques.
tâches qui nécessitent généralement Elle vise par exemple à comprendre et
IA une intelligence humaine. à prédire des tendances au fil du temps
et à détecter des anomalies.

- ML -
- CV -
ML Machine Learning
Sous-domaine de l’IA qui se concentre Computer vision
sur le développement de techniques Branche de l’IA qui permet aux

Partie 1 - L’IA générative


permettant aux ordinateurs d’ap- ordinateurs de voir et comprendre en
P prendre à partir de données et d’amé- analysant des images et des vidéos.
NL liorer leur performance sur des tâches
DL CV
spécifiques sans être explicitement
programmés. IA générative
TS

Théories et techniques permettant


- DL - de générer de nouvelles données
inexistantes auparavant (texte, image,
Deep Learning son, etc.) en réponse à des instructions.
IA générative Sous-catégorie du Machine Learning
qui utilise des algorithmes structurés
en réseaux pour représenter les Modèles de fondation
relations entre les données. Cette
approche est plus coûteuse mais peut Modèles d’intelligence artificielle
Modèles
BAROMÈTRE 2024

offrir de meilleures performances dans entraînés de manière générique sur des


de
de nombreux contextes. données à grande échelle, et pouvant
fondation
être adaptés à une large collection de
tâches spécifiques.
- NLP -

Natural Language Processing


Branche de l’IA qui se concentre sur
la compréhension, la génération et la
manipulation de textes et de discours
par les ordinateurs.

18 19
Les IA génératives et discriminatives Termes clés

sont synergiques Vecteur Au-delà de certains seuils, les modèles


Représentation mathématique de d’envergure produisent des capacités
mots, d’images ou d’autres éléments émergentes telles que la capacité à
L’IA générative ne doit pas être perçue comme la nouvelle génération permettant à un ordinateur d’évaluer répondre à des questions, construire
d’IA venue remplacer les pratiques préalables. Les IA génératives et la distance sémantique entre les un raisonnement…
discriminatives vont continuer de prospérer côte à côte, et bien souvent concepts et d’effectuer des calculs du
coexister au sein d’une même solution. type roi – homme + femme = reine.
Fine tuning
Les LLM tels que GPT sont qualifiés de
LLM - Large Language Model « fondationnels ». Ils servent de bases
Forces et faiblesses complémentaires Ces modèles servent de base pour aux applications d’IA génératives (ex:
les applications d’IA génératives ChatGPT) mais peuvent nécessiter un
fondées sur du texte. Ils sont des retraitement ou « fine tuning » pour
IA générative IA discriminative obtenir des performances suffisantes
représentations statistiques d’une
langue, construites sur la base de en conditions d’utilisation réelles. Le
corpus de données pouvant atteindre fine tuning est un réentraînement

Partie 1 - L’IA générative


Créer, synthétiser <> Détecter, classer, mesurer
plusieurs milliards de mots. Un LLM est qui nécessite de fournir un jeu de
conçu pour prédire le prochain mot le données d’exemples à reproduire par
plus probable dans une séquence de la machine.
Champ d’action plus étroit, type «le ciel est …» (bleu, gris, etc).
Polyvalent <> plus ciblé
Prompt engineering
Coûts plus élevés Coûts plus bas Hallucination En plus du fine tuning, la performance
(entraînement et inférence) <> (entraînement et inférence) Les LLM s’appuient sur leur du modèle dépend beaucoup des
connaissance des relations statistiques données dont il dispose pour répondre
entre les concepts qui constituent une à chaque requête. Ces données sont
Plus d’humain dans la boucle Usages moins basés langue. Cela leur permet de construire contenues dans le « prompt » ou
pour interagir <> sur l’interaction humaine
des phrases souvent intelligibles et l’instruction qu’il reçoit. Le prompt
cohérentes. En revanche, la véracité engineering est la discipline qui
des propos générés par les LLM n’est optimise la façon d’interroger les LLM
jamais garantie. Les LLM ont tendance au sein d’une application.
BAROMÈTRE 2024

à produire des « hallucinations » ou des Il s’appuie sur de nombreux éléments


contenus factuellement faux, qui ne comme :
sont pas toujours aisés à repérer sans • la question posée par l’utilisateur
connaissance préalable du sujet. (prompt design)
• des exemples à suivre (few shots
learning)
Capacités émergentes
La performance d’un LLM dépend • des données de contexte issues de la
de la taille, des thématiques et de la base documentaire de l’entreprises
qualité de son jeu d’entraînement ainsi (Retrieval Augmented Generation )
que du nombre de paramètres dont • l’utilisation de plusieurs LLM en
il dispose pour modéliser la langue. séquence (Chaining)
Cette performance n’est pas linéaire.

20 21
Les 4 enjeux des Chief Data Officers L’IA générative a fait remonter d’un cran les attentes du top management sur
l’IA et la data. On doit maintenant accompagner les dirigeants sur le sujet et vite
pour rester dans la course communiquer sur ce que l’on peut faire, et sur ce que l’on ne peut pas faire
au risque sinon de faire des choses contre-productives.
Olivier MONNIER,
1. Lancer rapidement de premières expérimentations CDO, MATMUT

Un enjeu de lucidité pour ne pas décevoir


Les CDO doivent aider le COMEX et les métiers à calibrer leurs attentes. Comme pour 2. Évaluer les risques et en dégager un cadre global d’utilisation à
le Deep Learning il y a quelques années, l’essor de l’IA générative s’accompagne de affiner progressivement
fausses promesses et d’attentes exagérées.
Même si le potentiel est important, l’IA générative présente des risques et des
Le POC fait son retour limites dont les utilisateurs doivent prendre connaissance. Les entreprises doivent
A date, seules quelques fonctionnalités sont matures (cf. tableau ci-dessous). L’enjeu rapidement poser un cadre qui délimite pour les utilisateurs : (a) le champ des
des entreprises sera donc d’éprouver rapidement les IA génératives sur leurs données possibles et (b) les bonnes pratiques à adopter pour un usage responsable.
et leurs cas d’usages pour en déterminer précisément la performance. Cela doit se faire de façon itérative à mesure que la technologie et le cadre légal
évoluent.
Un déploiement en 2 vagues
La première vague d’IA génératives proviendra des features intégrées aux applications
bureautiques telles que Microsoft Copilot. Ces outils pourront couvrir une proportion
Limites Risques

Partie 1 - L’IA générative


importante des besoins courants des métiers mais atteindront leurs limites sur les cas
d’usages plus spécifiques, nécessitant par exemple la maîtrise de concepts propres à
Hallucination Réputation
l’entreprise ou l’accès à des bases documentaires internes.
Difficulté à garantir l’exactitude Dysfonctionnement des applications
des résultats. en interface avec le public, les clients
Les entreprises devront rapidement identifier les usages nécessitant des
ou les partenaires commerciaux.
développements dédiés, en veillant toutefois à anticiper l’évolution des
fonctionnalités des éditeurs. Des expérimentations devront être initiées sans Toxicité
Recours occasionnel à un langage Juridique
tarder pour rester dans la course.
inapproprié, grossier ou haineux. Zones grises autour de la
propriété intellectuelle (données
Biais d’entraînement et contenu généré)
Fonctionnalités de l’IA générative à ce jour
Reproduction des distributions et de l’utilisation éthique.
Données statistique du jeu d’entraînement.
Texte/ vocal Code Image / vidéo
structurées Fournisseur
Mesure de performance Dépendance possible aux
Augmenter Identifier des
Résumer Compléter fournisseurs d’IA générative et limite
BAROMÈTRE 2024

la résolution anomalies Difficulté à automatiser la mesure


de performance compte tenu de la de souveraineté sur la gouvernance
Générer des subtilité du langage et de la nature des modèles.
Traduire Traduire Modifier / styliser représentations aléatoire des contenus générés.
graphiques
Opérationnel
Coûts Prise de décision sur la base
Interpréter / Décrire / Décrire /
reformuler
Optimiser
interpréter Interpréter Coûts d’entraînement prohibitifs d’informations erronées.
pour de nombreuses entreprises
Répondre Générer à partir Compléter (plusieurs millions d’euros pour Sécurité
factuellement Documenter de langage des valeurs un modèle à l’état de l’art). Coûts Cybercriminalité, fuites de données,
avec des sources naturel manquantes
d’inférences pouvant monter deepfakes...
rapidement pour les applications
Résoudre
Générer à partir fortement sollicitées et/ou
des problèmes Passer de la 2D
de langage
logiques / à la 3D nécessitant beaucoup de données
naturel
analytiques
en contexte.
22 23
Mature Émergent Embryonnaire
3. Former les utilisateurs pour éviter les déceptions

La manière d’interagir avec une IA générative impacte fortement sa performance.


Modifier quelques mots dans les instructions et le résultat obtenu peut changer du
tout au tout.

Exemple avec deux prompts différents

Le prompting standard Le prompting Chain of Thought

Input Input

Q : Roger a 5 balles de tennis. Il achète Q : Roger a 5 balles de tennis. Il achète


2 autres boîtes de balles de tennis. 2 autres boîtes de balles de tennis.
Chaque boîte contient 3 balles de Chaque boîte contient 3 balles de
tennis. Combien de balles de tennis tennis. Combien de balles de tennis
a-t-il maintenant ? a-t-il maintenant ?
R : La réponse est 22. R : Roger a commencé avec 5 balles.
Q : Le chef de la cafétéria avait 23 2 boîtes de 3 balles de tennis chacune
pommes. S'il en a utilisé 20 pour représentent 6 balles de tennis.
5 + 6 = 11.

Partie 1 - L’IA générative


préparer le déjeuner et qu'il en a
acheté 6 de plus, combien de La réponse est 11.
pommes a-il ? Q : Le chef de la cafétéria avait 23
pommes. S'il en a utilisé 20 pour
préparer le déjeuner et en a acheté
Model Output 6 de plus, combien de pommes a-t-il ?

R : La réponse est 27.


Model Output

R : Le chef de la cafétéria avait


23 pommes à l'origine ; il en a utilisé Pour répondre aux forts enjeux et attentes liés aux LLM et à l’IA Générative,
20 pour préparer le déjeuner. Il avait la réponse de Danone a été de monter un groupe de travail regroupant divers
donc 23 - 20 = 3. Il a acheté 6 pommes experts (Data Scientists, juristes, cyber...) afin de : Proposer des directives Groupe
supplémentaires, il en a donc 3 + 6 = 9. en matière de GenIA, Construire une offre de service interne simple et sécurisée,
BAROMÈTRE 2024

La réponse est 9. Mettre à disposition des collaborateurs un centre d’excellence sur le sujet.
Anne-Laure Cebile,
Les entreprises devront donc traiter l’interaction avec les IA génératives comme
Data Science Team Leader, DANONE
une compétence à maîtriser largement par les employés. Si elles n’agissent pas
rapidement, elles s’exposent à plusieurs risques.

Un usage sous-optimal : les utilisateurs ne tirent pas pleinement avantage


des capacités de l’IA
Un usage excessif : les utilisateurs démultiplient les tentatives pour aboutir
à un résultat satisfaisant, surconsommant ainsi les IA
Une perte d’intérêt : les utilisateurs confondent leurs lacunes et celles
de la technologie

Pour pallier à ces risques, les entreprises commencent à mettre en place


des programmes de formation d’envergure à travaers une "Prompt Academy".
24 25
4. Adapter la stratégie et le modèle opérationnel data & IA Vue d’ensemble des impacts du GenAI

L’IA générative met à l’épreuve les stratégies et modèles opérationnels des Directions
Peu mature
data et DSI. Elle présente en effet des spécificités qui peuvent la rendre complexe à Est utilisée Touche toutes
du point de vue
S’appuie
maîtriser. par tous les fonctions de sur des données
scientifique,
les employés l’entreprise documentaires
technique et légal

Spécificités de l’IA générative Capacité mise à l’épreuve pour l’entreprise


Enjeux, vision et stratégie

Est utilisée par tous les employés • Déployer et opérer des solutions d’IA
à l’échelle de l’entreprise
Pilotage du portefeuille de projets / cas d’usages
• Piloter des programmes de conduite
du changement d’envergure

Partie 1 - L’IA générative


• Surveiller et encadrer l’usage des solutions
d’IA pour mitiger les risques dans un contexte Culture data Organisation data Ressources & compétences
favorable au shadow data

Touche toutes les fonctions Architecture, Processus de delivery Data Management


de l’entreprise • Dimensionner des effectifs data et DSI plateformes et outils et méthodologies & gouvernance
par rapport aux demandes des métiers
(risque de goulot d’étranglement)
• Faire évoluer le socle technologique
en lien avec les besoins métiers Légal, compliance & éthique

Peu mature du point de vue Légende :


• Formuler et mettre en œuvre une stratégie Degré d’impact sur la stratégie et le modèle opérationnel data et AI
scientifique, technique et légal
de façon urgente pour ne pas être en retard Enjeux propres à l’IA générative Impact modéré Impact fort
• Trouver un équilibre entre liberté
BAROMÈTRE 2024

d’expérimenter et canalisation des initiatives


• Assurer l’agilité des processus de delivery

S’appuie beaucoup sur des


données documentaires • Renforcer la qualité et l’accessibilité
des bases documentaires
• Diffuser les bonnes pratiques de Knowledge
Management

26 27
La mise en production des IA génératives
soulève de nouveaux défis

Mesurer et optimiser la performance Éviter le « vendor lock-in » ?

Pour sortir les LLM du laboratoire, les Directions data vont devoir renforcer leur Le marché des LLM se concentre progressivement autour d’une poignée de modèles
capacité à mesurer et à suivre les performances des modèles en condition d’usage. à l’état de l’art détenus par des acteurs dominants comme OpenAI ou Anthropic. Cela
rend les entreprises clientes vulnérables à :
Nos recommandations
• Obsolescence
A) Proposer un Banc de Test aux développeurs d’IA générative La technologie progresse si vite qu’un modèle peut être supplanté par la
concurrence en quelques mois.
La performance d’une IA générative dépend d’une multitude de facteurs. Au-delà
du modèle, ce sont les choix de vector stores, les stratégies de prompt (chaînage, • Décommissionnement
agents…), le design des prompts et même l’UX qui déterminent la performance de À mesure que de nouvelles versions sont créées, les modèles sur lesquels
l’IA pour une tâche donnée. les applications sont fondées peuvent être décommissionnés.

Partie 1 - L’IA générative


Le Banc de Test permet aux développeurs d’élaborer un protocole pour comparer • Changements tarifaires
plusieurs configurations en parallèle. Aujourd’hui, le marché se développe pour Les fournisseurs stimulent actuellement la pénétration de marché en pratiquant
proposer des solutions dédiées aux IA génératives via des acteurs comme Weight & la vente à perte. Il est possible que les tarifs augmentent à l’avenir.
Biases ou WhyLabs.
• Éthique
L’entreprise qui consomme un modèle est tributaire des choix éthiques de
B) Intégrer des feedbacks utilisateurs à l’échelle son fournisseur. Par exemple, elle ne maîtrise pas la provenance des données
d’entraînement, pouvant être soumises à des contraintes de propriété
La mesure de performance est difficile à automatiser car le langage est une matière intellectuelle.
nuancée et ambiguë. Il est donc essentiel d’obtenir un feedback continu de la part
des utilisateurs, autant en phase d’expérimentation que durant le run. Nos recommandations
Ils auront pour rôle de remonter et qualifier les erreurs de l’IA afin
que les développeurs : A) Construire des architectures agnostiques des modèles
BAROMÈTRE 2024

Les architectures d’IA génératives doivent respecter un principe de découplage entre


recommandent de nouvelles façons d’interroger le modèle
les modèles et les autres briques technologiques. Il doit être possible de substituer
optimisent le modèle via un fine tuning ou de nouvelles stratégies de prompt un ChatGPT par un autre sans apporter de modifications conséquentes au reste de
par exemple l’architecture comprenant les pipelines de données, les vector stores, les agents ou
les prompts préconçus.
clarifient le domaine de validité du modèle : que sait-il faire ou ne sait-il pas faire ?
B) Proposer un Model Hub aux développeurs d’IA génératives

Le Model Hub permet aux développeurs d’IA génératives d’accéder à une librairie
étendue de modèles via APIs. Actuellement, le marché se structure pour offrir des
solutions de Model Hub clés en main. Les principaux providers cloud développent leur
offre sur ce marché. AWS Bedrock et Azure ML propose un accès vers une multitude
de LLM propriétaires ou open source, hébergés sur leurs serveurs.

28 29
Votre entreprise est-elle « GenAI-Ready »
pour saisir l’opportunité ?

AXES ENJEUX CLÉS CAPACITÉS FAVORABLES

#1 • Capacité à mobiliser les métiers sur toutes les fonctions de l’entreprise


Acculturer le COMEX et proposer une stratégie
Enjeux, vision
sur le court et moyen terme • Direction data proche du COMEX dans un rôle de conseiller stratégique
et stratégie

#2 • Gouvernance et processus efficaces pour remonter les cas d’usages


Canaliser l’afflux de nouveaux projets et orienter
Pilotage du portefeuille
les choix make or buy • Capacité de veille technologique en place
de projets

#3 • Gouvernance mature intégrant métier, data, légal, DSI et cybersécurité


Poser un cadre pour une utilisation efficace et responsable
Organisation
tenant compte des limites et risques de l’IA générative • Capacité à mettre en place des task forces dédiées à l’IA générative
& gouvernance

Partie 1 - L’IA générative


• Existence d’une filière data structurée notamment sur les profils de Data Engineers
#4 cruciaux pour les cas d’usages d’IA générative
Evaluer les impacts sur les compétences des populations
Ressources
de développeurs et d’utilisateurs d’IA générative • Existence d’une Data Academy et/ou d’un relai de formation équivalent
et compétences
• Relations de proximité entre équipe Data et DRH

#5 Communiquer en continu au rythme des évolutions • Relais en place dans les métiers pour faire de l’acculturation à l’échelle
Culture data du marché et des technologies • Relations de proximité entre équipe Data et équipes communication / transformation

#6 Faire évoluer les socles technologiques • Partenariats avec les Cloud providers
Architecture, pour permettre le développement et l’exploitation
plateformes et outils d’IA génératives en production • Gouvernance du socle technologique mature
BAROMÈTRE 2024

#7 • Centralisation au moins partielle des bases de données documentaires clés


Passer du Data Management au Data & Knowledge
Data management • Pratiques de Knowledge Management matures
Management
et gouvernance • Classification des données sensibles pour mitiger les risques de fuite de données

#8 Réaliser les premières expérimentations et en dégager • Capacité d’expérimentation et de mise en production matures (stack MLOps)
Processus de delivery des convictions sur les conditions de réussite en production
& méthodologies et les spécificités des IA génératives en production • Proximité avec les métiers utilisateurs pour mettre en place des boucles de feedbacks

#9 • Gouvernance en place entre les Directions data et juridique


Mitiger les risques sans brider l’organisation
Legal, compliance
dans un contexte règlementaire encore flou • Capacité de monitoring et de gouvernance des IA en anticipation de l’AI Act
& Ethics

30 31
Identifier
SUCCESS STORY 1 les bons gisements
de valeur
Leader dans le secteur
de la parfumerie
KPI

+ de 400 participants
Problématique
81 cas d’usages identifiés
Les collaborateurs au sein des métiers ont imaginé de nombreux usages de l'IA (20 Catégorie 1 / 40 Catégorie 2 / 9 Catégorie 3)
générative s'appuyant sur les LLM et les modèles de diffusion. L’enjeu majeur est de
canaliser les initiatives et de profiter de cette impulsion pour identifier, prioriser et Des cas d’usages répartis dans tous les départements de l’entreprise

Partie 1 - L’IA générative


répondre aux besoins. et souvent transverses.

Pour faire cela correctement il est nécessaire de : Le choix et le développement de 2 cas d’usage priorisés,
Sensibiliser et démystifier les parties prenantes à l’IA générative à forte valeur ajoutée et facilitateur pour d’autres sujets proches.

Inspirer les collaborateurs au moyen d’exemples concrets


Imaginer des cas d’utilisation percutants susceptibles d’apporter une forte
valeur ajoutée à l’entreprise
Enseignements clés

La priorisation des cas d’usages d’IA générative relève de critères différents des
Résultat critères usuels de priorisation des cas d’usages IA. En effet, ces cas d’usages
répondent souvent à des enjeux supplémentaires, comme la capacité à rayonner
Une campagne de 40 ateliers de sensibilisation et d’idéation auprès des métiers a été (valeur générée, économies de coûts…), en plus des critères de complexité
menée. Les cas d’usages ont été classés en 3 catégories. encore peu maîtrisés et évoluant quotidiennement.
BAROMÈTRE 2024

Catégorie 1
Les cas d’usages pouvant être lancés très facilement car ne nécessitant La distinction entre les cas d’usages relevant des IA génératives et ceux pouvant
que la formation des utilisateurs et l’achat de licences. être réalisés par d’autres techniques est nécessaire et permet de faire des
Catégorie 2 économies de coût. Une partie des cas d’usage proposés par les métiers, car
Les cas d’usages à développer, dans un second temps, car soulevant des problèmes couverts par ChatGPT, peut l’être par des modèles moins coûteux avec une
de confidentialité ou nécessitant de développer une interface ou une application performance égale ou supérieure.
complexe.
Catégorie 3 Lors des campagnes d’idéation, les populations à prioriser sont celles faisant de
Les cas d’usages à ne lancer que lorsqu’un acteur externe proposera une solution la recherche d’information au sein de grande quantité d’informations textuelles
car trop complexes à développer ou des cas d'usages que des acteurs majeurs sont et autres documents. Ces cas d’usages (nommés RAG) sont en effet à forte valeur
en train de développer pour les intégrer à des outils (MS Teams, Gmail…). et efficacement traités par l’IA générative et de nouveaux outils comme les bases
de données vectorielles.

32 33
Industrialiser
SUCCESS STORY 2
rapidement une solution
Entreprise dans le secteur performante
des services financiers

Problématique KPI

Un fond d’investissement gérant plus d’1Md d’assets souhaite accélérer + de 50 utilisateurs
significativement sa phase clé de due dilligence. Une due dilligence peut nécessiter dont les partners de la société comme premiers ambassadeurs de la solution

Partie 1 - L’IA générative


d’analyser 10 000 à 20 000 documents pour vérifier des éléments très précis et valider
ou non une décision d’achat de la société analysée. Gain opérationnel
significatif sur chaque due dilligence
Pour aider ses équipes, l’entreprise souhaitait :
Construire un assistant intelligent avec des interactions de type humain
en utilisant les capacités de GPT3.5/4
Récupérer des informations à partir d’un large corpus de documents,
les explorer et résumer les faits essentiels
Enseignements clés
Fournir une interface de type ChatGPT pour interagir avec l’assistant La performance de la solution ne dépend pas uniquement de la performance du
et visualiser les documents récupérés LLM :
l’interface utilisateur est clé dans l’adoption de la solution par les utilisateurs,
notamment en personnifiant l’agent afin que l’utilisateur ait l’impression d’être
dans une conversation. Pour cela, l’interface doit être intuitive, proposer des
Résultat suggestions de prompt…
BAROMÈTRE 2024

l’intégration d’agents ayant chacun leur rôle, leur domaine de validité et leur
Développement d’une application web aidant les équipes de due diligence à analyser
spécialisation permet de proposer plus de capacités avec de meilleurs résultats
un large corpus de documents (plus de 1 million de documents).
au plus proche du besoin de l’utilisateur.
L’utilisation d’outils performants tels que les bases de données vectorielles,
Cet analyste virtuel permet de répondre à plusieurs cas d’utilisations
les modèles d’embeddings multi-langues… est nécessaire pour garantir une
(recherche de documents en interne, résumé, extraction d’informations,
solution optimale.
recherche web…) au service de 3 catégories d’utilisateurs :
L’analyste qui doit connaître et analyser l’ensemble des documents
L’humain ne doit pas être délaissé afin d’assurer la performance et la pertinence de
Le spécialiste qui va rechercher des informations très précises
la solution. Il intervient dans l’ensemble du cycle de vie de la solution (entraînement,
(sectorielle ou fonctionnelle) dans les documents
définition du domaine de validité, mise en place de contrôles et de jeux de test…).
Le partner qui souhaite avoir une réponse rapide à quelques questions Ses feedbacks et jeux de tests permettent ainsi d’améliorer la solution.
spécifiques et préparer ses interactions avec la société analysée
Solution mise en production et utilisée sur chaque nouvelle due dilligence.
34 35
ZOOM

AI Act & IA de confiance : Les entreprises se préoccupent de l’AI Act mais restent
majoritairement dans le flou sur la manière de s’y préparer
une accélération pour mitiger les risques La règlementation RGPD a laissé des marques dans de nombreuses entreprises et
règlementaires & opérationnels pousse les organisations à prendre de l’avance par rapport à la règlementation à venir.
Cependant, le périmètre du sujet n’est pas encore clairement compris et les actions
d’état des lieux ou de remédiation pour mitiger les risques restent minoritaires.

L’IA générative remet l’IA de confiance au centre


des préoccupations
Comparaison de l’appropriation de l’AI Act au sein des entreprises,
L’arrivée des IA génératives, et notamment des LLM % de répondants

50 %
• Démultiplie les usages possibles de l’IA et incite donc les Dirigeants data à s’emparer
des questions de confiance et de gouvernance des modèles 40 %
• Pose de nouvelles questions spécifiques liées à la nature des LLM comme le respect

Partie 1 - L’IA générative


de la propriété intellectuelle ou encore la prémunition contre les hallucinations 30 %

45 %
20 %
30 %
25 %
En parallèle, l’IA Act se concrétise et s’enrichit 10 %

pour couvrir les exigences relatives à l’IA générative 0%


0%
Le sujet n’est pas En cours de réflexion Un certain nombre Tout est sous contrôle
Le Parlement Européen propose une règlementation sur l’utilisation de l’IA. Par encore étudié et/ou au moins une d'éléments mis en place
initiative lancée (processus…)
son positionnement sur les risques liés à l’usage et non à la technologie, l’AI Act a
vocation à être un socle de référence résistant au contexte mouvant, centré sur la
protection des droits fondamentaux.
Le vote du texte final et la période de tolérance avant les amendes effectives
poussent les entreprises à suivre le calendrier de déploiement pour s’y préparer.
BAROMÈTRE 2024

Calendrier de déploiement de l’IA Act

2020 2021 2022 2023 2024 2025 2026


Travail commission Publication de la proposition de règlement

Étude du conseil européen Publication de l’orientation générale

Étude du parlement Publication de la position du parlement

Trilogues Vote du texte au parlement

Période de tolérence Pleine application


36 37
ZOOM Bien que les LLM de confiance et l’audit de ces modèles constituent encore un
domaine de recherche, nous avons d’ores et déjà identifié des principes directeurs
spécifiques pour chaque pilier de l’IA de confiance.

AI Act & IA de confiance :


une accélération pour mitiger les risques Points
de faiblesse
Actions de conception Actions
d’audit
règlementaires & opérationnels
• Génération • Acculturer et former les utilisateurs Caractériser les
de contenu aux usages des LLM, notamment évasions possibles
illégal ou toxique ChatGPT, pour éviter les utilisations (jailbreaks)
Responsabilité
sur des faiblesses connues des outils

Pour répondre à ces enjeux, l’IA de confiance doit être


déclinée sur 8 piliers
• Hallucinations • Optimiser les prompts (prompt Comptabiliser

Partie 1 - L’IA générative


Ces thématiques sont celles assignées par l’IA Act, mais également celles qui sont des engineering) les hallucinations
• Capacités ciblées
enjeux majeurs pour les organisations.
Performance • Ne pas avoir une approche «LLM
tout nu» mais intégrer les modèles
LLM dans un système plus large de
briques techniques (couche métier
ou modèle logique pour raisonner,
Robustesse Performance chercher, calculer, optimiser...) afin
Définir et repousser les limites Répondre aux enjeux métiers d’utiliser la brique LLM pour sa
de validité du modèle de manière optimale
capacité clé à date : le traitement du
langage naturel

Qualité de données Responsabilité


Maîtriser la qualité des données Déployer une gourvenance
en entrée du modèle face aux enjeux règlementaires • Domaines • Etablir et différencier les domaines Quantifier
d’utilisation d’utilisation de chaque LLM pour l’incertitude
BAROMÈTRE 2024

Robustesse spécifiques adapter la responsabilité et la des résultats


IA DE CONFIANCE • Non- performance sur des domaines de
reproductibilité validité adaptés
• Réduire la température
Frugalité Équité
Mesurer et minimiser Maîtriser les biais et garantir
l’impact environnemental la non-discrimination

• Représentation • Faire valider les sorties par l’humain Caractériser


Contrôle des dérives Explicabilité arbitraire pour analyser, fact checker et le jeu
Contrôler l’impact opérationnel Expliquer les prédictions Qualité du monde censurer les contenus générés d’entraînement
du modèle en production aux utilisateurs finaux
de données

…/…

38 39
Nous préconisons une démarche en 4 volets pour mitiger
…/…
les risques efficacement et durablement.

Points Actions de conception Actions


de faiblesse d’audit Construire les fondations

Ecarts de qualité • Mettre en place un « pare feu » Quantifier Cadrage


les écarts de Stratégie et du programme Plan de conduite
de service de contenu sur les inputs des Macro-diagnostic
engagements (gouvernance, du changement
utilisateurs pour s’assurer de ne performance par KPIs,…)
Équité
pas adresser des thématiques domaine
non souhaitées en passant par
exemple par un modèle de
détection d’intention ou du prompt
engineering.

Conduire le changement & assurer la montée en compétences

Conduite du changement & montée en compétences

Partie 1 - L’IA générative


• Se brancher sur un moteur Evaluer la
Contenus générés
de recherche (RAG) pertinence des
sans citer aucune
Explicabilité source • Forcer une explicabilité by-design sources citées
en mettant en place la citation de Onboarding & animation des communautés impactées
source avec une UX permettant
aux utilisateurs de vérifier par eux-
mêmes la fiabilité
Acculturation Sensibilisation Formation Formation
COMEX collaborateurs managers Data Scientists

• Mettre en place une stratégie Réaliser le bilan


Coûts d’utilisation carbone du cas
FinOps
non-maîtrisés d’usage
Frugalité • S’assurer que la solution est adaptée
à l’usage : certains usages LLM Intégrer la confiance by design pour les IA à venir
peuvent être satisfaits avec des
BAROMÈTRE 2024

technologies moins consommatrices


comme le NLP
Définition des processus Definition of du framework
Assets techniques
cible d’audit interne

Mises à jour • Collecter les retours utilisateurs au Faire des audits


permanentes fil de l’eau détaillés sur une
des APIs base régulière
Contrôle • Mettre en place une stratégie de
des dérives tests automatiques par domaine
de validité pour détecter les
Mettre en conformité les cas d’usage existants
faiblesses et monitorer l’évolution
des performances et des retours
utilisateurs Inventaire des cas d’usage Audit des cas d’usage Remédiation des points
existants à haut risque de non conformité

40 41
Synthèse et analyse

Face à la rapidité, sans précédent, de l’émergence de l’IA générative,


une technologie de masse, dont une partie des usages reposera sur des
outils mis à la disposition du plus grand nombre, les Dirigeants data se
trouvent confrontés à de nouveaux challenges. Tout d’abord, il leur faut
réussir à répondre aux demandes de leur top management et lancer
rapidement de nouveaux usages d’IA génératives. Mais si les opportunités
potentielles générées par l’adoption de cette technologie sont immenses,
l’environnement technologiques et les risques associés sont encore en
phase de découverte.

Partie 1 - L’IA générative


Les Dirigeants data doivent alors définir une stratégie pour accompa-
gner cette transformation :

•
Expérimenter l’IA générative sur des premiers cas d’usages via des
solutions logicielles (« buy ») et des développements internes (« make »)
• Gérer les risques et la propagation qui peut vite devenir incontrôlée sans
une ligne directrice claire
• Préparer le passage de l’IA générative en production en :
-
adaptant le modèle opérationnel data pour prendre en compte
les spécificités de l’IA générative en matière de compétences, de
formation, de modèle de delivery…
- faisant les bons choix technologiques en fonction de ses objectifs et
BAROMÈTRE 2024

de ses contraintes

Enfin, l’adoption de ces nouveaux usages ne sera pérenne que si les


utilisateurs peuvent avoir confiance dans une technologie qui n’est
nativement pas conçue pour être fiable. Le passage en production d’IA
génératives de confiance, en capacité de s’intégrer dans le cadre défini par
l’AI Act Européen, sera l’un des enjeux clé de l’année 2024.

42 43
- Partie 2 -

LES ORGANISATIONS
SE TRANSFORMENT

Partie 2 - Se transformer par la data


POUR LA DATA
ET CHERCHENT
DÉSORMAIS À SE
TRANSFORMER
PAR LA DATA
BAROMÈTRE 2024

44 45
Les entreprises maîtrisent
l’industrialisation de la data et de l’IA

De plus en plus de cas d’usages en production L’IA gagne du terrain dans les portefeuilles data

Évolution du taux d’industrialisation des solutions BI et IA Evolution de la part des projets IA (vs BI)

80 % 80 %

58 % 40 %

Partie 2 - Se transformer par la data


46 % 36 %

32 %

2020 2021 2022 2023 2021 2022 2023

BI IA

Presque 6 produits IA sur 10 industrialisés,


En 2023, l’IA représente 40%
des cas d’usages des portefeuilles de projets
soit
25% de + qu’en 2022

Après une dépriorisation des projets IA en 2022, au profit de projets


BAROMÈTRE 2024

reposant sur des pratiques et technologies maîtrisées, l’IA gagne du terrain


dans les portefeuilles car :
Nous industrialisons maintenant Nous avons un bon taux
avec plus de facilité, mais le challenge d’industrialisation grâce à une l’arrivée de l’IA générative a redonné de l’intérêt pour l’IA
devient le time-to-market. sélection et priorisation réaliste des
les efforts d’acculturation portent leurs fruits et les métiers remontent
Head of AI Factory, cas d’usages que l’on instruit.
désormais spontanément des cas d’usages IA
secteur luxe Antoine Ly,
le développement des équipes data au sein des métiers permet de développer
Chief Data Science Officer, SCOR
plus de cas d’usages et de leur laisser l’ownership sur la réalisation
l’aboutissement des projets favorisés ces dernières années passées
(création de jeux de données, APIsation, mise sous contrôle de référentiels...)
a permis d’adresser les projets IA plus facilement et sereinement

46 47
La relation avec la DSI comme facteur clé de succès
En 2023,
des Directions data sont rattachées
Des DSI mieux acculturées à la data

La collaboration entre DSI et Directions data s’améliore et les mandats respectifs se


clarifient, fluidifiant fortement le passage des IA en production. Sur les projets, les
39% aux DSI. Un chiffre en augmentation
constante depuis 3 ans.

facteurs de succès principaux demeurent :

l’hybridation des compétences data et IT (Data Engineer, Machine Learning


Engineer)

une meilleure implication de la DSI de la phase de cadrage jusqu’au déploiement Et d’autres facteurs clés de succès identifiés

• La capacité à impliquer et responsabiliser les métiers grâce


Sur l’alignement stratégique entre DSI et data, les CDO constatent une aux démarches d’acculturation
amélioration en matière de :

Partie 2 - Se transformer par la data


• Les bons choix technologiques selon des écosystèmes SI cohérents
synchronisation des feuilles de route data et IT (Move-to-Cloud, Suites Editeurs...)
• La maîtrise des approches MVP & Agile pour apporter de la valeur à court terme
meilleure entente sur les besoins d’évolution des socles data
• La productisation des cas d’usages IA de mieux en mieux maîtrisée :
intégration dans les processus opérationnels (produits IA/digitaux)
Évolution du niveau d’acculturation des DSI et intégration dans l’écosystème SI
• La constitution d’équipes produits complémentaires avec des rôles bien
9%
27 % identifiés entre Data Scientist, Data Engineer, Machine Learning Engineering & Ops
48 % et Product Owner/Manager
40 %
• Une culture data chez les métiers qui permet désormais d’être réaliste
43 %
33 % sur la promesse de valeur des cas d’usages

2022 2023

Mauvais Correct Très bon


Ainsi que des nouvelles difficultés
BAROMÈTRE 2024

Le time-to-market La gestion de l’évolutivité


Un retour de la data au sein des DSI de mise en production des produits de l’environnement business
à cause des travaux préalables de data et SI impactant à la fois les données
Les évolutions d’organigramme constatées depuis quelques années sont à la fois
management (clarification des règles et les produits en production,
causes et résultantes du rapprochement entre data et DSI.
de gestion, consolidations notamment la conservation et
et nettoyages de référentiels, documentation de la connaissance.
ingestion sur la Data Platform...).
Évolution de la part des directions data rattachée aux DSI

39 %
32 %
20 % 19 %

2020 2021 2022 2023

48 49
La data & l’IA sont adoptées par tous Des roadmaps de cas d’usages construites en collaboration
avec les équipes métiers
dans les entreprises
La data étant désormais attendue sur la réalisation de cas d’usages par l’ensemble
des parties prenantes de la transformation, les feuilles de routes sont construites en
Des cas d’usages couvrant toutes les fonctions de l’entreprise
collaboration avec les principaux partenaires projets :

Comme en 2022, les fonctions Marketing & Vente et Opérations bénéficient 75% des roadmap
fortement des cas d’usages en production. La majorité des cas d’usages pour les sont construites
fonctions Marketing et Vente sont au service de l’amélioration de la relation client avec les équipes 20% des roadmap sont
et les cas d’usages pour les opérations sont destinés à l’amélioration des processus. métiers et le top construites par le top
Nous observons également une forte hausse de cas d’usages en production au management management uniquement
bénéfice de la stratégie, les dirigeants s’étant emparés de la BI comme élément
d’aide à la décision et au pilotage grâce à des dispositifs BI fiables, et de l’IA comme
enjeu stratégique.
20 %

75 %

Partie 2 - Se transformer par la data


Fonctions de l’entreprise bénéficiant du plus de cas d’usages en production
et principaux « grands » cas d’usages répandus
5%
Connaissance
client
• 5% des roadmap sont
Pilotage des
ventes construites par la DSI

Data uniquement
Marketing

Forecast Suivi
IA d’indicateurs
documentaire de
• performance
Fraude •
Maintenance
prédictive
Analyses La data bien identifiée comme enjeu clé de la transformation
descriptives
à chaud

de l’entreprise
Indicateurs
65 % de Reportings
performance •
53 % Aide Reportings
à la gestion • Les capacités data sont reconnues comme un asset clé et s’inscrivent de plus
47 % Aide
à la gestion en plus dans les plans stratégiques des entreprises, souvent comme pilier de la
24 % transformation digitale. En ce sens, les activités data font désormais majoritairement
BAROMÈTRE 2024

18 %
12 % l’objet d’une planification cohérente à travers une feuille de route annuelle.
6%

Marketing Opérations - Opérations - Stratégie Finance Ressources R&D


& Vente service industrielles humaines

En 2023, le Marketing & Vente 77% 80%


fait partie du
TOP 3 Les métiers proposent de plus en
plus de cas d’usages d’eux-mêmes. Ce
des Directions
data ont formalisé
des entreprises
ont inscrit la data
des Directions métiers phénomène s’accélère d'ailleurs avec une roadmap dans leur plan
bénéficiant du plus l'essor de l'IA générative.
de cas d’usages data
stratégique stratégique
Chief Data Officer,
pour 65% des entreprises
secteur banque
50 51
ZOOM Une intervention data pour répondre aux enjeux règlementaires RSE

Les équipes data doivent s’organiser pour répondre aux enjeux des équipes métiers et

La data au service des enjeux


enrichir leur offre de service pour répondre à la fois aux challenges liés à la mesure et au
reporting règlementaire, mais aussi être au rendez-vous pour porter des cas d’usages de
réduction d’impact environnemental, au cœur des activités métiers.

RSE et du développement
durable
Reporting
Extra Financier
Règlementaire
40%
Des organisations data contribuent
au reporting règlementaire
La data doit maintenant faire face aux défis
RSE & développement durable La mesure et l’élaboration des reportings RSE reste l’une des principales contributions
des équipes data au service des directions RSE. La principale difficulté rencontrée réside
Dans l’ensemble des domaines métiers adressés par les Directions data, les sujets dans l’acquisition de données granulaires, pour passer d’un reporting ponctuel à partir
de développement durable se multiplient et semblent s’inscrire comme une toile de d’ordres de grandeur à un pilotage dynamique industrialisé répondant aux obligations

Partie 2 - Se transformer par la data


fond dans les nouveaux défis à relever pour la fonction data. règlementaires (notamment CSRD).

50%
des Directions data
La dynamique autour de la data a
été accélérée par des besoins RSE,
Une des difficultés est de trouver la bonne data, factualiser une situation et avoir
une mesure cohérente.
Lilian PLACET, Head of Data, GSF
notamment par la volonté de rendre
sont mobilisées pour notre reporting plus robuste.
répondre à des enjeux Laurent MISSET,
de développement Directeur Data & Analytics,
Une intervention data pour répondre aux enjeux opérationnels
durable CHANEL
Les autres cas d’usages adressés ciblent principalement des enjeux de réduction
d’empreinte carbone, d’amélioration de performance énergétique ou encore de
résilience climatique selon les secteurs.

Part des organisations adressant chaque thématique du développement durable,


et principaux secteurs s’étant emparés du sujet
BAROMÈTRE 2024

48% 29% 16% 3% 7%

Décarbonation Performance Adaptation Biodiversité Qualité


énergétique & résilience Hygiène
climatique Sécurité
FMCG Energie Assurance Institutions Services
Retail / Luxe Industrie Banque Construction Industries
Industrie Services Energie
Transports

48% des Directions data adressent des sujets de décarbonation, et


29% adressent des sujets de performance énergétique
52 53
De premiers grands cas d’usages génèrent d’ores
et déjà de la valeur
ZOOM
3 exemples de cas d’usages en production, intégrés aux processus cœur métier

Des premières initiatives apparaissent comme des facteurs clés


de succès RETAIL INDUSTRIE ASSURANCE
INTÉGRATION LOGISTIQUE PRÉVISION
Pour accélérer la démarche « Data for Sustainability », afin de bâtir des fondations D’INDICATEURS DÉCARBONÉE DE RISQUES
data robustes à l’échelle de l’entreprise, et pouvoir ainsi construire des cas d’usages CARBONE DANS CLIMATIQUES
« actionnables », des bonnes pratiques se détachent dans les organisations matures. LES RÉFÉRENTIELS Optimisation des
opérations, des Utilisation des bases
Intégration des flux et des chaînes de données Climat
indicateurs carbone dans d’approvisionnement,
historiques et des modèles
les référentiels produits et gestion intelligente
prédictifs, afin de prévoir
ou fournisseurs, pour des entrepôts
le niveau de probabilité
1 Structuration d’un Data Domain Sustainability dédié une prise en compte de
d’occurrence d’un risque
l’impact environnemental

Partie 2 - Se transformer par la data


climatique, et quantifier
dans la gestion des stocks
et approvisionnements au ses impacts humains,
quotidien matériels ou financiers
Nous avons créé un Data Domain Sustainability comme socle pour
nos cas d’usages, notamment 80% des rapports extra-financiers du groupe.
Charles-Antoine ROBELIN,
Head of Data Platform, DECATHLON
L’objectif : transformer la base Achat en CO2 pour piloter par les émissions.
Chief Data Officer, secteur industrie

Capture de données chaudes/dynamiques pour des analyses


2 Des grands challenges à adresser
et actions réalistes

Les principaux challenges à adresser par les organisations data pour être
au rendez-vous des enjeux de développement durable
Nous nous constituons des socles de données et avons structuré un data product
carbone scope 1,2 et 3 pour ainsi mesurer avec des données « chaudes/physiques » • S’approprier les frameworks méthodologiques spécifiques
et ne plus convertir des euros en carbone. (équivalences carbones, ACV...) pour comprendre les données et être en capacité
BAROMÈTRE 2024

Alexis TRICHET, de les modéliser selon les besoins de l’entreprise


Directeur de la Stratégie, Data & Connaissance client, ORANGE • S’approprier les bases de données de références externes (ADEME…)
et les mettre à disposition pour accélérer les reportings et permettre la réalisation
des cas d’usages
• Poser une gouvernance des données RSE sur l’ensemble du cycle de vie
3 Rétroaction dans les processus opérationnels et inscription dynamique de la donnée
dans les prises de décisions
• S’organiser en filière pour mesurer et agir de manière cohérente selon
des standards data partagés entre partenaires / sous-traitants / fournisseurs
afin de faciliter la mise en place de cas d’usages data & IA impactants
Nos modèles d’IA nous permettent de mieux utiliser l’énergie, en accélérant • Accoster les roadmaps RSE & data pour identifier les principaux leviers
ou en ralentissant nos usines pour réduire la quantité de gaz brulé, faute de de réduction d’impact tout en mettant sous contrôle le périmètre de données
consommation. associées pour pouvoir mesurer, agir et monitorer grâce à la data & l’IA
Chief Data Officer, secteur industrie • Limiter l’impact environnemental des usages de la data et de l’IA,
54 55
notamment énergétique
Les entreprises cherchent désormais
à se transformer par la data

Générer de la valeur à tous les niveaux de l’entreprise


Pour créer de la valeur par la data, les attentes et besoins de l’entreprise évoluent et
poussent les Data Offices à diversifier leurs offres de services pour jouer à la fois un
rôle DOer, d’enabler et de stratège.

Les CDO attendus comme stratèges pour transformer en profondeur

Partie 2 - Se transformer par la data


STRATÈGE
Orienter les décisions stratégiques

Participer à la disruption Proposer des cas d’usages disruptifs et/ou différenciants


de l’entreprise et de son
marché par la data & l’IA Les modèles d’affaires encore peu impactés
S’inscrire dans les programmes de transformations business
En capacité de délivrer les bons cas d’usages au service des métiers et d’apporter
des gains d’efficacité opérationnelle de manière tactique, les Directions data & IA
doivent à présent démontrer leur capacité à générer des avantages stratégiques et
Les CDO sont de plus en plus mobilisés dans leur fonction de conseiller stratégique des nouveaux revenus pour impacter le modèle d’affaires de l’entreprise.
pour actionner au mieux les opportunités générées par la data & l’IA et impacter le
modèle même de l’entreprise.
• Chiffre d’affaires

Nous collaborons directement avec les CEO et le management fonctionnel des


80%
des entreprises
Création de valeur
sur la top line
• Parts de marchés,
• Volume de ventes


différentes enseignes pour réfléchir aux grands cas d'usages stratégiques au-delà • Panier moyen
de l'instruction de quick wins opérationnels apporteurs de valeur immédiate. cherchent désormais
à créer de la valeur
BAROMÈTRE 2024

Sophie GALLAY, Directrice Data Groupe, ETAM


en agissant à la fois • Coûts
sur leurs coûts et Création de valeur
• Marge
sur la bottom line
leurs revenus
• Productivité
Les ambitions portées par la data L’ambition globale est de soutenir
s’inscrivent dans la stratégie globale le business qui a un programme
de l’entreprise. L'un de nos objectifs d’amélioration de l’EBITDA dont
clé par exemple est de favoriser nous sommes contributeurs.
et soutenir l'innovation à travers Fabien DENEUVILE, Avant, la data, c'était assez opérationnel (usages internes), alors que maintenant, on
le Groupe. Head of Data Science, recherche de la croissance : nous sommes désormais un réel support de la proposition
Chief Data Officer, Modulaire Group de valeur, avec des services et produits data intégrés à notre catalogue d'offres.
secteur banque Group Chief Data & Digital Officer,
secteur services

56 57
Le potentiel de valeur encore mal estimé Les Directions data peinent à démultiplier
à l’échelle de l’entreprise leur impact à l’échelle

Un ROI rarement mesuré en production Les Directions data peinent à développer des cas d’usages réplicables à l’échelle
de l’entreprise : impact sur plusieurs Directions métiers, déploiement à des
L’estimation du ROI en amont des projets est devenue courante à des fins de
échelles géographiques importantes (plusieurs usines, plusieurs pays…). Les cas
priorisation et de sponsorsphip. En revanche, la valeur réellement dégagée pas les
d’usages développés jusque-là sont majoritairement tactiques et répondent à des
solutions data et IA est encore largement méconnue.
besoins spécifiques, peu transverses.

Un manque de pilotage par la valeur On observe plusieurs difficultés :


Les 2/3 des Directions data pilotent leur activité exclusivement sur la base d’objectifs
disparité des process métiers
de moyens ou d’activités. Le tiers restant s’engage partiellement sur des métriques

Partie 2 - Se transformer par la data


métier, mais sans engagement chiffré. disparité des systèmes IT

Il est évident qu’une part importante de la valeur dégagée reste diffuse et qualitative : plateformes peu matures
satisfaction client / collaborateur, image, mitigation des risques… Néanmoins,
une gouvernance des données ne permettant pas de passer
l’estimation des euros économisés ou gagnés grâce à la data reste un prérequis pour
à l’échelle de manière uniforme / homogène.
assoir sa légitimité et convaincre les métiers.

Pour pouvoir faire atterrir des projets emblématiques, les Data Offices doivent
Type d’objectifs suivis par les Directions data en 2023 recentrer leurs efforts sur la mise en œuvre d’un écosystème « fertile » en mettant
à disposition les capacités nécessaires (Data Plateform, cadre de gouvernance des
Engagements de valeur - chiffrés 16 % données et des outils, offre self-service, modèle organisationnel déployé...).

Engagements de valeur - qualitatif 16 %

Engagements de moyens / d’activité seuls 63 %

Aucun objectif 5%
Nous priorisons le passage à l’échelle des cas d’usages actuels par rapport
BAROMÈTRE 2024

au développement des nouveaux « Proofs Of Concept ». Cela nous permet


de démontrer l’apport de valeur aux métiers et donc de mieux les engager
sur les projets de transformation en cours.
Seuls Hind MECHBAL,

16%
CIO, CCR RE
des CDO sont responsabilisés sur
des objectifs de création de valeur chiffrés

58 59
Les Data Offices attendus comme «enabler» Un nécessaire rééquilibrage de l’offre de service
pour transformer largement et rapidement des Directions data

Volontairement dans un rôle de DOer pour insuffler une dynamique en phase Pour passer à l’échelle, les Data Offices les plus matures doivent progressivement
d’amorçage, les CDO cherchent désormais à se positionner comme «enablers» pour mettre la réalisation de cas d’usages « tactiques » aux mains des équipes métiers, et
démultiplier la capacité à industrialiser et couvrir l’ensemble des opportunités de s’appuyer sur l’hybridation et le Data Mesh pour ne pas être goulot d’étranglement
création de valeur par la data. face à l’augmentation du volume de cas d’usages à adresser. Ils se placent alors dans
un rôle d’enabler.
Pour cela, les Data Offices semblent vouloir dédier leur force de frappe en tant que
DOer à la réalisation de cas d’usages stratégiques pour le groupe et déléguer la
réalisation de cas d’usages tactiques aux équipes métiers afin de se concentrer sur Identifier des cas d’usages pour répondre aux besoins métiers

leur rôle d’enabler.


Développer et maintenir les flux de données

Produire des solutions analytics & IA industrielles

DOER
La Direction data n’a pas vocation à prendre toute la chaîne de valeur data, Réaliser des cas d’usages BI

Partie 2 - Se transformer par la data


notre valeur doit être demain sur la partie high level et la mise en capacité.
Identifier, cadrer et mettre Mettre en œuvre le data management
Directeur Data Groupe, secteur luxe en œuvre des d’usages
data intégrés aux
processus opérationnels Délivrer des cas d’usages aux métiers les moins matures

Les attentes vis-à-vis du Data Office comme «enabler» proviennent à la fois des Construire des bases de données
équipes métiers...
Réaliser des expérimentations
Les programmes d’acculturation lancés ces dernières années et le niveau de
1
culture data des populations métiers leur permettent aujourd’hui d’identifier Gérer le run des produits data & IA
des usages, d’exprimer des besoins et de solliciter des moyens pour les réaliser
eux-mêmes
Une volonté de revoir l’équilibre entre DOer et Enabler pour mieux
Certaines technologies no code/low code sont considérés comme accélérateurs passer à l’échelle
2
de la décentralisation (principalement PowerBI et Dataiku)

Les métiers matures veulent pouvoir expérimenter de manière autonome sans Orienter les choix d’organisation et de gouvernance
3
s’inscrire dans des démarches projets formelles
Orienter les choix technologiques
ENABLER
BAROMÈTRE 2024

...et de la DSI Orienter les choix scientifiques

Des attentes grandissantes de la DSI vis-à-vis de la data comme pilier dans les Structurer la fonction data Poser le cadre de gouvernance des données,
1 et organiser ses activités
programmes SI (CRM, ERP, E-Commerce…) des plateformes et des outils
pour sécuriser
et mettre le patrimoine
Des produits digitaux nécessitant un apport d’expertise data pour bâtir des data & IA au service de Développer et maintenir le socle data
2
architectures robustes et un écosystème digital cohérent la performance de
l’entreprise
Former les équipes techniques, scientifiques et projets
Porter l’expertise,
les connaissances et Acculturer l’organisation à tous les niveaux
La majorité des sondés estiment être principalement savoir-faire data de
l’entreprise et en faire
orientée « livraison de produits finis » et un asset actionnable Apporter de l’expertise dans les programmes SI (ERP, CRM...)

+ de 60% des directions


veulent tendre vers une offre de service « Mise à disposition de moyens »
Mettre à disposition les outils et exposer les données
pour permettre l’usage

Assurer la veille règlementaire et mise en conformité


60 61
Synthèse et analyse

Les Directions data délivrent désormais efficacement de la valeur de


manière tactique grâce à une maîtrise de l’industrialisation des cas
d’usages au service de l’ensemble des métiers de l’entreprise. Cependant,
Nous avons mis en place Aujourd’hui, nous travaillons surtout bien que des usages soient maintenant en production et que le calcul
une offre de service data pour tous  : des produits finis; nous devons poser d’un ROI prévisionnel par projet se soit systématisé, l’apport de la data à
mise à disposition d’outils pour la gouvernance du self-service pour l’échelle des enjeux stratégiques de l’entreprise est encore difficilement
faciliter la réalisation de l’exploration mettre à disposition des données estimé et chiffré.
des données à l’industrialisation. et répondre à l’engouement métier Cette génération de valeur par les cas d’usages semble se heurter à
CDO, acteur des services autour de PowerBI. deux difficultés :
Lilian PLACET, la position de goulot d’étranglement du data office dans son rôle
DSI Adjoint CIO Office, GSF de DOer
le passage à l’échelle des cas d’usages

En parallèle, la culture data des métiers leur permet maintenant d’être


autonome dans l’identification proactive de cas d’usages et parfois

Partie 2 - Se transformer par la data


Nous avons réussi à répandre Nous avons la volonté en 2023 dans leur réalisation. Cependant, ces équipes attendent maintenant les
l’utilisation de Dataiku, couvrant de nous rapprocher du 50/50 entre Directions data dans leur rôle d’ENABLER pour structurer un écosystème
aujourd’hui 80% de nos projets Data produits finis et mise à disposition fertile (outils, données, compétences et cadre de gouvernance) et favoriser
Science. d’outils. l’innovation au service des métiers.
Chief Data Officer, secteur banque Laurent BEUGNET,
Chief Data Officer, Orano D’autre part, les Directions data sont désormais attendues par leur COMEX
en tant que STRATEGES pour réussir à impacter les modèles d’affaires.
Les Data Offices sont donc attendus dans un triple rôle pour adresser
la création de valeur à tous les niveaux de l’entreprise :
la data comme STRATEGE, auprès des dirigeants et du top
management en demande de vision technologique / business
la data comme ENABLER, auprès des Directions métiers en demande
d’autonomie et de capacités robustes
la data comme DOer, pour accélérer l’entreprise et la
transformation auprès des métiers peu matures et des fonctions
transverses
BAROMÈTRE 2024

Les organisations cherchent aujourd’hui à rééquilibrer leur offre de service


pour mieux répartir le rôle de DOer et mieux répondre aux attentes dans
leur rôle d’enabler et de stratège. Les Data offices devront pour cela
s’appuyer sur un modèle opérationnel adapté et une gouvernance des
plateformes, données et outils mature et cohérente.

Transformation du rôle des Directions data pour répondre aux enjeux de


l’entreprise
AUJOURD’HUI DEMAIN

62 DOER ENABLER STRATÈGE DOER ENABLER STRATÈGE 63


- Partie 3 -

TROIS GRANDS
DÉFIS À RELEVER
EN 2024 POUR
ADRESSER

Partie 3 - Défis à relever


L’ENSEMBLE
DES LEVIERS
DE GÉNÉRATION
DE VALEUR PAR
BAROMÈTRE 2024

LA DATA

64 65
Défi #1
S’inscrire dans les enjeux
stratégiques de l’entreprise 1

Placer la data et l’IA dans l’agenda des décideurs :


passer de l’acculturation à l’action
Une fonction encore trop éloignée du Comex ?
Depuis 2020, les CDO les plus matures ont généralement accordé une place
Les initiatives data & IA transforment les usages, l’organisation et souvent même les
importante dans leur feuille de route à l’acculturation data & IA des dirigeants et du
relations clients / fournisseurs / employés, et en ce sens, les Chiefs Data Officers (CDO)
top management. Les programmes initiés ont dans l’ensemble porté leurs fruits et
occupent un rôle de plus en plus stratégique au sein de l’entreprise.
permettent à la data de figurer à présent dans les plans stratégiques des entreprises
Pourtant, depuis que le rôle de CDO s’est développé, son positionnement hiérarchique avec des budgets alloués.
par rapport au COMEX a peu évolué.

Ainsi, moins de 15% des CDO sont directement rattachés au COMEX. Cela concerne
Toutefois, l’écosystème data et l’IA évolue rapidement, mû par d’importants
des entreprises de toutes tailles et maturité, partageant toutefois un point commun :

Partie 3 - Défis à relever - Défi #1


progrès :
une volonté d’accélérer sur la data pour en faire un axe de différenciation ou rattraper
un retard perçu par rapport au marché. technologiques (exemple: IA générative)

réglementaires (exemple: AI Act Européen)

socio-économiques (exemple: impact de l’IA sur l’emploi et l’organisation


Part des Directions data rattachées au COMEX En 2023, seulement

13%
du travail)
2021 2023 des CDO
COMEX 11 % 13 %
sont directement De plus en plus, les décideurs se tournent alors vers la Direction data pour décrypter
Hors COMEX 89 % 87 % ces enjeux. La capacité d’actions des CDO varie en fonction de leur maturité et de
rattachés au COMEX leur champ d’actions. Les plus matures saisissent l’occasion de façon proactive, pour
sortir de leur pré-carré naturel et animer des groupes de réflexions interdisciplinaires
afin de proposer des stratégies à l’échelle de l’entreprise via une offre de services
La majorité des Directions se situent en N-2 par rapport au COMEX, mais de nombreux structurée. Ils jouent alors un rôle de conseiller stratégique et plus seulement
CDO et professionnels de la data militent pour un rattachement plus direct à la d’évangélisateur. D’autres, souvent moins matures et plus centrés sur un rôle de
Direction, avec pour ambition de gagner en visibilité et en influence sur les enjeux DOer, ont un positionnement plus attentiste.
BAROMÈTRE 2024

stratégiques de l’entreprise.

Bien que ce rapprochement puisse être bénéfique, il n’est pas strictement nécessaire.
Pour répondre à ces attentes de conseil, les Directions data s’emparent
En effet, les CDO les plus matures développent déjà leur posture de leader et
également de nouveaux mandats :
leur capacité d’influence sans rattachement formel au COMEX. Pour réussir, ils
s’appuient sur 3 principes. • Proposer une interprétation stratégique des tendances technologiques
S’assurer d’être en capacité de « digérer » les disruptions technologiques comme
Placer la data et l’IA dans l’agenda des décideurs :
1 l’IA générative en expérimentant rapidement pour se bâtir des convictions sur le
passer de l’acculturation à l’action
potentiel pour l’entreprise et les opportunités à saisir ou non
S’inscrire dans les grands programmes de transformation SI et digitaux
2 • Représenter l’entreprise dans l’écosystème data et dans la filière
en tierce partie transverse
Faire rayonner les initiatives data de l’entreprise au sein du secteur et des acteurs
S’inscrire dans les transformations métiers : bâtir des partenariats forts tech, pour bénéficier de partenariats technologiques, rester à l’état de l’art, être
3
et continus avec les Directions métiers pour co-construire des trajectoires au cœur des réflexions sectorielles et ainsi être leader sur son marché dans la
communes transformation de l’entreprise
66 67
2 3

S’inscrire dans les grands programmes S’inscrire dans les transformations métiers :
de transformation SI et digitaux en tierce partie bâtir des partenariats forts et continus avec
transverse les Directions métiers pour co-construire
des trajectoires communes
Les Directions data semblent de plus en plus attendues dans l’apport d’expertise aux
programmes transverses. Pour répondre à ce besoin, elles se mettent en capacité Les Directions data les plus matures se retrouvent désormais en position de co-
de s’inscrire dans les programmes SI et participer à la cohérence globale du SI sponsoriser des projets ambitieux business/data pour inscrire la data dans le modèle
d’entreprise (règles métiers, modèles de données, décisions d’architecture...) pour en d’affaires de l’entreprise à travers des produits robustes et matures, construits sur
faire un « terrain fertile » aux cas d’usages à venir. la durée et inscrits dans les processus métiers (ou dans les catalogues de produits,
La valeur d’une donnée dépend en grande partie de sa capacité à circuler sans entrave offres de services...).
à travers l’entreprise. Dans une banque par exemple, les données produites au sein Cela donne alors lieu à des produits matures intégrant, par exemple, les catalogues
de la division paiement présentent un intérêt majeur pour le marketing, en matière de services proposés aux clients comme différenciateur marché.

Partie 3 - Défis à relever - Défi #1


de connaissance client.
Cette collaboration de proximité passe par un accompagnement du métier dans les
Or, les données restent encore largement silotées by design, franchissant difficilement réflexions business de valorisation de la donnée (business model d’un produit data,
les barrières organisationnelles. En cause, un manque de leadership reconnu et de monétisation de données...) et des binômes CDO/Directeurs alignés.
ressources au service de la transformation data transverse, qui poussent les métiers à
prioriser les initiatives data dont ils sont directement bénéficiaires sur leur périmètre.

Au lieu d’opérer au sein des divisions organisationnelles, les CDOs les plus matures
interviennent en tierce partie. Ils alignent les intérêts des métiers producteurs
et consommateurs de données, sécurisent le sponsorship, et lorsque nécessaire,
appellent les métiers à mutualiser leurs ressources sur des projets communs.

Cela passe par le lancement de chantiers « fondations » pour amorcer la pompe :


identifier des terrains de jeu transverses à fort potentiel (domaine de données
cœur métier par exemple) pour préparer le patrimoine de données en tierce
partie afin de le rendre exploitable par les métiers et encourager la réalisation
de cas d’usages.
BAROMÈTRE 2024

68 69
SUCCESS STORY

Leader dans le secteur


de l’ingénierie

Problématique

Porté par un important plan de transformation de l’entreprise visant à devenir un

Partie 3 - Défis à relever - Défi #1


leader mondial dans les secteurs de l’ingénierie et de la mobilité, le groupe souhaite
avancer rapidement sur sa transformation data pour en faire un fort accélérateur de
croissance pour le groupe.
Une importante évolution de l’offre de valeur data était donc attendue pour répondre
favorablement aux enjeux opérationnels et stratégiques de l’entreprise.
Résultats

Une vision claire, structurée et partagée de la stratégie data du Groupe déclinée


pour les business lines
Démarche 5 dimensions majeures adressées en parallèle pour structurer et conduire la
transformation data sur 2 ans
Dans une optique d’offre de valeur holistique, l’organisation centrale en charge de la Un modèle organisationnel et un cadre de gouvernance permettant de :
data a défini et mis en œuvre un plan stratégique complet selon un horizon temporel
- structurer rapidement les activités et assurer une montée en puissance
à 2/3 ans à partir de :
des métiers
• l’ambition du groupe, pour définir des objectifs chiffrés
-a
 dapter le niveau d’hybridation et l’offre de service de la data factory et
BAROMÈTRE 2024

• les besoins de transformation du groupe pour utiliser la data comme socle dans les du data office selon les besoins métiers, les domaines concernés et les
programmes SI & digitaux (CRM, ERP, BI...) types de projets : delivery de produits fini, mise à disposition de données,
• les besoins opérationnels des équipes métiers pour identifier les bons cas d’usages apport d’expertise...
(IA, Optimisation...). Un nouveau processus de valorisation des cas d’usages data/IA objectivant et
Ce plan stratégique a ensuite été opérationnalisé rapidement sur l’ensemble des validant les intérêts économiques, métiers et environnementaux des cas d’usages
dimensions data : Data Plateform, cas d’usages, déploiement de la fonction data, data en collaboration avec les Directions transformation et financière
foundations,..) grâce à un sponsoring COMEX fort et aux bonnes synergies avec les Une nouvelle Data Plateform Cloud désignée selon les principes du Data Mesh,
autres programmes de transformation du groupe (IT & Business). à même de supporter la transformation data et technologique du Groupe en
tant que tierce partie fournissant un écosystème propice à la génération de cas
Le modèle opérationnel cible a été défini en prenant en compte les spécificités d’usages transverses et locaux : délivrer les cas d’usages transverses et outiller la
métiers comme la maturité hétérogène des business lines, la technicité des données à transformation digitale des métiers
adresser ou encore la demande d’autonomie des équipes terrain dans la manipulation De premiers cas d’usages data/IA sont valorisés, cadrés et développés par la Data
de données. C’est notamment ce qui a appuyé le choix d’un déploiement rapide du Factory et par des entités data locales dès les premiers mois de transformation
Data Mesh technique et organisationnel. pour les fonctions cœur métier et fonctions support
70 71
Exemple de schéma d’organisation de la fonction data dans l’ingénierie
SUCCESS STORY
Une entité digitale proche des équipes cœur métier pour
transformer les activités en profondeur en mettant la puissance
des produits digitaux et data au service du métier d’ingénieur

Un modèle organisationnel qui s’adapte à la maturité de chaque business line


avec un mandat de la DSI qui évolue en conséquence : d’abord DOer puis Enabler
DSI Groupe BUSINESS LINE #1 – Maturité basse

Business Team

Partie 3 - Trois grands défis à relever en 2024 pour adresser l’ensemble


BUSINESS LINE #2 – Maturité moyenne

des leviers de génération de valeur par la data


Digital for
Digital Factory Engineering
Business Data & Business Teams
Digital Lab

Partie 3 - Défis à relever - Défi #1


Digital Office BUSINESS LINE #3 – Maturité haute

une fois le métier autonome


Infrastructure
& Opérations Data &
Digital Lab Business Teams

Data Office

Fonctions Supports

Ressources humaines
Group
Data Factory Application
BAROMÈTRE 2024

& Data
Finances & contrôle de gestion

Ventes & commerce

RSE

Une collaboration DSI & fonctions supports pour


accompagner efficacement les programmes transverses
en s’appuyant sur la force de frappe Data Factory
ORGANISATION & ARCHITECTURE DATA MESH
• Data as a Product
Interfaces définies selon le cadre de gouvernance
72 • Data Contracts de la fonction data commun et partagé : mandats, 00
73
• Data Product Owners rôles, processus et comitologie
SUCCESS STORY

Exemple de schéma d’organisation


de la fonction data dans l’ingénierie

Principales activités data par entité

Data Office

Partie 3 - Trois grands défis à relever en 2024 pour adresser l’ensemble


Data Gouvernance
Formation & Recrutement &
Data Strategy & Data
Acculturation Organisation
Management

des leviers de génération de valeur par la data


Partie 3 - Défis à relever - Défi #1
Infrastructure & Opérations Data Factory

Gestion &
Data Platform Méthodes & Data Platform Product
Administration FinOps
Infrastructures standards Management Development
des outils

Digital for Engineering Business Group Application & Data

Portfolio Product Portfolio Product


Management Management Management Management
BAROMÈTRE 2024

Data & Digital Lab

Portfolio Product Product


Management Management Development

Business Team

Idéation et
Data Product Participation à
expression de
ownership l’acculturation
besoins
74 00
75
Défi #2
Piloter les Directions data
par la valeur

Partie 3 - Trois grands défis à relever en 2024 pour adresser l’ensemble


Des engagements de valeur partagés par le métier
et la data

des leviers de génération de valeur par la data


Les entreprises matures sont plus nombreuses à demander des engagements
business communs aux CDO et aux lignes métiers pour renforcer l’alignement de
leurs feuilles de route.

Partie 3 - Défis à relever - Défi #2


Cette approche fonctionne généralement sur les principes suivants :
chaque ligne métier s’engage sur un cash-in annuel data en €
les projections sont fixées en commun avec un représentant métier rattaché
à la Direction data, lui-même objectivé
pour atteindre l’objectif, chaque représentant aide sa ligne métier à :
- établir une feuille de route
- piloter la réalisation des usages en lien avec la direction data et la DSI

La Direction financière comme partenaire


Pour occuper pleinement leur rôle de stratège, les CDO matures ont mis en place des
systèmes de mesure en partenariat avec la Direction financière1.
BAROMÈTRE 2024

Celle-ci est principalement impliquée à 3 niveaux :

définir la méthodologie de chiffrage

contrôler les hypothèses pour chaque cas d’usages

valider les résultats

C’est une façon, pour les métiers, de sécuriser leurs objectifs business, et pour la data,
de légitimer son offre de valeur et ses demandes d’investissement ou de ressources.
(1) Dans certains cas, la Direction de la transformation peut jouer ce rôle de partenaire.

76 77
00
Exemple d’une organisation data orientée ROI
chez un acteur industriel (Organigramme simplifié)


Budget Régalien

Budget Régalien
DSI Data Factory

Coûts directs : construire et Coûts directs : gestion


faire évoluer le socle technologique patrimoine commun & normes
Coûts indirects : industrialiser Coûts indirects : incubation,
les traitements de données formation, conseil

DSI – Data Factory €


Complément de budget prélevé
sur enveloppe métier
Chief Data Officer

Partie 3 - Défis à relever - Défi #2


• Études
• Cadrage projet
• Développement produit
• Lead Tech
Data Science • Maintenance
• Data Scientists
& ML
• MLE Métier -
Business Lines

• Data Eng.
Data Pipelines Data Product Business Data Domain #1
• Développeurs Data Owners Data Stewards Data Analysts
& Platforms Manager sponsors Fabrication
• Data Analysts

• Data Eng.
Analytics Data Product Business Data Domain #2
• Développeurs Data Owners Data Stewards Data Analysts
Application Manager sponsors R&D
• Solution Architects
BAROMÈTRE 2024

• Data Managers
Data Gov. Data Product Business Data Domain #3
• Data Consultants Data Owners Data Stewards Data Analysts
& Strategy Manager sponsors Ventes & Mkg.
• Project Leads

Business Controller
DAF délégué Data

78 79
Une méthode de valorisation à formaliser

Exemple d’une méthode de valorisation à l’état de l’art d’un acteur industriel


Formaliser le pilotage de bout-en-bout

La plupart des entreprises ont mis en place un processus de pilotage par la valeur en
amont du lancement des projets data, pour prioriser les opportunités et cibler les cas Un portefeuille piloté par la valeur
d’usages prometteurs. En revanche, seules les entreprises les plus matures pilotent la
valeur dégagée durant le développement et l’exploitation des solutions data. Revue mensuelle du portefeuille de projets data
Cet exercice nécessite une revue régulière du portefeuille et s’appuie de plus en
plus sur des Dashboards dédiés, permettant aux équipes data, DSI et métiers de
centraliser les informations relatives au niveau d’utilisation, à la disponibilité et la Cadrage Build Run
performance des solutions data.

Engagement sur ROI Mesure de gains / Suivi continu de métriques


Formaliser le chiffrage des cas d’usages estimatif / prévisionnel coûts réels métier/ dérive

Partie 3 - Défis à relever - Défi #2


Les entreprises matures s’appuient sur des méthodes de valorisation articulées
autour de 4 éléments.
Dashboard de suivi
Modèle économique : quelle métrique utiliser pour la valorisation
1
(ex: ROI, Cash-in, score…) ? Comment estimer chaque métrique sur la base
de valeurs connues (ex: nombre d’heures économisées x coût horaire
moyen x nombre d’utilisateurs) ? Performance data validée par la DAF en fin de cycle budgétaire

Principe de valorisation : quelles sont les règles de calcul et hypothèses


2
admises pour simplifier/robustifier l’estimation (ex : courbes d’adoption type,
taux de croissances annuels moyens…)
Une méthode de valorisation commune et validée par la DAF

Métriques & ratios : quels sont chiffres clés ou les ordres de grandeurs sur
3
lesquels s’appuyer par défaut (ex: chiffre d’affaires, salaires moyens, coûts Modèle Principes de Métriques Clés de
BAROMÈTRE 2024

économique valorisation & ratios répartition


d’hébergement…) ?

Clé de répartition (optionnel) : comment répartir la valeur générée entre Data,


4 Entreprise
métier et DSI dans le cadre d’une comptabilité intra-entreprise formelle? Inducteurs de Lissage des valeurs
(CA, marge…)
Contributions
gains / coûts directes & indirectes
Hypothèses de la data, DSI
Abaques coûts
Équations types de ramp-up et métier
projets data
Ces méthodes permettent de simplifier le travail d’estimation, de fiabiliser les
comparaisons entre projets et de générer un meilleur consensus autour des
estimations.

80 81
Défi #3 On veut tendre vers une organisation Data Mesh à partir de l'année prochaine
pour décentraliser la gestion de l’infrastructure et ainsi alléger les processus
Démultiplier l’impact de notre datalake.
Head of AI Factory, secteur luxe

de la data à l’échelle
Une réponse aux enjeux des Directions data et DSI
avec le Data Mesh Le Data Mesh adresse des enjeux partagés par la plupart des Directeurs data :

équipes centralisées sous dimensionnées par rapport


Un modèle qui continue de se populariser à des besoins métiers croissant

La part des entreprises qui s’appuie sur des concepts Data Mesh pour transformer pratiques data hétérogènes à travers l’organisation
l’organisation data a bondi de 13% à 78% en l’espace d’un an. Encore en phase
règles de gouvernance difficiles à faire respecter
exploratoire, la plupart des entreprises déploient le modèle sur un nombre restreint
de data domains, et testent seulement les premiers Data Products en condition de données silotées peu partagées
run. Cependant, la majorité des sondés sont enthousiastes et souhaitent persévérer
dans la direction choisie pour 2024. En réponse à ces enjeux, le Data Mesh propose une vision claire :

Partie 3 - Défis à relever - Défi #3


autonomiser au maximum les métiers en leur donnant le mandat,
Implémentation de concepts Data Mesh au sein des entreprises sondées
les incitations et les moyens nécessaires

13 % favoriser l’échange de données entre pairs sans passer


par l’intermédiation systématique du Data Office
Data Mesh, nous sommes en
plein dedans, notamment pour
78 %
accélérer notre vélocité sur les
OBJECTIFS DU DATA MESH
fondamentaux data (plateforme &
Oui
data gouvernance) via la définition
Non des data domains et la création de
87 % 27 % 1 Réduire les goulots d’étranglement sur les équipes centralisées
notre Data Platform Office.
2022 2023
Antoine LY,
Chief Data Science Officer, SCOR 2 Conserver l’expertise métier au plus près de la donnée

Nous avons un objectif de 6 data products d'ici à la fin de l'année. Nous en avons 3 Faciliter et étendre l’usage des données en dehors des silos
BAROMÈTRE 2024

déjà un en place sur l'algorithme de recommandations personnalisées par


exemple. En top down, nous avons plus de difficultés à identifier les data products
susceptibles de répondre de façon directe à des douleurs exprimées par le top
4 Clarifier les responsabilités de chacun autour de la data

management, même si de très bonnes pistes commencent à émerger.


Brice MIRANDA, Autonomiser les métiers Favoriser le Peer 2 Peer
Data, AI & Automation Deputy, ORANGE
Relais métiers renforcés
et responsabilisés Producteurs incités
à partager leurs données
Données gouvernées ORGANISATION
Certains choix d'architecture
par leur producteur & ARCHITECTURE SLA / QLA
La logique Data as a Product est s'appuient sur les concepts du Data
Gouvernance centralisée FÉDÉRALES Données cataloguées
inscrite dans les objectifs cibles. Mesh, notamment en matière
d'accès à la donnée. réduite au minimum
Chief Data Officer, Secteur Banque API first
Loïc BRIENT, Stack modulaire
82 Chief Data Scientist, BPCE en self-service 83
Nous avons prévu, dès le départ, du Data Mesh car les filiales sont très
indépendantes, avec des P&L et des statuts juridiques indépendants. Donc on
4 leçons apprises sur le terrain
peut dire aujourd'hui que chaque société a son datalake et il y a des passerelles
1
qui sont créées.
Chief data Officer, secteur industrie Piloter la transformation de manière unifiée

Trop souvent, des projets Data Mesh émergent indépendamment dans l’entreprise
de façon non coordonnée. Or, le principal apport du Data Mesh est justement
d’offrir une vision, un vocabulaire et une trajectoire commune aux multiples parties
Depuis l'an dernier, nous souhaitons aller vers une logique prenantes de l’entreprise.
Data Mesh, pour améliorer l'accès à la donnée.
CDO, secteur luxe Assurez-vous d’avoir

• un programme officiel et visible au niveau COMEX


• un leader et une gouvernance dédiée
Une transformation profonde de l’organisation data
Le Data Mesh est avant tout une transformation organisationnelle visant à

Partie 3 - Défis à relever - Défi #3


décentraliser le data management (self-service, autogestion des données par le 2
métier...), tout en offrant la cohérence nécessaire pour que les données circulent
sans entrave à travers l’organisation (standards, socles communs, interopérabilité...). Prioriser l’organisation avant la technologie

D’un point de vue technologique, le Data Mesh ne repose pas sur des composants Le Data Mesh est avant tout une transformation organisationnelle. Les arbitrages
d’architecture particulièrement innovants (ex: Data catalogues, ETLs, Datalakes...). technologiques doivent succéder aux choix d’organisation et de gouvernance.

C’est l’alignement entre les choix technologies et la transformation organisationnelle Assurez-vous d’avoir répondu aux questions clés avant d’engager
qui représente la réelle innovation. des transformations technologiques ou de développer
des produits data :

4 principes fondamentaux* • Comment se redéfinissent les responsabilités entre data, DSI et métier ?
• Qui est en charge de construire et d’opérer les produits data ?
1- Domain Ownership 2 - Data as a Product
• Quelles compétences et ressources pour rendre cela possible ?
Déléguer la gestion des données Responsabiliser des équipes
aux métiers les plus proches pluridisciplinaires sur le cycle
du contexte d’utilisation de vie d’une donnée
BAROMÈTRE 2024

Promouvoir les échanges de pair Promouvoir une utilisation fiable


à pair sans intermédiation et autonome notamment via des Transformer l’organisation Transformer l’architecture
APIs, et des SLAs

Création de nouvelles structures Modularisation


3 - Federated Computational 4 - Self-Service Infrastructure (ex : Data Domains) de la stack
Governance as a platform
Equilibrer l’autonomie des Data Permettre aux utilisateurs de Nouvelles façons de travailler Interopérabilité
(ex: mode produit vs projet) des composants
Domains et l’imposition de normes construire leur stack technique
collectives (interopérabilité, sur un socle commun garantissant Nouveaux rôles Harmonisation
sécurité…) l’interopérabilité (Data Product Owner) des modèles sémantiques
Favoriser l’implémentation Offrir des capacités centralisées
des normes directement dans utiles à tous (ex : catalogue Changement de culture / incitations Implémentation d’une
« le code » des Data Products de données) (partage vs silotage des données) couche d’observabilité

84 * Source : Zhamak Dehghani, Analyse Quantmetry 85


Une transformation progressive et ciblée
Les organisations relèvent ces défis de façon progressive en insistant sur les éléments
du Data Mesh qui leur paraissent prioritaires.

Exemples de stratégies Data Mesh d'entreprises issues de secteurs variés

Acteur de Acteur de la grande Acteur Acteur du


Acteur Bancaire Acteur de la santé
l’automobile distribution du transport divertissement

1 Data Domain par 1 Data Domain


fonction métier par fonction métier
Chaque objet métier Structuration des • •
est assigné à un Data Equipes de delivery Data Domains avec les
de la Data Factory Ownership métier sur Ownership métier sur
Domain Le corporate et les Business Units
Domain structurées selon les chaque domaine chaque domaine
• regions sont alignés sur •
Ownership domaines fonctionnels • •
Les Data Domain les Data Domains Identification des
(vs decoupage Alignement sur Alignement sur
Owners sont en place technique) principaux objets
les principes de les principes de
avec un budget dédié business
fonctionnement entre fonctionnement entre

Partie 3 - Défis à relever - Défi #3


Data Squads et Digital Data Squads et Digital
Products Products

Standardisation des
organisations locales Accords et alignements
Gouvernance et de la gouvernance inter-métiers sur
inter-domaines en region la Data Policy et la
Federated Le modèle Le modèle
Computational • • Sharing Strategy opérationnel est aligné opérationnel est aligné
Governance Standards • entre les entités entre les entités
La France comme
d’interopérabilité colonne vertébrale Définition de processus
pour produire des cas communs
d’usages réplicables

Framework
de Data Contract
Approche Produit Définition de 3 types
• Accords et alignements
Standardisations des de Data Products :
sur les standards •
Data As a Product Templates formats d’exposition Data Analytics, Data
BAROMÈTRE 2024

d’exposition de la Standardisation des


de Data product selon les cas d’usage Science (API) and
donnée (Data Product) Data Products
• Dashboard products
Plateforme API

Normalisation des Data Products exposés


interfaces avec la Data à travers une solution
Self-Service Plateforme Groupe Une offre de service Data Products unique (Snowflake)
Infrastructure • unique à l’echelle du exposés à travers une avec des espaces dédiés
as a Platform groupe (Snowflake) solution unique par Data Domain et
Choix imposé 3 couches de stockage
aux stakeholders (Raw, Silver, Optimized) High implementation
Medium implementation
No implementation
86 87
Exemple de feuille de route type pour le déploiement d’un Data Domain
3
Rester pragmatique

Le Data Mesh offre un cadre théorique utile, mais ses Mois


principes se heurtent parfois à la réalité terrain. Les
Phase Activité clé
entreprises qui réussissent suivent un parcours de
transformation qui leur est propre. T1 T2 T3 T4

Assurez-vous d’avoir
Identifier les candidats puis nommer
• une approche pragmatique, itérative et adaptée
un Data Domain Officer
à votre maturité et vos priorités
Recruter et onboarder
les Data Stewards

4
Identifier les réseaux de contributeurs

Partie 3 - Défis à relever - Défi #3


Délivrer des résultats rapidement data et la comitologie en place

Le Data Mesh est une transformation profonde et Recenser les compétences existantes
progressive. Pour autant, il faut cibler ses efforts sur des Data Scientist, Analyst, Engineer, Data
victoires accessibles afin de maintenir la dynamique. Build Owner, Data Manager…
sur 5 mois
Recenser les cas d’usages
Assurez-vous d’avoir data existants

• fractionner le déploiement en phases : Mettre en place une comitologie et


lancer au plus 2 à 4 Data Domains à la fois des KPIS suivant les recommandations
du Data Office
• bien choisir ses Data Domains : privilégier ceux qui
s’engagent dans une relation client/fournisseur de Recenser les données clé mobilisées
dans les processus métiers
données avec un bon niveau de sponsorship

• aboutir vite sur des Data Products : Identifier et prioriser les données
viser le développement d’un Data Product à gouverner As A Product
en 6 mois ou moins
BAROMÈTRE 2024

Séquencer les principaux chantiers,


cas d’usages, Data Products
à réaliser sur 2024

Etablir les SLA/QLA des premiers


Nous essayons d'impulser une logique Data Product. Data Products
On ne dit pas Data Mesh car ça ne parle que très peu
Rédiger les notes de cadrage, le plan-
aux instances de décision pour l’instant, ce n'est pas Run ning et les charges puis les faire valider
encore assez vulgarisé. auprès des instances compétentes
Brice MIRANDA,
Data, AI & Automation Deputy, ORANGE Dimensionner les ressources
nécessaires pour la feuille de route

Initier le développement de cas


d'usages et Data Products
88 89
Synthèse et analyse

L’engouement autour de l’IA générative a remis la data dans l’agenda


des COMEX et c’est ainsi une magnifique opportunité à saisir pour les
CDO afin de relever les défis de la transformation de l’organisation par
la data :
c e coup de projecteur doit permettre plus que jamais aux CDO de
s’inscrire dans les enjeux stratégiques de l’entreprise aux côtés de la
DSI et des Directions métier
 promesses de création de valeur et de gain de productivité de
les
l’IA générative vont également provoquer des attentes plus élevées

Partie 3 - Défis à relever


de mesure concrète de cette valeur. L’occasion d’aligner métiers et
contrôle de gestion dans un pilotage par la valeur de la data
 nfin, le déploiement en production et à l’échelle d’IA génératives,
e
comme celui de tous les usages data, reposera notamment sur des
outils mis à la disposition du plus grand nombre… si, et seulement
si, les données et les connaissances qui alimentent ces outils sont
disponibles et pilotées ! Les grands principes du Data Mesh répondent
à cet enjeu et une large majorité d’entreprises avance dans ce sens.
Mais les initiatives restent très hétérogènes et souffrent d’un manque
de pilotage globale au niveau de l’entreprise. Cela remet en avant
la nécessité au préalable de bien aligner l’ensemble des parties
prenantes, data, IT et métiers vers un objectif et des moyens communs

Pour éviter l’écueil du gouffre des désillusions dans lequel l’IA


BAROMÈTRE 2024

« traditionnelle » était tombée, l’IA générative et ses promesses de


transformation profonde des entreprises devra s’accompagner d’un
investissement stratégique et humain sur ces piliers de la transformation
par la data.

90 91
92
BAROMÈTRE 2024

CONCLUSIONS
ET PERSPECTIVES

93

Conclusions et perspecitves
La maturité data des entreprises Ce qui est nouveau cette année dans la construction de notre grille d’analyse

à l’épreuve de l’IA générative La grille d’évaluation des maturités passe de 7 à 9 axes pour mieux représenter les
dimensions data et introduire des sujets prenant de l’envergure au sein des fonctions
data :

Séparation de l’axe « Enjeux & cas d’usages » en 2 axes distincts « Enjeux, vision
Enjeux, vision & stratégie » d’une part et « Portefeuille de cas d’usages » d’autre part afin
Nouveau
& stratégie d’aborder spécifiquement l’inscription de la data dans la stratégie d’entreprise
Cas d’usages puis la déclinaison dans le portefeuille de cas d’usages et les impacts sur sa
= & portefeuille composition. La grande majorité des Directions data s'est fixée des ambitions,
Legal, Compliance une vision des objectifs, une stratégie et a construit une feuille de route. Cela
Nouveau
& Ethique 4 a été favorisé par l’inscription grandissante de la data comme sujet clé dans les
Excellent
stratégies d’entreprise.
3
Avancé Création d’une dimension d’étude « Légal, compliance & éthique » pour préciser la
maturité des entreprises face aux contraintes réglementaires actuelles et futures
(RGPD, AI Act) ainsi qu’aux enjeux éthiques soulevés par l’IA et l’IA générative
Processus
= de delivery (GenAI). La réglementation RGPD est plutôt maîtrisée sur les cas critiques, et les

Conclusions et perspecitves
Culture entreprises se préparent désormais à l’arrivée de l’AI Act afin de ne plus revivre
data l’adaptation chaotique au RGPD.

Les piliers des organisations data à l’épreuve de l’IA générative

En 2023, plus de 1000 outils d’IA générative ont été lancés, provoquant un nouveau
far-west technologique. Cela vient réinterroger les choix réalisés ces dernières
Ressources Organisation années par les entreprises. Pour retrouver le même niveau de maturité que
& compétences & gouvernance sur l’IA/ML, les organisations devront mettre en place des plateformes qui
prennent en compte les nouveaux besoins de l’IA générative. La volonté de
créer des plates-formes d’IA générique avec une vrai composante FinOps devrait
s’intensifier en 2024.
Architecture, Gouvernance
= plateforme & outils des données Le processus de delivery stagne cette année. Si pour les entreprises les plus
BAROMÈTRE 2024

matures, le déploiement de l’agilité, la mise en place de rôles dédiés (PO, PPO…)


et la systématisation des méthodologies de cadrage permettent désormais de
passer en production plus facilement, l’IA générative vient bousculer légèrement
les pratiques. L’intégration du LLMOps au sein des pratiques « Ops » est attendu
pour 2024.

La gestion du portefeuille de cas d’usages stagne également car, malgré la


mise en place de gouvernance de portefeuille permettant de réunir les parties
prenantes autour des prises de décisions, les entreprises peinent encore à
mesurer le ROI effectif de leurs cas d’usages. De plus le foisonnement des
Augmentation Diminution de Stagnation initiatives IA génératives partout dans l’entreprise n’est pas encore bien maîtrisé
Résultats 2022 Résultats 2023 par rapport à N-1 la maturité par = par rapport à N-1 par l’ensemble des acteurs.
rapport à N-1

94 95
Des fondamentaux qui continuent de progresser ou se relancent

Le concept de Data Mesh a mis sous les projecteurs le besoin d’hybrider les
organisations data entre des ressources centrales et des relais locaux. Petit à
petit, chaque entreprise progresse pour avancer vers le niveau d’hybridation
adapté à ses enjeux. Cependant, cela ne se reflète pas dans la matrice car le
franchissement d’un cap de maturité a amené à une redéfinition des standards
à la hausse. Les modèles opérationnels permettent de gouverner la fonction
data en répartissant les mandats entre central/local et entre data/DSI/métier.
Le défi des entreprises sera de proposer une offre de service et de se munir de
ressources pour satisfaire à la fois les entités métiers et locales les plus matures
comme celles ayant besoin de plus d’accompagnement.

La gouvernance des données progresse (enfin!) sous l’effet de la mise en


application de concepts désormais maîtrisés (data catalogue, data lineage...) et
du développement du Data Mesh, notamment de l’appropriation du principe de
« Data product » pour répondre aux demandes métiers : autonomie et accès à des

Conclusions et perspecitves
données fiables. De nombreux acteurs restent néanmoins encore insatisfaits
des résultats tangibles. Enfin, l’impact de la diffusion des LLM nécessitant
de passer du data management au knowledge management n’est pas encore
mesuré ni pris en compte.

Les dimensions ressources, compétences et culture continuent de gagner


en maturité logiquement sous l’effet de l’expérience, des programmes
d’acculturation et de formation. Les compétences/rôles/postes data s’inscrivent
de plus en plus dans les référentiels et dispositifs RH afin d’être reconnus
et structurés. L’acculturation permet désormais aux métiers d’identifier des
cas d’usages et l’IA générative en devenant grand public apporte aussi aux
populations métiers une culture générale data/IA.
BAROMÈTRE 2024

96 97
Grille d’évaluation des maturités data
Processus Data Gouvernance Legal,
Enjeux, vision Cas d’usages Ressources Architecture, Organisation
de delivery et et Data Culture Data Compliance
& stratégie & portefeuille & Compétences plateforme & outils & Gouvernance
méthodologies Management & Ethics

Les plateformes
intègrent des outils La totalité du patri-
Le modèle opération-
La data & l’IA sont de data manage- moine de données
nel est éprouvé sur
inscrits comme des ment, d’éthique et de L’industrialisation est est cartographiée et
l’ensemble du péri-
sujets clés de la gestion du cycle de la norme et se passe documentée, la data La data est un axe
mètre, et le cadre de
stratégie d’entreprise La roadmap est vie des modèles - Des de façon fluide grâce est gérée comme un stratégique majeur. RGPD déployé,
Excellent

Les ressources sont gouvernance permet


- La roadmap de la continuellement outils avancés sont à des méthodologies produit dont le métier COMEX, métier framework d’audit
disponibles, les RH une bonne articula-
fonction data est mise alimentée avec des cas mis à disposition des déployées sur les s’est approprié la res- et IT soutiennent et remédiation IA
autonomes et matures tion des stakeholders
en œuvre et actualisée d’usages portés par utilisateurs techniques phases de cadrage, ponsabilité fonction- véritablement la de confiance sur
pour faire croître le de la fonction data
continuellement pour les métiers et un ROI et métiers pour pilotage (agilité), nelle - Les data users/ transformation data l’ensemble des cas
dispositif : IT, Métier, Digital,
aligner les moyens et effectif est suivi répondre à des usages industrialisation producers appliquent via des engagements d’usages
Data.L’ensemble des
l'ambition multiples (no code,..) - (CI/CD, DevOps) et les standards sous et budgets concrets
ressources néces-
Appropriation du Data exploitation la supervision des
saires est recruté et/
Mesh (technique) «anti responsables Data
ou formé
monolithique» Gouv
+ Self Service

Les fondamentaux du
modèle opérationnel
Les effectifs né- Les plateformes sont posés (rôles, res-
L’organisation
cessaires sont en couvrent la totalité du ponsabilités, funding).
Une entité promeut reconnait l’impor-
place. Des écarts de patrimoine de données Ils sont effectifs
Les processus de ca- des standards qui tance de la data mais La norme RGPD est
compétences restent et sont rationnalisées sur un périmètre
L’ambition est définie Les cas d’usages sont drage des produits et s’appliquent encore l’enthousiasme peine mise en œuvre sur
Avancé

à combler par de la pour une bonne capi- partiel. - Les instances


à travers des objectifs cartographiés et priori- de pilotage agile des petit à petit dans à se concrétiser dans l’ensemble du patri-
formation / prestation talisation du Dev. et permettent de
chiffrés et les moyens à sés dans une roadmap. projets permettent l’organisation et des les faits - Les métiers moine de données,
et des rôles/positions un passage à l’échelle prendre des décisions
aligner son identifiés et Le ROI est un critère de à certains usages de pilliers sont en cours sont suffisamment des objectifs et une
restent à inscrire fluide des I.A. - Les aux bons niveaux de
planifiés sélection passer en production de mise en place (data acculturés pour iden- feuille de route IA de
dans la fonction RH outils avancés adaptés manière fluide; une
avec difficulté catalog, data quality, tifier des cas d’usages confiance existent
(valorisation des com- sont mis à disposition politique RH dédiée
data lineage…) pertinents et porter
pétences, parcours de des utilisateurs tech- permet le recrute-
le product ownership
formation,..) niques. ment et la formation
des principaux rôles
data

Le patrimoine de
données est partiel-
Des plateformes lement cartogra-
Les procédures RGPD
Une feuille de route Les ressources data sont déployées. Elles Une ou des entités phié mais n’est pas
Emergent
BAROMÈTRE 2024

Les cas d’usages data Les sujets data sont existent mais ne sont
partielle fourni une Des cas d’usages sont permettent de couvrir disposent d’environne- de type Datalab, sous-contrôle (rôles,
en sont encore à un connus mais considé- pas appliquées à
visibilité sur les projets lancés de façon éparse partiellement les ments de développe- Datafab, Data Office documentation, qua-
stade expérimental rés comme contrai- l’ensemble du patri-
et chantiers en cours et dans l’organisation avec besoins techniques, ment et de produc- existent. Le modèle lité) - Les questions
sans processus gnants, secondaires moine et la dimension
à venir à court et moyen peu de pré-qualification scientifiques et d’assu- tion - Des outils sont d’organisation est d’accessibilité, de
d’industrialisation ou hors de portée éthique reste non
terme rer un pilotage administrés au niveau encore expérimental sécurité/compliance
considérée
groupe et de qualité sont gé-
rées de façon ad hoc
selon les usages

La donnée est silotée Peu ou pas de pré-


Embryonnaire

Le patrimoine de
dans les systèmes occupations pour les
données est peu/pas
applicatifs ou dispersée Les opportunités, aspects règlemen-
Pas d’ambition Les cas d’usages data connu (cartographié)
Peu ou pas de besoins/ Pas ou peu dans des documents - Les sujets data sont enjeux et besoins taires et éthiques
formalisée ni de ne dépassent pas le La donnée est silotée
opportunités identifiés de ressources Les outils sont éparses portés de manière propres à la data de l’utilisation des
transformation data stade d’idéation ou de par système. L’accessi-
sur la data présentes et «actionnés» par les désordonnée sont globalement données - L’ensemble
en tant que telle cadrage bilité, la sécurité/com-
utilisateurs sans ratio- méconnus de mon patrimoine
pliance et la qualité
nalisation/administra- n’est pas couvert par
ne sont pas pilotées -
tion au niveau groupe les procédures RGPD
98
Cases pleines : niveau moyen du marché français en 2023.
Pendant des années, l’enjeu des Directions data fut de réussir à industrialiser des cas
d’usages data & IA puis à fluidifier cette industrialisation. Ces deux dernières années,
le déploiement des pratiques MLOps, les investissements dans les infrastructures
technologiques et la montée en maturité progressive des organisations et des
compétences ont permis l’atteinte d’un seuil optimal pour les entreprises ayant
investi dans leur transformation data depuis plusieurs années.

L’irruption soudaine du tsunami IA générative va constituer un « stress test » pour


ces organisations data dans ces prochains mois. En effet, passée la vague actuelle
de POC et expérimentations en tout genre, 2024 devra être l’année du passage en
production de ces nouveaux usages et du déploiement d'outils dans toute l’entreprise
embarquant nativement cette technologie.

Conclusions et perspecitves
En ayant remis la data sur le devant de la scène, la capacité des CDO à piloter ces
enjeux sera d’autant plus attendue par le top management.

Les organisations qui ont déjà réussi à fluidifier le passage en production des cas
d’usages IA pourront s’appuyer sur leur fondamentaux tout en adaptant leur modèle
opérationnel et leur stack technologique aux nouveaux enjeux de l’IA générative.

Mais pour devenir un moteur de la transformation de l’entreprise, l’enjeu du CDO


est également de sortir de son positionnement trop souvent unique de DO-eur pour
adopter une offre de service d’Enabler auprès des métiers et de la DSI, ainsi qu'une
posture de stratège auprès du top management.

Pour cela, il faudra relever 3 défis que l’IA générative va naturellement accélérer :
s’inscrire dans les enjeux stratégiques des entreprises, piloter ces usages par la valeur
et organiser le bon niveau d’hybridation de son organisation entre central et local via
les grands principes du Data Mesh.
BAROMÈTRE 2024

Enfin, l’IA générative ne sera pas le seul blockbuster à l’agenda des directions data en
2024. La publication de l’AI Act Européen va lancer véritablement la course de mise
en conformité vis-à-vis de cette nouvelle réglementation. Cela imposera d’anticiper
les nécessaires plans de remédiation et de conduite du changement, mais ce sera
aussi l’opportunité, pour les plus ambitieux, de développer une plus grande confiance
dans leurs IA et ainsi d’accélérer leur adoption au sein de l’entreprise et de la Société.

100 101
BAROMÈTRE 2024

102
QUI SOMMES-NOUS ?

Qui sommes-nous ?
103
L'équipe à l’initiative du baromètre

Jonathan CASSAIGNE Matthieu VANNIER Clément LAVERRIERE Vlad FLAMIND


jonathan.cassaigne@capgemini.com matthieu.vannier@capgemini.com clement.laverriere@capgemini.com vlad.flamind@capgemini.com
— — — —
Jonathan est Associé et Directeur des Matthieu est Manager de l’expertise Data Clément est Consultant Senior au sein de Fort de 10 ans d’expérience dans le
expertises de Quantmetry. Il anime notre Strategy et accompagne les dirigeants la practice Data Strategy. Il accompagne conseil en stratégie et organisation,
pôle Data Strategy et accompagne nos dans la compréhension de leurs enjeux nos clients dans la définition de leurs Vlad accompagne nos clients dans la
clients dans la définition de leur ambition business vis-à-vis de la data et de stratégies data & IA, leur gouvernance et construction de leur modèle opérationnel
de transformation par la data et la mise l’intelligence artificielle puis les aide à leur organisation. Il intervient également et dans la mise en œuvre concrète de

Qui sommes-nous ?
en place de leur modèle opérationnel. Il « transformer l’essai » en élaborant les dans leur mise en œuvre opérationnelle. programmes de Data Management et
dispose de plus de 15 ans d’expérience bons programmes de transformation Data Gouvernance. Il intervient aussi sur
dans le conseil en stratégie digitale et sur l’ensemble des dimensions data : le cadrage et le pilotage d’usages data et
data. technologiques, organisationnelles et IA au service des métiers.
humaines.

Avec la collaboration
de l’équipe commerciale
Quantmetry dans la préparation et
BAROMÈTRE 2024

la conduite des entretiens, ainsi Pierre DEMEULEMEESTER Baptiste SMAGGHE


que de Claire Monjoin pierre.demeulemeester@capgemini.com baptiste.smagghe@capgemini.com
pour l’édition du présent rapport. — —
Pierre est vice-président chez Capgemini Baptiste est Senior manager dans
Invent et dirige la pratique Capgemini l’entité Data Stratégie de Capgemini
Invent Data. Il a mené de nombreux Invent. Il a mené de nombreux projets
projets de définition de vision stratégique, de stratégie Data, AI et Gen-AI et piloté
de conception de modèle opérationnel, des portefeuilles de cas d’usages IA. Il a
d'évaluation de cas d'usage dans le construit un benchmark Data & IA auprès
domaine de la gestion des données dans d’entreprises du CAC40 afin d’évaluer la
tous les secteurs : industrie, services maturité des organisations et identifier
publics, santé, services, etc. Il a plus de les meilleures pratiques sur le marché.
13 ans d’expérience dans le conseil en
stratégie Data.
104 105
Merci aux Chanel LCL Saint Gobain

entreprises et Danone LSDH Santeclair


à leur dirigeant
data pour la Décathlon Manutan Schneider

confiance qu’ils
Dior MATMUT SCOR
nous ont
accordée, ainsi EDF R&D MBDA Sodexo
que pour la
EGIS Michelin Setec
qualité de nos
échanges ENGIE Ministère de l’Intérieur Shift Technology

Eramet Ministère de la Culture SNCF Matériel

AG2R La Mondiale Eureden Modulaire Group (ex Algeco) Technip Energies

April Groupama Orange Terrena

ArcelorMittal France Groupe ETAM Orano Corp Veolia

Arkea GRTgaz Plastic Omnium Ynsect


BAROMÈTRE 2024

BNP PARIBAS SA GSF Pôle Emploi

BPCE L’Oreal Région Ile-de-France

CCR La Banque Postale SAFRAN ANALYTICS

106 107
Quantmetry, part of Capgemini Invent, est un cabinet de conseil
spécialisé dans l’intelligence artificielle de pointe. Il est animé
par la volonté d’offrir une gouvernance des données de très haut
standard et des solutions d’intelligence artificielle à l’état de l’art.

Lauréat du consortium “Confiance.ai”, Quantmetry et son


laboratoire de R&D contribuent activement au développement de
l’IA de confiance en France.

Il s’appuie sur des méthodes et des outils capables de mesurer


l’incertitude liée à l’IA, de manière maîtrisée et transparente.

Au sein de Capgemini Invent, Quantmetry est le cœur de réacteur


pour la transformation numérique et le développement de produits
et services innovants à fort impact, reposant sur l’IA de confiance.

Vous aimerez peut-être aussi