Introduction
« C’est difficile ». Voilà comment le data scientist d’une grande banque résumait la mise en production des modèles de machine learning et de deep learning auprès du MagIT l’année dernière. Non pas que les outils manquent : pléthores de librairies open source et de plateformes ont vu le jour pour préparer les données, entraîner les modèles, les déployer, récupérer les résultats et réentraîner les modèles en cas de dérives. Ces piles technologiques demeurent difficiles à maintenir et à opérer.
Côté pratique, dans la lignée de l’approche DevOps, le MLOps a fait son apparition. Le « MLOps est une culture et une pratique d’ingénierie ML qui vise à unifier le développement (Dev) et les opérations (Ops) des systèmes de ML », résume Google Cloud dans sa documentation.
Mais il y a, semble-t-il, une disparité forte entre les entreprises ayant largement investi dans leur stratégie de traitement de données et les autres, selon le cinquième baromètre des directions data de Quantmetry, une filiale de Capgemini.
« Ces deux dernières années, le déploiement des pratiques MLOps, les investissements dans les infrastructures technologiques et la montée en maturité progressive des organisations et des compétences ont permis l’atteinte d’un seuil optimal pour les entreprises ayant investi dans leur transformation data depuis plusieurs années », avance Quantmetry dans son rapport.
Dans une étude menée au mois d’avril 2023 auprès de 1 684 sondés, les observations de McKinsey confirment cette tendance. À ceci près que le cabinet de conseil considère que même les entreprises les plus avancées n’ont pas encore mis en pratique toutes les capacités du MLOps.
« Les résultats montrent une fois de plus que même les entreprises les plus performantes ne maîtrisent pas les meilleures pratiques en matière d’adoption de l’IA, telles que le MLOps, bien qu’elles soient beaucoup plus susceptibles de le faire que les autres », écrivent les auteurs de McKinsey. « Par exemple, seulement 35 % des répondants des entreprises les plus performantes en matière d’IA déclarent que, dans la mesure du possible, leurs organisations assemblent des composants existants plutôt que de les réinventer, mais cette proportion est bien plus importante que les 19 % de répondants des autres organisations qui font état de cette pratique ».
Au début de l’année dernière, Tecton, un éditeur de solutions de déploiement de ML a interrogé 1 700 professionnels, principalement originaires d’Europe et d’Amérique du Nord. Selon l’étude, 55,3 % des personnes interrogées affirment que leur entreprise a mis en place une équipe centrale chargée du machine learning (64,3 % dans les groupes de plus de 1 000 collaborateurs, 45,3 % dans les organisations de moins de 250 employés).
En moyenne en 2023, la moitié des entreprises avaient six modèles d’IA ou plus en production, tandis que les grands comptes atteignent une médiane de 12 modèles en production. La majorité des cas d’usage sont consacrés aux systèmes de recommandation, à l’analyse des données clients et à la personnalisation de l’expérience client. Environ 80 % des projets ne passeraient pas le stade de la production.
Au moment de déployer de nouveaux modèles, les répondants doivent faire face aux trois défis majeurs de la réunion des bonnes données d’entraînement (41,1 %), de la construction des bons pipelines de déploiement des modèles (37,6 %) et doivent prouver qu’il y a un retour sur investissement (34,3 %). Surtout, la majorité des équipes ML ont besoin entre un et trois mois pour déployer un nouveau système d’IA.
La collaboration entre les équipes de data science et d’ingénierie (26,1 %), le contrôle des coûts d’infrastructure (25,7 %) et l’interaction des outils dans une stack (23,5 %) sont d’autres difficultés importantes.
D’autant que les cinq briques de la pile technique MLOps identifiées par Tecton (registre de modèle, feature store, suivi de modèles, monitoring des données, inférence des modèles) sont très loin d’être toutes déployées dans les entreprises. Seulement 9,5 % des sondés déclaraient en 2023 que leur organisation avait mis à leur disposition toutes ces briques, quand 39,6 % des sondés affirmaient en avoir trois ou plus.
De manière plus générale, MckInsey remarque que les entreprises les plus avancées sont principalement préoccupées par les modèles et les outils, l’accès au talent, ainsi que l’adoption et la montée à l’échelle des projets. Les autres considèrent que le défi est d’établir une stratégie digne de ce nom, de recruter les talents et de traiter les données.
Or « de nombreuses technologies et pratiques MLOps spécialisées peuvent être nécessaires pour adopter certains des cas d’usage les plus transformateurs [tels] que les applications d’IA générative, et ce, de la manière la plus sûre possible », note le cabinet.
« L’irruption soudaine du tsunami IA générative va constituer un “stress test” pour ces organisations data [les plus avancées] dans ces prochains mois », prédisait Quantmetry au début de l’année 2024.
Les autres devront prendre une décision : faut-il se contenter d’utiliser les systèmes d’IA générative infusée dans les applications métiers en mode SaaS, qui sans doute accéléreront les tâches les plus répétitives, ou investir plus largement dans des systèmes spécifiques, adaptés aux enjeux propres de l’entreprise ?
En ce sens, ce guide essentiel revient sur les grands principes du MLOps, les technologies associées, et présente les stratégies IA de trois entreprises : LVMH, Orange et Equidia.