Le Data Mesh, effet de mode ou véritable outil de transformation de votre business model ?

La démultiplication des sources de données et des utilisateurs, la diversité des transformations et des traitements requis en fonction des cas d’usages, l’exigence de vitesse avec laquelle il faut réagir aux évènements et la constante évolution du paysage technologique sont des changements difficiles à appréhender pour les entreprises n’ayant mis en place une organisation, des processus et une culture adaptés.

Ciment de ce triptyque, la data permet de fluidifier le fonctionnement opérationnel quotidien de l’entreprise. Mais comment mettre cette donnée au cœur (devenir « data centric »), comment prendre des décisions fondées sur la donnée (être « data driven »), ou encore par où initier l’outillage en intelligence artificielle (devenir « AI-empowered ») ?

L‘obsession de « mettre la donnée au centre » ou une brève histoire du lieu de stockage de la donnée dans l’entreprise 

Depuis l’invention fin des années quatre-vingt de l’entrepôt de données, dont le but initial est de mettre à disposition la source servant de référence unique, il est principalement utilisé pour la prise de décisions dans l’entreprise sur la base de rapports réalisés via des outils de reporting. Sa conception prédominante est celle d’une donnée unifiée positionnée au centre, comme magasin d’approvisionnement (datamart), infocentre, ou puit de données..

Mais les magasins et les puits se sont multipliés, n’assurant plus la cohérence ou l’unicité des données : la rançon de l’accessibilité métier a été démultiplication des sources. Plus tard, le data lake a donc eu pour ambition de « recentraliser » les sources en les collectant pour toutes les localiser au même endroit. Mais les principaux clients des data lakes ont hélas été … les informaticiens eux-mêmes ! Depuis maintenant plus de dix ans, les distributions Hadoop ravissent les équipes Big Data, un peu moins les métiers, qui continuent d’accéder à leurs data warehouses historiques. 

Il est dès lors manifeste qu’aucune des solutions évoquées ci-dessus n’est à la hauteur du défi que nous propose la quatrième révolution industrielle : dans l’entreprise de la data economy, la donnée doit être une source d’énergie accessible, fiable et valorisée. 

C’est la proposition de valeur du Data Mesh, un paradigme qui permet de sortir de l’obsession de la centralisation, en laissant la donnée « là où elle est », c’est-à-dire près des métiers, permettant de ce fait d’assurer sa qualité et son stockage par principe de subsidiarité (les acteurs locaux en sont responsables et parties prenantes) tout en organisant la gouvernance d’accès. 

Concrètement, qu’est-ce que le Data Mesh ? 

Pour commencer, coupons court à une idée reçue : le Data Mesh n’est pas un nouveau type d’architecture ! Il s’agit d’un paradigme visant à rendre disponibles et accessibles les données à l’échelle, et dont les objectifs sont les suivants : 

  • Répondre avec élégance à la complexité, la volatilité, et l’incertitude du business 
  • Maintenir l’agilité face à la croissance 
  • Accélérer la production de valeur et le faire proportionnellement à l’investissement 

Pour cela, le Data Mesh se base sur quatre piliers fondateurs : 

  • DECENTRALIZED DOMAIN OWNERSHIP : inspiré du Domain Driven Design, le pilier principal du Data Mesh est la décentralisation et la distribution des responsabilités au plus proche de la donnée. Pour cela, il est nécessaire de s’appuyer sur une architecture découpant logiquement le stockage des données et les ressources de calcul par domaine. C’est d’ailleurs ce découpage logique et non technique qui permet aux équipes responsables des domaines d’être autonomes sur leur domaine, et ainsi de permettre la mise à l’échelle. 
  • DATA AS A PRODUCT : ensuite, le Data Mesh implique de considérer la data comme un produit. La donnée n’est alors plus uniquement l’énergie qui va propulser le produit, mais bien le produit lui-même. Il convient donc de mettre en place différents services pour y accéder (APIs, Data Marketplaces …) et permettre aux autres produits de l’entreprise d’être augmentés à l’aide de cette donnée. 
  • SELF-SERVE DATA PLATFORM : ou encore self-serve data infrastructure as a platform. Il s’agit de disposer d’un catalogue de services destinés aux développeurs faisant office de couche d’abstraction haut-niveau de l’infrastructure. Les services doivent masquer la complexité architecturale sous-jacente et donc être rapidement et facilement déployables. Le but est de permettre l’autonomie des domaines vis-à-vis des équipes Infra. 
  • FEDERATED COMPUTATIONAL GOVERNANCE : la traduction littérale est « gouvernance computationnelle fédérée ». Il s’agit de penser la gouvernance afin qu’elle soit automatisable, décentralisée, et que chaque domaine soit auto-souverain. Néanmoins, les règles doivent être normalisées afin d’être interopérables, d’où le besoin de fédération. 

Quels en sont les avantages ? 

Le Data Mesh promet certains avantages relatifs à l’exploitation de la donnée en entreprise : 

  • Avec le DECENTRALIZED DOMAIN OWNERSHIP, les données sont à la fois accessibles par les équipes métiers et les experts Data, facilitant ainsi la collaboration. Avoir des équipes Domaine responsables des données en améliore la qualité. L’autonomie des équipes métier sur leur domaine permet également de faire face plus facilement à la croissance du volume de données.
  • Grâce au DATA AS A PRODUCT, les experts Domaine sont au plus proche de la conception des produits car inclus dans les équipes Agile, qui de facto deviennent plus autonomes. Le SI devient également plus flexible grâce à des données considérées comme des produits à part entière. Enfin, l’expérimentation est rendue plus facile et peut se déployer plus facilement en production. 
  • Avec la SELF-SERVE DATA PLATORM, les relations entre urbanistes et architectes sont apaisées, et les Data Engineers sont plus efficaces, autonomes et épanouis car ils disposent d’outils et de templates facilitant et sécurisant leurs développements. L’émergence de nouveaux produits s’en voit donc accélérée. 
  • Le FEDERATED COMPUTATIONAL GOVERNANCE vous apporte une homogénéité dans vos règles de gouvernance, un monitoring industrialisé, une réduction des erreurs et des coûts, et un gain de confiance grâce à des règles conçues au niveau de chaque domaine et donc maîtrisées. 

En cible, les applications d’entreprise sont pensées pour échanger de la donnée, ce qui facilite la collaboration à l’intérieur et à l’extérieur de l’entreprise. « You build it you run it », c’est la fin de la responsabilité de la donnée sur une seule équipe centrale et le début d’une responsabilité partagée au niveau de l’entreprise permettant d’assurer une meilleure qualité et plus d’usages collaboratifs. 

En résumé, le Data Mesh facilite l’autonomie, l’industrialisation, et l’adoption de cas d’usages data avec plus de collaboration et de vélocité. 

Vers l’exosquelette informationnel de l’entreprise à l’ère de la donnée 

Le Data Mesh n’est ni un canon d’architecture d’entreprise ni une finalité. Parce qu’il ne s’autodécrète pas (nulle entreprise ne peut décider de « mettre en place un Data Mesh »), son objet n’est pas de faire adhérer l’organisation à la data ou la data à l’organisation, mais bien de faire converger les deux.  

Au-delà des concepts architecturaux, le Data Mesh donne des clés organisationnelles, culturelles, conceptuelles et technologiques pour que les données puissent être un vecteur de transformation de l’entreprise, permettant par là-même de réconcilier les développeurs et les utilisateurs en mettant ces derniers en situation et en responsabilité de « consommaction ». 

Le Data Mesh ne saurait être réduit à sa portée instrumentale. Il a cette capacité à se produire lui-même, en permanence et en interaction avec son écosystème, lui permettant ainsi de maintenir sa finalité d’accès et d’exposition à la donnée malgré l’évolution de l’environnement. Voilà ce qui pourrait permettre d’esquisser le véritable exosquelette informationnel de l’entreprise.  

Source : «groupeonepoint.com» du 22/12/2021