Qu’est-ce qu’un data mart, et quelle est sa différence avec un data warehouse ?
Depuis une dizaine d’années, la progression vertigineuse des données produites a accéléré le développement du big data. Les mondes du développement applicatif et de la gestion des données ont commencé à converger.
Dans ce cadre, savoir centraliser, structurer, traiter et analyser une masse de données pour une problématique précise est essentiel : c’est tout l’objet d’un data mart. Que couvre cette notion exactement ? En quoi est-ce différent d’un data warehouse ? Explications.
Qu’est-ce qu’un datamart ?
Data mart : définition
Un datamart, aussi appelé magasin de données ou comptoir de données, est une base de données précise destinée à un groupe d’utilisateurs donné.
Utilisé en informatique décisionnelle, il est extrait de systèmes sources puis nettoyé et mis à disposition des utilisateurs d’un domaine spécifique de l’entreprise, ou d’un groupe restreint d’utilisateurs.
Exemple de Data mart en image — © Talend
👉 Le datamart doit être au service du besoin final et donc retranscrire de la manière la plus intelligible et proche du langage métier possible les données initialement stockées dans le Datawarehouse.
Exemple de Data mart
On peut ainsi imaginer qu’au sein du domaine RH d’une société, un premier datamart compile tous les indicateurs relatifs à l’utilisation de l’ERP principal, et que d’autres « briques » du besoin RH soient des datamarts directement associés à des applications secondaires et très spécifiques, par exemple le suivi du e-Learning des employés.
Avantages du data mart
- Offre à ses utilisateurs un panel complet d’indicateurs concernant les données dont ils ont besoin au quotidien.
- Un même groupe d’utilisateurs peut avoir accès à un datamart unique ou à plusieurs datamarts, correspondant chacun à un besoin spécifique, selon les architectures informatiques mises en place et la confidentialité des données.
Data mart vs Data warehouse : quelles différences ?
Selon les conceptions donc, le Datawarehouse, ou entrepôt de données, peut être vu comme un ensemble de Datamarts et de leurs passerelles ou, plus couramment, comme la centralisation dans un même système assurant la sécurité, la disponibilité et la cohérence technique de toutes les données à l’usage des datamarts.
Il revêt donc une coloration plus technique et n’aura sans doute pas un unique champ « Chiffre d’Affaires », mais peut-être plusieurs composantes du Revenu et des charges de la société que chaque domaine agencera selon sa conception propre du CA.
Le Data warehouse permettra d’ailleurs d’assurer la traçabilité de l’information à travers l’ensemble de l’entreprise, là où le Data mart se limite à satisfaire les besoins spécifiques d’un métier.
Comment construire un data mart ? 3 options
Le datamart intégré à l’application source
Si vous privilégiez les datamarts dédiés à une application, c’est peut-être parce que l’applicatif lui-même vous propose des outils d’analyse intégrés. Cela vous paraît la solution idéale.
Avantage : coller au plus près du besoin adressé par l’application et d’assurer la cohérence entre la donnée et sa restitution.
Inconvénients :
- des coûts à moyen et long termes puisque vous n’avez pas la maîtrise de la restitution des indicateurs ;
- vous pouvez moins aisément l’enrichir du reste des données de votre entreprise et inversement ;
- vous faites peut-être l’impasse sur les options permettant la remontée de ces données dans le datawarehouse.
👉 Vous perdrez donc en potentiel ce que vous aurez gagné en rapidité de mise en place.
Le datamart indépendant du datawarehouse
Il s’agit là d’une version plus avancée du précédent, puisqu’il peut avoir été mis en place en interne, mais toujours à partir d’une source bien spécifique dont il est très dépendant.
Avantage : vous avez plus de latitude sur les éléments de restitution.
Inconvénient : le fait qu’il ne soit pas intégré au reste de votre entrepôt de données rogne toujours votre potentiel de réponse au besoin utilisateur à moyen terme.
Le datamart comme brique du datawarehouse
Les datamarts ont tout intérêt à s’articuler autour d’un datawarehouse afin de maximiser leur potentiel. Leur intégration peut être :
- ↗️ montante : un ensemble de Data marts permettant la constitution d’un Datawarehouse,
- ↘️ descendante : la centralisation des données dans le Data warehouse permet la création de toutes les briques nécessaires.
Avantages :
- la connexion avec les autres domaines de l’entreprise, permettant d’affiner et d’expliquer précisément des indicateurs clés de votre performance. Par exemple :
- mettre en évidence une corrélation entre des résultats en baisse sur un circuit particulier de votre plateforme d’e-learning et une augmentation des incidents sur une chaîne de production.
- optimiser votre cadence de production en fonction de l’analyse du pipe de votre outil de CRM.
- l’agencement de ces briques au sein ou autour d’un datawarehouse augmente ainsi vos chances de pérenniser la bonne interprétation de vos indicateurs dans une utilisation transverse.
Inconvénient : perte en indépendance
Quels outils pour mes datamarts ?
Bien sûr, les outils ETL ne manquent pas pour traiter des données en masse et les analyser rapidement.
Mais il existe également des outils de stockage dédiés, open source ou propriétaires, clés en main pour votre data mart.
Comme pour tout choix mettant en concurrence l’open source avec des solutions éditeurs, c’est le support, et la capacité interne pour développer ou adapter des composants qui seront les critères à prendre en compte.
Du data mart au DataOps
L’intégration de vos data marts à un data warehouse doit être un objectif majeur de votre architecture. Et la bonne évolution de ce data warehouse est son corollaire.
Les équipes techniques étant exposées à toujours plus de demandes et à un besoin accru de réactivité, il a fallu adapter les modes de développement et de déploiement via les techniques d’intégration continue qui ont fait leurs preuves dans le monde applicatif. C’est donc à un nouveau paradigme que l’ingénierie des données doit se soumettre : le DataOps, dérivé du DevOps.
En résumé, l’adaptation des principes du DevOps au monde de la Data offre une nouvelle réponse aux défis de la mise en place des datamarts dans un contexte de forte croissance.
Associé créateur de Marketor, Laurent Hercé évolue dans le monde de l’IT depuis son origine ou presque (1987). Il anime des communautés et des blogs dans les domaines IT, RH, Social Selling, Cloud computing, SaaS, innovation.
Passionné par la vulgarisation, Laurent rédige du contenu sous toutes ses formes, notamment pour les blogs, livres blancs, études et guides…