Les architectures en bus se fondent sur la notion de dimensions conformes afin de permettre de construire de manière itérative un entrepôt de données et de garantir la cohérence des données entre les différents processus métiers analysés.

Contexte

En informatique, un bus est un mécanisme permettant de transmettre/partager des informations entre plusieurs composants.

La modélisation dimensionnelle est une activité de planification stratégique dans le sens où elle permet de modéliser les besoins des différentes parties prenantes tout en préservant la cohérence des données entre les différents datamarts.

Pour cela, chaque datamart, construit sur la base d’un schéma en étoile, va partager certaines de ces dimensions conformes avec d’autres datamarts (voir schéma ci-dessous).

Source du schéma : Kimball, Ralph, and Ross, Margy. The Data Warehouse Tooolkit: The Complete Guide to Dimensional Modeling.

Dans ce schéma nous pouvons voir que les processus métier des ventes Stores Sales et de gestion de l’inventaire Store Inventory partagent trois dimensions conformes : Date, Product et Store. Cela va, par exemple, garantir la cohérence des analyses comparant les stocks et les ventes.

Matrice de bus

Source du schéma : gile Data Warehouse Design: Collaborative Dimensional Modeling. Laurence Corr and Jim Stagnitto.

La matrice de bus est un moyen de représenter de manière globale toutes les données du système d’information décisionnel. C’est un document indispensable pour permettre d’établir un dialogue clair à propos des données avec un interlocuteur.

Chaque ligne de la matrice représente un processus de l’organisation qui est associé à un marché d’information (datamart en anglais). En fait le marché d’information est tout simplement une table de faits entourées de ses dimensions.

C’est pourquoi chacune des colonnes de la matrice de bus représente les différentes dimensions présentes dans le système. Lorsqu’une dimension est utilisée par plusieurs tables de faits, elle est dite conforme.

Lecture Matrice de bus : Star Schema. Christopher Adamson. pages 100-101

Lecture Matrice de bus : Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema Laurence Corr, and Jim Stagnitto.pages 101-102, 128

Lecture Matrice d'événements : Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema Laurence Corr, and Jim Stagnitto.pages 102-103

Architecture en bus

Source du schéma : Agile Data Warehouse Design: Collaborative Dimensional Modeling. Laurence Corr and Jim Stagnitto.

Ce schéma représente le flux de transformation de données dans une architecture en bus. Chaque source de données (event source), subit une extraction, une transformation dans la zone ETL (interdite d’accès aux utilisateurs car les données ne sont pas encore mises en cohérence) pour être finalement chargée dans l’entrepôt de données qui historise et consolide les données en les mettant en cohérence notamment au moyen des dimensions conformes.

Nous voyons ici qu’un datamart n’est pas dédié à un service de l’organisation mais répond à un besoin global qui peut être partagé et interprété de la même manière par différentes parties prenantes de l’organisation.

Lecture Architecture en bus : Star Schema. Christopher Adamson. pages 100-104

Lecture Architecture en bus : Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema Laurence Corr, and Jim Stagnitto.pages 100-103, 128