La modélisation dimensionnelle propose un ensemble de méthodes permettant de gérer la particularité des données décisionnelles. C'est une modélisation tournée vers les processus métier qui vise à garantir la cohérence de données historisées.

La modélisation dimensionnelle est une technique de modélisation adaptée aux données décisionnelles. Cette technique est orientée par les processus métiers pour structurer des données historisées qui seront interrogées par des requêtes complexes afin de produire les indicateurs nécessaires aux décideurs.

Passons en revue les concepts fondamentaux à assimiler avant de produire un premier schéma dimensionnel.

Schéma en étoile

Un schéma en étoile se structure autour de tables de faits et de tables de dimensions. Les tables de dimensions permettent de décrire les entités métier par exemple des produits, des clients, des fournisseurs, des dates. Elles contiennent des colonnes permettant de décrire ces entités. Les tables de faits contiennent, quant à elles, des mesures permettant de décrire les événements métiers, par exemple le nombre de produits achetés, le délai de réception d’une commande. La table de faits contient des colonnes clefs qui référencent les clefs primaires des tables de dimensions.

Un schéma en étoile est une méthode de structuration de données non normalisée par opposition à l’approche de normalisation utilisée dans les bases de données relationnelles. Nous présentons également les raisons pour lesquelles les modélisations en flocon sont à éviter.

Granularité

La notion de granularité permet de définir le niveau de précision des données au sein de nos données. La définition du niveau de granularité est moins simple qu’il n’y parait, car en langage courant les confusions sont fréquentes. Cette étape nécessite donc toute votre attention.

Faits

La notion de faits est au cœur du schéma en étoile : elle permet de définir des observations ou événements qui sont mesurés au moyen de métriques. Il est important de se questionner sur la nature des faits que l’on définit pour éviter les sources d’erreurs. Si vous avez une solution d’alcool à 60° dans votre placard et une autre à 90° dans votre armoire à pharmacie, combien avez-vous de bouteilles ? Et si vous les mélangiez, quel serait le degré du mélange obtenu ? Tout ne s’ajoute pas, il faut le garder constamment à l’esprit …

Types de clefs

Redécouvrez les différents types de clefs utilisés au sein d’une base de données relationnelle et prenez connaissance des clefs spécifiques à la Business Intelligence.

Dimension dégénérée

Un schéma en étoile se base sur des faits que l’on souhaite mesurer et qui s’observent selon plusieurs dimensions (temps, géographique, client, produit, etc.). Ces dimensions correspondent à des axes d’analyse et peuvent s’apparenter à des catalogues (de jours, de lieux, de clients, de produits) possédant différentes propriétés. Et si l’une de ces dimensions n’avait pas de propriété ?

Dimensions conformes

Les dimensions conformes sont la pierre angulaire d’un entrepôt de données en garantissant la cohérence des données entre différents datamarts (basés chacun sur un schéma en étoile). Elles permettent de s’assurer que 2 requêtes sur 2 processus métiers différents vont donner des résultats cohérents. Il serait dommage que les produits vendus ne puissent pas être mis en relation avec les produits commandés à cause de dénominations différentes, non ? Dans la réalité, ce type de problème peut être fréquent en absence d’une modélisation rigoureuse des données.

Un ensemble de tables de faits et de dimensions conformes permettent de construire une architecture en bus.