Comment créer un modèle de données fiable sur Power BI ?
Dans cet article, je vous propose de découvrir comment créer un modèle de données solide et performant sur Power BI, afin d'exploiter pleinement la puissance de cet outil incontournable de la data visualisation. En partant d'un cas pratique concret, nous allons voir ensemble comment structurer vos données, construire les relations entre vos tables, et adopter la meilleure approche pour modéliser vos données autour d'un modèle en étoile. Ce guide s'adresse à tous ceux qui souhaitent maîtriser la modélisation des données pour améliorer la qualité et la pertinence de leurs analyses sur Power BI.
Avant de plonger dans la pratique, il est essentiel de comprendre le concept théorique du modèle en étoile. Ce modèle est la structure la plus courante, et celle vers laquelle il faut tendre pour exploiter pleinement la puissance de Power BI et de ses modèles de données.
Imaginons que nous sommes une entreprise d'achat-vente. Nous achetons des produits à des fournisseurs à un certain prix et à une date donnée, puis nous revendons ces mêmes produits à des clients, toujours à une date et un prix précis. Ce scénario simple génère plusieurs flux de données, et chaque flux possède plusieurs caractéristiques à prendre en compte.
Dans ce cas, la table centrale qui rassemble les faits de l'activité sera notre table des ventes. Cette table recense toutes les transactions commerciales, c'est-à-dire les ventes réalisées. Autour de cette table des faits, nous allons créer plusieurs tables de dimensions qui vont décrire les caractéristiques liées à ces ventes :
Le modèle en étoile consiste donc à relier la table des ventes (table de faits) à toutes ces tables de dimensions via des relations de clé, généralement une relation de type un-à-plusieurs. Le but est d'avoir un schéma simple et performant qui facilite l'analyse et la création de mesures dans Power BI.
Pour illustrer ce modèle, j'ai préparé un jeu de données accessible en description, que vous pouvez télécharger et utiliser pour suivre ce tutoriel. Ce fichier Excel contient plusieurs tables :
Ce jeu de données est volontairement simplifié pour que l'on puisse se concentrer sur la modélisation et la construction des relations, sans être noyé dans trop de détails inutiles.
Une fois le fichier Excel téléchargé, il suffit de l'importer dans Power BI en important les différentes tables : clients, calendrier, produits, fournisseurs, et ventes. Toutes les tables apparaissent ensuite dans le volet des données, prêtes à être modélisées.
Power BI crée automatiquement des relations entre les tables dès l'import, mais il est préférable de les supprimer et de les recréer manuellement. Cela permet de mieux comprendre la structure et de s'assurer que les relations correspondent bien au modèle théorique que nous souhaitons mettre en place.
Pour supprimer les relations, vous pouvez soit cliquer droit sur chaque lien dans la vue Modèle et choisir "Supprimer", soit utiliser la gestion des relations pour sélectionner et supprimer toutes les relations d'un coup, ce qui est plus rapide.
Une astuce intéressante dans le volet Propriétés est d'épingler les champs utilisés pour les relations en haut de la carte, ce qui facilite la visibilité et la vérification lorsque vous travaillez avec plusieurs tables.
Nous allons maintenant construire les relations entre les tables, en suivant le modèle en étoile :
Le résultat est un schéma en étoile parfaitement organisé, avec la table des ventes au centre et les tables de dimensions autour. Ce modèle est la clé pour construire des analyses puissantes et efficaces dans Power BI.
Dans Power BI, les relations peuvent être de plusieurs types :
Le sens de la relation est important car il détermine la direction du filtrage des données. Dans un modèle en étoile, le sens va toujours des tables de dimensions vers la table des faits. Cela signifie que lorsqu'on applique un filtre sur une dimension (exemple : sélectionner un produit), ce filtre s'applique automatiquement aux données des ventes.
Une fois le modèle en étoile construit avec des relations un-à-plusieurs bien configurées et un sens de filtrage correct, vous pouvez pleinement exploiter la puissance de Power BI :
Ce modèle est la base pour bâtir des tableaux de bord fiables et dynamiques, qui répondent parfaitement aux besoins des contrôleurs de gestion et des analystes.
En résumé, la création d'un modèle de données fiable sur Power BI passe par une bonne compréhension du modèle en étoile, la préparation d'un jeu de données structuré, et la création manuelle des relations entre les tables. Ce travail de modélisation est la clé pour tirer le meilleur parti de Power BI, en garantissant des performances optimales et une grande flexibilité pour vos analyses.
🔎 Découvrez nos autres articles sur Power BI.
📧 Ne manquez pas nos actualités avec notre newsletter.
👀 Par ici pour découvrir nos formations Power BI.
Ressources gratuites