Group By : Comment agréger des données dans Power BI ?

Dans cet article, je vais vous guider pas à pas pour maîtriser la fonction Group By dans Microsoft Power BI, en partant d'un niveau débutant jusqu'à un niveau plus avancé. L'objectif est simple : apprendre à agréger des données efficacement pour passer d'une table brute à un calcul de résultat comptable clair et précis. Cette méthode vous permettra de gagner du temps et de structurer vos données intelligemment, en exploitant pleinement les fonctionnalités offertes par Power BI.

Présentation des données

Pour commencer, il est essentiel de bien comprendre la structure des données avec lesquelles nous allons travailler. Nous disposons d'un fichier Excel appelé modèle data group by qui contient plusieurs colonnes :

  • Numéro de compte : identifiant du compte (à convertir en texte pour éviter les erreurs)
  • Libellé : nom du produit ou de la transaction
  • Sous-catégorie : classification intermédiaire des données
  • Catégorie : catégorie générale (ex : produits, achats)
  • Valeur : montant associé à chaque ligne

À titre d'exemple, un produit peut apparaître plusieurs fois dans la table avec des valeurs différentes correspondant à des ventes répétées. Par exemple, le produit un a été vendu à plusieurs reprises avec des montants de 2293 euros, 950 euros, puis 2109 euros. Notre objectif est d'agréger ces lignes pour obtenir une seule ligne par produit avec la somme totale des ventes.

Utilisation de la fonction Group By pour l'agrégation

La première étape consiste à utiliser la fonction Group By dans Power Query pour regrouper et agréger les données. Voici comment procéder :

  1. Conversion du numéro de compte en texte : cela permet d'éviter des erreurs lors des traitements ultérieurs.
  2. Sélection des colonnes à conserver : dans notre cas, on garde le libellé et la sous-catégorie.
  3. Agrégation de la colonne valeur : on effectue la somme des valeurs pour chaque groupe.

Concrètement, vous allez dans Power Query, sélectionnez la colonne Libellé, puis cliquez sur Regroupement par. Ensuite, vous ajoutez la colonne Sous-catégorie comme deuxième critère de regroupement. Enfin, vous définissez une nouvelle colonne appelée Valeur qui correspond à la somme des montants associés.

Le résultat est une table simplifiée où chaque produit n'apparaît qu'une seule fois avec la somme totale de ses ventes, par exemple 5302 euros pour le produit un. Cette méthode est très puissante pour condenser des données volumineuses en informations exploitables.

Regroupement par catégorie : produits et achats

On peut aller plus loin en regroupant non seulement par produit, mais aussi par catégorie, comme les produits et les achats. La démarche est similaire :

  1. Utiliser à nouveau la fonction Group By en sélectionnant la colonne Sous-catégorie pour conserver cette granularité.
  2. Effectuer la somme des valeurs dans la colonne Valeur.

Vous obtenez ainsi une table qui résume les ventes et les achats par sous-catégorie, ce qui est très utile pour analyser les flux financiers et commerciaux.

Calcul du résultat comptable : une approche avancée

Le véritable défi consiste à calculer un résultat comptable qui fait la différence entre les produits et les achats. Pour cela, il faut adapter la méthode précédente en intégrant une logique conditionnelle qui distingue les valeurs positives (produits) des valeurs négatives (achats).

Voici les étapes clés :

  1. Création d'une copie de la table initiale : grâce à la fonction Référence dans Power Query, on duplique la table sans la recalculer entièrement.
  2. Ajout d'une colonne conditionnelle : cette colonne, que l'on appellera Valeur 2, va transformer les montants des comptes d'achats en valeurs négatives.

La colonne conditionnelle utilise une formule en langage M, qui ressemble à ceci :

if Text.StartsWith([Numéro de compte], "6") then [Valeur] * -1 else [Valeur]

Cette formule vérifie si le numéro de compte commence par « 6 », ce qui correspond souvent aux comptes d'achats dans la comptabilité. Si c'est le cas, la valeur est multipliée par -1 pour la rendre négative. Sinon, la valeur reste inchangée.

Cette étape est cruciale car elle permet d'intégrer la notion de charges (achats) négatives dans le calcul global.

Agrégation finale avec la catégorie

Une fois la colonne conditionnelle créée, on peut procéder à une nouvelle agrégation :

  • On regroupe par la colonne Catégorie (produits, achats, etc.)
  • On effectue la somme des valeurs de la nouvelle colonne Valeur 2

Le résultat final est un tableau qui présente en une seule ligne le résultat comptable, c'est-à-dire la différence entre les produits et les achats, calculée automatiquement et prête à être utilisée dans vos rapports Power BI.

Conseils pratiques et recommandations

Voici quelques astuces pour optimiser votre utilisation de la fonction Group By et améliorer vos modèles Power BI :

  • Toujours convertir les colonnes clés en texte pour éviter les erreurs de type lors des transformations.
  • Utiliser la fonction Référence pour dupliquer les tables sans recalculer les étapes précédentes, ce qui accélère le traitement.
  • Créer des colonnes conditionnelles personnalisées en langage M pour appliquer des règles métier spécifiques, comme la transformation des montants en négatif selon le numéro de compte.
  • Valider systématiquement les types de colonnes (texte, nombre décimal, etc.) afin d'éviter les erreurs lors des agrégations.
  • Tester vos agrégations étape par étape pour s'assurer que les résultats correspondent bien à vos attentes comptables.

Pourquoi maîtriser l'agrégation dans Power BI est indispensable

Dans le monde de la data et du reporting, savoir agréger les données est une compétence fondamentale. Power BI offre des outils puissants pour transformer des tables brutes en informations synthétiques et exploitables. La fonction Group By est au cœur de ce processus.

Grâce à elle, vous pouvez :

  • Réduire la complexité de vos données en condensant plusieurs lignes en une seule.
  • Calculer facilement des totaux, moyennes, ou autres métriques clés.
  • Préparer vos données pour des analyses plus poussées, comme la création de tableaux de bord dynamiques.
  • Automatiser la transformation de données comptables pour obtenir des résultats fiables et rapides.

Au-delà de la simple somme, la possibilité de créer des colonnes conditionnelles ouvre la porte à des calculs personnalisés adaptés à vos besoins métiers, ce qui est un atout majeur pour les analystes et les contrôleurs de gestion.

Conclusion

En résumé, la fonction Group By dans Power BI est un outil incontournable pour tout utilisateur souhaitant structurer et analyser ses données efficacement. Que vous soyez débutant ou avancé, il est possible de passer d'une simple agrégation de lignes à un calcul complexe de résultat comptable en quelques clics.

Voici les points clés à retenir :

  1. Commencez par bien préparer vos données (conversion des types, nettoyage).
  2. Utilisez Group By pour regrouper vos données selon les colonnes pertinentes.
  3. Créez des colonnes conditionnelles pour intégrer des règles métier spécifiques.
  4. Référencez vos tables pour optimiser les performances et éviter les recalculs inutiles.
  5. Validez vos résultats à chaque étape pour garantir la fiabilité de vos calculs.

Je vous encourage à tester cette méthode dans vos propres projets Power BI. N'hésitez pas à expérimenter avec vos données et à adapter les formules selon vos besoins spécifiques.

🔎 Découvrez nos autres articles sur Power BI.

📧 Ne manquez pas nos actualités avec notre newsletter.

👀 Par ici pour découvrir nos formations Power BI.

Copyright 2025 | Tous Droits Réservés