Power BI - Relation plusieurs à plusieurs Tutoriels

Découvrez comment créer une relation plusieurs à plusieurs dans Microsoft 365 grâce à cette vidéo pratique.
Cette fonctionnalité permet de lier une table de données à une autre table qui contient plusieurs clés communes pour faciliter l'analyse et la visualisation des données.
Obtenez des conseils pratiques pour identifier les clés communes et créer la relation entre les tables dans Power Pivot.
Cette vidéo est destinée aux utilisateurs débutants souhaitant se familiariser avec la création de relations dans Microsoft 365. Suivez cette vidéo pour en savoir plus sur cette fonctionnalité pratique pour mieux gérer vos données et améliorer vos analyses.

  • 6:32
  • 3929 vues

Objectifs :

Comprendre la cardinalité plusieurs à plusieurs dans les bases de données et apprendre à gérer les relations entre les tables en utilisant des exemples pratiques.


Chapitres :

  1. Introduction à la Cardinalité Plusieurs à Plusieurs
    La cardinalité plusieurs à plusieurs est un concept essentiel dans la gestion des bases de données. Ce type de relation permet à plusieurs enregistrements d'une table d'être associés à plusieurs enregistrements d'une autre table. Ce module se concentre sur la compréhension de cette cardinalité et sur la manière de la gérer efficacement.
  2. Définition et Importance
    La cardinalité plusieurs à plusieurs est particulièrement pertinente dans des scénarios où les données sont interconnectées. Par exemple, dans un tableau qui contient des départements, des festivals et des participants, chaque département peut avoir plusieurs festivals, et chaque festival peut avoir plusieurs participants. Cela nécessite une gestion adéquate pour éviter les doublons et garantir l'intégrité des données.
  3. Gestion des Doublons
    Lors de la création de relations entre les tables, il est crucial de prendre en compte les doublons. Par exemple, si l'on souhaite analyser la population par département et par tranche d'âge, il est probable que certaines valeurs apparaissent plusieurs fois. Il est donc nécessaire d'agréger les données pour obtenir des résultats précis. Voici quelques étapes à suivre : - Identifier les doublons dans les données. - Agréger les valeurs pour obtenir des totaux par département. - S'assurer que les relations entre les tables sont correctement établies.
  4. Utilisation de Power Query
    Pour gérer les données efficacement, nous allons utiliser Power Query. Voici les étapes à suivre : 1. Accéder à Power Query et importer les données des participants par département. 2. Renommer les colonnes pour une meilleure clarté. 3. Vérifier les formats des données, notamment pour les départements et les âges. 4. Créer des jointures entre les tables en s'assurant que les formats correspondent. 5. Appliquer les transformations nécessaires pour obtenir un tableau final.
  5. Création du Tableau Final
    Une fois les données importées et les jointures créées, il est temps de construire le tableau final. Voici comment procéder : - Ajouter les départements et les volumes de participants dans le tableau. - Vérifier les types d'agrégation pour chaque colonne. - S'assurer que les relations entre les données sont correctement établies pour éviter les erreurs de calcul. Il est important de ne pas descendre à des granularités trop faibles, car cela pourrait entraîner des incohérences dans les résultats.
  6. Conclusion
    La gestion de la cardinalité plusieurs à plusieurs est un aspect fondamental de la modélisation des données. En comprenant comment gérer les relations entre les tables et en utilisant des outils comme Power Query, on peut créer des analyses précises et significatives. Il est essentiel de prêter attention aux doublons et aux types d'agrégation pour garantir l'intégrité des données.

FAQ :

Qu'est-ce que la cardinalité dans une base de données?

La cardinalité décrit la nature des relations entre les tables dans une base de données, spécifiant combien d'enregistrements d'une table peuvent être liés à des enregistrements d'une autre table.

Comment gérer une cardinalité plusieurs à plusieurs?

Pour gérer une cardinalité plusieurs à plusieurs, il est souvent nécessaire d'utiliser une table intermédiaire qui contient les clés de réconciliation des deux tables concernées.

Qu'est-ce qu'une clé de réconciliation?

Une clé de réconciliation est un identifiant utilisé pour établir des relations entre deux tables, permettant de relier des enregistrements correspondants.

Pourquoi l'agrégation est-elle importante dans l'analyse de données?

L'agrégation est essentielle car elle permet de résumer de grandes quantités de données en valeurs significatives, facilitant ainsi l'analyse et la prise de décision.

Comment utiliser Power Query pour importer des données?

Power Query permet d'importer des données en se connectant à différentes sources, en transformant les données selon les besoins, et en les intégrant dans Excel pour une analyse ultérieure.


Quelques cas d'usages :

Analyse des participants à des festivals par département

Dans le cadre d'un événement culturel, les organisateurs peuvent utiliser la cardinalité plusieurs à plusieurs pour analyser le nombre de participants par département et par tranche d'âge, permettant ainsi d'optimiser la planification des ressources.

Gestion des données démographiques

Les agences gouvernementales peuvent appliquer les concepts de cardinalité et d'agrégation pour gérer et analyser les données démographiques par département, facilitant ainsi la prise de décisions éclairées sur les politiques publiques.

Optimisation des campagnes marketing

Les équipes marketing peuvent utiliser les relations plusieurs à plusieurs pour cibler des campagnes en fonction des festivals et des départements, en analysant les données de participation pour ajuster leurs stratégies.

Évaluation des ressources nécessaires pour des événements

Les organisateurs d'événements peuvent utiliser Power Query pour importer et analyser les données de population et de participants, leur permettant de prévoir les ressources nécessaires en fonction des tendances de participation.


Glossaire :

Cardinalité

La cardinalité fait référence à la relation entre deux tables dans une base de données, indiquant combien d'instances d'une table peuvent être associées à une instance d'une autre table.

Cardinalité plusieurs à plusieurs

Une relation où plusieurs enregistrements d'une table peuvent être associés à plusieurs enregistrements d'une autre table. Par exemple, un département peut avoir plusieurs festivals, et un festival peut être associé à plusieurs départements.

Clé de réconciliation

Une clé utilisée pour établir une relation entre deux tables, permettant de lier des enregistrements correspondants.

Agrégation

Le processus de regroupement de données pour obtenir des valeurs résumées, comme la somme ou la moyenne, souvent utilisé dans les analyses de données.

Power Query

Un outil de Microsoft Excel qui permet de connecter, combiner et affiner des données provenant de différentes sources.

Jointure

Une opération en base de données qui combine des enregistrements de deux tables basées sur une condition de correspondance.

00:00:00
Alors on va voir le dernier type de
00:00:03
cardinalité ensemble qui est la cardinalité.
00:00:06
Plusieurs à plusieurs et ça en fait,
00:00:08
c'est assez récent dans pour bien que ça
00:00:10
soit géré correctement parce qu'avant il
00:00:11
fallait faire plein de manipulations pour
00:00:13
pouvoir gérer ce type de cardinalité.
00:00:15
Et maintenant c'est natif donc
00:00:16
c'est une très bonne nouvelle.
00:00:17
À quoi ça correspond mais en fait c'est
00:00:19
le dernier cas qu'on n'a pas encore vu,
00:00:20
c'est à dire que de chaque côté,
00:00:22
la clé de réconciliation entre les 2
00:00:25
tables il y a des valeurs dupliquées,
00:00:27
donc on est toujours ici par exemple
00:00:30
sur un tableau. Qui contient les.
00:00:32
Par exemple, les départements avec les
00:00:35
festivals et finalement les participants.
00:00:37
Et ici, on va avoir également
00:00:39
des valeurs dupliquées,
00:00:39
c'est à dire qu'on va importer et ça,
00:00:41
on va le faire juste après.
00:00:42
La population,
00:00:43
par département mais aussi par tranche d'âge,
00:00:46
ce qui fait qu'on va se retrouver plusieurs
00:00:47
fois avec Essonne selon la tranche d'âge,
00:00:48
donc là les 018 et les 25,
00:00:51
35 de l'Essonne.
00:00:52
Et donc ça fatalement en fait,
00:00:54
il va falloir prendre en compte
00:00:57
ce facteur-là dans la relation
00:00:59
puisque là si par exemple on fait.
00:01:02
En une liaison entre les 2,
00:01:04
il va d'abord y avoir une
00:01:05
agrégation donc par exemple se dire mais
00:01:07
en fait mon volume de participants,
00:01:09
si c'est ça que je souhaite faire
00:01:11
par département,
00:01:11
et bien c'est la somme la des
00:01:13
participants donc par exemple ici
00:01:15
Essonne y avait 30000 et ici 11000 donc
00:01:17
je fais 41000 et je fais pareil pour
00:01:19
les autres et là de la même manière,
00:01:21
le volume d'habitants je vais le Sommer
00:01:22
en ignorant la tranche d'âge donc ça
00:01:24
c'est l'agrégation que je fais pour
00:01:26
finalement me proposer ce tableau-là.
00:01:28
Du coup 2 départements versus participants
00:01:31
versus habitants donc en fait oui.
00:01:33
On a des cardinalités à plusieurs,
00:01:34
mais selon les croisements qu'on
00:01:36
souhaite faire à savoir si on
00:01:37
voulait les départements,
00:01:38
les participants et les habitants,
00:01:39
on va avoir des étapes intermédiaires
00:01:42
de régulation ou du coup on va pouvoir
00:01:45
retomber sur des cardinalités classiques
00:01:47
et pouvoir construire notre tableau.
00:01:50
Et donc ça se matérialise,
00:01:52
ça, ça se matérialise,
00:01:54
alors là on ne la voit pas.
00:01:57
Je n’ai pas pris la bonne bon ce n’est pas grave,
00:01:58
ce n’est pas grave façon on va la créer
00:02:00
et donc pour ça on va se rendre dans
00:02:03
notre tableau de festival et on va
00:02:06
je suis désolé, on va y retourner,
00:02:08
du coup on va aller dans Power Query
00:02:10
donc on va aller ici dans transformer
00:02:12
les données et on va aller importer
00:02:14
notre table de participants.
00:02:17
Par département, non de population,
00:02:19
pardon par département et donc
00:02:21
voyez ici le classeur Excel et on
00:02:24
va aller chercher nos départements.
00:02:26
Voilà population partagée par département.
00:02:35
Qu'on va récupérer les données.
00:02:42
Voilà parfait.
00:02:43
Et donc on va juste renommer ça.
00:02:47
On va mettre population.
00:02:50
Population par âge et par
00:02:55
département voilà et on va vérifier
00:02:58
un petit peu les formats,
00:03:00
donc département numéro de département.
00:03:03
Alors oui là je ne vais pas pouvoir le
00:03:05
passer en nombre parce que nous avons.
00:03:07
La Corse avec les 2 à et les 2B.
00:03:10
Pour l'instant,
00:03:10
je vais laisser comme ça l'âge,
00:03:11
on va le laisser aussi.
00:03:12
Cependant la population,
00:03:13
elle est bien au bon format,
00:03:15
donc là on est plutôt pas mal et on va
00:03:19
chercher du coup à faire la jointure,
00:03:21
alors juste on va se poser la
00:03:24
question de comment on va faire
00:03:26
la jointure au plus simple.
00:03:28
Est-ce que on est bien au même format ?
00:03:31
Au niveau des festivals,
00:03:33
est-ce qu'on a bien le
00:03:35
département écrit comme ça ?
00:03:36
Oui, mon département.
00:03:37
Ben écoutez,
00:03:38
ça m'a l'air pas mal donc
00:03:39
on va pouvoir se baser.
00:03:39
Il y a bien les accents circonflexes.
00:03:45
Ce qui m'a bien mis les circonflexes ici.
00:03:51
Oui, code dehors.
00:03:52
OK Ben écoutez, c'est parfait,
00:03:53
on va plutôt partir sur cette jointure-là.
00:03:55
Je voulais faire sur potentiellement
00:03:56
le numéro mais comme.
00:03:58
Y a les 2, ça va être un peu compliqué.
00:04:01
Donc on a notre tableau,
00:04:02
on va aller appliquer ça et donc on
00:04:04
voit évidemment ce que du coup vu que
00:04:06
j'ai par tranche d'âge que potentiel,
00:04:07
je vais fatalement avoir des doublons ici.
00:04:10
Et je vais cliquer sur appliquer.
00:04:13
Pour pouvoir apporter.
00:04:17
Dans mon jeu de données ici,
00:04:19
cette nouvelle valeur, donc voilà,
00:04:23
et donc là je vais pouvoir faire
00:04:24
le lien avec mon département.
00:04:26
Donc ici je vais faire
00:04:29
département et non département.
00:04:31
Et donc là il va me dire que je peux
00:04:33
bien faire une relation à plusieurs
00:04:35
plusieurs à plusieurs, il me fait.
00:04:37
Il m'a indiqué qu'il faut que
00:04:38
je fasse attention parce que,
00:04:40
effectivement, selon les retraitements,
00:04:41
je vais faire si je veux vraiment descendre
00:04:43
à une granularité ligne par ligne.
00:04:45
En fait, ça ne sera pas possible parce qu’il
00:04:46
n’y a pas de correspondance ligne par ligne.
00:04:48
Fatalement, chaque y a plusieurs lignes,
00:04:50
donc par exemple pour le l'Allier,
00:04:53
je vais avoir plusieurs lignes.
00:04:54
Dans les 2 cas,
00:04:55
donc je ne pourrais jamais descendre à
00:04:57
la granularité festival ou descendre
00:04:59
à la granularité,
00:05:00
département de de l'autre côté.
00:05:02
Voilà donc bien faire attention à ça.
00:05:05
Et on va cliquer sur OK.
00:05:10
Voilà, et du coup,
00:05:11
j'ai ce symbole-là qui va s'afficher,
00:05:13
à savoir la double étoile ici.
00:05:16
Maintenant que j'ai ça,
00:05:17
on va aller se rendre ici et on va
00:05:20
aller créer notre jeu de données,
00:05:21
donc on va aller rajouter.
00:05:24
Notre département dans un tableau.
00:05:27
Donc ici,
00:05:28
on va prendre le nom de département,
00:05:31
voilà mon département.
00:05:33
Donc on voit qu'on a des valeurs vides,
00:05:35
ce n’est pas grave, on va aller
00:05:38
chercher mon volume de participants.
00:05:41
Voilà, on va les classer de cette manière-là.
00:05:45
Et on va aller chercher.
00:05:49
Dans.
00:05:49
Ce tableau-là, le volume de.
00:05:54
Population ici voilà.
00:05:56
Et donc ici,
00:05:58
on va pouvoir à chaque fois vérifier
00:06:00
le type d'agrégation qui est fait donc
00:06:01
ici la somme ça me va parfaitement.
00:06:03
Et ici, une somme aussi,
00:06:04
ça me va parfaitement,
00:06:05
mais voyez que là maintenant,
00:06:06
sur les 2 colonnes que j'ai utilisées
00:06:08
dans la liaison et bien on me
00:06:10
propose à chaque fois le type de
00:06:13
retraitement que je souhaite réaliser
00:06:15
donc faites bien attention à ça.
00:06:16
Un cancer de l'agrégation
00:06:18
typiquement sur la colonne
00:06:20
de Liaison n’y a pas de souci,
00:06:21
mais n'essayez pas de redescendre à
00:06:23
des granularités trop faibles puisque
00:06:25
encore une fois il n'y aura pas de
00:06:27
relation un à un sur le tableau,
00:06:28
donc ça peut vous amener à
00:06:30
calculer des choses erronées.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher