Power BI - Fusionner des requêtes - théorie Tutoriels

Découvrez comment fusionner des requêtes dans Microsoft Excel grâce à cette formation en ligne.
Cette formation vous permettra de comprendre comment fusionner des données provenant de différentes sources en utilisant la fonction "Fusionner des requêtes", de personnaliser les options de fusion et de manipuler les données fusionnées.
Obtenez des conseils pratiques pour améliorer votre productivité et votre autonomie dans l'utilisation de Microsoft Excel.
Cette formation est destinée aux utilisateurs débutants souhaitant s'initier à la fonction "Fusionner des requêtes" dans Excel.
Suivez cette formation à distance de 45 minutes pour en savoir plus sur la fonction "Fusionner des requêtes" dans Microsoft Excel.

  • 7:46
  • 3627 vues

Objectifs :

Comprendre la notion de fusion de tables dans Power Query, en apprenant à gérer les jointures entre différentes tables de données, et à identifier les différentes méthodes de fusion disponibles.


Chapitres :

  1. Introduction à la Fusion de Tables
    Dans cette section, nous allons aborder un concept essentiel en retraitement de données dans Power Query : la fusion de tables. Cette technique permet de combiner des informations provenant de différentes sources, facilitant ainsi l'analyse des données.
  2. Concept de Fusion de Tables
    Imaginons que nous avons deux tables : l'une contenant des informations sur les régions et leur population, et l'autre sur le nombre de festivals dans ces régions. L'objectif est d'importer le nombre de festivals dans le tableau de population. Pour ce faire, nous utiliserons la fusion de tables, qui consiste à établir des jointures entre les deux tables en utilisant un dénominateur commun, ici les noms des régions.
  3. Mécanisme de la Fusion
    Lors de la fusion, Power Query cherche à faire correspondre les noms des régions dans les deux tables. Par exemple, si 'Bretagne' est présent dans les deux tables, il importera les valeurs correspondantes. Il est crucial que chaque valeur dans la colonne de jointure soit unique pour éviter les conflits.
  4. Gestion des Valeurs Manquantes
    Il est possible que certaines régions soient absentes dans l'une des tables. Dans ce cas, il faut décider comment gérer ces valeurs manquantes : les laisser vides, les supprimer ou les traiter d'une autre manière. Cela dépendra des besoins de l'analyse.
  5. Types de Jointures
    Il existe plusieurs types de jointures que nous pouvons utiliser lors de la fusion de tables :
  6. Conclusion
    La fusion de tables est un outil puissant dans Power Query qui permet de combiner et d'analyser des données de manière efficace. En comprenant les différents types de jointures et comment gérer les valeurs manquantes, vous serez en mesure d'effectuer des analyses plus précises et pertinentes.

FAQ :

Qu'est-ce qu'une fusion de table dans PowerCore?

La fusion de table dans PowerCore consiste à combiner des données de deux tables distinctes en utilisant une colonne de jointure commune, permettant ainsi d'enrichir les données d'une table avec des informations d'une autre.

Quels types de jointures existe-t-il?

Il existe plusieurs types de jointures : jointure externe gauche, jointure externe droite, jointure interne, et jointure externe entière. Chacune a ses propres règles sur la manière dont les données sont combinées.

Comment gérer les valeurs manquantes lors d'une fusion de table?

Lors d'une fusion de table, les valeurs manquantes peuvent être gérées en utilisant des jointures qui remplissent les données manquantes par des valeurs nulles, ou en choisissant de ne pas inclure les lignes sans correspondance selon le type de jointure utilisé.

Qu'est-ce qu'une colonne de jointure?

Une colonne de jointure est une colonne dans les deux tables qui contient des valeurs communes, permettant d'établir une correspondance entre les lignes lors d'une fusion.

Pourquoi est-il important d'avoir des valeurs uniques dans la colonne de jointure?

Il est crucial d'avoir des valeurs uniques dans la colonne de jointure pour éviter les ambiguïtés lors de la fusion des tables, ce qui pourrait entraîner des doublons ou des erreurs dans les données combinées.


Quelques cas d'usages :

Analyse des données démographiques et culturelles

Une entreprise de recherche peut utiliser la fusion de tables pour combiner des données sur la population d'une région avec des informations sur le nombre de festivals, permettant ainsi d'analyser l'impact culturel sur la démographie.

Optimisation des ressources pour des événements

Les organisateurs d'événements peuvent fusionner des données sur la population et le nombre de festivals pour mieux planifier les ressources nécessaires, en s'assurant que les événements sont adaptés à la taille de la population locale.

Rapports de performance régionale

Les gouvernements locaux peuvent utiliser la fusion de tables pour créer des rapports sur la performance régionale en combinant des données économiques avec des données sur les événements culturels, facilitant ainsi la prise de décision.

Études de marché

Les entreprises peuvent fusionner des données de vente avec des données démographiques pour identifier des opportunités de marché, en analysant comment les festivals influencent les comportements d'achat dans différentes régions.


Glossaire :

Fusion de table

Processus d'intégration de données provenant de deux tables distinctes en utilisant une colonne de jointure commune.

Jointure

Méthode permettant de combiner des lignes de deux tables en fonction d'une condition de correspondance.

Jointure externe gauche

Type de jointure qui conserve toutes les lignes de la table de gauche et les lignes correspondantes de la table de droite, remplissant les valeurs manquantes par des valeurs nulles.

Jointure externe droite

Type de jointure qui conserve toutes les lignes de la table de droite et les lignes correspondantes de la table de gauche, remplissant les valeurs manquantes par des valeurs nulles.

Jointure interne

Type de jointure qui ne conserve que les lignes ayant des correspondances dans les deux tables.

Jointure externe entière

Type de jointure qui conserve toutes les lignes des deux tables, remplissant les valeurs manquantes par des valeurs nulles.

Colonne de jointure

Colonne utilisée pour établir une correspondance entre les lignes de deux tables lors d'une fusion.

Valeur nulle

Indication qu'une donnée est absente ou non applicable dans une table.

00:00:00
Alors on va attaquer ici une notion
00:00:02
qui est extrêmement importante
00:00:03
en retraitement de données dans
00:00:05
powercore qui est la fusion de table,
00:00:08
alors à quoi ça consiste ?
00:00:09
Imaginons comme ici qu'on est 2
00:00:11
tables présentes, donc les régions
00:00:13
avec la population et les régions,
00:00:15
avec le nombre de festivals,
00:00:16
ça tombe bien, c'est un peu près
00:00:18
les jeux de données qu'on a.
00:00:20
On va se retrouver du coup avec notre
00:00:21
liste de régions de chacun des 2 côtés,
00:00:23
pas forcément dans le même ordre
00:00:25
quand on peut le voir ici et nous
00:00:27
notre objectif ça va être de pouvoir
00:00:29
importer le nombre de festivals
00:00:30
dans le tableau de la population
00:00:32
pour après il effectuer des.
00:00:34
Des calculs potentiellement faire
00:00:36
plutôt l'inverse d'aller importer les
00:00:38
populations dans mon tableau avec le
00:00:40
nombre de festivals et donc pour faire ça,
00:00:42
on va utiliser ce qu'on appelle
00:00:44
des fusions de table.
00:00:46
Et donc, qu'est-ce que ça va faire
00:00:47
qu'on va appliquer une fusion ?
00:00:48
Eh bien, le système,
00:00:50
donc powercore,
00:00:51
va chercher à trouver des liaisons,
00:00:53
des jointures en fait plaisir.
00:00:55
D'accord donc si tu veux lier
00:00:56
les 2 tables entre elles,
00:00:58
quel est le dénominateur commun qui
00:01:00
va me permettre de les croiser ?
00:01:01
Alors moi ce que je peux lui dire
00:01:03
c'est que du coup les noms des
00:01:04
régions sont les mêmes entre les 2
00:01:05
tables et donc à chaque fois que tu
00:01:07
vas trouver un nom qui match bien,
00:01:09
tu vas aller m'apporter la valeur,
00:01:10
c'est un peu comme une recherche
00:01:12
V dans Excel si vous utilisez un
00:01:13
petit peu Excel où là du coup la
00:01:15
Bretagne va se repérer et va se dire
00:01:17
d'accord donc la valeur était ici.
00:01:19
Bourgogne la valeur est ici et Auvergne
00:01:22
la valeur Auvergne Rhône-Alpes la
00:01:23
valeur est ici et à partir de là du coup,
00:01:26
il va aller importer.
00:01:28
Les nombres de de festivals
00:01:30
dans l'autre tableau donc,
00:01:32
une jointure,
00:01:33
une fusion,
00:01:34
c'est tout simplement ça et
00:01:35
l'élément très important,
00:01:36
c'est d'avoir la capacité d'avoir cette
00:01:38
fameuse colonne de jointure entre les 2
00:01:41
tables pour pouvoir faire son apport.
00:01:42
Ça veut dire qu’il faut que chaque
00:01:44
valeur soit unique et là on va faire
00:01:46
écho à tout ce que je vous ai dit
00:01:47
là autour de cette histoire de nom
00:01:49
de festival qui n'était pas unique
00:01:50
où code de Festival qui n'était pas
00:01:52
unique parce que pour chacune des lignes,
00:01:54
si on a potentiellement 2 fois la Bretagne,
00:01:56
ça ne peut pas,
00:01:57
ça ne peut pas fonctionner.
00:02:01
On verra que dans certains cas,
00:02:03
nous n'avons pas forcément,
00:02:05
à chaque fois exactement les mêmes
00:02:07
disponibilités d'informations.
00:02:09
Par exemple, je peux très bien
00:02:11
me retrouver dans un tableau ici
00:02:12
avec ici une région qui manque par
00:02:15
rapport à celle-ci et dans ce cas-là,
00:02:17
comment doit-on gérer ce cas-là
00:02:18
et ce qu'on doit laisser ?
00:02:20
La colonne en question la ligne
00:02:22
en question vide et ce qu'on doit
00:02:24
la supprimer et ce qu'on doit la,
00:02:26
la romanité, parler d'une autre manière.
00:02:28
Et bien ça, ça va être toutes
00:02:30
les options autour des fusions de
00:02:32
tables qui vont être disponibles.
00:02:33
Et donc on va regarder ça tout
00:02:36
de suite ensemble.
00:02:37
Avec 2 tableaux relativement simples,
00:02:39
?
00:02:39
On a largement simplifié pour que
00:02:41
je vous expliqué ça,
00:02:42
donc on va avoir des régions ici
00:02:44
dans un tableau avec la population,
00:02:45
donc la région à,
00:02:46
B et C et un 2e tableau avec les
00:02:49
nombres de festivals avec BCE.
00:02:51
Alors ce qu'on va remarquer tout de suite,
00:02:53
c'est que du coup dans ce tableau
00:02:55
là manque la valeur A donc là on
00:02:57
aura un souci au moment
00:02:58
de la fusion et dans ce tableau
00:03:01
là manque la valeur e donc il va
00:03:03
falloir encore une fois voir un
00:03:05
petit peu comment on va gérer ça.
00:03:08
La première manière de faire,
00:03:10
c'est de dire que je vais faire un,
00:03:13
donc là on va voir tous les types
00:03:14
de jointures qui sont possibles,
00:03:15
donc essayer de de bien retenir les
00:03:18
les termes même si pouvoir Query vous
00:03:20
les affichera le premier c'est ce
00:03:22
qu'on appelle la jointure externe gauche,
00:03:23
donc ayez bien en tête que c'est ce
00:03:26
tableau-là qui va être le receveur
00:03:28
de la colonne nombre festival .
00:03:29
Donc la notion de gauche et
00:03:31
de droite est très importante
00:03:32
puisqu’ici ça sera la colonne,
00:03:34
ça sera le la table de gauche
00:03:36
et ici la table de droite.
00:03:37
Et là en gros,
00:03:38
ça résumé un petit peu ce schéma là
00:03:39
qui est de dire, Eh bien, je vais.
00:03:42
En cas d'une jointure externe gauche,
00:03:43
je vais garder toutes les valeurs d'origine,
00:03:45
donc il faut absolument que je retrouve
00:03:47
tout mon tableau ici et après tu
00:03:48
va simplement compléter avec ce
00:03:50
que tu trouves dans l'autre tableau,
00:03:52
donc ce que ça donne dans les faits ici
00:03:54
ma colonne région va me retourner du
00:03:56
coup à BC c'est bien ce qu'on demande ici,
00:03:58
l'externe gauche donc uniquement
00:04:00
le tableau d'origine et dans le
00:04:02
cas où je n'avais pas de valeur
00:04:04
pour nombreux festivals et bien
00:04:06
il va simplement me retourner.
00:04:07
La valeur nulle.
00:04:09
Et ensuite pour le B et bien là,
00:04:11
il a bien réussi à faire l'import de
00:04:13
45 et pour le C, la bien la valeur 39,
00:04:16
donc là retenez bien 2 choses,
00:04:19
il importe uniquement le tableau d'origine.
00:04:21
En tout cas les valeurs et c'est
00:04:23
pour ça que E est ignoré et pour
00:04:25
toutes les valeurs qui manquent
00:04:27
dans nombreux festivals.
00:04:28
Et bien il me met une valeur
00:04:30
nulle donc premier
00:04:31
cas de figure, la jointure externe gauche.
00:04:36
Ensuite, on a l'autre
00:04:37
type de jointure externe,
00:04:38
donc qui va être de l'autre côté,
00:04:40
donc là excusez-moi pour le
00:04:42
titre donc ça sera la jointure
00:04:43
externe droite ou la du coup,
00:04:44
Eh bien c'est tout simplement l'inverse.
00:04:46
C'est à dire que toutes les colonnes
00:04:49
d'origine de ce tableau doivent
00:04:51
être conservées et du coup donc on
00:04:53
aura BCE et dans le cas où dans
00:04:55
population il manque une valeur
00:04:56
donc ce qui était le cas pour la
00:04:58
valeur qui n'existe pas et bien
00:05:00
on retourne la valeur nulle et
00:05:01
la colonne A est ignorée puisqu’
00:05:03
on privilégié ce tableau-là.
00:05:07
Maintenant le cas un peu plus restrictif,
00:05:09
on va faire ce qu'on appelle une
00:05:11
jointure interne jointure interne.
00:05:12
Ça veut dire qu'on va prendre
00:05:14
strictement les cas où il y a une
00:05:16
correspondance entre les 2 tableaux.
00:05:17
Donc en gros il va se dire OK donc
00:05:19
là la première colonne c'est à
00:05:20
est-ce que j'ai un équivalent ici ?
00:05:22
Ça n'est pas le cas donc je supprime
00:05:24
cette ligne des données B j'ai bien
00:05:26
la valeur donc je vais l'ajouter ici.
00:05:28
La colonne la valeur C elle est bien ici
00:05:30
des 2 côtés donc je vais la rajouter et
00:05:32
ensuite je passe dans l'autre tableau.
00:05:34
Je vois la valeur e est-ce qu'il
00:05:35
y a un équivalent ? Non ?
00:05:37
Eh bien je ne la prends pas,
00:05:38
ce qui fait qu’ici on ne peut
00:05:41
qu’avoir un tableau complet.
00:05:44
On ne peut pas manquer de valeur
00:05:46
puisque justement,
00:05:48
on fait un cadre très restrictif.
00:05:49
On ne prend que le.
00:05:51
Le match entre les 2 tables.
00:05:57
Alors le cas, à l'inverse,
00:05:58
qui est beaucoup plus large,
00:06:00
ça va être les jointures, les jointures,
00:06:02
pardon externes entières.
00:06:04
Donc là, comme son nom l'indique,
00:06:05
en gros là on va prendre absolument
00:06:07
toutes les combinaisons même
00:06:08
quand il n’y a pas d'équivalence,
00:06:09
donc en gros il va prendre la colonne à
00:06:11
il va rajouter nul puisqu’ici je n'ai
00:06:13
pas de valeur donc ça c'était comme
00:06:15
pour la jointure externe gauche BC,
00:06:17
il n'y a pas de sujet et là pour la
00:06:19
valeur e donc là il l'importe
00:06:20
parce que là ici on va vraiment tout
00:06:22
prendre et donc placer la valeur
00:06:24
51 qu'on a et la valeur nulle.
00:06:26
Pour ici, donc ça c'est le cas plus
00:06:28
large où il y a aucune perte de
00:06:30
données et par contre des valeurs
00:06:31
annulés dans certains cas et pour
00:06:33
les 2 colonnes qui sont recueillies.
00:06:38
Là, on va rentrer dans des cas un
00:06:40
peu plus un peu plus exotiques,
00:06:41
on va dire un peu plus particulier
00:06:43
mais qui peuvent avoir son
00:06:44
intérêt dans certains cas-là,
00:06:45
typiquement ce qu'on va chercher à isoler,
00:06:47
ce sont les colonnes, ce sont les valeurs,
00:06:50
pardon où il n'y a pas de correspondance
00:06:52
dans le tableau d'en face et on
00:06:55
va ne conserver que celle-ci.
00:06:56
Donc ici, par exemple,
00:06:58
on comme on l'a vu plusieurs fois,
00:07:00
la seule valeur qui manque dans ce tableau,
00:07:01
c'est la valeur à.
00:07:02
On voit que BC est présent donc
00:07:04
en fait BC ça ne m'intéresse pas.
00:07:06
Je ne cherche que les
00:07:08
valeurs qui sont spécifiques.
00:07:10
À mon tableau de gauche et donc
00:07:11
je vais ici prendre uniquement la
00:07:13
Colonne A donc très restrictif,
00:07:15
donc ici je ne peux avoir
00:07:17
que des valeurs nulles.
00:07:19
Et là jointure entre droite,
00:07:20
c'est exactement l'inverse.
00:07:22
Donc à savoir
00:07:25
la colonne
00:07:26
la valeur E pardon ou du coup la
00:07:28
population annulée avec le nombre
00:07:30
de festivals à 51 et j'exclus tous
00:07:32
les autres qui sont bien présents
00:07:34
déjà dans mon tableau de gauche.
00:07:39
Donc j'espère que tout a bien été
00:07:40
clair pour vous et on se retrouve
00:07:42
tout de suite pour aller appliquer
00:07:44
ça dans notre tableau de festival.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher