Power BI - Introduction à la notion de data model Tutoriels

Découvrez comment créer un modèle de données pour une utilisation professionnelle dans Microsoft 365 grâce à cette vidéo informative.
Cette vidéo présente les étapes clés pour comprendre la notion de modèle de données et comment créer un modèle de données à l'aide de Power Pivot.
Obtenez des conseils pratiques pour organiser vos données et créer des relations entre les tables pour optimiser la manipulation et l'analyse des données.
Suivez cette vidéo pour en savoir plus sur la création de modèles de données dans Microsoft 365 et comment cela peut vous aider à améliorer les performances de votre entreprise.

  • 9:03
  • 3745 vues

Objectifs :

L'objectif de cette section est de comprendre le modèle de données dans Power BI, y compris la création de relations entre les tables et l'importance de ces relations pour l'analyse des données.


Chapitres :

  1. Introduction au Modèle de Données
    Dans cette section, nous allons explorer le modèle de données dans Power BI, une notion fondamentale pour la gestion et l'analyse des données. Après avoir terminé avec Power Query, nous nous concentrerons sur la gestion du modèle de données, qui est essentiel pour créer des rapports efficaces.
  2. Qu'est-ce que le Modèle de Données?
    Le modèle de données est une zone d'entrée dans Power Query et Power Pivot. Il permet de visualiser les données et de comprendre les relations potentielles entre les différentes tables. Nous avons trois onglets principaux : la zone de rapport, la zone de données, et la zone modèle.
  3. Importance des Relations entre les Tables
    Les relations entre les tables sont cruciales pour croiser les données. Par exemple, si nous avons une table des régions avec la population et une autre table avec le nombre de festivals, nous pouvons créer une jointure entre ces deux tables pour enrichir notre analyse. Cependant, il est important de noter que les jointures peuvent entraîner des duplications de données et alourdir le processus de mise à jour.
  4. Éviter les Jointures Inutiles
    Il est parfois plus pertinent de créer des relations entre les tables plutôt que de faire des jointures. Cela permet d'éviter la duplication des données et de garder les informations dans leurs tables respectives. Les relations sont définies par des colonnes communes, et elles ne nécessitent pas de calculs à chaque mise à jour.
  5. Création de Relations dans Power BI
    Power BI détecte automatiquement les relations entre les tables lorsque vous les importez. Ces relations sont représentées par des lignes entre les tables, indiquant le sens de la jointure et le type de cardinalité. Vous pouvez également ajuster la disposition des tables dans le modèle de données pour une meilleure visualisation.
  6. Exemple Pratique de Création de Tableaux
    Pour illustrer l'utilisation des relations, nous allons créer un tableau dans la zone de rapport. Nous allons sélectionner des données des tables de festivals et de participants, en veillant à ce que les colonnes soient correctement formatées pour permettre les jointures. Cela nous permettra de visualiser les données de manière plus granulaire.
  7. Conclusion
    En résumé, la gestion du modèle de données et la création de relations entre les tables sont essentielles pour une analyse efficace dans Power BI. En évitant les jointures inutiles et en utilisant des relations, nous pouvons optimiser nos rapports et réduire la duplication des données.

FAQ :

Qu'est-ce que Power Query et comment l'utiliser ?

Power Query est un outil de Microsoft qui permet d'importer et de transformer des données. Pour l'utiliser, vous devez l'ouvrir dans Excel ou Power BI, puis sélectionner les données que vous souhaitez importer et appliquer les transformations nécessaires.

Comment créer un Data Model dans Power BI ?

Pour créer un Data Model dans Power BI, vous devez importer vos tables de données, puis établir des relations entre elles en utilisant des colonnes communes. Cela vous permettra d'analyser les données de manière intégrée.

Quelle est la différence entre une jointure et une relation dans un Data Model ?

Une jointure combine les données de plusieurs tables en une seule table, tandis qu'une relation établit un lien entre les tables sans les combiner, permettant d'accéder aux données de manière dynamique lors de l'analyse.

Comment éviter la duplication des données lors de l'importation ?

Pour éviter la duplication des données, il est conseillé d'utiliser des relations plutôt que des jointures lors de l'importation. Cela permet de garder les données dans leurs tables d'origine tout en les reliant pour l'analyse.

Qu'est-ce que la cardinalité et pourquoi est-elle importante ?

La cardinalité décrit le nombre de relations possibles entre deux tables. Elle est importante car elle influence la manière dont les données sont filtrées et analysées dans le Data Model.


Quelques cas d'usages :

Analyse des ventes par région

Utiliser Power Query pour importer des données de ventes et de régions, puis créer un Data Model qui relie ces tables. Cela permet de visualiser les performances des ventes par région dans Power BI.

Suivi des événements et des participants

Créer un Data Model qui relie les tables des événements et des participants. Cela permet d'analyser le nombre de participants par événement et d'identifier les tendances au fil du temps.

Rapport sur les performances des festivals

Utiliser Power BI pour créer un rapport qui croise les données des festivals avec les informations sur les participants. Cela aide à évaluer le succès des festivals et à planifier des événements futurs.

Optimisation des ressources

Établir des relations entre les tables de ressources et de projets dans Power BI pour analyser l'utilisation des ressources et identifier les domaines d'amélioration.

Prévisions de ventes

Utiliser un Data Model pour relier les données historiques de ventes avec des données de marché. Cela permet de créer des prévisions de ventes plus précises en utilisant des analyses avancées.


Glossaire :

Power Query

Un outil de Microsoft utilisé pour l'importation, la transformation et la préparation des données avant leur analyse dans des applications comme Excel et Power BI.

Data Model

Une structure qui permet de relier différentes tables de données entre elles, facilitant ainsi l'analyse et la visualisation des données dans Power BI.

Jointure

Une opération qui combine des données de deux tables ou plus en fonction d'une colonne commune, permettant d'enrichir les informations disponibles.

Cardinalité

Un concept qui décrit la relation entre deux tables, spécifiant combien de fois une valeur dans une table peut correspondre à une valeur dans une autre table.

Power Pivot

Un complément pour Excel qui permet de créer des modèles de données complexes et d'effectuer des analyses avancées sur de grandes quantités de données.

Onglet de visualisation

Une section dans Power BI où les utilisateurs peuvent créer des rapports et des tableaux de bord à partir des données importées.

00:00:00
Alors, la première bonne nouvelle, en
00:00:02
arrivant jusqu'à ce que cette section,
00:00:05
c'est qu'on en a fini avec Power Query,
00:00:07
je vous ai à peu près montre tout ce
00:00:10
qu'il y avait à savoir dans cette zone
00:00:12
là et on va pouvoir enfin s'attaquer à
00:00:15
la zone rapport et surtout en premier
00:00:17
lieu à la gestion du data model qui est,
00:00:20
comme tout ce que je vous dis depuis
00:00:21
le début, une notion fondamentale.
00:00:23
Je pense que vous aurez retenu
00:00:25
ce terme avec moi.
00:00:26
Alors qu'est-ce que le data model ?
00:00:28
Eh bien, le data model,
00:00:29
c'est donc une des zones
00:00:31
d'entrée que vous avez.
00:00:32
Dans Power Query dans Power pivot voilà.
00:00:35
Et du coup faut que je switch donc là
00:00:36
en gros on a apporté nos données ici,
00:00:38
on voit qu'on a 3 onglets,
00:00:39
y en a un premier de visualisation
00:00:41
donc c'est la zone rapport ici ça
00:00:43
va être la zone des données qui vont
00:00:45
nous permettre de les visualiser et
00:00:47
enfin il y aura la zone modèle qui
00:00:49
va nous montrer les potentielles
00:00:51
relations qu'il existe entre nos tables.
00:00:53
Alors qu'est-ce qu'on entend
00:00:54
par relation et à quoi ça sert ?
00:00:56
On va repartir d'un cas qu'on
00:00:58
avait déjà rencontré avant où on a
00:01:01
souhaité un importer fusionner 2 ?
00:01:03
2 tables pour aller apporter
00:01:05
des informations donc.
00:01:06
Pour rappel, on avait la colonne,
00:01:08
la table des régions avec la population
00:01:10
et ensuite une autre colonne,
00:01:12
une autre table.
00:01:13
Je vais y arriver avec les régions et
00:01:16
le nombre de festivals et donc nous,
00:01:18
notre technique, c'était de se dire,
00:01:19
on fait une jointure entre ces 2
00:01:22
tables pour pouvoir ensuite aller
00:01:24
créer notre tableau final entre les 2.
00:01:26
Alors ça, ça marche très bien.
00:01:28
C'est intéressant de pouvoir courir
00:01:29
dans beaucoup de cas puisqu'on
00:01:31
va avoir besoin d'aller importer
00:01:32
des données pour continuer à.
00:01:34
Re manipuler nos informations,
00:01:36
mais y a certains cas,
00:01:37
et en fait c'est le cas plutôt simple.
00:01:39
On veut juste du coup croiser des
00:01:41
données entre plusieurs tables ou
00:01:43
ce n’est pas forcément le plus pertinent.
00:01:44
Pourquoi ?
00:01:45
Eh bien parce que déjà tout ce que
00:01:47
vous allez faire dans Power Query,
00:01:48
c'est des choses qui vont être
00:01:50
exécutées à chaque mise à jour
00:01:52
de votre de votre fichier et donc
00:01:54
potentiellement ça va aller alourdir
00:01:56
toute cette étape de mise à jour.
00:01:58
On va avoir aussi une duplication des
00:02:00
informations parce qu'on va avoir
00:02:02
la même information dans 2 tables
00:02:04
différentes parce que du coup, la population.
00:02:06
On l'avait dans la table de base
00:02:08
et le nombre de festivals,
00:02:10
du coup,
00:02:11
on l'a maintenant dans cette table de base,
00:02:13
plus dans la table d'origine,
00:02:14
donc on va générer plus de données
00:02:16
et donc plus aussi de données à
00:02:18
stocker dans le fichier en lui-même.
00:02:20
Et de dernier point,
00:02:21
c'est que les 2 tables sont liées
00:02:23
en cas de modification.
00:02:24
Donc si vous allez renommer
00:02:26
par exemple le nom d'une,
00:02:29
d'une colonne qui sert de jointure
00:02:30
ou qui est importée
00:02:32
au moment où vous faites la jointure,
00:02:34
ça peut générer des cassures.
00:02:36
Donc ça aussi c'est un problème.
00:02:37
C'est que les 2 tables sont liées en cas de.
00:02:39
Modification, donc on va essayer
00:02:41
de changer un peu de paradigme et
00:02:43
plutôt imaginer quelque chose de plus
00:02:45
dynamique et moins mécanique pour ça.
00:02:47
On voit plutôt imaginer en fait qu'on va
00:02:49
créer une relation entre les 2 tables,
00:02:51
c'est à dire qu’on ne va pas automax.
00:02:53
Comment importer les données entre elles ?
00:02:54
Mais on va juste prévenir le fichier que,
00:02:57
Eh bien, il existe une relation possible
00:02:59
entre ces 2 tables et on va préciser
00:03:02
par quelle colonne cela est possible.
00:03:04
Donc pour le coup,
00:03:05
ça ressemble aux jointures,
00:03:06
donc là pour le coup on va dire
00:03:08
que les colonnes de régions et les
00:03:10
enfin les colonnes de régions qui
00:03:12
se situent dans les 2 tableaux sont
00:03:14
liées donc là les symboles que
00:03:16
je vous mets ne sont pas innocents,
00:03:18
c'est exactement ce qu'on va
00:03:20
retrouver dans le data model.
00:03:23
Et du coup, on verra ce lien qui est
00:03:25
créé entre les 2 et encore une fois,
00:03:27
implicitement,
00:03:27
tant qu'on ne le demande pas,
00:03:30
il n'y aura pas de jointure qui sera
00:03:32
effectuée pour rassembler les données,
00:03:34
ce qui fait que,
00:03:35
en fait,
00:03:35
c'est uniquement qu'on va faire
00:03:36
ce croisement,
00:03:37
notamment dans la zone de rapport
00:03:39
que la jointure va être utilisée.
00:03:41
Et le gros avantage par rapport à ça,
00:03:43
c'est que typiquement,
00:03:44
ça ne nécessite pas de calcul pour
00:03:45
rien puisqu'on va uniquement
00:03:47
l'utiliser quand on a besoin,
00:03:48
notamment dans les rapports qu'on va éviter.
00:03:50
Aussi, la duplication des données,
00:03:52
puisque même si on fait une jointure,
00:03:55
Eh bien les données d'origine
00:03:56
restent bien dans leur.
00:03:57
Où respectifs, donc, en l'état,
00:03:58
il y a beaucoup de bonnes choses
00:04:01
qui sont créés.
00:04:02
Il est à noter que nativement quand vous
00:04:05
allez apporter vos tables dans Power BI,
00:04:08
Eh bien,
00:04:09
il va pouvoir détecter lui-même
00:04:10
des relations entre les tables.
00:04:12
Donc en fait,
00:04:13
ça va se symboliser par
00:04:14
cette ligne-là ici qui,
00:04:15
quand vous la sélectionnez est jaune
00:04:17
et quand vous ne la sélectionnez pas et
00:04:19
noir et va vous indiquer aussi via ce
00:04:22
petit symbole le sens de la Jointure,
00:04:24
donc ça j'y reviendrai et également
00:04:26
des petits numéros aussi qui indiquent
00:04:28
le type de cardinalité et ça on
00:04:29
aura l'occasion aussi d'en reparler.
00:04:31
Et là,
00:04:31
on voit au survol que du coup,
00:04:33
non école de la manifestation
00:04:34
a été utilisée pour retrouver
00:04:36
la jointure entre les 2,
00:04:38
ce qui fait que si maintenant je
00:04:40
me rends dans le data model et
00:04:41
donc je viens aller constater ici,
00:04:43
donc là jointure donc là pour
00:04:45
cette zone là on va essayer de
00:04:47
faire un petit peu de place pour
00:04:49
que je puisse vous montrer.
00:04:50
Donc vous avez ici la possibilité
00:04:53
d'aller zoomer sur une zone.
00:04:56
Vous avez aussi la possibilité
00:04:58
d'aller bouger vos tables,
00:04:59
donc ici chaque carré représente.
00:05:02
Un tableau ici donc là par exemple,
00:05:04
ça, c'était un test,
00:05:05
ça ne nous intéresse pas, mais on peut.
00:05:07
Voilà aller essayer de les rassembler un
00:05:10
petit peu au même endroit pour éviter d'avoir
00:05:12
à aller de gauche à droite trop loin.
00:05:14
Ici, voilà, on va essayer de rassembler
00:05:15
un petit peu tout ça dans la même zone.
00:05:17
On voilà et lui,
00:05:18
on va le mettre juste un peu plus bas.
00:05:21
Voilà à part du reste et on
00:05:23
va se dire qu'on est pas mal,
00:05:23
donc on va zoomer un petit peu.
00:05:25
Et donc vous voyez ici.
00:05:26
Donc là on a alors celle-là
00:05:28
aussi est pas intéressante,
00:05:29
on va la mettre un peu de côté.
00:05:31
Et l'entraînement, c'est pareil,
00:05:33
c'est là tout cela,
00:05:35
ça ne nous intéresse pas trop.
00:05:36
On ne va pas forcément les afficher.
00:05:38
Par contre toutes les et c'est là non plus,
00:05:41
c'est là non plus pas très
00:05:42
intéressant donc on va vraiment
00:05:43
se concentrer sur ce qu'il est.
00:05:45
Voilà donc là,
00:05:46
ce sont ces 4 tables d'origine où on
00:05:49
va vraiment pouvoir travailler par
00:05:51
Rapport aux données du Festival.
00:05:55
Et quand je vous disais ici on voit
00:05:56
que j'ai une relation qui a été créée
00:05:59
automatiquement par Power courrier,
00:06:00
alors on aura la possibilité de
00:06:02
les supprimer.
00:06:03
On verra tout ça.
00:06:04
Et donc au survol, on voit
00:06:06
la jointure qui a été faite, donc c'est non.
00:06:08
Et code de la manifestation qui a servi,
00:06:10
2 jointures entre les 2
00:06:11
et donc dans les faits,
00:06:13
qu'est-ce que ça veut dire ?
00:06:13
Eh bien ici,
00:06:14
si je me rends dans la zone de rapport,
00:06:16
je vais aller supprimer ici ce
00:06:18
que j'étais en train de faire.
00:06:19
On en a plus besoin et je vais
00:06:21
par exemple aller créer un tableau
00:06:22
pour que vous puissiez bien,
00:06:24
vous vous vous rendre compte de la chose.
00:06:26
On va aller d'abord dans notre
00:06:28
table de festival,
00:06:29
on va aller sélectionner par
00:06:31
exemple ce qu'on va chercher,
00:06:32
par exemple les domaines.
00:06:35
Des spectacles je vais aller
00:06:37
agrandir un petit peu ça.
00:06:39
On va y ajouter le nombre
00:06:42
de participants en 2018.
00:06:45
Ici voilà,
00:06:47
et on va du coup aller dans horaire
00:06:51
festival et du coup aller aussi
00:06:53
indiquer la durée totale des festivals dans.
00:06:58
Pour chacun des domaines.
00:06:59
Alors là du coup,
00:07:00
il n'a pas réussi à me faire.
00:07:03
Le lien entre les 2.
00:07:05
Parce que là du coup,
00:07:06
il ne l'affiche rien.
00:07:10
Que se passe-t-il ?
00:07:11
Alors c'est peut-être à cause
00:07:12
du format de cette colonne.
00:07:14
Là, on va aller vérifier.
00:07:17
Alors j'ai réussi à trouver
00:07:19
la source du problème.
00:07:20
Donc en fait,
00:07:21
dans powercore ce qu'il faudra faire,
00:07:23
c'est que la de base elle était
00:07:24
la colonne des durées était
00:07:26
encore au format heure et nous,
00:07:28
on l'avait modifié en la transformant
00:07:30
en extrayant juste le nombre
00:07:32
d'heures et donc qu'il faut faire.
00:07:33
C'est le passé en nombre entier ici
00:07:37
et de réappliquer les modifications.
00:07:41
Et donc d'avoir maintenant les durées qui
00:07:44
s'affichent bien ici dans le tableau,
00:07:46
pour peut-être plus que vous,
00:07:48
vous rendiez compte de ce qui se passe.
00:07:49
On va aller sur quelque
00:07:50
chose de plus granulaire,
00:07:51
on va sélectionner carrément
00:07:53
les noms de festivals,
00:07:54
donc par exemple ici je vais
00:07:57
sélectionner ma visualisation.
00:07:58
Je vais décocher les domaines
00:08:01
et je vais prendre.
00:08:04
Du coup, le nom du Festival ?
00:08:07
Voilà non et code du Festival ici.
00:08:12
Et je vais aller prendre par exemple.
00:08:16
Le que je vais prendre l'ordre de début,
00:08:19
voilà l'ordre du début.
00:08:23
Alors là, pour le coup il
00:08:26
va m'apporter l'ensemble.
00:08:27
Donc on va plutôt lui dire de.
00:08:30
Mettre simplement l'heure
00:08:31
de début comme ceci,
00:08:33
et on va aller trier ça pour
00:08:34
avoir un peu de valeur.
00:08:36
Voilà donc là comme vous voyez ici,
00:08:38
il va prendre la combinaison à
00:08:40
chaque fois des valeurs et donc
00:08:41
bien effectuer un croisement entre
00:08:43
les 2 tableaux puisque là je suis
00:08:44
en train d'utiliser des valeurs qui
00:08:46
sont à cheval sur 2 tableaux et
00:08:49
donc ça c'est grâce à la jointure,
00:08:52
alors on verra dans les prochaines
00:08:53
sessions qu'il y a pas mal
00:08:55
de subtilités à connaître par
00:08:55
rapport à ses jointures,
00:08:56
notamment la cardinalité et le sens
00:08:58
dans lequel le filtre se fait.
00:09:00
Donc on va en reparler.
00:09:02
Tout de suite.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher