Power BI - Intégrer des graphiques Python Tutoriels

Intégrez des graphiques Python dans Power BI pour un usage professionnel dans la solution Microsoft 365. Découvrez comment créer des visualisations personnalisées et mettre en œuvre des boîtes à moustaches pour analyser et résumer les données.

  • 11:41
  • 2917 vues

Objectifs :

L'objectif de cette vidéo est d'apprendre à intégrer des visualisations personnalisées dans Power BI en utilisant du code Python, en se concentrant sur la création de boîtes à moustaches, notamment des boîtes à moustaches en forme de violon, pour représenter des distributions de données.


Chapitres :

  1. Introduction aux Visualisations Personnalisées
    Dans cette section, nous allons explorer les visualisations personnalisées dans Power BI, en particulier celles qui nécessitent l'intégration de code Python. Bien que cette étape soit technique, elle permet d'accéder à des visualisations avancées qui ne sont pas disponibles par défaut dans Power BI.
  2. Importance de l'Intégration de Python
    L'intégration de Python dans Power BI permet de créer des visualisations variées grâce à de nombreuses bibliothèques disponibles. Cela offre une flexibilité pour générer des graphiques adaptés aux besoins spécifiques des utilisateurs. Nous allons nous concentrer sur les boîtes à moustaches, qui sont utiles pour résumer la distribution des données.
  3. Les Boîtes à Moustaches
    Les boîtes à moustaches fournissent une représentation visuelle de la distribution des données, semblable à un histogramme, mais avec moins de détails. Elles montrent les quartiles, la médiane, ainsi que les valeurs minimales et maximales. Ces visualisations sont particulièrement utiles pour comparer rapidement des distributions entre différentes catégories.
  4. Utilisation des Boîtes à Moustaches
    Les boîtes à moustaches peuvent être utilisées pour analyser des données variées, comme la répartition des prix de produits ou les notes des élèves. Par exemple, on peut visualiser la distribution des prix de produits dans différentes tranches de prix ou la répartition des notes des étudiants.
  5. Intégration de Python dans Power BI
    Pour intégrer Python dans Power BI, il est nécessaire d'avoir un noyau Python installé. Une fois cela fait, on peut ajouter un nouvel onglet pour les appels Python et commencer à travailler sur les données. L'activation des éléments visuels de script est une étape cruciale pour permettre l'exécution du code Python.
  6. Création de la Visualisation
    Nous allons créer une visualisation de type boîte à moustaches en utilisant des bibliothèques Python comme Matplotlib et Seaborn. Le code Python importera les données nécessaires et générera la visualisation. Il est important de s'assurer que les colonnes de données sont correctement référencées dans le code.
  7. Analyse des Résultats
    Une fois la visualisation générée, nous pouvons analyser les résultats. Par exemple, nous pouvons observer la répartition des participants dans différents domaines et identifier des tendances, comme des volumes de participants très disparates dans certains domaines par rapport à d'autres.
  8. Conclusion
    L'intégration de visualisations personnalisées dans Power BI via Python, bien que technique, permet d'enrichir les rapports avec des graphiques avancés. Les boîtes à moustaches, en particulier, offrent une méthode efficace pour visualiser et comparer des distributions de données.

FAQ :

Qu'est-ce que Power BI?

Power BI est un outil d'analyse de données développé par Microsoft qui permet de créer des rapports interactifs et des tableaux de bord à partir de diverses sources de données.

Comment intégrer du code Python dans Power BI?

Pour intégrer du code Python dans Power BI, vous devez activer les éléments visuels de script et utiliser l'éditeur Python pour écrire et exécuter votre code.

À quoi sert une boîte à moustaches?

Une boîte à moustaches est utilisée pour résumer la distribution d'un ensemble de données, montrant les quartiles, la médiane, ainsi que les valeurs minimales et maximales.

Quelles sont les différences entre un histogramme et une boîte à moustaches?

Un histogramme montre la fréquence des données dans des intervalles, tandis qu'une boîte à moustaches résume la distribution en indiquant les quartiles et les valeurs extrêmes.

Quels outils sont nécessaires pour utiliser Python avec Power BI?

Vous devez avoir Python installé sur votre ordinateur, ainsi que les bibliothèques nécessaires comme Matplotlib et Seaborn pour créer des visualisations.

Est-il nécessaire de savoir coder en Python pour utiliser Power BI?

Non, il n'est pas nécessaire de savoir coder en Python pour utiliser Power BI, mais cela peut vous permettre de créer des visualisations plus personnalisées.


Quelques cas d'usages :

Analyse des ventes par catégorie de produit

Utiliser des boîtes à moustaches pour visualiser la distribution des ventes par catégorie de produit, permettant d'identifier les catégories avec des performances variées.

Évaluation des performances des étudiants

Appliquer des visualisations en Python pour analyser les notes des étudiants par matière, en utilisant des boîtes à moustaches pour comparer la dispersion des notes.

Analyse démographique

Utiliser des visualisations de type violon pour représenter la distribution de la population par âge, permettant d'identifier les tranches d'âge les plus représentées.

Comparaison des événements

Créer des visualisations pour comparer le volume de participants à différents événements, en utilisant des boîtes à moustaches pour montrer la variabilité des participants.

Analyse des prix des produits

Utiliser des boîtes à moustaches pour visualiser la répartition des prix des produits, facilitant l'identification des produits à prix extrêmes.


Glossaire :

Power BI

Un outil d'analyse de données et de visualisation développé par Microsoft, permettant de créer des rapports interactifs et des tableaux de bord.

Python

Un langage de programmation polyvalent utilisé pour le développement web, l'analyse de données, l'intelligence artificielle, et plus encore.

Visualisation

La représentation graphique de données pour faciliter leur compréhension et leur analyse.

Boîte à moustaches

Un type de graphique qui résume la distribution d'un ensemble de données en montrant les quartiles et les valeurs extrêmes.

Quartiles

Des valeurs qui divisent un ensemble de données en quatre parties égales, permettant d'analyser la dispersion des données.

Médiane

La valeur qui sépare un ensemble de données en deux parties égales, représentant le point central.

Seaborn

Une bibliothèque Python basée sur Matplotlib, utilisée pour créer des visualisations statistiques attrayantes.

Matplotlib

Une bibliothèque Python pour créer des visualisations de données en 2D.

Violin plot

Un type de graphique qui combine une boîte à moustaches et une densité de probabilité, montrant la distribution des données.

00:00:00
Alors, on en a fini avec les
00:00:03
visualisations graves classiques
00:00:04
qu'on peut avoir dans Power BI,
00:00:06
maintenant on va s'attaquer à tout ce
00:00:08
qui va être custom et on va s'attaquer
00:00:10
alors là ici en assez gros morceaux
00:00:11
donc pour ceux qui ne sont pas du
00:00:13
tout intéressés par tout ce qui est
00:00:15
intégration de code Python puisqu'on en
00:00:16
a déjà fait dans la partie Power Quéry.
00:00:18
N'hésitez pas à ne pas faire cette
00:00:20
étape là parce que là c'est quelque chose
00:00:22
d'assez technique donc ça n'est pas
00:00:24
du tout nécessaire pour finir le cours.
00:00:26
Donc ceux qui ne veulent pas apprendre
00:00:28
les fonctionnalités en lien avec
00:00:30
le Python parce que vous savez
00:00:31
que vous ne les utiliserez pas.
00:00:32
Vous pouvez passer directement
00:00:34
à l'accès section suivante.
00:00:36
Maintenant que cela est dit,
00:00:37
l'idée c'est que on a la possibilité d'aller
00:00:40
intégrer du code Python dans une boîte,
00:00:43
donc dans une box de visualisation,
00:00:45
et donc de pouvoir générer à l'aide de
00:00:47
ce code-là visualisation de son choix.
00:00:49
Et ça, c'est super intéressant.
00:00:51
Pourquoi ?
00:00:51
Parce qu’en théorie,
00:00:52
avec Python,
00:00:53
on peut faire n'importe quel type
00:00:55
de visualisation,
00:00:55
parce que y a tellement de librairies,
00:00:57
il y a tellement de ressources
00:00:58
que on peut faire tout ce qu'on
00:01:00
veut et donc à partir de là,
00:01:01
Eh bien on peut faire bénéficier un
00:01:04
rapport Power BI de cette puissance-là.
00:01:06
En affichant du coup visuellement un
00:01:08
graphique et donc là j'ai choisi un
00:01:11
graphique qui est plutôt alors joli,
00:01:13
je n’aime pas le terme ce que la,
00:01:15
la visualisation n'est pas
00:01:16
là pour être jolie mais
00:01:17
dans tous les cas moi je trouve
00:01:18
ça joli donc je le dis, on
00:01:20
va essayer d'afficher des boîtes à
00:01:21
moustaches parce que ça typiquement
00:01:23
c'est une visualisation qui
00:01:24
n'est pas disponible par défaut
00:01:25
dans mon dans Power BI.
00:01:27
On verra comment télécharger
00:01:28
des visuels mais en
00:01:29
tout cas par défaut il n'y
00:01:30
est pas et donc en plus de ça
00:01:32
j'ai choisi pas n'importe quel type de boîte
00:01:35
à moustache. Mais des boîtes
00:01:37
à moustache qu'on appelle en violon,
00:01:39
parce que, en théorie,
00:01:40
c'est censé un petit peu là
00:01:42
avoir la forme d'un violon.
00:01:44
Je vous laisserai donner
00:01:45
votre avis par rapport à ça,
00:01:47
mais dans tous les cas, ça donne un
00:01:48
aspect un petit peu sympa.
00:01:50
Alors à quoi servent ces
00:01:50
boîtes à moustaches ?
00:01:51
Donc j'en avais un petit
00:01:52
peu parlé en introduction.
00:01:53
Ça donne la version
00:01:55
résumée d'un histogramme,
00:01:56
c'est à dire la distribution
00:01:58
d'une valeur par rapport au
00:02:00
nombre de d'observations
00:02:02
pour chacune des catégories.
00:02:04
Et on va avoir
00:02:06
à chaque fois 4 paliers par rapport à ça,
00:02:08
donc ça sera donc les fameux.
00:02:12
Les fameux, excusez-moi,
00:02:13
quand il dont j'avais pu parler, excuse-moi.
00:02:16
Les quartiles, les quartiles,
00:02:17
avec donc la ligne du milieu qui
00:02:19
représente la médiane et ensuite
00:02:21
les extérieurs qui vont représenter
00:02:22
les valeurs minimales et maximales.
00:02:24
Donc en gros ici vous avez la médiane ici,
00:02:28
vous avez votre quartile un
00:02:30
autre quartile et ensuite ici les
00:02:31
valeurs minimales et les valeurs
00:02:33
maximales et donc ça va créer cette
00:02:35
forme un petit peu ici et en plus
00:02:37
de ça on va pouvoir le faire pour
00:02:40
chacune de d'une colonne de catégorie.
00:02:42
Alors, ça comporte moins effectivement
00:02:44
de finesse qu'un histogramme,
00:02:46
puisque là on ne va pas avoir vraiment
00:02:47
le détail pour chacune des valeurs.
00:02:49
En tout cas, ça sera difficilement lisible,
00:02:51
mais ça permet de compléter rapidement
00:02:53
des distributions entre elles.
00:02:54
Donc en gros plus ce cette forme est
00:02:57
allongée et plus on aura des valeurs
00:02:59
hétérogènes et plus cette forme est
00:03:02
resserrée et plus les valeurs seront homos.
00:03:06
Alors, ces visualisations sont moins
00:03:08
évidentes à comprendre qu'un histogramme.
00:03:10
Oui c'est vrai, donc il ne faut pas
00:03:12
hésiter si vous les utilisez,
00:03:13
rajouter un petit peu d'explications,
00:03:14
ce que tout le monde n'est
00:03:16
pas habitué à les lire.
00:03:17
Alors dans quel cas on pourrait
00:03:19
utiliser ces visualisations-là ?
00:03:21
Donc nous on va évidemment trouver
00:03:22
un cas pour nos données de festival.
00:03:24
Ça serait par exemple la répartition
00:03:26
des produits par prix,
00:03:27
donc là ça serait intéressant de
00:03:30
voir effectivement combien de
00:03:31
prix coûtent entre 0 et 10€,
00:03:33
puis entre 10 et 20, et cetera.
00:03:35
Et par exemple,
00:03:36
des élèves aussi en fonction de
00:03:37
leurs notes et des humains aussi.
00:03:39
Par taille,
00:03:39
on peut avoir ce type de représentation là
00:03:42
là autre que vous connaissez peut-être.
00:03:45
Ce sont les.
00:03:45
Alors là je n’ai pas pris une visuelle
00:03:48
mais ce sont,
00:03:49
les pyramides par âge où on peut
00:03:51
avoir aussi un petit peu ce cette,
00:03:53
ce type de forme,
00:03:54
là où pour chacun des âges on va avoir là.
00:03:56
Le volume de population et donc
00:03:57
ça peut aller un petit peu créer
00:03:59
ces fameux violons,
00:04:00
donc celle-ci par exemple
00:04:01
ne marchent pas trop mal.
00:04:02
Bref, allez on va démarrer
00:04:04
du coup pour cette intégration-là alors ?
00:04:07
Pour rappel, on a déjà fait
00:04:09
l'installation d'un noyau python
00:04:11
sur notre sur notre poste informatique.
00:04:13
Pour ceux qui ne l'ont pas fait,
00:04:14
je vous je vous renvoie sur la partie
00:04:16
Power Query où on fait toutes ces
00:04:18
installations pour faire notamment un
00:04:19
appel via Python de données externes.
00:04:21
Donc là on va considérer que
00:04:22
le travail a été fait.
00:04:24
On va retourner sur notre tableau.
00:04:28
Ici et on va les rajouter.
00:04:30
Un nouvel onglet donc là
00:04:31
on va mettre des appels.
00:04:35
En Python. Ici et on va pouvoir
00:04:40
commencer à ajouter nos éléments,
00:04:42
donc on va aller ici.
00:04:44
Cliquer sur notre Python. On va demander,
00:04:48
il va nous demander si on souhaite
00:04:50
activer les éléments visuels de script,
00:04:52
donc en gros c'est un peu un,
00:04:53
un pare-feu de sécurité donc il n’y a pas
00:04:55
vraiment de problème pour le faire.
00:04:56
Donc nous ici on va l'activer.
00:04:58
Et là donc, on va avoir le champ
00:05:01
de travail et ici on va avoir
00:05:03
le l'éditeur de de Python et
00:05:05
notamment ici la capacité d'aller.
00:05:10
Faire un petit peu de personnalisation,
00:05:12
alors on va juste aller vérifier
00:05:14
un petit élément avant.
00:05:16
Voilà donc on va bien vérifier que
00:05:19
au niveau des scripts, on a toujours
00:05:21
notre ressource qui est appelée,
00:05:23
donc ça peut être un raccourci
00:05:24
intéressant si vous souhaitez
00:05:25
vérifier donc encore une fois.
00:05:26
Pour rappel, si vous ne voyez pas trop
00:05:28
de quoi je parle, je vous renvoie
00:05:29
vers la partie sur Power Quéry.
00:05:32
Et en plus de ça, du coup, on va pouvoir
00:05:34
aller un peu agrandir cette zone-là.
00:05:36
Alors, s'il veut bien bon,
00:05:38
Ah hop, je la reprends et on va
00:05:42
pouvoir commencer à travailler.
00:05:44
Sur nos valeurs.
00:05:47
Et donc pour ça, Eh bien, décidément,
00:05:49
j'ai du mal à le sélectionner.
00:05:50
On va déjà lui indiquer sur quel type
00:05:51
de données on souhaite travailler,
00:05:52
donc on a toujours un champ de valeur ?
00:05:54
Ça ?
00:05:54
Pour le coup,
00:05:54
ça ne change pas et on va aller afficher une
00:05:57
distribution des valeurs en fonction de.
00:06:01
En fonction de nos tableaux global donc,
00:06:05
à savoir le nom et le code de
00:06:07
la manifestation,
00:06:08
le domaine et le volume de
00:06:10
participants sur 2018 donc on va déjà,
00:06:12
on va lui donner ça parce que là l'idée
00:06:13
c'est qu'il est vraiment toutes les
00:06:14
lignes de notre tableau pour pouvoir
00:06:16
justement calculer cette distribution,
00:06:17
donc on va aller sur le nom et
00:06:19
le code de la manifestation.
00:06:21
On va le placer ici pour ceux qui
00:06:23
ne savent pas coder en Python.
00:06:24
Je précise que vous n'aurez pas
00:06:25
besoin de le savoir puisque je
00:06:27
vais vous fournir le code.
00:06:28
C'est encore une fois c'est pour
00:06:29
tester le format et pour
00:06:30
ceux qui savent le faire,
00:06:32
vous pourrez vous amuser à
00:06:33
personnaliser ce qu'on va créer.
00:06:35
Donc on va déjà mettre
00:06:36
cette première colonne,
00:06:37
on va les rajouter le domaine.
00:06:40
Ici et on va rajouter le volume.
00:06:45
De participants.
00:06:49
Voilà participants 2018.
00:06:52
Voilà et donc là, qu'est-ce qu'il a fait ?
00:06:55
Et bien il m'a ouvert un champ,
00:06:57
donc là on va aller l'agrandir un petit peu,
00:07:00
potentiellement mourir un bloc note.
00:07:05
Alors là, il va carrément m'ouvrir
00:07:06
Visual Studio donc c'est un logiciel
00:07:07
de traitement de code donc vous avez
00:07:09
pas forcément besoin de l'installer.
00:07:10
Dans tous les cas il va vous afficher
00:07:12
un petit peu le code source de ce qu'on
00:07:15
cherche à intégrer et donc à partir de là
00:07:18
donc il m'indique que Eh bien le code.
00:07:21
Alors je crois que ça cause du zoom.
00:07:23
J'ai un petit peu du mal, c'est dommage.
00:07:25
Alors un instant je vais juste régler
00:07:28
ça parce que là avec le zoom sur l'écran
00:07:30
je ne peux pas accéder à la suite OK c'est
00:07:33
bon donc là j'ai juste aller rentrer
00:07:35
voilà comme ça et je vais pouvoir aller.
00:07:37
Chercher le code que je vous
00:07:39
ai également fournir,
00:07:39
donc aller chercher
00:07:41
dans les petits blocs-notes que j'ai dans
00:07:43
les petits fichiers de texte que j'ai
00:07:44
Rajoutés dans le dossier
00:07:46
des festivals et donc on va aller chercher
00:07:48
notre appel qui va aller permettre de
00:07:51
générer notre visuel et je vais quand
00:07:53
même un petit peu vous détailler le code.
00:07:55
Pour ceux que ça intéresse.
00:08:00
Ah non. On va le placer ici.
00:08:04
Et on va l'exécuter pour voir si tout
00:08:06
fonctionne et après je vous l'explique.
00:08:11
Donc, c'est à l'aide du bouton Play
00:08:13
qu'on va lancer la visualisation.
00:08:19
Alors là j'ai un petit souci
00:08:21
donc typiquement quand on a un
00:08:23
petit problème, on va pouvoir
00:08:24
cliquer ici sur voir les détails.
00:08:29
Alors oui, c'est tout à fait puisque
00:08:31
là j'avais pris déjà un code
00:08:33
mais je n’ai pas totalement appelé
00:08:34
les colonnes de la même manière
00:08:37
parce que là typiquement ici.
00:08:38
Donc vous, évidemment,
00:08:39
je corrigerai la valeur,
00:08:40
on va placer, participant.
00:08:47
2018, on va en profiter pour vérifier donc,
00:08:48
le domaine c'est bon et pour le reste
00:08:51
c'est okay donc on va relancer ça.
00:08:56
Voilà donc notre magnifique visualisation.
00:09:00
Qui est là ? On va juste le relancer
00:09:02
pour qu'il soit à la bonne taille.
00:09:03
Parce qu'en réalité,
00:09:04
ça c'est une image ?
00:09:05
Là, pour le coup,
00:09:06
on n'aura aucune interaction
00:09:06
possible avec le visuel.
00:09:08
Ce qui va en gros intégrer un jpeg quoi.
00:09:10
Une photo et alors ?
00:09:11
Pour vous détailler un petit peu
00:09:13
le code très rapidement on va
00:09:14
pas rentrer dans les détails.
00:09:15
La première étape,
00:09:16
ça va être importée des librairies qui
00:09:18
vont permettre de la visualisation de
00:09:20
données donc notamment matplotlib
00:09:21
qui est la base dans la matière,
00:09:23
on va importer une autre librairie
00:09:24
qui se base à la base sur Maps.
00:09:26
Clip qui s'appelle Seaborn et
00:09:28
on va aller importer un thème,
00:09:30
donc un thème c'est tout simplement
00:09:31
les le style graphique qui va
00:09:33
s'afficher qui s'appelle White.
00:09:34
Bride et ensuite de ça,
00:09:37
on va aller intégrer du coup à
00:09:39
partir de la librairie
00:09:41
qu'on est allé chercher,
00:09:42
donc un une visualisation de
00:09:45
type Violine plot.
00:09:46
Ici on va lui préciser sur quel
00:09:48
jeu de données on est en train de
00:09:51
travailler et en réalité comment on
00:09:53
nous précise comme pour B Nous précise ici,
00:09:55
il a tout préparé en fait quand
00:09:57
je sélectionne ici les colonnes,
00:09:58
il m'a tout intégré dans une variable
00:10:00
qui s'appelle Dataset donc je lui
00:10:02
précise dataset et ensuite je lui précise
00:10:05
00:10:06
les colonnes que je souhaite utiliser,
00:10:08
donc l'axe des X c'est ce qui est ici.
00:10:11
Je vais utiliser le domaine
00:10:12
donc c'est ce qu'on voit ici.
00:10:14
Au niveau de l'axe des y les participants,
00:10:16
ça sera bah ça sera effectivement
00:10:18
les participants donc ça sera
00:10:20
les valeurs numériques.
00:10:22
Je souhaite bien séparer les
00:10:24
valeurs et cetera et qu'est-ce
00:10:26
que j'ai fait d'autre ?
00:10:27
Bah pas grand-chose.
00:10:30
Si j'ai juste du coup ajouté une
00:10:32
rotation sur le sur les sur les,
00:10:35
sur la légende des lacs des X
00:10:36
pour que le on ait la place pour
00:10:38
ajouter les titres sinon ça ne
00:10:40
ne rentrait pas donc j'ai juste à
00:10:41
rajouter 45° ici sur ces taxes là
00:10:44
et donc on obtient ce magnifique.
00:10:47
Ce magnifique,
00:10:48
cette magnifique boîte à moustache
00:10:51
de type violon et donc là on voit ici
00:10:54
quand je vous disais un petit peu
00:10:55
cette répartition en fonction
00:10:58
00:10:59
du nombre de participants pour
00:11:01
chacun des domaines et donc
00:11:03
on voit par exemple qu'ici,
00:11:05
pour les domaines divers,
00:11:06
alors c'est peut-être aussi dans le nom,
00:11:08
on a des volumes de participants
00:11:10
extrêmement disparates.
00:11:11
Contrairement à son voisin qui est art,
00:11:15
cinéma et audiovisuel,
00:11:15
où là on a quelque chose de beaucoup
00:11:17
plus serré qu'on voyait ici.
00:11:19
Ce qu'on appelle les quartiers
00:11:21
sont beaucoup plus resserrés,
00:11:22
donc ça c'est égal à quelque
00:11:24
chose d'un peu plus homogène.
00:11:26
Donc voilà comment intégrer un
00:11:28
une visualisation en python,
00:11:30
alors ce n’est clairement pas le
00:11:31
plus simple évidemment,
00:11:32
mais on est là pour être exhaustif
00:11:34
et potentiellement vous
00:11:35
pouvez tout à fait quand
00:11:36
vous en avez vraiment besoin,
00:11:37
intégrer une visualisation qui
00:11:38
n'est disponible qu’en Python.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher