Power BI - Modifier un tableau avec Python Tutoriels

Découvrez comment modifier un tableau avec Python en utilisant les fonctionnalités de transformation de données dans Microsoft 365. Cette vidéo vous montre comment utiliser Python pour manipuler les données de votre tableau et effectuer des modifications en masse.
Obtenez des conseils pratiques pour utiliser cette fonctionnalité de manière efficace et automatiser vos tâches de mise en forme.
Contactez-nous pour plus d'informations sur l'utilisation des fonctionnalités de transformation de données dans Microsoft 365.

  • 4:10
  • 2737 vues

Objectifs :

L'objectif de cette vidéo est d'apprendre à manipuler des données en utilisant Python, en particulier pour supprimer une colonne d'un tableau dans Power BI. Les apprenants découvriront comment intégrer du code Python dans leurs processus d'analyse de données.


Chapitres :

  1. Introduction à la manipulation des données avec Python
    Dans cette vidéo, nous allons explorer comment intégrer une étape de manipulation des données en utilisant Python. Bien que nous ayons déjà importé des données, nous allons maintenant créer une étape avec du code Python pour effectuer des modifications simples sur un tableau.
  2. Suppression d'une colonne dans un tableau
    Nous allons commencer par supprimer une colonne d'un tableau. Pour cela, nous allons utiliser la bibliothèque Python 'pandas'. Voici les étapes à suivre : 1. Accéder à l'onglet 'Transformer' dans Power BI. 2. Sélectionner l'option 'Exécuter du script Python'. 3. Une fois dans l'éditeur de script, nous allons importer la bibliothèque pandas avec la commande : `import pandas as pd`. 4. Créer un DataFrame à partir des données disponibles, qui sont stockées dans une variable appelée 'dataset'. 5. Utiliser la méthode `drop` de pandas pour supprimer la colonne que nous ne souhaitons pas conserver.
  3. Exécution du code et vérification des résultats
    Après avoir écrit le code pour supprimer la colonne, nous allons l'exécuter. Si tout se passe bien, la colonne spécifiée sera supprimée du tableau. Voici comment procéder : - Écrire `dataset = dataset.drop(columns=['station_point_UI'])` pour supprimer la colonne 'station_point_UI'. - Exécuter le script et vérifier que la colonne a bien disparu du tableau. Si la colonne est toujours présente, il est important de vérifier le code pour s'assurer qu'il n'y a pas d'erreurs.
  4. Conclusion et perspectives
    Nous avons vu comment effectuer une manipulation simple des données en utilisant Python dans Power BI. Bien que nous n'ayons supprimé qu'une seule colonne, Python offre de nombreuses possibilités pour manipuler des données grâce à des bibliothèques comme pandas et NumPy. Dans les prochaines vidéos, nous explorerons comment intégrer des graphiques Python dans nos rapports Power BI, ce qui élargira encore nos capacités d'analyse.

FAQ :

Qu'est-ce que Python et pourquoi l'utiliser pour la manipulation de données?

Python est un langage de programmation polyvalent qui est particulièrement efficace pour la manipulation de données grâce à ses bibliothèques comme Pandas. Il permet d'effectuer des analyses complexes et de manipuler facilement des ensembles de données.

Comment supprimer une colonne d'un DataFrame en Python?

Pour supprimer une colonne d'un DataFrame en Python, vous pouvez utiliser la méthode 'drop' de Pandas. Par exemple, 'dataset.drop(columns=['nom_de_la_colonne'])' supprimera la colonne spécifiée.

Qu'est-ce que Power Query et comment se compare-t-il à Python?

Power Query est un outil de transformation de données intégré dans Excel et Power BI, permettant aux utilisateurs de manipuler des données sans programmation. En revanche, Python offre plus de flexibilité et de puissance pour des analyses complexes, mais nécessite des compétences en programmation.

Quels types de données peuvent être manipulés avec Pandas?

Pandas peut manipuler divers types de données, y compris des données numériques, des chaînes de caractères, des dates, et des données manquantes. Il est particulièrement adapté pour travailler avec des données tabulaires.

Comment intégrer des graphiques Python dans Power BI?

Vous pouvez intégrer des graphiques Python dans Power BI en utilisant la visualisation Python, qui vous permet d'exécuter des scripts Python pour créer des visualisations directement dans vos rapports.


Quelques cas d'usages :

Analyse des ventes

Utiliser Python et Pandas pour analyser les données de ventes d'une entreprise, en supprimant les colonnes non pertinentes et en générant des rapports sur les performances des produits.

Préparation des données pour le machine learning

Appliquer des techniques de manipulation de données en Python pour nettoyer et préparer des ensembles de données avant de les utiliser dans des modèles de machine learning.

Rapports automatisés

Créer des scripts Python qui automatisent la génération de rapports à partir de données extraites, en utilisant Pandas pour manipuler les données et produire des visualisations.

Intégration de données

Utiliser Power Query pour importer des données de différentes sources, puis appliquer des scripts Python pour effectuer des transformations avancées sur ces données.

Visualisation de données

Utiliser des bibliothèques Python comme Matplotlib ou Seaborn pour créer des graphiques à partir de données manipulées avec Pandas, et les intégrer dans des rapports Power BI.


Glossaire :

Python

Un langage de programmation interprété, largement utilisé pour le développement web, l'analyse de données, l'intelligence artificielle et plus encore.

Pandas

Une bibliothèque Python utilisée pour la manipulation et l'analyse de données, offrant des structures de données flexibles et des outils pour travailler avec des données tabulaires.

DataFrame

Une structure de données bidimensionnelle fournie par la bibliothèque Pandas, similaire à une table dans une base de données ou une feuille de calcul, permettant de stocker des données sous forme de lignes et de colonnes.

drop

Une méthode de Pandas utilisée pour supprimer des colonnes ou des lignes d'un DataFrame.

Power Query

Un outil de Microsoft utilisé pour l'importation, la transformation et la manipulation de données dans des applications comme Excel et Power BI.

Jumpy

Une bibliothèque Python pour le calcul numérique, souvent utilisée pour le traitement de données et l'analyse scientifique.

00:00:00
Pour aller au bout du processus,
00:00:02
on va essayer d'intégrer une étape.
00:00:04
On va aussi manipuler des données
00:00:05
en puissance que l'instant on
00:00:07
a fait de l'import de données,
00:00:08
mais on pourrait très bien se dire
00:00:10
que dans n'importe quel de ces de ces,
00:00:11
de ces données sur une des étapes en fait,
00:00:14
au lieu de créer une étape avec Power Query,
00:00:16
on va plutôt créer une étape
00:00:18
avec du code en Python,
00:00:19
donc là on va essayer de faire quelque chose
00:00:21
de très simple sur cette table-là,
00:00:24
on va simplement essayer d'enlever,
00:00:25
de supprimer une colonne du tableau.
00:00:28
Voilà quelque chose de très simple,
00:00:30
juste pour vous montrer.
00:00:31
Comment ça fonctionne ?
00:00:32
Et donc ici on va aller ici dans transformer
00:00:35
et on va dire exécuter du script Python,
00:00:39
donc là qu'est-ce qui vous indique il vous ?
00:00:40
Il vous dit en gros que l'ensemble des
00:00:43
données qui sont disponibles dans le
00:00:45
tableau sont ont été enregistrées dans
00:00:47
une variable qui s'appelle dataset,
00:00:49
là ici et comme cette phrase commence
00:00:52
par un dièse, en fait ça en python ce
00:00:55
sont ça correspond à des commentaires,
00:00:58
donc au final ce code là on peut tout à fait
00:00:59
mettre ce qu'on veut derrière etc.
00:01:01
Ça ne sera pas exécuté.
00:01:02
Donc moi ce que je vais faire,
00:01:03
c'est déjà aller importer la librairie
00:01:06
principale pour faire ça donc c'est panda.
00:01:08
Donc, importe panda,
00:01:11
as ** et ensuite on va créer notre dataset.
00:01:16
Enfin, on va créer,
00:01:18
on va tout simplement
00:01:19
remanier les notes dataset.
00:01:21
Donc dataset qui va être égal à.
00:01:26
** point. Data Frame.
00:01:32
Auquel on va rajouter du coup
00:01:34
le tableau de Régine Data 7
00:01:37
donc je le transforme lui-même
00:01:40
et une fois qu'on a fait ça,
00:01:41
on va pouvoir utiliser les méthodes de panda,
00:01:42
notamment pour supprimer des colonnes
00:01:44
et donc on va essayer écrire dataset.
00:01:48
Je suis arrivé point drop.
00:01:51
Entre parenthèses. Colonne.
00:01:57
Et là, ici, on va donner la liste de toutes
00:01:59
les colonnes qu'on souhaite supprimer,
00:02:01
donc là on va mettre juste une de celle qu'on
00:02:03
avait vue qui n’était pas forcément utile.
00:02:05
Donc on va juste mettre la station. Point UI.
00:02:14
Voilà et à partir de là,
00:02:15
normalement, il va aller bien
00:02:17
me supprimer cette colonne là
00:02:18
qui est ici là donc c'est le.
00:02:20
Un code qui ne va pas nous être utile,
00:02:21
donc on va le supprimer.
00:02:24
Donc je relis rapidement,
00:02:25
mais ça me semble honnête.
00:02:27
Et on va aller exécuter ça.
00:02:34
Donc là il me l'a retransformé
00:02:36
en mode en mode table et donc
00:02:39
je vais aller. L'orée tendre.
00:02:43
Donc là je vais reprendre l'ensemble.
00:02:48
Hop.
00:02:54
Et alors, qu'est-ce qui s'est passé ici ?
00:02:59
Alors on voit que j'ai toujours
00:03:01
la station UI qui est présente,
00:03:03
donc je dois avoir une
00:03:04
petite erreur dans mon code,
00:03:05
donc je vais aller ici re
00:03:07
cliquer sur la roue dentée pour
00:03:09
réaccéder à mon code et Ah oui,
00:03:11
je vois qu'effectivement ici donc dataset,
00:03:13
il faut en fait que je dise que ça.
00:03:15
C'est égal à le fait que je supprime
00:03:18
la colonne station point UI de
00:03:21
mon tableau dataset.
00:03:23
Donc je vais cliquer sur OK.
00:03:27
Je vais aller supprimer cette
00:03:28
étape là et aller retendre
00:03:30
l'ensemble de mes colonnes.
00:03:32
Et là, on voit qu’effectivement,
00:03:34
elle a bien disparu.
00:03:37
Donc voilà là, on a fait quelque
00:03:38
chose de très simple.
00:03:39
Encore une fois,
00:03:40
on a juste supprimé une colonne,
00:03:41
mais python permet de largement
00:03:43
de manipuler des données via la
00:03:46
librairie Panda via la librairie
00:03:48
Jumpy et plein d'autres,
00:03:50
plein d'autres librairies et vous
00:03:51
me verrez même qu'on peut aller
00:03:53
intégrer des graphiques Python
00:03:54
au sein de nos rapports Power BI.
00:03:56
Donc je fais un peu de teasing
00:03:57
pour là pour la prochaine partie
00:03:58
mais voilà en tout cas,
00:03:59
vous savez comment effectuer une requête
00:04:02
en Python et comment exécuter une
00:04:05
partie de manipulation des données en.
00:04:07
Citons également.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher