Power BI - Introduction Tutoriels

Découvrez une introduction complète à la suite Microsoft 365 pour une utilisation professionnelle grâce à cette vidéo informative.
Cette vidéo présente les différents services, applications et possibilités offerts par Microsoft 365, ainsi que leur utilité et leurs avantages.
Obtenez des conseils pratiques pour choisir les bons outils de la solution Microsoft 365 en fonction de vos besoins et les utiliser de manière complémentaire.
Suivez cette vidéo pour en savoir plus sur la suite Microsoft 365 et comment elle peut vous aider à améliorer les performances de votre entreprise.

  • 6:26
  • 3665 vues

Objectifs :

L'objectif de cette vidéo est de démontrer l'importance du retraitement des données dans Power Query pour garantir leur exploitation efficace dans des projets d'analyse. Nous allons explorer les étapes nécessaires pour corriger les erreurs de formatage, gérer les valeurs manquantes et uniformiser les données afin de créer un tableau propre et exploitable.


Chapitres :

  1. Introduction au Retraitement des Données
    Dans cette vidéo, nous allons aborder le retraitement des données, une étape cruciale au début de tout projet. Nous avons déjà vu un aperçu de ce processus avec les crypto-monnaies, où il était nécessaire de remanier l'information pour la rendre exploitable. Nous allons maintenant plonger dans les détails de cette manipulation, en utilisant Power Query, un module disponible dans Excel.
  2. Importance de Power Query
    Power Query joue un rôle essentiel dans le retraitement des données. Il permet de corriger les erreurs dans les tableaux de données, comme les problèmes d'entêtes de colonnes, de séparateurs décimaux et de formats de colonnes. En utilisant Power Query, nous pouvons établir des règles de retraitement qui s'appliqueront chaque fois que nous mettons à jour nos données, évitant ainsi de devoir répéter ces étapes manuellement.
  3. Exemple Pratique de Retraitement
    Prenons l'exemple d'un tableau de données pour un vendeur d'instruments de musique. Ce tableau contient plusieurs colonnes, telles que l'identifiant du produit, le nom, le type d'instrument, la marque, le prix, etc. Nous allons examiner les étapes nécessaires pour rendre ce tableau exploitable :
  4. Conclusion
    En conclusion, le retraitement des données est une étape indispensable pour garantir que nos tableaux soient exploitables. Grâce à Power Query, nous pouvons automatiser ce processus, ce qui nous permet de nous concentrer sur l'analyse des données plutôt que sur leur préparation. En appliquant les règles de retraitement, nous nous assurons que nos visualisations et analyses sont basées sur des données précises et bien formatées.

FAQ :

Qu'est-ce que Power Query et comment l'utiliser ?

Power Query est un outil d'Excel qui permet de transformer et de préparer des données pour l'analyse. Vous pouvez l'utiliser pour nettoyer des données, gérer des valeurs manquantes et appliquer des transformations avant de les importer dans Excel.

Comment gérer les valeurs manquantes dans un tableau de données ?

Pour gérer les valeurs manquantes, vous pouvez appliquer des règles pour remplir les données manquantes en fonction d'autres informations disponibles, comme utiliser des valeurs par défaut ou des moyennes.

Pourquoi est-il important de changer le format des colonnes dans un tableau de données ?

Changer le format des colonnes est crucial pour s'assurer que les données sont interprétées correctement. Par exemple, une colonne de prix doit être formatée comme une valeur monétaire pour permettre des calculs précis.

Comment créer un histogramme dans Excel ?

Pour créer un histogramme dans Excel, sélectionnez vos données, allez dans l'onglet 'Insertion', puis choisissez 'Histogramme' dans le groupe 'Graphiques'. Cela vous permettra de visualiser la distribution de vos données.

Quels sont les avantages de l'uniformisation des données ?

L'uniformisation des données permet d'éliminer les incohérences dans les valeurs, ce qui facilite l'analyse et la visualisation des données. Cela garantit également que les résultats sont fiables et comparables.


Quelques cas d'usages :

Analyse des ventes d'instruments de musique

Un vendeur d'instruments de musique en ligne peut utiliser Power Query pour nettoyer et préparer ses données de ventes mensuelles. En appliquant des règles pour gérer les valeurs manquantes et uniformiser les noms des produits, il peut créer des rapports de vente précis et exploitables.

Préparation de données pour des visualisations

Une entreprise souhaitant visualiser ses données de performance peut utiliser Power Query pour transformer ses données brutes en un tableau propre. Cela inclut le changement de format des colonnes, la gestion des valeurs manquantes et la création d'histogrammes pour analyser les tendances.

Optimisation des rapports financiers

Un analyste financier peut utiliser Power Query pour préparer des rapports mensuels. En s'assurant que toutes les colonnes sont correctement formatées et que les valeurs manquantes sont gérées, il peut produire des rapports fiables qui aident à la prise de décision.


Glossaire :

Power Query

Un module d'Excel qui permet de manipuler et de transformer des données avant de les utiliser dans des analyses ou des visualisations.

Tableau de données

Une structure organisée de données, souvent sous forme de lignes et de colonnes, utilisée pour stocker et analyser des informations.

Valeurs manquantes

Des données qui sont absentes dans un ensemble de données, ce qui peut affecter l'analyse et les résultats.

Histogramme

Un type de graphique qui représente la distribution d'un ensemble de données en utilisant des barres pour montrer la fréquence des valeurs dans des intervalles spécifiques.

Format de colonne

La manière dont les données dans une colonne sont interprétées, par exemple, comme des nombres, des dates ou du texte.

Uniformisation des données

Le processus de rendre les données cohérentes en remplaçant des valeurs similaires par une seule désignation standard.

00:00:00
On l'a un petit peu vu dans l'exemple
00:00:02
précédent avec les crypto monnaies.
00:00:03
Il y a eu une étape,
00:00:04
on a eu besoin de remanier l'information
00:00:06
pour la rendre réellement exploitable.
00:00:08
On avait des soucis au niveau des entêtes
00:00:10
de colonnes au niveau des séparateurs
00:00:12
de décimales au niveau du format de
00:00:15
la colonne qui a été sélectionnée.
00:00:16
Donc encore une fois je ne
00:00:18
suis pas rentré dans le détail,
00:00:19
on va le faire justement
00:00:20
dans cette partie-là.
00:00:21
Donc toute cette manipulation c'est
00:00:23
une étape extrêmement importante qui
00:00:25
intervient dès le départ de tout projet
00:00:27
et qui a été fait dans la partie Power
00:00:30
quéry de pompier avec une Power quéry.
00:00:32
C'est un module qui est également
00:00:34
disponible Pour information pour Excel
00:00:36
dans une dans une version quasi
00:00:38
quasi similaire et qui va justement
00:00:41
permettre ce retraitement. Donc,
00:00:42
pour vous donner un petit peu un schéma,
00:00:44
donc on va se retrouver avec un
00:00:46
tableau de données avec des erreurs,
00:00:48
des problèmes qui va nous empêcher
00:00:51
de l'exploiter correctement,
00:00:53
ce qui fait que si je fais directement
00:00:55
la connexion avec pour Billy I,
00:00:57
et bien ça ne va pas fonctionner.
00:00:58
Mais visualisations ne
00:01:00
vont pas fonctionner.
00:01:02
Donc,
00:01:02
plutôt que de faire ça,
00:01:03
je vais au contraire mettre un
00:01:05
intermédiaire entre les 2 qui est
00:01:07
Power quéry et qui va justement
00:01:09
faire ce travail de retraitement
00:01:10
avec des règles que je vais définir
00:01:12
pour finalement obtenir un tableau
00:01:14
tout propre que je vais pouvoir là
00:01:17
ici injecter dans la partie pour I
00:01:19
et la partie rapport de de l'outil.
00:01:25
Ce qui est super intéressant avec ce système,
00:01:27
c'est que, comme vous le voyez ici en gros,
00:01:29
à chaque fois que je vais appeler
00:01:31
mes données, tout ce retraitement
00:01:32
va être une nouvelle fois appliqué,
00:01:34
donc ça veut dire que y a pas besoin de
00:01:36
refaire à chaque fois ces étapes quand le
00:01:38
jeu de données d'origine a été modifié,
00:01:40
donc imaginez un fichier Excel qui
00:01:42
contient les ventes de votre entreprise.
00:01:44
Évidemment, chaque mois,
00:01:45
il y a des nouvelles ventes qui vont être
00:01:48
écrites dans qui vont être écrites
00:01:50
le dans ce document là ça serait
00:01:52
dommage de devoir dire à chaque fois pour.
00:01:55
À pouvoir courir attention,
00:01:56
il y a des nouvelles lignes qu'il
00:01:57
faut que je rapplique encore.
00:01:58
Toutes mes méthodes sur ces nouvelles,
00:02:00
là, non pour courir,
00:02:01
il va prendre en compte le jeu de
00:02:03
données de départ et tout et appliquer
00:02:04
les mêmes règles quelle que soit la
00:02:06
longueur ou les potentiels modifications
00:02:08
qu'il y a dans le jeu de données.
00:02:09
Alors évidemment, il faut qu'on
00:02:10
retrouve les colonnes d'origine.
00:02:11
Non ?
00:02:12
Si on modifie le type de la première colonne,
00:02:14
il faut qu'on la retrouve dans la
00:02:16
nouvelle version du fichier,
00:02:17
mais en tous les cas, à chaque fois,
00:02:19
vous allez actualiser vos données.
00:02:21
Tout ce processus-là va être appeler
00:02:22
donc vous l'avez fait qu'une
00:02:23
fois il y aura plus à le faire,
00:02:25
à la différence potentiellement d'Excel.
00:02:26
Où on a régulièrement à retravailler
00:02:29
certaines données, ce qu'on fait,
00:02:31
on le fait sans ce type de module.
00:02:35
Alors un petit exemple pour vous,
00:02:36
pour vous projeter un petit peu,
00:02:37
donc,
00:02:38
imaginons qu'on ait ce tableau
00:02:40
de données qui correspond à des
00:02:43
produits de type musicaux,
00:02:44
donc imaginons une base de données
00:02:46
pour un vendeur de d'instruments
00:02:47
de musique sur Internet,
00:02:49
donc on va retrouver une
00:02:50
première colonne ici.
00:02:51
I produit qui correspond à
00:02:52
la D unique d'un produit,
00:02:54
on verra que les I c'est très important
00:02:56
sur tout ce qui est gestion de données,
00:02:59
le nom qu'on est littéral,
00:03:01
Du nom, du produit,
00:03:04
le type d'instrument, la marque,
00:03:05
la gamme, le prix du produit,
00:03:07
sa taille et finalement son.
00:03:10
On va rendre compte qu'on a un
00:03:12
certain nombre de de choses à
00:03:14
faire sur ce sur cette table pour
00:03:16
pouvoir l'exploiter au mieux.
00:03:17
Déjà,
00:03:18
ça va être de gérer les
00:03:19
mauvais types de colonnes, hein.
00:03:20
Il ici, on voit qu'on avait le signe euro,
00:03:23
ce qui indique que là la colonne
00:03:25
n'a pas encore été interprétée
00:03:26
comme une valeur monétaire.
00:03:28
Hein.
00:03:28
C'est exactement ce qui
00:03:29
s'est passé tout à l'heure,
00:03:30
donc là on va préciser que prix et une
00:03:33
valeur en euros donc première étape,
00:03:35
c'est tout ce qui va être géré,
00:03:36
le format, les types d des colonnes.
00:03:39
Ensuite,
00:03:40
on va avoir la gestion des
00:03:42
valeurs manquantes ?
00:03:43
On voit que dans le tableau,
00:03:43
ici,
00:03:44
il me manque la valeur Yamaha
00:03:46
pour ce produit là et donc ça on
00:03:48
va pouvoir appliquer une règle
00:03:50
qui dit que si le nom du
00:03:52
produit contient Yamaha,
00:03:53
alors la marque EST Yamaha,
00:03:55
donc là c'est exactement ce qu'on
00:03:57
a fait ici pour aller compléter la.
00:03:59
La valeur montante donc.
00:04:00
Autre élément intéressant,
00:04:01
ça va être de compléter tout
00:04:02
ce qui peut manquer ou tout
00:04:03
ce qui peut être erroné.
00:04:07
Qu'est ce qu'on a fait ici ?
00:04:08
Donc au niveau du poids effectivement,
00:04:10
de bien également essayer de récupérer
00:04:12
de manière externe ou en tout cas de
00:04:15
de déduire en faisant des moyennes
00:04:17
le poids d'un d'un produit.
00:04:20
Tout ça peut tout à fait de prendre
00:04:22
le prix moyen des pianos et de
00:04:24
le compléter avec la valeur obtenue.
00:04:26
De pouvoir aussi lisser les valeurs
00:04:29
parce que ici, ici, on s'amuse à
00:04:31
faire un histogramme sur les gammes.
00:04:34
On voit qu'on a 2 types de de
00:04:36
de gammes d'entrée de gamme.
00:04:39
Justement, on va avoir le terme bas de
00:04:41
gamme et le terme premier prix alors bas
00:04:43
de gamme qui est très péjoratif.
00:04:45
Évidemment ça ne ça ne serait pas écrit comme
00:04:46
ça dans une réelle base de notre client,
00:04:48
mais vous voyez l'idée,
00:04:49
on a 2 termes qui ont la même désignation,
00:04:52
donc ça c'est un problème
00:04:53
et on va devoir laisser ça.
00:04:54
Et donc typiquement ici à les remplacer
00:04:57
aussi les valeurs en disant que.
00:04:59
Premier prix est transformé en bas de gamme.
00:05:05
On va avoir également
00:05:07
l'uniformisation des hommages,
00:05:09
ici où on a potentiellement
00:05:11
piano et piano électrique,
00:05:13
donc on va remplacer ça en disant
00:05:15
que ça s'appelle systématiquement,
00:05:17
ça s'appelle systématiquement piano.
00:05:18
De la même manière, guitare guitare
00:05:20
sèche qu'on fait plus simple,
00:05:22
on met uniquement guitare.
00:05:26
On va également avoir un souci
00:05:28
au niveau des tailles,
00:05:29
parce que on voit que les tailles
00:05:31
sont en l'état une seule colonne
00:05:33
qui vont contenir la, la hauteur,
00:05:35
la largeur, la profondeur,
00:05:37
mais c'est parée par des X,
00:05:38
donc là pour essayer de faire une
00:05:40
somme ou une moyenne ou que sais-je
00:05:42
De la hauteur par exemple,
00:05:44
c'est très compliqué ce que du coup tout
00:05:46
est tout est mélangé dans la colonne,
00:05:48
donc là ici on va faire une séparation de
00:05:51
colonnes pour pouvoir isoler la largeur,
00:05:53
la longueur et la hauteur
00:05:55
dans des colonnes.
00:05:57
Séparés et donc à partir de là
00:05:59
de bien pouvoir les exploiter.
00:06:02
Et à partir de là,
00:06:03
on a un dataset qui est prêt à
00:06:05
l'emploi et qui va nous permettre de
00:06:07
coup d'effectuer nos visualisations.
00:06:09
Donc comme vous l'aurez compris, hein,
00:06:10
on a des étapes de changement de format,
00:06:12
de remplacement, de valeur,
00:06:14
de d'estimation, même,
00:06:15
de de valeurs, et cetera et cetera,
00:06:18
pour que notre tableau devienne exploitable.
00:06:20
Et donc c'est exactement ce qu'on va
00:06:23
s'arrêter à faire dans PowerPoint.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher