Power BI - Remplir les lignes vides avec des valeurs adjacentes Tutoriels

Découvrez comment remplir les valeurs manquantes dans Power Query pour lisser votre visualisation de données dans Power BI.
Cette vidéo vous guide à travers le processus de remplissage des données manquantes en utilisant la fonction "Remplir les données" dans Power Query.
Obtenez des conseils pratiques pour choisir la direction de remplissage et pour appliquer vos modifications dans Power BI.
Contactez-nous pour plus d'informations sur l'utilisation de Power BI Services dans Microsoft 365.

  • 4:29
  • 2713 vues

Objectifs :

L'objectif de cette vidéo est d'apprendre à combler des valeurs manquantes dans un ensemble de données à l'aide de Power Query et Power BI. Nous allons importer un fichier Excel contenant des données sur le nombre de participants à des festivals en France, puis nous allons explorer comment remplir les valeurs manquantes pour améliorer la visualisation des données.


Chapitres :

  1. Introduction à la gestion des valeurs manquantes
    Dans cette section, nous allons aborder l'importance de combler les valeurs manquantes dans les ensembles de données. Les valeurs manquantes peuvent fausser les analyses et rendre les visualisations moins claires. Nous allons utiliser Power Query pour importer un fichier Excel contenant des données fictives sur le nombre de participants à des festivals en France, de 1970 à 2019.
  2. Importation des données
    Pour commencer, nous allons ouvrir Power Query et sélectionner l'option pour importer une nouvelle source de données. Nous choisissons un classeur Excel et importons la feuille contenant les données sur le nombre de participants. Il est important de noter que les valeurs sont fictives et ne doivent pas être référencées ailleurs. Après avoir importé les données, nous vérifions que le format des années et le nombre de participants sont corrects.
  3. Création d'un histogramme
    Une fois les données importées, nous allons créer un histogramme dans Power BI. Nous sélectionnons une visualisation en histogramme, plaçons les années sur l'axe et le nombre de participants en valeur. En agrandissant le graphique, nous remarquons que certaines années manquent, ce qui peut poser problème lors du calcul des taux de progression.
  4. Remplissage des valeurs manquantes
    Pour résoudre ce problème, nous retournons dans Power Query et sélectionnons la colonne contenant les valeurs manquantes. Nous utilisons l'option 'Remplir les données' pour combler les valeurs nulles. Nous avons le choix de remplir vers le bas ou vers le haut. Dans ce cas, nous choisissons de remplir vers le bas, ce qui remplace les valeurs manquantes par celles de l'année précédente. Après avoir appliqué les modifications, le graphique devient plus propre et complet.
  5. Précautions à prendre
    Il est essentiel de faire attention lors du remplissage des valeurs manquantes. Si de nombreuses valeurs sont manquantes, il peut ne pas être judicieux de les combler. Cette méthode est principalement utilisée pour améliorer la visualisation des données. Il est également recommandé d'ajouter des commentaires sous le graphique pour expliquer les ajustements effectués.
  6. Conclusion
    En conclusion, nous avons appris à importer des données dans Power Query, à créer un histogramme dans Power BI et à combler les valeurs manquantes pour améliorer la clarté de nos visualisations. Ces compétences sont essentielles pour toute personne travaillant avec des données, car elles permettent d'assurer l'intégrité et la lisibilité des analyses.

FAQ :

Qu'est-ce que Power Query et comment l'utiliser ?

Power Query est un outil de Microsoft qui permet de connecter et de transformer des données provenant de différentes sources. Pour l'utiliser, ouvrez Excel ou Power BI, accédez à l'onglet 'Données', puis sélectionnez 'Obtenir des données' pour importer vos données et les transformer selon vos besoins.

Comment remplir des valeurs manquantes dans Power Query ?

Pour remplir des valeurs manquantes dans Power Query, sélectionnez la colonne contenant les valeurs nulles, allez dans l'onglet 'Transformer', puis choisissez 'Remplir les données'. Vous pouvez choisir de remplir vers le bas ou vers le haut, selon que vous souhaitez utiliser la valeur au-dessus ou en dessous.

Pourquoi est-il important de gérer les valeurs manquantes ?

Gérer les valeurs manquantes est crucial pour garantir l'exactitude des analyses. Des valeurs manquantes peuvent fausser les résultats, en particulier lors du calcul de taux de progression ou d'autres statistiques, ce qui peut mener à des conclusions erronées.

Qu'est-ce qu'un histogramme et comment le créer dans Power BI ?

Un histogramme est un graphique qui montre la distribution des données. Pour le créer dans Power BI, sélectionnez 'Visualisations', choisissez l'option histogramme, puis placez les années sur l'axe et le nombre de participants en valeur.

Quels sont les risques de remplir des valeurs manquantes ?

Remplir des valeurs manquantes peut introduire des biais si les valeurs remplacées ne sont pas représentatives. Il est important de ne le faire que lorsque cela est justifié et de documenter les modifications pour éviter toute confusion.


Quelques cas d'usages :

Analyse des participants à des festivals

Utiliser Power Query pour importer et nettoyer les données sur le nombre de participants à des festivals au fil des ans. Cela permet de visualiser les tendances de participation et d'identifier les années avec des données manquantes, facilitant ainsi une analyse plus précise.

Préparation de rapports de données

Avant de générer des rapports dans Power BI, utiliser Power Query pour remplir les valeurs manquantes et transformer les données. Cela garantit que les rapports sont basés sur des données complètes et précises, améliorant ainsi la qualité des décisions basées sur ces rapports.

Visualisation des tendances de données

Créer des visualisations claires et informatives en utilisant des histogrammes dans Power BI. En remplissant les valeurs manquantes, les utilisateurs peuvent obtenir une vue d'ensemble plus cohérente des tendances de participation, ce qui est essentiel pour les présentations et les analyses stratégiques.

Optimisation des performances d'événements

Analyser les données de participation à des festivals pour optimiser la planification d'événements futurs. En utilisant les données complètes, les organisateurs peuvent mieux comprendre les préférences des participants et ajuster leurs stratégies marketing en conséquence.


Glossaire :

Valeurs manquantes

Données qui ne sont pas disponibles ou qui n'ont pas été enregistrées dans un ensemble de données. Par exemple, si le nombre de participants à un festival pour une année donnée n'est pas enregistré, cela constitue une valeur manquante.

Power Query

Un outil de Microsoft Excel et Power BI qui permet de connecter, combiner et affiner des données provenant de différentes sources avant de les analyser.

Classeur Excel

Un fichier créé avec Microsoft Excel qui peut contenir plusieurs feuilles de calcul, chacune pouvant contenir des données, des formules et des graphiques.

Histogramme

Un type de graphique qui représente la distribution d'un ensemble de données en utilisant des barres pour montrer la fréquence des valeurs dans des intervalles spécifiques.

Remplir les données

Une fonction dans Power Query qui permet de remplacer les valeurs manquantes par des valeurs existantes, soit en utilisant la valeur au-dessus (vers le bas) ou la valeur en dessous (vers le haut).

Valeur nulle

Une valeur qui indique l'absence de données. Dans un tableau, cela peut apparaître comme un espace vide ou un symbole spécifique.

Transformation de données

Le processus de modification des données pour les rendre plus appropriées pour l'analyse, ce qui peut inclure le nettoyage, le formatage et le remplissage des valeurs manquantes.

00:00:00
Dans cette nouvelle partie,
00:00:01
on va voir comment combler des valeurs
00:00:03
manquantes et pour ça on va avoir
00:00:06
besoin d'importer un nouveau fichier,
00:00:07
donc pour ça, on va se placer ici,
00:00:11
donc toujours pareil dans Power Query
00:00:13
et on va indiquer qu'on souhaite avoir
00:00:16
une nouvelle source et qu'on souhaite
00:00:18
importer à nouveau un classeur Excel.
00:00:20
Et ici, on va aller importer le nombre de
00:00:23
participants à des festivals par année,
00:00:25
donc on va d'abord l'importer et
00:00:27
après on va découvrir ensemble
00:00:29
les données qui le composent.
00:00:36
Donc ici évidemment c'est la feuille,
00:00:38
y en a qu'une qui nous intéresse et
00:00:39
comme vous voyez ici ce qu'on va avoir,
00:00:40
en gros c'est encore une fois,
00:00:42
ce sont des valeurs inventées ?
00:00:44
Donc n'essayez pas de trouver des
00:00:46
des références sur d'autres sites.
00:00:47
Là-dessus, il y en a ça, ça sera des,
00:00:50
des valeurs fausses, mais là,
00:00:52
c'est uniquement pour l'exercice.
00:00:53
Mais imaginons que ça le soit en tout cas,
00:00:54
donc ça serait le nombre de participants
00:00:57
en France au festival par année,
00:01:00
donc des années 70 jusqu'à 2019,
00:01:04
donc on va cliquer sur OK.
00:01:07
On va emporter ça,
00:01:09
on va vérifier rapidement les valeurs,
00:01:11
ça nous semble tout à fait correct,
00:01:13
donc avoir le nombre d'années avec ce
00:01:15
format là et le nombre de participants
00:01:17
avec le format nombre entier,
00:01:20
donc là on est pas mal du tout.
00:01:21
On va cliquer ici sur appliquer
00:01:24
pour que le les données remontent
00:01:27
dans notre dans notre histogramme.
00:01:29
Dans notre dans Power dans Power
00:01:32
BI ici donc là on voit d'ailleurs
00:01:35
le renommera après mais qu'on a ici
00:01:37
la feuille un et ce que je voulais
00:01:39
simplement vous montrer c'est si on
00:01:41
cherche à créer un histogramme
00:01:42
ici donc je vais aller sélectionner
00:01:44
une visualisation en histogramme.
00:01:47
On va mettre ici alors pas en valeur,
00:01:50
mais plutôt en axe les années et qu'on
00:01:53
met le nombre de participants en valeur ici.
00:01:56
On va grandir un petit peu ça.
00:02:02
On voit que on a certaines
00:02:04
années qui qui manquent.
00:02:05
Ici, on a l'année 90 ici l'année 88 et
00:02:08
donc il nous manque fatalement l'année 89.
00:02:11
Alors là ça peut être gênant visuellement en
00:02:13
ce qu'on peut dire qu'est-ce qui se passe ?
00:02:15
Surtout si on calcule des taux de
00:02:17
de progression d'une année à une autre.
00:02:19
On peut se retrouver avec du coup des
00:02:22
valeurs complètement erronées sur
00:02:23
une étape dont l'étape précédente est
00:02:25
une donnée manquante et donc on va voir
00:02:27
ici comment on va pouvoir compléter les 16,
00:02:31
ces valeurs manquantes.
00:02:33
Afin de lisser notre visualisation,
00:02:36
donc pour ça.
00:02:38
On va retourner dans Power Query.
00:02:42
Ici, on va se rendre sur la colonne.
00:02:45
Du coup il manque des valeurs,
00:02:46
donc on voit ici la valeur nulle qui apparaît
00:02:48
et la valeur nulle qui apparaît une 2e fois.
00:02:51
Et on va donc là sélectionner,
00:02:53
aller dans transformer et on va
00:02:57
aller sur remplir les données.
00:03:00
Qui se situe ici donc,
00:03:02
remplir les données.
00:03:03
Alors vous allez avoir 2 choix
00:03:05
vers le bas ou vers le haut,
00:03:06
C'est à dire que si j'ai une valeur
00:03:09
manquante ici et que je dis vers le bas,
00:03:12
et bien c'est la valeur du dessus qui
00:03:13
va aller se mettre du coup vers le bas.
00:03:15
Donc aller remplir ici et sinon
00:03:17
je peux mettre vers le haut qui
00:03:19
va faire l'effet inversé.
00:03:20
Et qui va donc prendre la valeur du
00:03:23
dessous pour la placer au-dessus ?
00:03:25
Donc nous,
00:03:26
on va essayer déjà de le faire vers
00:03:28
le bas ici, remplir vers le bas.
00:03:32
Voilà,
00:03:32
et donc on se retrouve avec la valeur
00:03:34
du dessus qui est apparue en dessous.
00:03:36
Donc évidemment, si vous le souhaitez,
00:03:37
vous pouvez tout à fait l'inverse.
00:03:39
On va ? Appliquer nos modifications.
00:03:44
Et à chaque, vous allez modifier,
00:03:45
vous allez être obligé de
00:03:47
réappliquer vos modifications.
00:03:48
Et comme vous voyez ici maintenant,
00:03:49
le graphique va être beaucoup plus
00:03:51
propre et on voit là ici les 2 étapes
00:03:54
qui viennent d'être qui viennent
00:03:55
d'être fusionnées et qui permet du
00:03:57
coup d'avoir un histogramme complet.
00:03:59
Alors évidemment,
00:03:59
faut faire attention à ça.
00:04:01
Si vous manquez énormément de valeur et
00:04:03
si vous n'avez pas vraiment d'utilité
00:04:04
de remplir les valeurs manquantes,
00:04:06
vous n'êtes pas du tout obligé de le faire.
00:04:08
Là,
00:04:08
c'est juste dans le cadre de visualisation,
00:04:10
pour que ça soit un peu plus propre,
00:04:11
on va juste dire, Eh bien,
00:04:12
en fait,
00:04:12
je prends la même valeur que
00:04:14
l'État précédente.
00:04:14
Pour avoir quelque chose d'assez
00:04:17
cohérent et voilà,
00:04:20
ne pas hésiter potentiellement à mettre
00:04:21
un commentaire en dessous du graphique.
00:04:22
On verra comment ajouter des zones
00:04:24
de texte pour expliquer,
00:04:26
la petite astuce que vous avez utilisée ici.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher