Power BI - Analyse du XML ou JSON contenu dans une colonne Tutoriels

Découvrez comment analyser les fichiers XML ou JSON dans une colonne avec Power Query dans Microsoft 365. Cette vidéo vous guide à travers le processus d'analyse de ces formats de fichiers en utilisant la fonction "Analyser" dans Power Query.
Obtenez des conseils pratiques pour reconnaître la nomenclature de chaque format et pour extraire les données qui vous intéressent.
Contactez-nous pour plus d'informations sur l'utilisation de Power Query dans Microsoft 365.

  • 5:53
  • 3675 vues

Objectifs :

L'objectif de cette vidéo est de présenter les différents formats de fichiers couramment utilisés dans le traitement de données, notamment JSON et XML, ainsi que les méthodes pour les importer et les traiter efficacement dans Excel.


Chapitres :

  1. Introduction aux fichiers de données
    Depuis le début de notre travail, nous utilisons principalement des fichiers Excel et CSV, qui sont très simples à importer car ils nécessitent peu de retraitement. Cependant, il arrive que certains formats soient mélangés, ce qui peut compliquer l'importation. Dans cette vidéo, nous allons explorer deux formats principaux : JSON et XML, et comment les traiter correctement.
  2. Format JSON
    Le format JSON (JavaScript Object Notation) est l'un des formats les plus répandus pour stocker des données. Il fonctionne par un système de paires clé-valeur, où les données sont encapsulées entre des accolades. Par exemple, une structure JSON commence par une accolade ouvrante, suivie de clés et de valeurs. Les valeurs peuvent être des listes, ce qui est indiqué par des crochets. Il est important de reconnaître cette nomenclature pour identifier un fichier JSON.
  3. Format XML
    Le format XML (eXtensible Markup Language) est moins courant que JSON, mais il est utilisé pour des données plus complexes. XML utilise un système de balisage, où chaque valeur est entourée de balises. Par exemple, une balise d'élément peut contenir plusieurs balises enfants. Ce format est plus verbeux et nécessite plus de code pour représenter les données, mais il est essentiel de comprendre sa structure pour travailler avec des fichiers XML.
  4. Importation et traitement des fichiers
    Pour traiter ces formats, nous allons importer un fichier d'exemple dans Excel. Nous allons sélectionner un fichier JSON, puis utiliser l'onglet 'Transformer' pour analyser les données. Dans l'onglet d'analyse, nous avons la possibilité de choisir entre JSON et XML. En sélectionnant JSON, les données se transforment en enregistrements, ce qui nous permet de les visualiser sous forme de tableau. Nous pouvons ensuite extraire les valeurs qui nous intéressent et les renommer si nécessaire.
  5. Conclusion
    Il est crucial de se familiariser avec les formats JSON et XML, car vous serez souvent confronté à ces types de fichiers. Grâce aux outils d'analyse d'Excel, vous pouvez facilement importer, analyser et extraire les données dont vous avez besoin. Ne soyez pas intimidé par ces nomenclatures ; avec un peu de pratique, vous serez en mesure de les gérer efficacement.

FAQ :

Qu'est-ce qu'un fichier CSV et comment l'utiliser ?

Un fichier CSV est un format simple pour stocker des données sous forme de tableau. Il est facile à importer dans des logiciels comme Excel, car il nécessite peu de retraitement. Pour l'utiliser, il suffit de l'ouvrir dans un programme compatible et de manipuler les données comme un tableau.

Comment reconnaître un fichier JSON ?

Un fichier JSON se reconnaît par sa structure qui utilise des accolades pour délimiter les objets et des crochets pour les tableaux. Il contient des paires clé-valeur, ce qui permet de stocker des données de manière organisée.

Quelle est la différence entre JSON et XML ?

JSON est plus léger et plus facile à lire que XML, qui est plus verbeux et utilise des balises pour structurer les données. JSON est souvent préféré pour les échanges de données entre serveurs et applications web, tandis que XML est utilisé pour des documents plus complexes.

Comment importer un fichier JSON dans Excel ?

Pour importer un fichier JSON dans Excel, vous devez ouvrir Excel, sélectionner 'Nouvelle source', puis choisir le fichier JSON. Ensuite, utilisez l'onglet 'Transformer' pour analyser et structurer les données en records.

Quels outils peuvent aider à travailler avec des fichiers JSON et XML ?

Des outils comme Excel, des éditeurs de texte comme Notepad++, ou des environnements de développement comme Visual Studio Code peuvent aider à travailler avec des fichiers JSON et XML. Des bibliothèques de programmation comme 'json' en Python ou 'xml.etree.ElementTree' pour XML sont également utiles.


Quelques cas d'usages :

Analyse de données de ventes

Une entreprise peut utiliser des fichiers CSV pour importer des données de ventes mensuelles dans Excel. En utilisant les fonctionnalités d'analyse d'Excel, elle peut rapidement générer des rapports et des graphiques pour visualiser les performances des ventes.

Intégration d'API

Lorsqu'une application web doit récupérer des données d'une API, elle peut recevoir des réponses au format JSON. Les développeurs peuvent alors utiliser des bibliothèques pour parser ces données et les afficher dans l'application, améliorant ainsi l'expérience utilisateur.

Gestion de données de produits

Un e-commerce peut utiliser des fichiers XML pour gérer les informations sur les produits. En structurant les données avec des balises, l'entreprise peut facilement mettre à jour les informations sur les produits et les synchroniser avec son site web.

Reporting d'événements

Une organisation peut collecter des données d'événements sous forme de fichiers JSON. En les important dans Excel, elle peut analyser la participation et les retours des participants, ce qui aide à améliorer les futurs événements.

Migration de données

Lors d'une migration de données d'un ancien système vers un nouveau, les fichiers CSV et JSON peuvent être utilisés pour transférer les données. Les équipes peuvent utiliser des outils d'importation pour s'assurer que les données sont correctement formatées et intégrées dans le nouveau système.


Glossaire :

Fichier CSV

Un fichier CSV (Comma-Separated Values) est un format de fichier qui utilise une structure de tableau pour stocker des données, où chaque ligne représente un enregistrement et chaque colonne est séparée par une virgule.

JSON

JSON (JavaScript Object Notation) est un format léger d'échange de données qui utilise une structure de paires clé-valeur. Il est souvent utilisé pour transmettre des données entre un serveur et une application web.

XML

XML (eXtensible Markup Language) est un langage de balisage qui définit un ensemble de règles pour encoder des documents dans un format lisible par l'homme et par machine. Il utilise des balises pour structurer les données.

API

Une API (Application Programming Interface) est un ensemble de règles et de protocoles permettant à différentes applications de communiquer entre elles.

Record

Un record est un enregistrement de données qui contient une série de valeurs organisées, souvent sous forme de tableau.

00:00:00
Depuis le début de notre travail,
00:00:02
on fonctionne uniquement sur des fichiers
00:00:04
Excel ou des fichiers CSV qui sont
00:00:07
extrêmement simples à importer parce que
00:00:08
y a quasiment aucun retraitement à faire,
00:00:11
ce sont déjà des tableaux.
00:00:12
En réalité, vous verrez que des
00:00:14
fois certains formats vont être
00:00:15
mélangés avec d'autres. Par exemple,
00:00:17
vous allez importer un fichier à plat,
00:00:19
un fichier CSV qui pourra
00:00:21
potentiellement contenir des expressions
00:00:23
qui sont dans un autre format.
00:00:25
Et donc je voudrais ici vous en présenter 2,
00:00:27
les 2 principaux et après,
00:00:29
comment pouvoir les retraiter
00:00:30
correctement quand vous êtes devant ?
00:00:32
Ce cas de figure dans un dans un
00:00:35
fichier pour voir Query donc le premier
00:00:37
que je vous souhaite vous présenter,
00:00:39
c'est le plus répandu, ?
00:00:40
Et c'est celui que vous
00:00:41
rencontrez fatalement.
00:00:42
Le plus, c'est le Jason,
00:00:44
donc le Jason c'est juste une autre
00:00:46
manière de stocker un tableau,
00:00:47
ou en tout cas une suite d'informations.
00:00:51
Ça va fonctionner par système de
00:00:53
propriété de liste de clés et de valeurs.
00:00:56
Donc ici par exemple j'ai une
00:00:58
ouverture d'accolade , qui va,
00:01:00
qui va m'indiquer que je vais
00:01:02
démarrer mon expression ?
00:01:03
Ensuite, j'ai là,
00:01:05
j'ai là,
00:01:06
j'ai mon objet de data qui va contenir
00:01:08
comme on le voit ici une liste,
00:01:10
parce que j'ai les crochets qui
00:01:11
s'ouvrent et là je vais avoir ma
00:01:13
première valeur à l'intérieur.
00:01:15
À savoir ici, par exemple,
00:01:16
Des variables en fait,
00:01:19
où je vais avoir du coup la clé et là
00:01:21
valeur associée, et ainsi de suite.
00:01:23
Donc en réalité, tout ça en fait,
00:01:25
on pourra presque l'afficher
00:01:25
sous la forme d'un tableau.
00:01:27
C'est juste que là c'est
00:01:28
stocké de cette manière-là.
00:01:29
Et c'est notamment via le enfin sous format.
00:01:31
Disons que la plupart des API va fonctionner.
00:01:34
Voilà,
00:01:34
ne retenez pas par cœur cette nomenclature.
00:01:36
Je moi mon objectif,
00:01:38
c'est juste que vous puissiez
00:01:39
la reconnaître .
00:01:39
Donc généralement quand il y a un jeu
00:01:42
d'accolade de crochets et de clés de valeur,
00:01:44
vous vous êtes sûrement en face.
00:01:46
Dans un fichier Gisa ?
00:01:49
En plus de ça,
00:01:49
vous allez avoir un peu plus
00:01:51
rarement un autre type de fichier
00:01:52
qui est le XML un peu plus rare
00:01:55
car très gourmand en nomenclature,
00:01:57
ce qu'on voit qu'on a énormément
00:01:59
de choses à écrire et là ça va
00:02:00
être plutôt être un système de
00:02:01
balisage ici ou à chaque fois
00:02:03
qu'on va rentrer une valeur,
00:02:04
on va devoir encadrer cette valeur
00:02:06
avec des balises et donc de les nommer
00:02:09
pour pouvoir après créer un une sorte
00:02:12
de tableau pour cela et donc ici par
00:02:15
exemple j'ai une première balise route,
00:02:17
élément qui va contenir
00:02:18
une balise Child élément.
00:02:20
Une autre balise Child élément 2
00:02:22
et la valeur contente donc juste
00:02:24
du coup pour stocker la valeur
00:02:25
contente donc c'est quand je
00:02:27
vous disais assez long à écrire.
00:02:28
Là, ce qui m'importe,
00:02:29
c'est surtout pour vous que
00:02:30
vous puissiez encore une fois
00:02:31
retenir la nomenclature.
00:02:32
Donc quand on est avec des
00:02:34
chevrons ouvrant fermant et
00:02:35
une série de de valeurs avec des
00:02:37
chevrons qui se qui s'emboitent
00:02:38
les unes dans les autres,
00:02:40
Eh bien vous êtes sûrement en face de XML.
00:02:42
Alors comment faire pour
00:02:44
gérer ces 4 figures là ?
00:02:45
Eh bien on va aller s'entraîner
00:02:48
avec l'import d'un fichier.
00:02:50
Ici donc, encore une fois.
00:02:51
Un fichier d'exemple donc on va
00:02:53
aller ici sur une nouvelle source.
00:02:55
Un classeur et dans les fichiers d'exemple,
00:02:58
ici vous allez avoir un fichier Jason XL.
00:03:02
Donc on va l'ouvrir.
00:03:08
On va apporter la feuille, une. Ici,
00:03:17
on va le renommer.
00:03:22
Voilà, alors on va tout de suite
00:03:24
mettre les premières lignes comme
00:03:25
en-tête de colonne ici et donc on va
00:03:28
se retrouver avec ce format là et
00:03:30
c'est normalement là-dessus ?
00:03:32
Où vous vous pouvez vérifier que
00:03:35
c'est bien du Jason ou du XM,
00:03:38
donc là ça a plutôt l'air d'être du Jason.
00:03:40
Pour rappel, à chaque fois
00:03:41
vous cliquez sur une valeur.
00:03:42
Vous avez ici un champ qui vous
00:03:43
permet de sélectionner ça pour
00:03:44
potentiellement le copier-coller,
00:03:46
le mettre de côté et donc
00:03:48
on va chercher à rendre ça.
00:03:50
Utilise ça parce qu'on voit que
00:03:51
là y a quand même des informations
00:03:52
qui nous intéressant, à savoir la.
00:03:54
Le nombre de participants pour
00:03:56
2017 et pour 2018.
00:03:57
Mais tout ça,
00:03:58
du coup sous ce format-là donc de de Jason.
00:04:01
Alors pour transformer ça on va
00:04:03
aller ici sélectionner les valeurs,
00:04:04
on va aller dans l'onglet de transformer.
00:04:08
Et on va avoir ici un onglet analyser
00:04:10
donc dans l'onglet analyser vous
00:04:12
allez avoir 2 types d'analyses,
00:04:13
le j zone et le XM.
00:04:15
Ça tombe bien,
00:04:15
c'est les 2 dont je vous ai parlé et
00:04:18
on va ici par exemple cliquer sur Jason.
00:04:20
Voilà et là,
00:04:21
on voit que maintenant ça s'est
00:04:23
transformé en ce qu'on appelle des records.
00:04:25
Alors qu'est-ce qu’un record ?
00:04:27
Du coup, c'est en bas,
00:04:29
comme on l'indique en fait un
00:04:30
enregistrement de données.
00:04:31
Donc en fait, en réalité,
00:04:32
à l'intérieur de ça,
00:04:33
j'ai une série de valeurs et si
00:04:36
je clique sur un de ces records ?
00:04:38
Je vais me retrouver avec ce
00:04:40
tableau là alors qu'il est dans
00:04:41
un format un peu particulier.
00:04:42
Ce que là du coup,
00:04:42
les entêtes de colonnes
00:04:43
sont les en-têtes de ligne,
00:04:44
mais on voit que comme
00:04:46
on peut le constater,
00:04:46
il y a 2 valeurs en réalité,
00:04:48
qui est qui est sélectionnée ici ?
00:04:50
Donc,
00:04:51
pour pouvoir extraire l'ensemble
00:04:52
en une seule fois,
00:04:53
on a ici une petite flèche qui va nous
00:04:56
permettre d'aller extraire l'ensemble
00:04:57
des valeurs qui nous intéressent.
00:04:59
Potentiellement,
00:04:59
vous aurez beaucoup plus de colonnes ,
00:05:01
donc la liste pourrait être plus longue.
00:05:03
Vous pouvez potentiellement charger
00:05:04
plus d'éléments si vous voulez être
00:05:06
certain d'avoir tout sélectionné.
00:05:08
Donc ici on a bien 2017.
00:05:09
2018 les 2 colonnes qui nous intéressant.
00:05:12
On va cliquer sur OK.
00:05:13
Et là partir de là, alors à la limite,
00:05:16
on peut aussi changer les formats
00:05:18
en le mettant en nombre entier.
00:05:20
C'est là aussi qu'on s'en fait.
00:05:21
Le travail jusqu'au bout.
00:05:23
On peut même renommer 2017.
00:05:26
Par
00:05:32
2017 ici et 2018 ici et là,
00:05:35
on a fait le travail jusqu'au bout
00:05:37
et donc voilà donc ne soyez pas
00:05:39
effrayé par ce ces nomenclatures-là,
00:05:41
ça va vous arriver régulièrement de
00:05:43
tomber dessus mais avec cette petite,
00:05:45
cette petite astuce d'analyse
00:05:47
de la colonne on arrive très
00:05:49
facilement à analyser et extraire
00:05:51
les données qui nous intéressé.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher