Power BI - Rassembler les fichiers similaires depuis un dossier Tutoriels

Découvrez comment rassembler les fichiers similaires depuis un dossier pour une utilisation professionnelle dans Microsoft 365 grâce à cette vidéo informative.
Cette vidéo présente les étapes clés pour importer et combiner des fichiers similaires à partir de sources externes à l'aide de Power Query.
Obtenez des conseils pratiques pour identifier les fichiers similaires et les combiner en fonction de vos besoins pour optimiser la manipulation et l'analyse des données.
Suivez cette vidéo pour en savoir plus sur la combinaison de fichiers similaires dans Microsoft 365 et comment cela peut vous aider à améliorer les performances de votre entreprise.

  • 7:17
  • 3468 vues

Objectifs :

L'objectif de cette vidéo est de découvrir les différents types d'appels de données possibles dans PowerPoint, en se concentrant sur l'utilisation de Power Query pour se connecter à diverses sources de données telles que SharePoint, des API et des bases de données. Cela vise à répondre aux besoins professionnels en matière de gestion de données.


Chapitres :

  1. Introduction aux appels de données dans PowerPoint
    Dans cette vidéo, nous allons explorer les différents types d'appels de données que l'on peut effectuer dans PowerPoint. Jusqu'à présent, nous avons principalement travaillé avec des fichiers Excel. L'objectif ici est de vous montrer un large éventail d'importations disponibles, y compris des fichiers dans SharePoint, des API, et des connexions à des bases de données. Ces compétences devraient répondre à la plupart des besoins que vous pourriez rencontrer dans un contexte professionnel.
  2. Préparation des fichiers d'exemple
    Pour commencer, il est conseillé de partir d'un fichier d'exemple. Nous allons nous connecter à plusieurs sources de données, bien que cela ne soit pas directement lié au projet des festivals. Cela nous permettra d'avoir des exemples pour chaque type de connexion. Nous allons ouvrir Power Query et examiner comment appeler plusieurs sources simultanément.
  3. Structure des fichiers clients
    Dans le dossier d'exemple, vous trouverez un dossier nommé 'client' contenant plusieurs sous-dossiers avec des fichiers CSV. Chaque fichier contient des informations sur les clients, telles que le téléphone, le code client, le nom, le prénom, la durée de la relation avec le client, et la région de résidence. Il est important de noter que ces fichiers suivent la même nomenclature, mais sont répartis dans plusieurs dossiers pour diverses raisons, comme des limites de lignes ou des mises à jour quotidiennes.
  4. Problématique de la gestion des fichiers
    Se connecter manuellement à chaque fichier et les concaténer n'est pas une méthode efficace, surtout si de nouveaux fichiers sont créés quotidiennement. Cela peut devenir très chronophage. Heureusement, Power Query offre des solutions pour automatiser ce processus en créant une nouvelle source de données.
  5. Utilisation de Power Query pour importer des fichiers
    Dans Power Query, nous allons sélectionner l'option pour importer des fichiers à partir d'un dossier. Après avoir sélectionné le bon dossier, Power Query affichera les fichiers récupérés. À ce stade, les fichiers sont en format binaire et doivent être combinés et transformés. Nous allons choisir de combiner les données, car tous les fichiers sont au même format.
  6. Configuration des paramètres d'importation
    Lors de l'importation, il est crucial de définir le bon délimiteur pour les fichiers CSV, qui peut être une virgule ou un point-virgule. De plus, il est possible de spécifier comment détecter les types de données, soit à partir des 200 premières lignes, soit de l'ensemble du jeu de données. Dans notre cas, il est acceptable de se baser sur les 200 premières lignes.
  7. Fusion des données et nettoyage
    Après avoir combiné les fichiers, nous obtiendrons un tableau contenant toutes les données nécessaires. Il est important de noter que la première colonne indiquera la source des données. Nous avons la possibilité de supprimer cette colonne pour ne conserver que les informations pertinentes sur les clients.
  8. Conclusion
    En conclusion, cette vidéo a démontré comment utiliser Power Query pour se connecter à plusieurs sources de données et automatiser le processus d'importation. Ces compétences sont essentielles pour gérer efficacement les données dans un environnement professionnel, en facilitant l'accès et l'analyse des informations clients.

FAQ :

Qu'est-ce que Power Query et comment l'utiliser ?

Power Query est un outil de Microsoft qui permet de connecter et de transformer des données provenant de différentes sources. Pour l'utiliser, ouvrez Power Query dans Excel ou Power BI, sélectionnez la source de données souhaitée, et suivez les étapes pour importer et transformer vos données.

Comment connecter Power Query à SharePoint ?

Pour connecter Power Query à SharePoint, ouvrez Power Query, sélectionnez 'Obtenir des données', puis choisissez 'SharePoint'. Entrez l'URL de votre site SharePoint et suivez les instructions pour accéder aux fichiers ou listes disponibles.

Quels types de fichiers puis-je importer avec Power Query ?

Power Query permet d'importer divers types de fichiers, y compris des fichiers Excel, CSV, des bases de données SQL, et des fichiers provenant de services en ligne comme SharePoint et Google Analytics.

Comment combiner plusieurs fichiers dans Power Query ?

Pour combiner plusieurs fichiers dans Power Query, sélectionnez l'option 'Dossier' lors de l'importation, choisissez le dossier contenant vos fichiers, puis utilisez l'option 'Combiner' pour fusionner les données en un seul tableau.

Qu'est-ce qu'un fichier CSV et comment l'utiliser dans Power Query ?

Un fichier CSV est un format de fichier texte qui stocke des données tabulaires. Dans Power Query, vous pouvez importer un fichier CSV, spécifier le délimiteur utilisé (comme une virgule ou un point-virgule), et transformer les données selon vos besoins.


Quelques cas d'usages :

Analyse des données clients

Utilisez Power Query pour importer et combiner des données clients provenant de plusieurs fichiers CSV stockés dans un dossier. Cela permet d'analyser les informations clients de manière centralisée, facilitant la prise de décisions basées sur des données consolidées.

Rapports automatisés

Créez des rapports automatisés en connectant Power Query à des sources de données comme SharePoint ou des bases de données SQL. Cela permet de générer des rapports à jour sans intervention manuelle, améliorant ainsi l'efficacité et la précision des rapports.

Suivi des performances des ventes

Utilisez Power Query pour extraire des données de ventes de différents fichiers et les combiner en un seul tableau. Cela permet de suivre les performances des ventes sur plusieurs périodes et d'identifier les tendances.

Intégration de données de plusieurs systèmes

Connectez Power Query à différentes API pour intégrer des données provenant de plusieurs systèmes (comme CRM, ERP, etc.). Cela permet d'avoir une vue d'ensemble des données de l'entreprise et d'améliorer la prise de décision.

Préparation de données pour l'analyse

Utilisez Power Query pour nettoyer et transformer des données avant de les analyser dans Excel ou Power BI. Cela inclut la suppression de colonnes inutiles, le changement de types de données, et la gestion des valeurs manquantes.


Glossaire :

PowerPoint

Un logiciel de présentation développé par Microsoft, utilisé pour créer des diaporamas composés de diapositives contenant du texte, des images, des graphiques, et d'autres éléments multimédias.

Power Query

Un outil de Microsoft qui permet de connecter, combiner et affiner des données provenant de différentes sources avant de les charger dans Excel ou Power BI.

API

Interface de Programmation d'Applications, un ensemble de règles et de protocoles permettant à différentes applications de communiquer entre elles.

SharePoint

Une plateforme de collaboration développée par Microsoft qui permet le stockage, la gestion et le partage de documents et d'informations au sein d'une organisation.

CSV

Comma-Separated Values, un format de fichier utilisé pour stocker des données tabulaires sous forme de texte, où chaque ligne représente une entrée et les valeurs sont séparées par des virgules.

UTF-8

Un format d'encodage de caractères qui peut représenter tous les caractères de l'alphabet Unicode, souvent utilisé pour le traitement de texte et les fichiers de données.

Données

Des faits, des chiffres ou des informations collectées pour être analysées ou utilisées dans des applications.

Concaténation

L'opération consistant à combiner plusieurs chaînes de caractères ou données en une seule.

00:00:00
Dans cette acception,
00:00:00
on va découvrir tous les types d'appels
00:00:02
de données qui sont possibles,
00:00:04
de faire dans PowerPoint risque jusqu'ici,
00:00:06
on fait des choses relativement simples,
00:00:07
on ne fait appel qu'à des fichiers
00:00:10
Excel et là l'objectif c'est de vous montrer
00:00:12
tout un panel d'impôts qui est disponible,
00:00:14
donc on va appeler des fichiers
00:00:15
dans des SharePoint.
00:00:16
On va appeler des API se connecter à
00:00:18
des bases de données, et cetera, et cetera.
00:00:20
Et donc ça devrait répondre à
00:00:22
la plupart des besoins que vous
00:00:24
aurez en milieu professionnel ou
00:00:25
en tout cas en situation réelle.
00:00:27
Donc ce que je vous conseille de faire,
00:00:28
c'est de partir d'un
00:00:30
fichier ****** ,
00:00:30
parce que là tout ce qu'on va faire,
00:00:31
on ne va pas forcément le garder ,
00:00:33
c'est ça, on va se connecter à
00:00:34
plein de sources de données.
00:00:35
Mais qui n’est pas vraiment en lien
00:00:37
Avec le projet des festivals ?
00:00:40
Cependant,
00:00:40
pour le garder dans un coin pour
00:00:42
justement avoir des exemples
00:00:43
pour chacune de ces connexions,
00:00:45
donc on va démarrer tout de suite,
00:00:46
on va aller ouvrir notre ami Power Query.
00:00:52
Hop. Qui s'ouvre sur le mauvais écran à
00:00:57
plein et la première chose qu'on va faire,
00:00:59
c'est voir comment on peut appeler
00:01:02
plusieurs sources à la fois pour faire ça.
00:01:05
Je vais vous montrer un peu la
00:01:07
problématique qu'on va avoir.
00:01:09
Donc dans les fichiers d'exemple,
00:01:10
vous allez avoir ici un dossier qui
00:01:13
s'appelle client et qui contient une
00:01:15
série de dossiers en CV et qui vont
00:01:18
contenir des informations clients.
00:01:19
Donc si on ouvre le premier.
00:01:25
Ça se présente de cette manière-là,
00:01:27
on va avoir le téléphone du client,
00:01:30
son code client, son nom, son prénom,
00:01:32
la durée de la relation avec le client
00:01:35
et la région dans laquelle il habite.
00:01:37
Donc voilà le premier un des
00:01:39
premiers fichiers qu'on a.
00:01:41
Et si j'ouvre le 2e,
00:01:42
on va rendre compte que c'est
00:01:44
exactement la même nomenclature,
00:01:45
mais simplement que du coup ça a
00:01:47
été réparti dans plusieurs dossiers.
00:01:49
Alors pourquoi une répartition
00:01:51
dans plusieurs dossiers ?
00:01:52
Alors ça y a plein de raisons, ,
00:01:53
que potentiellement ça peut être
00:01:55
des extraits de fichiers où
00:01:57
le nombre de lignes est limité,
00:01:59
auquel cas on va avoir plusieurs
00:02:00
dossiers ou sinon ça peut être
00:02:02
aussi des extras que journaliers.
00:02:04
Où donc ?
00:02:04
Bah chaque jour on va avoir
00:02:06
un nouveau dossier,
00:02:07
un nouveau fichier qui va se créer
00:02:09
et donc il faut être capable
00:02:10
de facilement aller créer une
00:02:12
requête pour aller les récupérer.
00:02:15
Alors là,
00:02:15
évidemment,
00:02:15
on pourrait faire quelque chose
00:02:16
d'assez simple,
00:02:17
c'est à dire se connecter au premier fichier,
00:02:20
se connecter au fichier.
00:02:21
Ce 3e fichier 4e fichier et ensuite
00:02:23
d'aller faire potentiellement une
00:02:24
une concaténation de roquettes
00:02:26
comme on avait pu le voir là,
00:02:27
ce n’est pas forcément idéal parce
00:02:29
que le nombre de fichiers va
00:02:30
pouvoir fermer dans le temps ,
00:02:32
surtout si on est dans le cadre
00:02:33
de mises à jour.
00:02:34
Journalière,
00:02:34
c'est à dire qu'on aura un
00:02:36
nouveau fichier tous les jours
00:02:37
donc ce n’est pas envisageable de
00:02:38
faire ça de cette manière-là.
00:02:40
Et puis en plus de ça,
00:02:41
c'est extrêmement chronophage ,
00:02:42
c'est à dire de de lancer
00:02:44
des roquettes une à une,
00:02:45
ça va prendre beaucoup de temps
00:02:46
pour un gain qui n’est pas très
00:02:48
intéressant donc il va falloir
00:02:50
utiliser une autre méthode forte
00:02:52
heureusement Power Query nous
00:02:53
propose de d'automatiser ça en allant
00:02:56
créer ici une nouvelle source,
00:02:58
donc on va aller ici dans plus.
00:03:05
Et on va découvrir l'ensemble des
00:03:07
sources qui sont disponibles à.
00:03:09
Avec Power Query donc là vous avez
00:03:12
l'ensemble, vous avez la possibilité
00:03:13
de filtrer par thématique,
00:03:15
donc ici on a les fichiers.
00:03:17
Par base de données donc on
00:03:19
va avoir du Azure, du My SQL,
00:03:21
du Redshift, du Big Query.
00:03:23
Après tout ce qui est Power plateforme,
00:03:25
alors ça on y reviendra,
00:03:26
mais c'est ce que vous pouvez
00:03:28
générer potentiellement via
00:03:29
Power BI pro où Power BI premium.
00:03:33
Tout ce qui est Azure donc c'est
00:03:35
le système de base de données
00:03:36
et tous les services de gestion
00:03:38
de base de données de Microsoft.
00:03:40
Les services en ligne,
00:03:41
donc ça va être potentiellement SharePoint,
00:03:43
ça va être Google Analytics,
00:03:45
ça va être LinkedIn et cetera, et cetera.
00:03:48
Donc là vous voyez c'est plein
00:03:49
de connecteurs en fait qui sont
00:03:52
disponibles pour pouvoir requêter
00:03:53
facilement certaines sources de
00:03:55
données et après y a bah tout le
00:03:56
reste on va dire donc y en AY en
00:03:58
à quelques-uns et après on verra
00:04:00
qui a aussi la possibilité de créer
00:04:01
des choses un peu plus custom,
00:04:03
notamment via du Python,
00:04:04
donc nous on va aller se rendre
00:04:06
ici dans fichier parce que c'est ce
00:04:08
qu'on cherche à faire importer des fichiers.
00:04:10
Et là,
00:04:11
on voit qu'on a une option dossier
00:04:13
et là l'idée de cette option-là,
00:04:14
ça va justement de dire,
00:04:15
d'indiquer non pas un fichier téléchargé
00:04:17
mais plutôt un dossier à télécharger.
00:04:19
Donc ici on va.
00:04:22
Sélectionnez un dossier.
00:04:25
Je vais me rendre au bon endroit.
00:04:28
Voilà donc
00:04:30
je suis allé dans projet Festival,
00:04:32
fichier d'exemple et client
00:04:34
ici donc vous sélectionnez vous
00:04:36
cliquez sur OK et c'est parti.
00:04:43
Donc là il va vous afficher le
00:04:45
résultat des fichiers qu'il a réussi
00:04:47
à récupérer là donc on voit au niveau
00:04:49
du contenu donc c'est en binaire
00:04:51
parce que pour l'instant ça n'a pas
00:04:53
encore la forme d'un tableau,
00:04:55
là en d'importer un fichier,
00:04:57
il va vous indiquer le nom du fichier,
00:04:59
son extension, la date de modification,
00:05:02
la date de création,
00:05:03
et cetera, et ensuite
00:05:06
Le chemin complet de chacun de ces fichiers.
00:05:10
Donc là ce qui va vous proposer
00:05:12
c'est soit de
00:05:13
Combiner et transformer les données
00:05:14
ou soit de transformer les données.
00:05:16
Donc là l'idée,
00:05:17
ça va plutôt être de demander à
00:05:20
combiner tout de suite les données,
00:05:21
puisqu'on sait que les 4 fichiers
00:05:23
sont au même format.
00:05:25
Ici donc,
00:05:27
il va aller un petit peu calculer ça.
00:05:31
Donc là, vous allez avoir le
00:05:33
résultat qui vous affiche, .
00:05:34
Ici potentiellement vu
00:05:35
que c'est un fichier CSV,
00:05:37
vous auriez besoin de changer de
00:05:39
délimiteur c'est à dire qu'est ce qui
00:05:40
sépare les valeurs les unes des autres ?
00:05:42
Donc c'est souvent soit virgule,
00:05:43
soit point-virgule , ça c'est le
00:05:46
la méthode d'encodage des fichiers.
00:05:49
Donc là on est en UTF 8 pour
00:05:50
gérer tout ce qui est caractères
00:05:52
spéciaux et après vous pouvez aussi.
00:05:55
Dire comment lui doit détecter
00:05:57
les types de données,
00:05:59
est-ce que c'est à partir des
00:06:00
200 premières lignes ou selon
00:06:01
le jeu de données complètes ?
00:06:02
Donc ça on avait vu que quand il se base
00:06:04
uniquement sur les premières lignes,
00:06:05
Ça peut poser un problème,
00:06:07
ça on peut prendre un risque
00:06:09
mais là dans notre cas on sait
00:06:11
tout à fait acceptable de rester
00:06:12
sur les 200 premières lignes et.
00:06:15
Et puis voilà,
00:06:16
on est pas mal donc on va
00:06:18
aller cliquer sur OK.
00:06:24
Donc là on voit que j'ai pas mal de
00:06:26
requêtes d'assistance qui se sont
00:06:27
créées justement pour aller pour
00:06:30
aller importer les fichiers
00:06:34
et les fusionner ?
00:06:38
Et donc on se retrouve avec un
00:06:40
fichier comme ceci qui va contenir.
00:06:43
Hop-là l'ensemble de nos tableaux.
00:06:46
Ici et donc on se retrouve
00:06:48
avec ce qui nous intéressait.
00:06:50
Alors attention, du coup,
00:06:51
la première colonne va être
00:06:52
ajoutée automatiquement,
00:06:53
qui correspond à au fichier
00:06:55
source de la donnée.
00:06:57
Donc là on voit que ces clients
00:06:59
un client 2 client 34 donc vous
00:07:02
avez tout à fait la possibilité
00:07:04
d'aller supprimer cette.
00:07:06
Cette colonne-là est donc de conserver
00:07:08
uniquement les données qui nous
00:07:10
Intéressaient et donc là on se retrouve.
00:07:12
Parfaitement avec les choses
00:07:13
dont on avait besoin.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher