Power BI - Extraire les données d'une plateforme cloud (Big Query) Tutoriels

Découvrez comment extraire les données d'une plateforme cloud telle que Big Query en utilisant les fonctionnalités de transformation de données dans Microsoft 365. Cette vidéo vous montre comment connecter votre compte Big Query à Excel et extraire les données souhaitées dans votre tableau.
Obtenez des conseils pratiques pour personnaliser votre requête et filtrer les données pour répondre à vos besoins spécifiques.
Contactez-nous pour plus d'informations sur l'utilisation des fonctionnalités de transformation de données dans Microsoft 365.

  • 8:08
  • 2893 vues

Objectifs :

L'objectif de cette vidéo est d'apprendre à se connecter à une base de données à l'aide des connecteurs proposés par Power Query, en utilisant Google Cloud Platform et son outil BigQuery. Les apprenants découvriront comment exécuter des requêtes SQL et choisir entre l'importation de données et l'utilisation de DirectQuery.


Chapitres :

  1. Introduction aux bases de données
    Une base de données est un système qui permet de stocker des données sous diverses formes, telles que des tables en SQL ou des données JSON. Ces systèmes de stockage sont essentiels pour gérer et accéder à de grandes quantités d'informations.
  2. Présentation de Google Cloud Platform et BigQuery
    Google Cloud Platform offre une solution gratuite pour tester ses outils, notamment BigQuery, qui permet de se connecter à une base de données et d'envoyer des requêtes SQL. Pour utiliser BigQuery, il est nécessaire de créer un compte Google.
  3. Création d'un compte et connexion
    Après avoir créé un compte Google, les utilisateurs peuvent se connecter à BigQuery. Une fois connectés, ils peuvent accéder aux bases de données de test mises à disposition par Google Cloud Platform. Dans Power Query, il faut définir une nouvelle source de données et sélectionner BigQuery pour se connecter.
  4. Accès aux données publiques
    Une fois connecté, les utilisateurs peuvent explorer les bases de données disponibles, symbolisées par des cylindres. Il est possible de déployer ces bases de données pour voir les tables accessibles. Par exemple, les données concernant le baseball peuvent être sélectionnées pour l'analyse.
  5. Importation des données vs DirectQuery
    Lors de la sélection d'une table, les utilisateurs doivent choisir entre importer les données ou utiliser DirectQuery. L'importation envoie toutes les informations à Power Query, ce qui peut générer des fichiers lourds. En revanche, DirectQuery permet d'effectuer des calculs directement sur le serveur, ce qui est plus efficace pour de grandes quantités de données.
  6. Avantages de DirectQuery
    Utiliser DirectQuery permet de réduire la charge sur l'ordinateur de l'utilisateur, car les calculs sont effectués par BigQuery, qui dispose de plus de puissance de calcul. Cela permet d'obtenir des fichiers moins volumineux et des temps de réponse améliorés.
  7. Conclusion et recommandations
    Il est recommandé d'utiliser DirectQuery lorsque cela est possible, car cela optimise les performances lors de l'analyse de grandes bases de données. À la fin de la période d'essai de BigQuery, certaines fonctionnalités peuvent être perdues, mais l'accès aux tables en libre-service sera toujours disponible pour s'entraîner à requêter des bases de données.

FAQ :

Qu'est-ce qu'une base de données?

Une base de données est un système qui permet de stocker des données sous diverses formes, comme des tables en SQL ou des fichiers JSON.

Comment se connecter à une base de données avec Power Query?

Pour se connecter à une base de données avec Power Query, vous devez d'abord créer un compte Google, puis utiliser l'outil BigQuery pour établir la connexion et exécuter des requêtes SQL.

Quelle est la différence entre l'importation de données et l'utilisation de DirectQuery?

L'importation de données consiste à récupérer toutes les informations et à les stocker localement, ce qui peut être lourd pour de grandes tables. DirectQuery, en revanche, exécute des requêtes directement sur la source de données, permettant des calculs plus rapides et réduisant la charge sur votre ordinateur.

Qu'est-ce que BigQuery?

BigQuery est un service de Google Cloud Platform qui permet d'exécuter des requêtes SQL sur de grandes quantités de données, offrant une puissance de calcul supérieure à celle d'un ordinateur personnel.

Comment puis-je créer un compte Google pour utiliser BigQuery?

Pour créer un compte Google, rendez-vous sur le site de Google et suivez les instructions pour créer un nouveau compte. Une fois votre compte créé, vous pourrez accéder à BigQuery.


Quelques cas d'usages :

Analyse de données sportives

Utiliser BigQuery pour analyser des données de baseball, en exécutant des requêtes SQL pour extraire des informations pertinentes sur les performances des joueurs et des équipes.

Rapports d'entreprise

Les entreprises peuvent utiliser Power Query et BigQuery pour générer des rapports basés sur des données volumineuses, en utilisant DirectQuery pour obtenir des résultats en temps réel sans surcharger leurs systèmes locaux.

Prototypage de solutions de données

Les développeurs peuvent utiliser la Sandbox de Google Cloud Platform pour tester des solutions de données sans risque, en accédant à des bases de données publiques pour expérimenter avec des requêtes SQL.

Optimisation des performances de calcul

Les analystes de données peuvent tirer parti de la puissance de calcul de BigQuery pour effectuer des analyses complexes sur de grands ensembles de données, réduisant ainsi le temps de traitement par rapport à l'utilisation de leur propre matériel.


Glossaire :

Base de données

Un système qui permet de stocker des données sous diverses formes, telles que des tables en SQL ou des fichiers JSON.

SQL

Structured Query Language, un langage standard utilisé pour interagir avec des bases de données relationnelles.

JSON

JavaScript Object Notation, un format léger d'échange de données qui est facile à lire et à écrire pour les humains et à analyser et à générer pour les machines.

Google Cloud Platform

Une suite de services de cloud computing proposée par Google, qui inclut des outils pour le stockage de données, le calcul, et l'analyse.

BigQuery

Un service de Google Cloud Platform qui permet d'exécuter des requêtes SQL sur de grandes quantités de données.

Power Query

Un outil de Microsoft qui permet de connecter, combiner et affiner des données provenant de différentes sources.

DirectQuery

Une méthode d'interrogation des données qui permet d'exécuter des requêtes directement sur la source de données sans importer les données dans Power BI.

Sandbox

Un environnement de test qui permet aux utilisateurs d'expérimenter avec des fonctionnalités sans affecter les données réelles.

00:00:00
Alors maintenant, on va voir un
00:00:02
petit peu comment se connecter à une
00:00:04
base de données avec les connecteurs
00:00:07
proposés par Power Quéry donc
00:00:08
basiquement une base de données,
00:00:10
c'est un système qui permet de stocker
00:00:12
des données sous diverses formes,
00:00:13
hein, ça peut être des tables en SQL,
00:00:15
ça peut être du Jason, ça peut être
00:00:18
de la donnée beaucoup plus brute.
00:00:19
Quoi qu'il en soit,
00:00:20
on a besoin de stocker toutes ces
00:00:22
informations et donc on a besoin de
00:00:24
ces systèmes de de stockage et donc là
00:00:26
on va s'intéresser à une des solutions
00:00:27
qui nous permet de le tester gratuitement,
00:00:29
qui est la solution ?
00:00:30
Google cloud Platform,
00:00:31
et notamment son outil Big Quéry qui
00:00:34
permet en fait de se connecter à
00:00:36
une base de données et d'envoyer des
00:00:38
requêtes en SQL à l'intérieur de celle-ci.
00:00:40
Alors, comme je vous disais,
00:00:42
du coup vous avez la possibilité de
00:00:44
vous créez un essai gratuit ?
00:00:47
De cet outil-là de batterie donc
00:00:48
je vous invite à le faire,
00:00:50
alors il faudra un compte Google
00:00:52
Hein pour le coup pour le faire
00:00:55
donc je vous laisse vous créer un.
00:00:57
Un compte gratuit et on se retrouve tout
00:00:59
de suite une fois qu'on est connecté.
00:01:04
Une fois qu'on est connecté,
00:01:06
alors je ne vais pas forcément vous
00:01:07
expliquer comment fonctionne tout ça.
00:01:08
Il faut juste retenir que du
00:01:10
coup on va pouvoir exécuter
00:01:12
potentiellement des requêtes SQL
00:01:13
et ici où activer des connecteurs,
00:01:16
utiliser différents comptes
00:01:19
différents, différents projets.
00:01:22
Notamment.
00:01:22
La voilà par exemple pour aller pour
00:01:25
aller requêter directement ici.
00:01:31
Bon bref, ce n’est pas très important
00:01:32
une fois qu'on a créé ce compte-là,
00:01:34
du coup on va pouvoir se connecter
00:01:36
aux bases de données de de,
00:01:38
de tests qui sont mises à disposition
00:01:40
par Google cloud plateforme.
00:01:42
Donc pour ça on va retourner
00:01:44
comme d'habitude dans Power Quéry,
00:01:46
on va définir une nouvelle source de données,
00:01:49
donc là on va aller dans les plus.
00:01:56
On va chercher Big Query.
00:02:00
Google Big Quéry il est là,
00:02:02
on va cliquer sur se connecter.
00:02:05
Donc là on va se connecter à votre compte.
00:02:11
Alors là, on va aller plutôt ici,
00:02:13
donc le compte professionnel,
00:02:14
on va nous demander si on est d'accord
00:02:17
pour se connecter. On va accepter.
00:02:25
Et voilà donc là il m'indique,
00:02:26
vous vous êtes bien connecté,
00:02:28
donc on pourra fermer cet onglet là
00:02:30
de navigateur donc c'est ce qu'on
00:02:32
va faire et maintenant il m'indique
00:02:33
que je suis bien connecté et donc
00:02:35
nous on va cliquer également sur se
00:02:37
connecter donc à partir de là il va
00:02:39
aller récupérer toutes les bases
00:02:40
de données auxquelles j'ai accès.
00:02:42
Alors je vous préviens ça peut
00:02:43
prendre un peu de temps.
00:02:44
Ce que les c'était ce sont des comptes
00:02:46
de test et les tables sont assez
00:02:48
grosses donc ça peut un petit peu ramer
00:02:51
ou quoi que là c'est allé assez vite.
00:02:54
Et donc là on va s'intéresser à tout ce
00:02:56
qu'il mette en disposition en public data.
00:02:59
Donc ici, vous avez des bases de données ici,
00:03:01
c'est symbolisé ici par les
00:03:03
par ces petits cylindres.
00:03:04
On va aller en en déployer, hein.
00:03:06
Alors, c'est l'eau,
00:03:08
potentiellement,
00:03:08
ça peut un petit peu ramer.
00:03:13
Une fois qu'il a chargé toutes les tables,
00:03:15
on voit ici bah tous ceux à quoi on
00:03:17
peut potentiellement avoir accès,
00:03:19
donc nous on va aller prendre,
00:03:21
alors il y a beaucoup de choses
00:03:22
qui où il n'y a pas de données.
00:03:23
Donc moi je vais aller là où je
00:03:25
sais qu'il y a des informations
00:03:26
que j'ai pu le tester avant,
00:03:27
donc on va aller ici dans les données
00:03:29
qui concernent du baseball et on va
00:03:32
aller sélectionner la première table.
00:03:35
Qui contient du coup ?
00:03:37
Nos données, alors je n'ai pas
00:03:39
trop cherché ce que c'était,
00:03:42
ce que je sais juste, c'est que du
00:03:43
coup il y a des données à l'intérieur.
00:03:46
Et donc là voilà donc là,
00:03:47
il m'a indiqué un échantillon de ce qu'on,
00:03:49
de ce qu'on va récupérer,
00:03:51
on ne va pas trop se poser de questions,
00:03:52
on va dire qu'on est d'accord,
00:03:53
hein ?
00:03:54
Hop.
00:03:57
Alors là, il va me poser une
00:03:59
question assez importante,
00:04:00
qui va me demander si je souhaite
00:04:02
importer les données ou si je
00:04:04
souhaite utiliser le système direct ?
00:04:06
Quéry alors ça c'est important que vous
00:04:09
puissiez comprendre la distinction,
00:04:11
donc on va regarder un petit schéma ensemble.
00:04:15
Alors on se retrouve ici avec le schéma,
00:04:17
donc en gros si vous cliquez ici sur
00:04:19
importer, qu'est-ce qui va se passer ?
00:04:20
C'est que on va demander à Becky donc
00:04:24
de renvoyer toutes les informations
00:04:26
et on va demander à Power Quéry et
00:04:28
donc à votre fichier pour I de stocker
00:04:31
l'ensemble des données qui ont été
00:04:34
renvoyées et donc potentiellement ça,
00:04:36
ça peut générer des fichiers
00:04:39
relativement lourds. Je.
00:04:47
Et donc oui, excusez-moi donc on va
00:04:50
ré importer tous les fichiers et en
00:04:53
gros si par exemple on va demander à
00:04:56
appliquer un regroupé par Eh bien
00:04:59
il va lui-même calculer cette
00:05:01
cette manipulation et donc
00:05:03
potentiellement ça peut être très
00:05:05
long ce cas-là dans l'exemple qu'on
00:05:07
a ont pu avoir des dizaines ou des
00:05:10
centaines voire des 1000000 de lignes
00:05:11
et donc là c'est votre ordinateur qui
00:05:13
doit être capable de calculer ça à
00:05:14
partir de toutes les données brutes.
00:05:16
Qu'il a récupéré.
00:05:16
Donc, quand on est dans le cas de très,
00:05:19
très grand volume de données,
00:05:20
ce n’est pas forcément le plus pertinent
00:05:22
de sélectionner le système d'import.
00:05:24
Voilà donc oui très lourd si la table
00:05:27
est grande est impossible dans certains,
00:05:29
pas complètement qu'en fait votre
00:05:30
**** va ramer, ramer,
00:05:31
ramer et jamais réussir à calculer.
00:05:33
Donc dans le cas où on utilise direct
00:05:35
Query donc c'est toujours la même chose,
00:05:37
c'est à dire que le bakery va
00:05:39
renvoyer les données mais dans le
00:05:40
cas où on applique des manipulations
00:05:42
par exemple ça peut être faire un
00:05:44
regroupement où faire des calculs.
00:05:46
Par faire une multiplication sur une,
00:05:48
sur une certaine colonne, et cetera.
00:05:50
Eh bien ici en fait,
00:05:51
la requête va être envoyée plutôt
00:05:53
directement à celui qui hébergé les données.
00:05:56
Et donc c'est buckcherry qui
00:05:57
va effectuer le calcul.
00:05:58
Et ça,
00:05:59
c'est super intéressant parce que Bouygues,
00:06:00
Cory a beaucoup plus de puissance
00:06:02
de calcul que votre ordinateur
00:06:03
parce que c'est fait pour.
00:06:04
En fait, c'est fait pour du,
00:06:05
c'est fait pour du Big data.
00:06:06
Comme son nom l'indique,
00:06:08
et donc là c'est beaucoup plus,
00:06:09
c'est beaucoup plus intéressant parce que
00:06:11
c'est lui qui va se charger des calculs
00:06:13
et vous renvoyer l'information à votre poste,
00:06:15
donc ça c'est super intéressant.
00:06:18
Je,
00:06:18
je l'ai beaucoup dit,
00:06:20
mais ça va du coup alléger votre.
00:06:24
Ça va alléger le potentiellement ce
00:06:26
que vous allez emporter dans
00:06:28
dans Power BI puisque vous
00:06:30
allez limiter le nombre de ligne et
00:06:32
ensuite tout ce qui est chargé de
00:06:34
calcul et bien c'est effectué par Big Quéry,
00:06:36
donc vous allez globalement avoir un
00:06:38
fichier beaucoup moins volumineux et
00:06:40
avec des temps de calcul qui sont meilleurs.
00:06:42
Alors après tout dépend le service que
00:06:44
vous regrettez mais dans le cadre de
00:06:46
Bouygues Quéry ou de WS ou d’azur,
00:06:48
vous aurez des temps de réponse
00:06:50
bien meilleurs,
00:06:50
donc ici leur recommandation que j'ai
00:06:52
pour vous c'est plutôt d'utiliser direct
00:06:55
courrier quand on vous le propose.
00:06:57
Y a assez peu en l'état de de connecteurs
00:07:00
qui proposent l'option Directory,
00:07:03
parce que ça implique beaucoup de
00:07:04
choses pour pouvoir I mais en
00:07:06
tous les cas il y en a certains qui
00:07:09
sont disponibles notamment sur azur,
00:07:10
hein évidemment.
00:07:12
Quelques autres services
00:07:14
et dont fait partie Bitcoin.
00:07:17
Donc on va retourner sur notre
00:07:18
tableau et donc on va plutôt lui
00:07:20
demander de le faire en direct.
00:07:22
Quéry ici.
00:07:26
Et donc voici notre fameux
00:07:28
tableau qui a été récupérée,
00:07:29
donc qui est effectivement extrêmement
00:07:32
grand et qui est connecté directement
00:07:33
du coup à une base de données.
00:07:35
Donc bravo à vous.
00:07:36
Vous avez apporté une table
00:07:38
provenant d'une base de données et
00:07:39
on pourrait tout à fait ici aller
00:07:41
créer une nouvelle requête pour
00:07:42
aller apporter une nouvelle table
00:07:44
qui est disponible dans Big Query.
00:07:45
Donc Pour information en gros au bout
00:07:47
de la période d'essai vous allez
00:07:49
perdre certaines fonctionnalités,
00:07:51
mais le fait d'utiliser ce
00:07:52
qu'ils appellent la Sandbox,
00:07:54
donc toutes les toutes les tables qui
00:07:56
sont disponibles un peu en libre-service.
00:07:58
Ça, vous allez le garder,
00:07:59
donc je suis peut-être de le mettre
00:08:00
de côté pour si besoin que vous
00:08:02
avez de vous entraîner à requêter
00:08:03
des bases de données.
00:08:04
Eh bien,
00:08:05
vous avez la possibilité de le faire ici.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher