Power BI - Les courbes et les aires Tutoriels

Découvrez comment utiliser les courbes et les aires pour une utilisation professionnelle dans Microsoft 365 grâce à cette vidéo informative.
Cette vidéo présente les étapes clés pour comprendre les différences entre les courbes et les aires dans Microsoft Power BI et comment choisir le type de graphique le plus adapté à vos données.
Obtenez des conseils pratiques pour choisir les visuels appropriés en fonction de vos objectifs de communication et de vos données, ainsi que pour personnaliser la mise en forme de vos graphiques pour optimiser la lisibilité et la compréhension.
Suivez cette vidéo pour en savoir plus sur l'utilisation des courbes et des aires dans Microsoft 365 et comment cela peut vous aider à améliorer la présentation et l'analyse de vos données.

  • 20:43
  • 3567 vues

Objectifs :

L'objectif de cette vidéo est de comprendre les visualisations de données à travers les courbes et les aires, en expliquant leurs définitions, leurs utilisations, et en fournissant des exemples pratiques pour illustrer leur application dans l'analyse de données chronologiques.


Chapitres :

  1. Introduction aux Visualisations de Données
    Dans cette section, nous allons explorer les deux principaux types de visualisations utilisés pour afficher des tendances : les courbes et les aires. Nous commencerons par définir ce qu'est une courbe et une aire, en revenant aux bases pour assurer une compréhension claire.
  2. Définition d'une Courbe
    Une courbe est définie comme une succession de points, chacun ayant des coordonnées XY, reliés par des traits. Visuellement, cela représente une tendance qui peut être non linéaire, ce qui est particulièrement utile pour les données chronologiques. Il est important de ne pas surcharger un graphique avec trop de courbes, car cela peut créer un effet 'spaghetti', rendant l'interprétation difficile.
  3. Utilisation des Aires
    Les aires sont une extension des courbes, où la zone sous la courbe est remplie. Cela permet de visualiser des proportions et d'analyser les contributions de différentes catégories à une valeur totale. Par exemple, en affichant les ventes par produit sous forme d'aires, on peut facilement identifier quel produit a eu le plus d'impact sur les ventes.
  4. Exemples Pratiques
    Nous allons examiner des exemples concrets, tels que l'évolution du chiffre d'affaires ou le trafic mensuel sur un site web. Ces visualisations sont familières à la plupart des gens, notamment à travers des courbes épidémiologiques, comme celles observées durant la pandémie de COVID-19.
  5. Création de Graphiques en Courbe
    Pour créer un graphique en courbe, nous allons utiliser un logiciel de visualisation de données. Nous allons personnaliser la taille de la page, sélectionner les valeurs d'intérêt, et afficher les années sur l'axe des abscisses. En survolant la courbe, un curseur isolera les points pour afficher des données spécifiques, comme le nombre de participants à un festival en 1994.
  6. Ajout de Courbes de Tendance
    Nous allons également ajouter une courbe de tendance, qui représente la meilleure approximation linéaire des points de données. Cela permet d'observer la tendance générale des données au fil du temps. De plus, nous pourrons ajouter des prévisions basées sur les données existantes, ce qui nous donnera une estimation des valeurs futures.
  7. Graphiques Multimétriques
    Nous allons explorer la possibilité d'afficher plusieurs courbes sur un même graphique, chacune avec sa propre échelle. Cela nous permettra de comparer différentes valeurs numériques, comme le volume de festivals créés par année et le nombre moyen de participants.
  8. Visualisation en Aires Empilées
    Les aires empilées permettent de visualiser l'accumulation de valeurs au fil du temps. Nous allons créer un graphique qui montre le nombre total de participants par année de création de festival, en utilisant des filtres pour exclure les valeurs non pertinentes.
  9. Graphiques en Ruban
    Enfin, nous allons créer des graphiques en ruban, qui permettent de visualiser la fréquentation des festivals par région au cours de l'année. Ces graphiques montrent les variations de participation et permettent d'analyser les tendances saisonnières.
  10. Conclusion
    En conclusion, nous avons exploré différentes méthodes de visualisation des données, en mettant l'accent sur les courbes et les aires. Ces outils sont essentiels pour analyser et interpréter les données de manière efficace, et leur utilisation appropriée peut grandement améliorer la compréhension des tendances et des relations entre les variables.

FAQ :

Qu'est-ce qu'une courbe dans une visualisation de données?

Une courbe est une représentation graphique qui relie des points de données par des traits, permettant de visualiser des tendances dans les données chronologiques.

Comment éviter l'effet spaghetti dans un graphique?

Pour éviter l'effet spaghetti, il est conseillé de limiter le nombre de courbes affichées sur un même graphique. Utilisez des couleurs distinctes et des légendes claires pour faciliter la lecture.

Quelle est l'utilité d'une aire sous une courbe?

L'aire sous une courbe permet de visualiser des proportions et de comparer différentes catégories de données, rendant les informations plus accessibles.

Comment interpréter une courbe de tendance?

Une courbe de tendance montre la direction générale des données. Elle est calculée pour minimiser la distance entre les points de données et la ligne, indiquant ainsi la tendance globale.

Qu'est-ce qu'un graphique en air empilé?

Un graphique en air empilé montre la somme des valeurs de plusieurs catégories, empilées les unes sur les autres, ce qui permet de visualiser la contribution de chaque catégorie à un total.

Comment utiliser les prévisions dans une visualisation?

Les prévisions peuvent être ajoutées à un graphique pour estimer les valeurs futures basées sur des données historiques. Elles sont souvent accompagnées d'intervalles de confiance pour indiquer l'incertitude.

Qu'est-ce qu'une hiérarchie de date et comment l'utiliser?

Une hiérarchie de date permet de décomposer une date en éléments comme l'année, le trimestre, le mois et le jour, facilitant ainsi l'analyse des données temporelles.


Quelques cas d'usages :

Analyse des ventes par produit

Utiliser des courbes et des aires pour visualiser les ventes d'une entreprise par produit au fil du temps. Cela permet d'identifier les produits les plus performants et d'ajuster les stratégies de marketing.

Suivi des tendances épidémiologiques

Appliquer des courbes de tendance pour suivre l'évolution des cas d'une maladie, comme le COVID-19, afin de prévoir les besoins en ressources médicales et d'informer le public.

Évaluation de la fréquentation des festivals

Utiliser des graphiques en air empilé pour visualiser la fréquentation des festivals par région et par année, permettant aux organisateurs de mieux planifier les événements futurs.

Analyse du trafic web

Mettre en place des courbes pour analyser le trafic mensuel sur un site web, permettant d'identifier les périodes de forte affluence et d'optimiser les campagnes publicitaires.

Comparaison des performances des produits

Utiliser des graphiques en ruban pour comparer les performances de différents produits au fil du temps, facilitant ainsi la prise de décision sur les lancements de nouveaux produits.


Glossaire :

courbe

Une courbe est une représentation graphique où chaque arrête représente un point avec des coordonnées XYZ, reliés par un trait. Elle est souvent utilisée pour visualiser des données chronologiques.

aire

Une aire est une extension d'une courbe qui remplit la zone sous celle-ci, permettant de visualiser des proportions et des comparaisons entre différentes catégories.

effet spaghetti

Un effet spaghetti se produit lorsque trop de courbes sont affichées sur un même graphique, rendant la lecture difficile et confuse.

courbe de tendance

Une courbe de tendance est une ligne qui représente la tendance générale des données sur un graphique, souvent calculée par régression linéaire.

prévisions

Les prévisions sont des estimations des valeurs futures basées sur des données historiques, souvent représentées sur un graphique avec des intervalles de confiance.

graphique en air empilé

Un graphique en air empilé est une visualisation qui montre la somme des valeurs de plusieurs catégories, empilées les unes sur les autres pour montrer la contribution de chaque catégorie à un total.

hiérarchie de date

Une hiérarchie de date est une structure qui permet de décomposer une date en éléments tels que l'année, le trimestre, le mois et le jour, facilitant ainsi l'analyse temporelle.

ruban

Un graphique en ruban est une visualisation qui montre la variation de plusieurs catégories au fil du temps, où chaque catégorie est représentée par un ruban dont la largeur varie en fonction de la valeur.

00:00:00
On continue avec l'affichage des tendances,
00:00:05
donc ici on va utiliser principalement
00:00:07
2 types de visualisations qui
00:00:09
sont les courbes et les airs.
00:00:10
Alors on va revenir quand même aux
00:00:12
basiques pour comprendre ce qu'est une
00:00:13
courbe et aussi ce qui est une aire,
00:00:14
même si c'est l'extension d'une courbe.
00:00:17
Donc en gros ce qu'on va,
00:00:18
ce qu'on la définition d'une courbe,
00:00:20
c'est que chaque arrête de la courbe
00:00:22
représente un point avec des coordonnées
00:00:24
XYZ reliées en au suivant par un trait.
00:00:28
Donc en réalité une courbe
00:00:29
ça n'est qu'un,
00:00:30
qu'une succession de points.
00:00:32
Donc de coordonnées XY qu'on va les relier
00:00:34
via une courbe et donc visuellement après,
00:00:36
ça va afficher effectivement cette,
00:00:39
ce train qu'on va voir qui est
00:00:41
spécifique des courbes,
00:00:42
enfin qui est très,
00:00:43
qui n’est pas forcément droit mais en
00:00:44
tout cas cette liaison qui est
00:00:46
qui est affichée donc très utilisée
00:00:47
pour des données chronologiques comme
00:00:49
je vous l'ai dit en introduction,
00:00:50
il est familier à la plupart des
00:00:52
gens donc c'est bien de l'utiliser
00:00:53
parce que tout le monde sait lire
00:00:55
normalement une courbe attention on
00:00:56
ne peut pas avoir trop de courbes
00:00:58
sur un même graphique effectivement,
00:01:01
sinon vous allez avoir un effet
00:01:02
spaghetti donc si par exemple
00:01:04
vous allez avoir 10 ou 20 ou 30
00:01:06
valeurs affichées sur une cour.
00:01:07
Donc, en fonction des catégories.
00:01:09
Eh bien,
00:01:09
ça va avoir un effet un petit peu spaghetti.
00:01:11
D'ailleurs,
00:01:11
c'est ce que on va voir un petit peu ici,
00:01:13
mais je n’ai pas eu trop le choix,
00:01:15
donc il faut quand même
00:01:17
l'utiliser avec parcimonie,
00:01:18
qu'on a énormément de valeur affichée.
00:01:19
Sinon il y a tellement de courbes
00:01:21
à l'écran qu'on arrive plus à s'y
00:01:23
retrouver et ensuite on a son,
00:01:25
son frère,
00:01:26
son cousin,
00:01:26
peu importe en tout cas un équivalent qui
00:01:28
sont les airs donc qu'il reprend pour
00:01:30
base un graphique en courbe mais il va
00:01:32
venir remplir la zone sous la courbe.
00:01:34
Donc vous voyez ici c'est coloré
00:01:36
sous les différentes zones.
00:01:37
Et ça permet d'accéder à des
00:01:39
visualisations difficiles à comprendre
00:01:41
avec uniquement des courbes,
00:01:42
notamment pour comprendre les proportions,
00:01:45
,
00:01:46
qui ont mené par exemple à
00:01:47
la hauteur d'une courbe.
00:01:48
Encore une fois,
00:01:49
je reprends l'exemple que je vous
00:01:50
donnais tout à l'heure sur les ventes
00:01:53
d'une entreprise par produit et
00:01:54
bien si on affiche juste le total
00:01:56
des ventes et bien évidemment on
00:01:58
n'a pas le détail des produits.
00:01:59
Par contre,
00:02:00
si en dessous on va afficher chacune
00:02:02
des aires qui correspond à un type
00:02:04
de produit et bien visuellement
00:02:05
on va tout de suite comprendre
00:02:07
qui a été le plus impactant sur
00:02:10
les ventes parmi les produits.
00:02:12
Et attention, dans certains cas,
00:02:13
il est au contraire plus difficile de
00:02:16
comprendre l'évolution des valeurs,
00:02:18
notamment sur les aires empilées.
00:02:21
Et donc ici,
00:02:22
effectivement on ne va pas s'attacher
00:02:24
totalement à la valeur en elle-même,
00:02:27
mais plutôt à la l'évolution
00:02:29
de la répartition entre les
00:02:30
différentes catégories.
00:02:32
Donc tout cela est très théorique.
00:02:33
Je vous rassure, on va aller les utiliser,
00:02:35
donc des petits exemples pour comprendre
00:02:37
dans quel cas il faut l'utiliser.
00:02:39
Donc effectivement,
00:02:40
évolution par chiffre d'affaires.
00:02:41
Trafic mensuel sur un site web où
00:02:44
encore des courbes PE et épidémie.
00:02:46
Et voilà, j'ai du mal épidémiologique,
00:02:49
on est encore en plein dedans avec
00:02:51
le COVID où on a été largement
00:02:53
habitué à ces courbes là et on
00:02:55
retourne dans pour B pour aller
00:02:57
créer ces premières courbes.
00:03:01
Euh.
00:03:04
Ici, notre tri MAP est donc on va aller ici
00:03:08
créer un nouvel onglet pour les courbes.
00:03:12
On va faire rapidement notre
00:03:15
personnalisation, ajuster à la page,
00:03:17
on va aller agrandir un petit peu la page.
00:03:21
En personnaliser on va le
00:03:22
passer à 1500 pour être large.
00:03:26
1500 pixels et on va pouvoir attaquer nos
00:03:29
visualisations et donc on va faire quelque
00:03:31
chose d'assez simple pour l'instant,
00:03:33
donc on va les sélectionner ici.
00:03:34
Le graphique en courbe ?
00:03:37
On va aller chercher les
00:03:38
valeurs qui nous intéressent,
00:03:39
donc comme d'habitude,
00:03:40
on va attaquer le nombre
00:03:43
de participants 2018.
00:03:44
Et on va aller rajouter la notion alors
00:03:48
non en fait on ne va pas utiliser celle-là,
00:03:51
on va plutôt réutiliser le nombre
00:03:53
de participants totaux qu'on avait au
00:03:55
global par année et donc on va aller
00:03:57
ici dans ce tableau là en participant
00:03:59
par année et on va prendre le nombre
00:04:02
de participants pour les valeurs et.
00:04:03
On va aller afficher dans l'axe les années
00:04:07
et donc on va avoir quelque chose comme ça.
00:04:09
Voilà qu'on avait déjà vu un
00:04:11
petit peu en introduction.
00:04:12
Avec une vue en histogramme et voilà,
00:04:14
on se retrouve avec un joli groupe courbe,
00:04:16
alors vous voyez qu'on survole une
00:04:17
courbe qu'on va voir ici un curseur.
00:04:19
Et si vous cliquez du coup,
00:04:20
il va vous isoler le point et
00:04:21
vous dire par exemple, en 1994,
00:04:23
le nombre de participants qu'on avait
00:04:27
dans les festivals de cette année-là.
00:04:31
Donc ça a été assez vite,
00:04:32
?
00:04:33
Pour créer une courbe,
00:04:34
il n’y a pas grand-chose à configurer puisque
00:04:35
ici on est sur un pas extrêmement simple,
00:04:37
de de, juste d'un,
00:04:38
d'un volume de participants
00:04:39
par rapport à une année.
00:04:40
Donc là on est vraiment dans des données
00:04:42
chronologiques comme on avait pu en parler.
00:04:44
Et donc en plus de ça,
00:04:45
on va faire un petit peu de personnalisation
00:04:48
donc déjà on va aller ajouter ce
00:04:50
qu'on appelle une courbe de tendance,
00:04:52
donc on va aller ici dans les dans
00:04:55
le champ analytique et on va aller
00:04:57
ici dans le champ courbe de tendance.
00:05:00
Et on va aller l'ajouter.
00:05:03
Donc la courbe de tendance va
00:05:04
tout simplement dire en gros voilà
00:05:06
sur l'ensemble de la courbe.
00:05:08
Voici une droite qui va au mieux
00:05:10
se rapprocher des points.
00:05:12
En fait, qui sont ici donc en haut,
00:05:14
c'est le meilleur, c'est le.
00:05:16
C'est le meilleur traçage,
00:05:17
donc ce qu'on appelle aussi
00:05:18
une régression linéaire.
00:05:19
Donc c'est le fait que cette courbe
00:05:21
là si on fait la soustraction
00:05:23
des distances ici avec la courbe
00:05:25
pour chacun des points,
00:05:26
Eh bien c'est cette courbe
00:05:28
là qui représente la,
00:05:29
la valeur la plus faible.
00:05:30
Voilà bon je ce n’est pas le sujet,
00:05:32
00:05:33
c'est vraiment des statistiques.
00:05:34
Retenez juste que du coup ça va vous
00:05:36
afficher ce qu'on appelle le trend.
00:05:38
La tendance globale sur notre courbe
00:05:40
et en plus de ça on va pouvoir faire
00:05:42
autre chose qui est très intéressant
00:05:44
c'est pouvoir ajouter des prévisions.
00:05:46
Donc là en gros il va se baser sur.
00:05:50
La courbe que j'ai actuellement et donc
00:05:53
il va pouvoir estimer dans le futur,
00:05:54
qu'est-ce que ça donne donc par exemple ici,
00:05:56
il m'a mis par défaut 10 points.
00:05:58
Qu'est-ce que symbolise 10 points ?
00:05:59
En fait, c'est les 10 années suivantes et
00:06:01
donc par rapport à ma courbe d'évolution,
00:06:03
il va me dire que lui,
00:06:05
ce qu'il estime par exemple pour 2000.
00:06:07
Alors la courbe ne connaît pas le COVID
00:06:09
évidemment parce que là c'est
00:06:11
des données qu'on n'a pas encore, mais.
00:06:13
Voilà donc il va vous
00:06:15
donner ici la prévision.
00:06:17
Pour 2023 pour 2025, et cetera donc,
00:06:20
qui est plutôt cohérent par
00:06:21
rapport à la
00:06:22
à la tendance globale sur
00:06:24
sur la fin de l'année.
00:06:25
On voit qu'il a quasiment tiré un trait là,
00:06:27
sur les.
00:06:28
Sur les 5,
00:06:28
10 dernières années pour obtenir ça
00:06:30
et donc vous allez avoir la droite
00:06:32
Noire qui est la prévision officielle
00:06:34
entre guillemets et ensuite la limite
00:06:36
supérieure et limite inférieure
00:06:37
qui correspond à l'intervalle,
00:06:39
ce qu'on appelle l'intervalle de confiance.
00:06:40
Donc en gros il estime qu’il y a de
00:06:43
très fortes probabilités que du coup
00:06:45
la prévision soit entre ces 2 valeurs
00:06:47
et fatalement plus on s'éloigne.
00:06:49
Dans le temps et moins,
00:06:51
il est sûr de de lui, entre guillemets,
00:06:53
donc plus.
00:06:54
L'écart de la zone grise augmente donc plus.
00:06:56
L'incertitude est là.
00:06:57
Donc là encore une fois c'est
00:06:59
de la pure statistique.
00:07:00
Mais voilà,
00:07:01
on a rajouté pas mal d'informations
00:07:03
intéressantes sur cette courbe-là.
00:07:08
On va pouvoir continuer, non ?
00:07:11
Notre création de courbes.
00:07:14
Pour afficher une courbe multi
00:07:15
métrique parce que comme on voit
00:07:17
ici un petit peu sur le schéma,
00:07:19
on a la capacité d'afficher plusieurs
00:07:21
courbes à la fois avec chacune leur échelle.
00:07:24
Donc ici on va partir sur
00:07:27
cette visualisation,
00:07:28
alors en Max on va choisir un axe
00:07:30
temporel qui va nous permettre d'afficher
00:07:33
plusieurs valeurs numériques
00:07:34
et donc ici ce qu'on va faire,
00:07:36
c'est qu'on va se baser sur la date de
00:07:39
sur la date de création de des festivals.
00:07:42
Donc ici on va aller le mettre.
00:07:44
Sur notre axe.
00:07:45
Comme ceci, après évidemment,
00:07:47
on va rajouter des valeurs,
00:07:49
on va rajouter le volume de de festival,
00:07:52
?
00:07:53
Pour chacune de ces dates de création.
00:07:54
Donc pour ça on va aller chercher
00:07:56
notre colonne de qui contient le
00:07:59
nom et le code de la manifestation.
00:08:00
On va ajouter dans les valeurs
00:08:02
et là on va bien s'assurer que.
00:08:04
Et bien oui,
00:08:05
voilà parfait donc en gros ce qu'on a ici,
00:08:07
c'est le volume de.
00:08:09
De festivals en fonction de
00:08:12
leur année de création.
00:08:14
Donc on va fatalement,
00:08:15
il y a assez peu de création
00:08:17
de festivals sur les,
00:08:19
sur les sur les années lointaines.
00:08:23
On va seulement un qui est
00:08:24
la fête de l'humanité.
00:08:26
Pour information, et après,
00:08:27
on va retrouver de plus en plus de festivals,
00:08:30
donc là 52, 77, et cetera et cetera.
00:08:35
Et en plus de ça,
00:08:36
on va,
00:08:36
alors on va peut-être juste
00:08:38
effectivement filtrer,
00:08:39
donc là on va voir aussi comment
00:08:40
filtrer sur un graphique,
00:08:41
donc ici on va aller rajouter le
00:08:44
cet onglet là et on va dire que
00:08:45
on ne souhaite pas forcément les
00:08:47
valeurs qu'on va appeler parasite,
00:08:48
c'est à dire les valeurs à
00:08:50
les points juste une valeur.
00:08:52
ça rallonge la
00:08:53
courbe et donc ça nous intéresse
00:08:55
pas tellement et donc ce qu'on va
00:08:57
dire c'est que on souhaite que le
00:08:59
nombre de festivals donc qui est ?
00:09:02
Toc, toc, toc,
00:09:03
voilà le nombre de festivals qui est ici.
00:09:05
On va lui indiquer qu'il doit
00:09:07
forcément être supérieur à un,
00:09:10
donc avec une valeur minimale à 2,
00:09:12
ce qui va nous permettre,
00:09:13
voilà de zoomer d'autant plus
00:09:16
sur notre graphique.
00:09:18
Et là,
00:09:19
est-ce qu’on n’irait pas zoomer encore plus ?
00:09:21
Non allez, on va rester,
00:09:23
on va,
00:09:23
on va rester là-dessus donc évidemment .
00:09:25
Là,
00:09:25
vu que je l'ai mis que sur ce
00:09:27
visuel là ça ne va pas,
00:09:28
ça ne va pas impacter les autres visuels.
00:09:34
Et en plus de ça, donc on va aller rajouter
00:09:37
également la moyenne de participants,
00:09:40
donc on va aller chercher nos participants.
00:09:45
Et on va les rajouter dans les valeurs.
00:09:47
Et donc ce qu'on va faire ici, c'est
00:09:49
qu'on va plutôt afficher la moyenne ici.
00:09:53
Pour avoir du coup ces 2
00:09:56
représentations graphiques et. On va ?
00:09:59
On va se rend compte qu'un petit problème,
00:10:00
que là Ah oui alors du coup c'est
00:10:01
de ma faute ça, ce que j'ai mis ?
00:10:05
Les moyens de participants et je l'ai
00:10:06
pas mis dans la valeur secondaire,
00:10:08
donc voilà, on va le faire ici,
00:10:09
je vais un petit peu agrandir pour que
00:10:11
vous puissiez voir donc en gros là,
00:10:13
comme vous le voyez,
00:10:14
on va avoir 2 échelles ici
00:10:16
donc ici on va avoir là.
00:10:18
Le nombre de de créations de de,
00:10:20
de festivals.
00:10:21
Donc ici,
00:10:22
ça va être cette première échelle là
00:10:24
et on voit qu'on a aussi l'échelle
00:10:25
du nombre de moyens de participants.
00:10:27
Donc en gros on va prendre pour chaque
00:10:29
année de création le nombre de festivals
00:10:31
qui ont été créés et pour ces festivals,
00:10:34
on va calculer la moyenne
00:10:35
de participants en 2019,
00:10:36
donc là c'est encore une fois pour
00:10:38
montrer un petit peu toutes les
00:10:40
fonctionnalités qui existent et on
00:10:41
avait aussi la possibilité d'aller
00:10:43
extraire le minimum,
00:10:44
potentiellement le maximum.
00:10:46
Voilà,
00:10:46
ça nous fait encore d'autres courbes.
00:10:49
Et potentiellement aussi la somme,
00:10:51
, tout simplement.
00:10:52
Donc là on voit qu'on a une
00:10:54
très forte corrélation.
00:10:55
Entre les 2,
00:10:56
ce qui est aussi lié au fait que j'ai
00:10:58
créé en toutes les toutes les données
00:11:00
et donc on va rester sur les moyennes.
00:11:03
Comme ceci et en plus de ça,
00:11:05
on va aller rajouter une ligne de moyenne,
00:11:08
donc on va aller ici.
00:11:09
Dans les données analytiques
00:11:10
et on va les rajouter.
00:11:12
Notre ligne de moyenne.
00:11:14
Voilà, donc ça sera ici pour cette valeur-là,
00:11:16
donc en moyenne,
00:11:17
on avait à peu près.
00:11:19
Voilà 48000 participants.
00:11:24
Voilà donc ici c'est intéressant,
00:11:26
notamment pour essayer de montrer des
00:11:29
certaines corrélations entre 2 entre 2.
00:11:31
Oui, c'est ça entre 2 métriques,
00:11:32
entre 2 valeurs numériques et ce qui
00:11:34
est intéressant c'est que du coup les
00:11:35
échelles vont être adaptées parce que là
00:11:37
on n'est pas du tout sur la même valeur.
00:11:38
Ici on est sur des centaines,
00:11:40
ici on est quasiment sur des
00:11:41
centaines de milliers ,
00:11:42
ça va de 40000 à 60000 et donc au moins
00:11:45
on peut avoir au moins une échelle
00:11:47
ou les 2 puissent se juxtaposer et
00:11:49
donc potentiellement voir que si
00:11:50
l'un monte est-ce que l'autre monde,
00:11:52
si l'un baisse, est-ce que l'autre baisse ?
00:11:54
Et cetera, et cetera.
00:11:54
Et en plus de ça,
00:11:55
ça n'empêche pas d'avoir la capacité
00:11:58
d'ajouter nos informations analytiques.
00:11:59
C'est là notamment une moyenne.
00:12:04
Donc voilà pour les courbes multi métriques,
00:12:06
on va continuer avec les airs,
00:12:09
donc les airs elles se situent ici.
00:12:12
Donc je vais aller prendre le premier.
00:12:14
Donc qui est le graphique en R
00:12:15
et à l'intérieur de ça,
00:12:16
on va aller prendre à nouveau notre
00:12:19
date de création de festival.
00:12:21
Donc, qui est ici ?
00:12:24
Voilà,
00:12:24
on va aller rajouter en plus de
00:12:27
ça le domaine pour la légende.
00:12:31
Donc le domaine, il est ici.
00:12:34
Et finalement,
00:12:35
on va aller rajouter les valeurs
00:12:37
qui correspondront à.
00:12:43
Le nombre de.
00:12:45
Domaine participant qu'on pourra avoir.
00:12:49
Excusez-moi le nombre de festivals
00:12:51
qui ont été créés et donc pour ça
00:12:54
on va aller rechercher encore une
00:12:56
fois notre colonne. Nom et code.
00:12:58
On va les placer ici dans les valeurs.
00:13:00
On va bien vérifier qu'il me fait la somme,
00:13:02
donc là on est bon.
00:13:04
On va pouvoir aussi effectuer un zoom
00:13:06
en ce coup-ci et plutôt se concentrer
00:13:08
à partir des années peut-être des
00:13:10
années quatre-vingt et donc pour ça,
00:13:13
on va aller appliquer ici un nouveau
00:13:15
filtre avec la date de la date de
00:13:17
création et on voit que quand je
00:13:19
rajoute une date en fait il va,
00:13:21
il va me rajouter un ensemble d'éléments ici,
00:13:23
l'année, le trimestre,
00:13:24
le mois et le jour alors que je
00:13:26
ne sélectionnais qu'un champ.
00:13:27
Parce qu'en réalité,
00:13:28
quand je type une colonne au
00:13:30
format date et bien en fait,
00:13:31
il va aller me créer ce qu'on
00:13:33
appelle une hiérarchie de date et
00:13:34
donc aller me créer des colonnes
00:13:35
entre guillemets virtuelles qui vont
00:13:37
uniquement contenir soit l'année,
00:13:38
le trimestre, le mois, le jour.
00:13:40
Ça c'est vraiment super intéressant
00:13:41
puisqu’après on va pouvoir jouer
00:13:43
avec ça et dire par exemple,
00:13:44
je ne sélectionne que l'année dans
00:13:46
ce dans cet élément ici par exemple,
00:13:48
là je ne prendrai que voilà l'année
00:13:50
et donc ne pas intéresser forcément
00:13:53
à la granularité des jours.
00:13:55
Alors là j'ai tout cassé,
00:13:57
je vais aller le remettre.
00:13:58
Ici,
00:13:59
voilà parfait et donc ici au niveau des fils,
00:14:02
ça va être la même chose,
00:14:02
c'est que je vais retrouver cet ensemble
00:14:04
de valeurs donc avec les années,
00:14:05
les jours,
00:14:06
les mois,
00:14:07
les trimestres et donc sur ce visuel
00:14:09
on va aller appliquer un filtre
00:14:11
qui m'indique que le l'année doit
00:14:14
être supérieure à on va mettre.
00:14:18
10 970 et on va cliquer sur
00:14:20
appliquer le filtre.
00:14:22
Voilà donc pour avoir déjà quelque chose
00:14:24
d'un peu plus intéressant visuellement.
00:14:26
Et donc ici alors attention,
00:14:28
ce n'est pas un histogramme.
00:14:29
Un excusez-moi un une courbe en air
00:14:31
cumule parce que s’il n’y a pas d'addition
00:14:33
à faire entre les différents auteurs,
00:14:35
donc là c'est juste une accumulation de
00:14:38
valeur et on voit qu'en plus de ça il
00:14:41
y a là les musiques actuelles .
00:14:44
Donc là ces catégories-là qui
00:14:46
écrasent complètement les autres
00:14:47
donc ceci n'est pas forcément le
00:14:49
plus simple à lire donc par contre
00:14:51
ce qu'on va pouvoir faire c'est
00:14:53
potentiellement reprendre ce tableau-là,
00:14:55
le copier et le coller.
00:14:57
Le placer en dessous est plutôt
00:15:00
utiliser des empiles.
00:15:04
Comme ceci et donc là l'idée,
00:15:05
c'est que en réalité du coup.
00:15:08
La hauteur ici correspond à exactement là.
00:15:11
Le nombre de participants,
00:15:12
donc en gros ça devra, ça doit reprendre.
00:15:14
En gros cette courbe que vous avez
00:15:16
ici celle qu'on a déjà calculé,
00:15:18
donc le nombre de participants en fonction
00:15:20
de l'année de création du Festival.
00:15:23
Et donc ici, vous avez l'autre détail donc,
00:15:24
si j'agrandis un petit peu.
00:15:27
Alors ce n’est pas autant hop là ?
00:15:30
Juste un petit peu.
00:15:32
Voilà donc on voit ici
00:15:33
que y a une cumulation,
00:15:35
donc ça sera seulement le total ,
00:15:36
qui, qui qui indiquera le nombre total
00:15:38
de de de participants par création
00:15:40
et par contre là on voit que y a
00:15:43
potentiellement une évolution dans le
00:15:45
temps de qui prend la plus grande part.
00:15:47
Est-ce que y a des sujets
00:15:49
qui qui émergent plus ou moins,
00:15:50
et cetera et cetera ?
00:15:53
Donc voilà pour la visualisation en Air,
00:15:56
Empile et on va les rajouter.
00:15:58
Une dernière réalisation de
00:16:00
bonus qui est ma foi très jolie.
00:16:02
Vous allez la voir,
00:16:03
il faut prendre un peu le coup
00:16:05
de main pour la lire,
00:16:06
mais je tenais à vous la montrer.
00:16:07
Donc on voit qu'on est encore un petit
00:16:09
peu au bout de notre visualisation,
00:16:11
donc on va aller ici,
00:16:12
on va aller.
00:16:16
On va aller personnaliser la taille
00:16:18
de la page, on va mettre 1700
00:16:21
pour un petit peu de place voilà,
00:16:24
et on va faire ce qu'on appelle des
00:16:27
graphiques en ruban et donc pour
00:16:29
ça on va aller le sélectionner,
00:16:31
donc il se situe ici. Alors là,
00:16:34
ça va être assez difficile à expliquer,
00:16:35
donc je vais plutôt créer le visuel et
00:16:37
après on y revient et donc ce qu'on va faire,
00:16:39
c'est que on va aller se concentrer
00:16:42
sur la date de début du Festival,
00:16:44
donc ici on va se rendre là et on
00:16:46
va justement utiliser ce système
00:16:48
de hiérarchisation de dates pour
00:16:51
sélectionner uniquement le mois.
00:16:52
Donc je vous disais c'est tout
00:16:53
à fait possible d'isoler,
00:16:54
donc là je ne prends que le mois
00:16:55
et là ce qui est intéressant c'est
00:16:57
que du coup Eh bien je vais pouvoir
00:16:59
avoir une analyse dans le temps de
00:17:00
l'année 2019 avec le volume. Par mois.
00:17:04
Et donc je vais aller rajouter les régions.
00:17:07
Donc ici on va aller.
00:17:09
Dans les régions, les régions, les régions.
00:17:12
Qui sont toujours au même endroit,
00:17:14
mais que j'ai du mal à trouver
00:17:16
qu'on va mettre les gens d'ici.
00:17:18
Et on va les rajouter,
00:17:19
notre volume de participants
00:17:21
en 2018 comme ceci et donc là,
00:17:24
qu'est-ce que ça représente ici ?
00:17:26
Alors déjà,
00:17:27
on voit qu'on a un certain nombre
00:17:29
de de de valeurs à vide ?
00:17:30
Donc ça veut dire ça,
00:17:31
c'est toutes les,
00:17:32
c'est tous les festivals où je n'ai
00:17:34
pas de valeur de date,
00:17:35
de début et donc pour ça on va pouvoir
00:17:37
les supprimer en faisant une nouvelle fois
00:17:39
un filtre et donc ici dire date de début.
00:17:42
On va rajouter un filtre de base qui n'est
00:17:45
donc non ça sera un filtre avant c'est.
00:17:48
On va dire qu'il n'est pas vide.
00:17:51
Et donc ça va aller.
00:17:53
Ah alors non,
00:17:54
il ne me l’enlève pas.
00:17:57
Bon alors c'est la région non ?
00:17:59
Non date de début ça devrait fonctionner.
00:18:02
Alors attendez.
00:18:05
Qu'est-ce que j'ai fait ? Qui ne va pas ?
00:18:09
Donc on va tout prendre,
00:18:11
sauf les valeurs vides.
00:18:12
Voilà, ça marche mieux comme ça.
00:18:14
Donc là j'ai tout sélectionné ici.
00:18:15
Sauf les valeurs vides et donc
00:18:17
ce qui est intéressant ici,
00:18:18
c'est qu'on va voir en gros là le
00:18:21
poids de chaque région au cours de l'année
00:18:24
pour la fréquentation des festivals.
00:18:26
Donc on voit ici par exemple,
00:18:28
donc je vais essayer encore d'agrandir
00:18:29
pour que vous puissiez bien voir ça,
00:18:31
c'est clair.
00:18:33
La police est un petit peu petit,
00:18:35
on va vraiment mettre toutes les chances
00:18:37
de notre côté pour grouper.
00:18:38
Alors, c'est quand même pas mal comme ça,
00:18:40
donc ici en gros ce que vous avez c'est
00:18:42
donc les fameux rubans dont on parlait,
00:18:44
c'est à dire que là vous avez
00:18:46
une liaison par exemple ici
00:18:47
pour je crois que c'est ouais,
00:18:48
c'est ça c'est l'Auvergne,
00:18:49
donc vous voyez que le ruban de
00:18:51
l’Auvergne ici il n’y a pas de
00:18:53
discontinuité et ce qui est intéressant
00:18:54
c'est qu'en gros la valeur du haut
00:18:56
c'est toujours la valeur la plus
00:18:57
forte donc ici par exemple pour
00:18:59
le mois de mars c'est Auvergne
00:19:01
Rhône-Alpes qui avait eu le plus
00:19:03
de participants à ces festivals.
00:19:04
On voit aussi au global,
00:19:05
la fréquentation au cours de l'année
00:19:07
pour les festivals où évidemment,
00:19:08
tout ce qu'on centre enfin,
00:19:09
tout y a une grosse partie qui
00:19:11
se concentre sur le thé.
00:19:12
Mais c'est intéressant de voir
00:19:12
c'est qu’au mois de mars,
00:19:14
on a aussi une petite fréquentation
00:19:15
et on voit par contre que,
00:19:16
à partir de septembre,
00:19:17
il y a plus grand chose qui se passe.
00:19:20
Donc Pour rappel,
00:19:21
on est sur là le mois de début de
00:19:23
de chaque festival et donc à chaque
00:19:25
fois qu'il va y avoir en gros des
00:19:27
dépassements c'est presque une course
00:19:28
ici et bien en fait les rubans
00:19:31
vont changer de position par exemple,
00:19:32
ici j'ai l’Ile-de-France qui représente
00:19:35
le plus de participants en avril.
00:19:38
Et donc il va aller doubler au vert
00:19:39
qu’on n’a pas en passer au-dessus de lui
00:19:41
puisqu’encore une fois les valeurs
00:19:43
sont classées du plus grand au plus petit.
00:19:45
On voit qu'on a aussi des
00:19:46
zones un petit peu visuelles,
00:19:48
c'est à dire que là on a des rectangles.
00:19:50
Alors à quoi ils servent ?
00:19:51
En gros ils vous indiquent dans cette
00:19:53
zone que c'est exactement la bonne
00:19:56
hauteur du carreau entre guillemets,
00:19:58
du ruban pour vous dire que là,
00:20:01
visuellement et mathématiquement c'est
00:20:02
ça que ça représente proportionnellement
00:20:04
vis-à-vis des autres valeurs et dès
00:20:05
qu'on va sortir de ça on va plutôt
00:20:07
être sûr de la représentation visuelle,
00:20:08
on va sortir du ruban.
00:20:10
Et donc potentiellement avoir voilà,
00:20:12
selon le déclassement,
00:20:12
qu'on va avoir là, par exemple,
00:20:14
ici sur Île-de-France,
00:20:16
on voit qu'on chute totalement
00:20:18
sur juillet.
00:20:20
Et donc le ruban Laval largement s'affiner.
00:20:24
Donc, ce qui compte la vraie
00:20:25
hauteur de chaque case, en fait,
00:20:27
c'est celle qui se situe en grisé.
00:20:30
Donc moi je la trouve vraiment
00:20:31
sympa
00:20:32
Cette visualisation,
00:20:33
elle est plutôt bien,
00:20:34
elle est plutôt intuitive,
00:20:36
donc n'hésitez pas à l'utiliser
00:20:37
dans vos différents graphiques
00:20:39
et on en a terminé sur tous
00:20:41
les sujets avec les courbes.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher