Excel - Présentation des graphiques de distribution d'une série de valeurs Tutoriels

Découvrez comment présenter des graphiques de distribution d'une série de valeurs dans Microsoft 365 en utilisant des données réelles.
Cette vidéo présente les étapes clés pour créer des histogrammes et des courbes de densité pour mieux comprendre la distribution de vos données.
Obtenez des conseils pratiques pour personnaliser les axes, les couleurs et les étiquettes pour une présentation claire et professionnelle de vos données.
Cette ressource est utile pour tous les professionnels souhaitant améliorer leur compréhension de la datavisualisation dans Microsoft 365. Suivez cette formation pour créer facilement des graphiques de distribution professionnels et mieux comprendre vos données.

  • 05:57
  • 2674 vues

Objectifs :

Comprendre les différents types de représentations graphiques, notamment les histogrammes et les boîtes à moustaches, et leur utilisation pour analyser la répartition des données.


Chapitres :

  1. Introduction aux Représentations Graphiques
    Dans cette section, nous allons explorer deux types de représentations graphiques : l'histogramme et les boîtes à moustaches. Ces outils sont essentiels pour visualiser la répartition des données, que ce soit pour des prix de produits, des notes d'élèves ou des tailles humaines.
  2. L'Histogramme
    L'histogramme est utilisé pour représenter la distribution d'une variable numérique. Par exemple, pour analyser les prix des produits, on peut créer des tranches de prix (0-50, 50-100, etc.) et compter le nombre de produits dans chaque tranche. Cela permet de visualiser où se situent la majorité des produits en termes de prix. - **Exemple de Tranches de Prix :** - 0 à 50 - 50 à 100 - 100 à 150 De même, on peut appliquer cette méthode pour les notes des élèves, en regroupant les notes par intervalles (0-5, 5-10, etc.) pour identifier la tranche où il y a le plus d'élèves.
  3. Visualisation des Tailles
    Un autre exemple d'utilisation de l'histogramme est l'analyse des tailles humaines. On peut compter combien de personnes mesurent entre 169 cm et 170 cm, et ainsi de suite. Cela permet de visualiser la distribution des tailles dans un échantillon donné.
  4. Les Boîtes à Moustaches
    Les boîtes à moustaches, ou box plots, sont une autre méthode de visualisation des données. Elles permettent de représenter les quartiles d'une distribution. Pour créer une boîte à moustaches, on classe les données par ordre croissant et on divise la population en quatre quartiles. - **Quartiles :** - Premier quartile (Q1) - Deuxième quartile (Q2, médiane) - Troisième quartile (Q3) - Quatrième quartile (Q4) Cela permet de voir la répartition des notes des élèves, par exemple, et d'identifier si certaines notes sont plus concentrées que d'autres.
  5. Comparaison entre Histogrammes et Boîtes à Moustaches
    Les histogrammes offrent une granularité plus fine, car ils peuvent représenter plusieurs valeurs dans des intervalles. En revanche, les boîtes à moustaches sont plus adaptées pour comparer plusieurs catégories de données, car elles permettent de visualiser les quartiles et la médiane de manière concise. - **Utilisation de l'Histogramme :** - Pour une granularité élevée sur une distribution. - **Utilisation de la Boîte à Moustaches :** - Pour comparer plusieurs catégories de données.
  6. Conclusion
    En résumé, les histogrammes et les boîtes à moustaches sont des outils puissants pour visualiser et analyser la répartition des données. Chacun a ses avantages selon le type d'analyse que l'on souhaite réaliser. Il est important de choisir le bon type de graphique en fonction des données et des informations que l'on souhaite communiquer.

FAQ :

Qu'est-ce qu'un histogramme et comment l'utiliser ?

Un histogramme est un graphique qui représente la distribution d'un ensemble de données en regroupant les valeurs en intervalles. Il est utilisé pour visualiser la fréquence des données dans chaque intervalle, ce qui permet d'identifier les tendances et les anomalies.

Comment interpréter une boîte à moustaches ?

Une boîte à moustaches montre la médiane, les quartiles et les valeurs extrêmes d'un ensemble de données. La longueur de la boîte représente l'interquartile (Q3 - Q1), et les 'moustaches' indiquent l'étendue des données. Cela permet de visualiser la dispersion et la symétrie des données.

Quelle est la différence entre la médiane et la moyenne ?

La médiane est la valeur qui divise un ensemble de données en deux parties égales, tandis que la moyenne est la somme de toutes les valeurs divisée par le nombre total de valeurs. La médiane est moins influencée par les valeurs extrêmes que la moyenne.

Quand devrais-je utiliser un histogramme plutôt qu'une boîte à moustaches ?

Utilisez un histogramme lorsque vous souhaitez visualiser la distribution des données avec plus de granularité, en montrant la fréquence des valeurs dans des intervalles. Une boîte à moustaches est préférable pour comparer plusieurs ensembles de données ou pour résumer la distribution avec moins de détails.

Comment choisir le nombre d'intervalles pour un histogramme ?

Le choix du nombre d'intervalles dépend de la taille de l'échantillon et de la distribution des données. Un nombre trop faible peut masquer des détails importants, tandis qu'un nombre trop élevé peut rendre le graphique difficile à interpréter. Il est souvent recommandé de commencer avec 5 à 10 intervalles et d'ajuster selon les besoins.


Quelques cas d'usages :

Analyse des ventes de produits

Un analyste de données peut utiliser un histogramme pour visualiser la distribution des prix des produits dans un magasin. Cela permet d'identifier les tranches de prix où la majorité des produits se situent, facilitant ainsi la prise de décisions sur les stratégies de tarification.

Évaluation des performances des étudiants

Un enseignant peut utiliser une boîte à moustaches pour comparer les notes des étudiants dans différentes matières. Cela permet de visualiser la répartition des notes et d'identifier les matières où les étudiants ont des performances similaires ou très variées.

Étude de la taille des populations

Un chercheur en anthropologie peut utiliser un histogramme pour analyser la distribution des tailles dans une population donnée. Cela aide à comprendre les variations de taille et à identifier des tendances démographiques.

Comparaison des salaires dans une entreprise

Un responsable des ressources humaines peut utiliser une boîte à moustaches pour comparer les salaires des employés dans différents départements. Cela permet d'identifier les disparités salariales et d'ajuster les politiques de rémunération.

Analyse des temps de réponse des serveurs

Un ingénieur en informatique peut utiliser un histogramme pour visualiser la distribution des temps de réponse des serveurs. Cela permet d'identifier les périodes de forte charge et d'optimiser les performances du système.


Glossaire :

Histogramme

Un histogramme est un type de représentation graphique qui montre la distribution d'un ensemble de données en regroupant les valeurs en intervalles (ou 'tranches') et en comptant le nombre d'observations dans chaque intervalle.

Boîte à moustaches

Une boîte à moustaches, ou 'box plot' en anglais, est un graphique qui résume la distribution d'un ensemble de données en indiquant les quartiles, la médiane, et les valeurs extrêmes. Elle permet de visualiser la dispersion et la symétrie des données.

Quartile

Un quartile est une mesure statistique qui divise un ensemble de données en quatre parties égales. Le premier quartile (Q1) est la valeur en dessous de laquelle se trouve 25% des données, le deuxième quartile (Q2) est la médiane, et le troisième quartile (Q3) est la valeur en dessous de laquelle se trouve 75% des données.

Médiane

La médiane est la valeur qui sépare un ensemble de données en deux parties égales. Elle est différente de la moyenne, car elle n'est pas influencée par les valeurs extrêmes.

Distribution

La distribution est la manière dont les valeurs d'un ensemble de données sont réparties. Elle peut être visualisée à l'aide d'histogrammes ou de boîtes à moustaches.

00:00:01
représentation graphique avec
00:00:03
les distributions, donc à savoir
00:00:04
l'histogramme et les boîtes à moustaches.
00:00:06
L'utilisation de ces types de visualisation
00:00:08
rentre en ligne de compte
00:00:11
quand vous allez avoir besoin d'avoir une
00:00:13
idée de la répartition d'un élément.
00:00:15
Ça peut être les prix en fonction...
00:00:17
les produits en fonction de leur prix,
00:00:20
donc on pourrait faire par exemple,
00:00:22
combien j'ai de produits de 0 à
00:00:23
50€, combien j'ai de produits de 50 à 100€,
00:00:26
de 100 à 150,
00:00:28
et cetera et cetera. Et
00:00:30
donc on va compter le nombre de produits
00:00:32
qui est représenté et in fine du
00:00:34
coup on va pouvoir potentiellement
00:00:35
se retrouver avec un
00:00:37
histogramme qui va nous représenter,
00:00:38
du coup, quels sont les blocs,
00:00:40
quelles sont les tranches de prix
00:00:41
où j'ai le plus de produits.
00:00:43
On va potentiellement pouvoir faire la
00:00:45
même chose avec les élèves par note.
00:00:47
Voilà, on va rassembler les élèves
00:00:48
qui ont eu entre 0 et 5, entre 5 et 10,
00:00:51
entre 10 et 15, et 15 et 20.
00:00:53
On compte et donc on va se rendre
00:00:55
compte de
00:00:56
de la tranche où il y a le plus d'élèves
00:00:58
représentés et finalement le dernier cas
00:01:01
qui peut être assez évident
00:01:03
en terme de compréhension,
00:01:04
c'est celui des tailles des humains,
00:01:06
donc tout simplement regarder combien
00:01:08
j'ai de personnes qui fait un mètre 69,
00:01:11
70, 71, et cetera.
00:01:13
Et donc on va avoir cette
00:01:16
forme assez caractéristique d'une
00:01:18
distribution sur ces valeurs-là.
00:01:21
Donc là, on est dans un cas où
00:01:23
on n'a qu'une seule valeur numérique
00:01:25
en entrée,
00:01:26
on ne va pas avoir une comparaison de
00:01:28
deux métriques, donc ça c'est important
00:01:30
à avoir en tête.
00:01:31
On rassemble les éléments par tranche.
00:01:32
Parfois pas forcément.
00:01:33
Du coup,
00:01:34
comme je vous disais par exemple les tailles,
00:01:36
si l'échantillon est assez grand,
00:01:37
on peut directement mettre les
00:01:39
tailles précises et donc oui le
00:01:40
but est évidemment de compter le
00:01:42
nombre d'éléments et la hauteur
00:01:43
de l'histogramme représente ce
00:01:45
nombre d'éléments en particulier.
00:01:48
Et il permet effectivement de voir les
00:01:50
particularités d'une distribution.
00:01:51
Est ce que par exemple j'ai plutôt
00:01:52
des valeurs qui se situent sur les
00:01:54
masses plutôt au début
00:01:56
des valeurs ou alors à la fin ou au
00:01:58
contraire tout ça est très harmonieux
00:02:00
et très bien réparti. Donc
00:02:02
ça permet de se rendre compte
00:02:04
un petit peu là de la répartition.
00:02:06
Et potentiellement, effectivement,
00:02:07
le dernier conseil que je peux donner,
00:02:09
c'est de savoir jouer avec la taille et
00:02:12
le nombre des tranches pour un bon visuel.
00:02:15
Voilà, j'ai 6, 5 tranches réparties.
00:02:16
J'aurais pu en mettre 6, 7, 8, 9,
00:02:18
10.
00:02:18
Après voilà,
00:02:19
j'ai des groupes qui vont être avec
00:02:21
de moins en moins d'observation donc
00:02:23
c'est un équilibre à trouver
00:02:26
pour trouver la bonne manière
00:02:28
de visualiser les données.
00:02:30
Et le deuxième élément,
00:02:31
le deuxième type de graphique qui permet
00:02:33
d'afficher ce type d'informations,
00:02:35
ça va être les boîtes à moustaches
00:02:38
ou box plot en anglais,
00:02:39
qui sont un peu moins évidentes à
00:02:41
comprendre en terme de visualisation.
00:02:43
Sachez que dans deux parties,
00:02:44
on aura tout un chapitre sur la statistique,
00:02:46
donc c'est de ça que ça parle.
00:02:48
Au final, c'est de la
00:02:50
statistique descriptive. Donc,
00:02:51
qu'est ce qu'on peut lire
00:02:53
sur ce type de graphique-là ? Donc en fait,
00:02:55
ça, il faut comprendre que
00:02:58
vous allez avoir plusieurs paliers. Ici,
00:03:00
ça va être le minimum, le
00:03:01
premier quartile, le deuxième quartile,
00:03:03
le troisième et le quatrième quartile. Donc qu'est ce qu'un
00:03:06
quartile ? En gros vous avez votre population.
00:03:08
On va les ranger dans l'ordre,
00:03:10
donc du plus petit au plus grand,
00:03:12
donc on va prendre par exemple les notes
00:03:14
d'élèves et donc on va regarder pour
00:03:16
le quart de
00:03:17
la population,
00:03:18
donc le quart de mes élèves,
00:03:20
quelle va être la répartition au
00:03:21
niveau de l'ordre de leur note.
00:03:23
Donc ça, ça va me donner du coup cet écart-là.
00:03:26
Donc en gros je sais que entre ce trait-là
00:03:28
et ce trait-là, j'ai un quart de mes élèves.
00:03:31
Ensuite je vais recommencer l'opération
00:03:32
entre ce trait-là et ce trait-là,
00:03:35
j'ai un nouveau quart de mes élèves,
00:03:36
entre ce trait-là et ce trait-là,
00:03:38
un nouveau quart,
00:03:39
entre ce trait-là,
00:03:40
un nouveau quart. Donc au final,
00:03:41
on se retrouve avec bien avec nos quatre quarts,
00:03:44
donc l'ensemble de ma population et là
00:03:46
ce qu'on peut potentiellement voir en fait,
00:03:48
et c'est ça l'intérêt de ces répartitions,
00:03:50
c'est de se dire, eh bien,
00:03:51
le premier quart est plutôt
00:03:52
ramassé et par contre enfin non.
00:03:54
D'ailleurs oui il est équilibré.
00:03:55
Dans tous les cas,
00:03:56
là ce qu'on voit que c'est le troisième quartile,
00:03:59
du coup la troisième tranche
00:04:00
est très ramassée.
00:04:01
Ça veut dire que les notes en fait
00:04:03
sont très proches les unes des autres
00:04:05
pour ce groupe
00:04:06
d'élèves.
00:04:07
Et potentiellement on peut
00:04:09
voir, donc là,
00:04:09
c'est pour les tailles des hommes
00:04:11
et des femmes.
00:04:12
Donc ça je crois que c'est le cas
00:04:14
qu'on va voir après dans
00:04:15
l'exercice, on va avoir par exemple
00:04:17
des hommes qui vont tendance à
00:04:19
avoir visiblement des tailles
00:04:20
plus ramassées que les femmes où
00:04:22
là c'est beaucoup plus large.
00:04:23
Là on a un premier quartile, donc
00:04:24
là un quart de la population des femmes
00:04:26
fait entre 175 centimètres et 168,
00:04:28
on va dire, donc la fourchette
00:04:30
est très grande par rapport à ce
00:04:32
qu'on peut avoir chez les hommes où
00:04:34
du coup les chiffres sont beaucoup
00:04:36
plus ramassés.
00:04:38
Donc voilà à quoi servent
00:04:40
ces box plot,
00:04:41
ces boîtes à moustaches et
00:04:42
sachez que le trait du milieu,
00:04:44
ça va représenter ce qu'on
00:04:45
appelle la médiane.
00:04:46
Donc la médiane,
00:04:47
ça va couper exactement en deux
00:04:49
la population que j'ai, donc
00:04:50
mon nombre d'élèves en deux
00:04:52
parties égales.
00:04:53
Voilà. Et
00:04:54
c'est la définition de la médiane,
00:04:56
à ne pas confondre avec la moyenne.
00:04:58
La comparaison par rapport
00:04:59
aux deux types de graphique,
00:05:01
c'est que la boîte à moustache
00:05:03
est moins fine par rapport à
00:05:05
l'histogramme, parce que là, vous le voyez,
00:05:06
je n'ai que, au final, quatre
00:05:08
valeurs, alors qu'ici je peux en avoir
00:05:10
5, 6, 7, 8, 9, 10, donc plus de granularité.
00:05:12
Par contre,
00:05:13
ce qui est intéressant c'est que
00:05:14
j'ai la place pour en afficher
00:05:16
plusieurs et potentiellement
00:05:17
pouvoir faire des comparaisons.
00:05:18
Donc quand on a toute une section de
00:05:20
catégories qu'on souhaite afficher
00:05:22
au niveau de leur distribution, eh
00:05:23
bien la boîte à moustaches, c'est
00:05:25
potentiellement plus indiqué.
00:05:27
Et si au contraire on veut de la
00:05:28
granularité sur une répartition,
00:05:30
sur une distribution,
00:05:31
là on va plutôt utiliser
00:05:33
l'histogramme. Gardez en tête que
00:05:35
même si là on va les manipuler,
00:05:36
les gens ont moins l'habitude de manipuler
00:05:39
ce type de boîte à moustaches,
00:05:40
donc,
00:05:41
ce type de graphique. Donc si
00:05:42
c'est juste pour vous, bon voilà,
00:05:44
vous avez compris l'intérêt du
00:05:46
graphique et vous pouvez donc les
00:05:48
utiliser, si c'est pour être diffusé
00:05:49
après auprès d'autres personnes,
00:05:51
soit vous devrez leur expliquer
00:05:53
potentiellement, soit pas adapté donc
00:05:55
partir peut-être sur quelque chose d'autre.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher