Power BI - Regrouper par dans la pratique Tutoriels

Découvrez comment utiliser la fonction "Regrouper par" dans Microsoft Excel grâce à cette formation en ligne.
Cette formation vous permettra de comprendre comment regrouper des données dans Excel en utilisant la fonction "Regrouper par", de personnaliser les options de regroupement et de manipuler les données regroupées.
Obtenez des conseils pratiques pour améliorer votre productivité et votre autonomie dans l'utilisation de Microsoft Excel.
Cette formation est destinée aux utilisateurs débutants souhaitant s'initier à la fonction "Regrouper par" dans Excel.
Suivez cette formation à distance de 45 minutes pour en savoir plus sur la fonction "Regrouper par" dans Microsoft Excel.

  • 5:10
  • 2865 vues

Objectifs :

L'objectif de cette vidéo est d'apprendre à gérer les doublons dans un tableau d'horaires de festivals en utilisant des techniques de regroupement. Cela permettra de simplifier la présentation des données en consolidant les informations sur plusieurs jours en une seule ligne.


Chapitres :

  1. Introduction au Problème des Doublons
    Dans cette section, nous abordons le problème des doublons dans un tableau d'horaires de festivals. Lorsque les festivals s'étalent sur plusieurs jours, il est fréquent de se retrouver avec des lignes dupliquées. Par exemple, un festival qui se déroule sur deux jours peut apparaître deux fois dans le tableau, une fois pour chaque jour.
  2. Tri des Données
    Pour visualiser ce problème, nous allons effectuer un tri croissant sur le nom de la manifestation. Cela nous permettra d'identifier les festivals qui partagent le même numéro d'identification et qui apparaissent sur plusieurs lignes.
  3. Regroupement des Lignes
    Pour résoudre ce problème, nous allons utiliser l'option de regroupement des lignes. Nous accédons à cette option en allant dans le menu 'Transformer' et en sélectionnant 'Regrouper par'. Il est essentiel de définir les critères de regroupement, en utilisant à la fois le nom de la manifestation et son code d'identification.
  4. Définition des Agrégations
    Nous devons également indiquer comment traiter les valeurs numériques et les dates. Par exemple, pour la date de début, nous allons récupérer la valeur minimale de la colonne 'heure de début'. Cela nous permettra d'obtenir la date du premier jour du festival.
  5. Calcul de la Durée Totale
    Pour la durée, nous allons indiquer que nous souhaitons faire une somme des valeurs. Cela nous permettra de cumuler la durée totale du festival sur les jours concernés. Ainsi, pour chaque combinaison de nom de manifestation et de numéro d'identification, nous obtiendrons une seule ligne avec les informations consolidées.
  6. Correction des Erreurs
    Il est possible que certaines valeurs de durée ne soient pas au format correct. Dans ce cas, nous allons extraire les deux premiers caractères de la colonne 'durée' et les transformer en nombre entier. Cela nous aidera à corriger les erreurs et à garantir que les calculs sont effectués correctement.
  7. Conclusion
    En conclusion, nous avons appris à gérer les doublons dans un tableau d'horaires de festivals en utilisant des techniques de regroupement. Cela nous permet de simplifier la présentation des données et d'obtenir une vue d'ensemble claire des horaires des festivals. Les regroupements sont essentiels pour une analyse efficace des données.

FAQ :

Comment éviter les lignes dupliquées dans un tableau des horaires de festival?

Pour éviter les lignes dupliquées, vous pouvez utiliser une fonction de regroupement qui combine les lignes en fonction de critères comme le nom de la manifestation et son numéro d'identification.

Qu'est-ce qu'un numéro d'identification dans le contexte d'un festival?

Le numéro d'identification est un code unique attribué à chaque festival, permettant de le distinguer des autres événements et de faciliter la gestion des données.

Comment calculer la durée totale d'un festival qui se déroule sur plusieurs jours?

La durée totale peut être calculée en additionnant les heures d'ouverture de chaque jour. Utilisez une fonction d'agrégation pour cumuler ces valeurs.

Pourquoi est-il important de récupérer la valeur minimale pour la date de début?

Récupérer la valeur minimale pour la date de début permet de déterminer le premier jour de l'événement, ce qui est essentiel pour une planification correcte.

Comment transformer des valeurs de durée en nombres entiers?

Pour transformer des valeurs de durée en nombres entiers, vous pouvez extraire les premiers caractères de la durée et les convertir en nombre entier.


Quelques cas d'usages :

Gestion d'un festival de musique

Lors de l'organisation d'un festival de musique, les organisateurs peuvent utiliser un tableau des horaires pour planifier les performances. En regroupant les lignes par nom de manifestation et numéro d'identification, ils peuvent éviter les doublons et avoir une vue d'ensemble claire des horaires.

Planification d'événements multi-jours

Pour un événement qui s'étale sur plusieurs jours, comme un salon professionnel, les organisateurs peuvent appliquer des techniques de regroupement pour calculer la durée totale et s'assurer que les horaires ne se chevauchent pas.

Analyse des données d'événements

Les analystes de données peuvent utiliser des tableaux des horaires pour extraire des informations sur les événements passés, en calculant des statistiques comme la durée moyenne des festivals ou le nombre d'événements par trimestre.

Optimisation des ressources

Les gestionnaires d'événements peuvent optimiser l'utilisation des ressources en analysant les horaires des festivals. En regroupant les données, ils peuvent identifier les périodes de forte affluence et ajuster le personnel et les installations en conséquence.


Glossaire :

tableau des horaires

Un tableau qui organise les horaires d'un événement, comme un festival, pour faciliter la gestion et la visualisation des informations.

festival

Un événement organisé sur plusieurs jours, souvent avec des activités variées, concerts, ou spectacles.

regroupement des lignes

Une opération qui consiste à combiner plusieurs lignes de données en une seule, en fonction de critères spécifiques.

tri croissant

Une méthode de classement des données par ordre croissant, généralement utilisée pour organiser des listes ou des tableaux.

numéro d'identification

Un code unique attribué à un événement ou une entité pour faciliter son identification dans un système.

durée

Le temps total pendant lequel un événement est ouvert ou se déroule.

agrégation

Le processus de combinaison de plusieurs valeurs en une seule, souvent utilisé pour des calculs comme la somme ou la moyenne.

valeur minimale

La plus petite valeur trouvée dans un ensemble de données, utilisée pour déterminer des points de référence.

extraction

Le processus de sélection et de récupération de données spécifiques d'un ensemble de données plus large.

00:00:00
On va continuer à travailler sur notre
00:00:02
table des horaires de de festival pour
00:00:05
se rendre compte d'un léger problème
00:00:07
dans la création de ce tableau.
00:00:09
En effet, quand un festival va
00:00:11
s'étaler sur plusieurs jours,
00:00:13
on va se retrouver avec des lignes
00:00:15
dupliquées dans notre tableau,
00:00:17
pour vous puissiez vous rendre
00:00:18
compte de de ça,
00:00:20
je vous invite à faire un tri croissant
00:00:22
sur le nom de la manifestation et
00:00:25
Certains où vont apparaître,
00:00:27
par exemple ici à bout de champs donc qui
00:00:30
a bien le même numéro d'identification ?
00:00:33
Et on le retrouve sur 2 lignes
00:00:35
bien pourquoi puisque en fait,
00:00:36
ce festival se déroule sur 2
00:00:38
jours et donc il est ouvert 6h le
00:00:40
premier jour et 6h00 le 2e jour.
00:00:42
Sauf que nous, ça ne nous va pas nous.
00:00:44
Ce qu'on veut,
00:00:45
c'est une seule ligne avec la date
00:00:47
de début et l'heure de début,
00:00:48
donc du premier jour et après la
00:00:51
durée totale du temps ou le festival
00:00:53
est ouvert donc pour ça on va
00:00:56
pouvoir utiliser une option de
00:00:58
regroupement des lignes et donc
00:01:01
ici on va aller dans transformer.
00:01:03
Et on va aller dans regrouper par.
00:01:07
Donc la première étape ici,
00:01:08
ça va être de définir le.
00:01:12
Alors on va déjà se mettre en mode avancé,
00:01:13
, parce qu'on va en avoir besoin,
00:01:15
c'est déjà de dire par quel dénominateur
00:01:18
les lignes vont être regroupées,
00:01:20
donc c'est à dire pour chaque
00:01:22
combinaison de ce que je vais mettre ici.
00:01:24
Il va me dupliquer les lignes et ne
00:01:26
m'en garder qu'une seule version,
00:01:28
donc le nom de la manifestation,
00:01:29
ce n'est pas suffisant,
00:01:30
comme on l'a vu.
00:01:31
Nous, on a besoin du nom de la
00:01:33
manifestation et également de son code.
00:01:35
Donc ici je vais aller rajouter.
00:01:37
Le numéro d'identification,
00:01:38
donc là pour chaque combinaison de ces
00:01:40
2 colonnes, une ligne va être créée.
00:01:44
Et après je vais devoir indiquer également ce
00:01:46
que je souhaite faire des valeurs numériques,
00:01:49
des valeurs de date comme retraitement
00:01:51
puisque vu que là je vais regrouper,
00:01:53
je dois dire ce que je compte
00:01:54
faire des tas de début,
00:01:55
des heures de début, et cetera et cetera.
00:01:57
Donc ce qu'on va faire,
00:01:58
c'est déjà récupérer l'heure de début.
00:02:03
Début et comme on l'a vu,
00:02:04
nous, ce qu'on veut,
00:02:06
c'est récupérer la date du premier jour.
00:02:08
Donc ici je vais mettre la
00:02:11
valeur minimale rencontrée pour
00:02:13
la colonne heure de début.
00:02:16
Voilà tout simplement.
00:02:19
Ensuite, je peux également.
00:02:23
Récupérer la date de début qui
00:02:26
s'en va mettre date de début.
00:02:29
Donc on va prendre encore
00:02:31
une fois le minimum.
00:02:32
C'est exactement le principe
00:02:33
de la date de début.
00:02:35
Je vais encore rajouter une agrégation
00:02:37
pour récupérer le trimestre parce
00:02:39
qu'on s'était embêté à le récupérer,
00:02:41
donc on va essayer de le garder.
00:02:43
Le trimestre, donc le trimestre est pareil,
00:02:45
on va prendre la valeur minimale.
00:02:48
Et on va prendre le trimestre et finalement
00:02:50
la dernière étape et c'est là où c'est
00:02:52
important de de faire attention, c'est sûr.
00:02:55
Le la durée, donc la durée ici.
00:03:01
Où je vais lui indiquer de faire
00:03:02
une somme là pour le coup,
00:03:03
ce que je veux qu'il cumule les valeurs
00:03:06
des plus des jours et donc ici,
00:03:08
je vais lui dire de faire la somme
00:03:12
De la durée tout simplement.
00:03:14
Et donc à partir de là, Eh bien,
00:03:16
il va me faire cette combinaison.
00:03:17
Nom de la manifestation et numéro
00:03:19
d'identification et après ?
00:03:20
Il va appliquer les calculs donc
00:03:22
par exemple si j'ai 2 colonnes,
00:03:23
si j'ai 2 lignes qui ont le
00:03:25
même nom de manifestation,
00:03:26
Eh bien quelle est la valeur
00:03:28
minimale pour le début,
00:03:29
je la prends pour les 2 lignes.
00:03:30
Quelle est la valeur minimale de date
00:03:32
de début, et cetera, et pour la durée ?
00:03:34
Bien je fais la somme du total des valeurs.
00:03:36
Et à partir de là,
00:03:38
si je recherche.
00:03:41
À bout de champ du coup, qui est venu ici ?
00:03:43
Et je vois que je n'ai plus que de
00:03:45
seules lignes et donc il a extrait
00:03:46
les valeurs que je souhaitais.
00:03:48
Et alors là j'ai une petite erreur qu'on
00:03:51
va essayer de corriger tout de suite.
00:03:56
Alors, il semblerait que certaines valeurs
00:03:59
en durée ne soient pas au format comme
00:04:01
il faut sur le sur le fichier d'origine,
00:04:04
mais ça ce n’est pas grave.
00:04:04
On va essayer de de s'en sortir quand même.
00:04:07
On va essayer de sortir un peu du cadre,
00:04:09
de la durée donc on va aller se
00:04:11
placer sur l'étape précédente pour
00:04:12
aller éviter les erreurs et ici ce
00:04:13
qu'on va faire c'est tout simplement
00:04:15
comme au final ce sont tout le
00:04:16
temps des heures rondes uniquement.
00:04:18
Extraire du coup les 2 premières
00:04:19
Valeurs de l'horaire et
00:04:21
de transformer ça en nombre.
00:04:22
Donc pour faire ça, on va aller
00:04:24
ici sélectionner la colonne durée.
00:04:25
On va aller extraire les premiers caractères,
00:04:29
on va dire qu'on veut insérer une étape,
00:04:31
c'est tout.
00:04:32
L'avantage de pouvoir Query,
00:04:33
dire que je veux les 2 premiers
00:04:36
caractères ici.
00:04:37
Qui vont être extraits et ensuite
00:04:40
que je souhaite transformer ça en.
00:04:42
Nombre entier.
00:04:46
Voilà donc ça, ça me semble pas mal.
00:04:49
Et maintenant, si je vais ici.
00:04:53
La durée, voilà la somme a bien
00:04:55
été faite donc c'est parfait.
00:04:57
Voilà à bout de champ.
00:04:58
Typiquement donc il a récupéré
00:05:00
les valeurs minimales et il m'a
00:05:02
bien sélectionné la durée pour
00:05:03
en faire la somme à chaque fois.
00:05:06
Donc voilà les regroupements et
00:05:08
l'intérêt qu'ils peuvent avoir.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher