Power BI - Extraire des valeurs d'une colonne Tutoriels

Découvrez comment extraire des valeurs spécifiques d'une colonne dans Excel à l'aide de Power Query.
Cette vidéo vous guide à travers le processus d'extraction de données en utilisant la fonction "Filtrer les lignes" dans Power Query, ainsi que la création de colonnes personnalisées pour afficher les résultats souhaités.
Obtenez des conseils pratiques pour nettoyer vos données avant l'extraction et pour appliquer vos modifications dans Excel.
Contactez-nous pour plus d'informations sur l'utilisation de Power Query dans Microsoft 365.

  • 6:43
  • 6717 vues

Objectifs :

L'objectif de cette vidéo est de présenter les différentes méthodes d'extraction de valeurs à partir d'une colonne de texte, en mettant l'accent sur des techniques simples et pratiques pour isoler des parties spécifiques d'une chaîne de caractères.


Chapitres :

  1. Introduction aux Méthodes d'Extraction
    Dans cette section, nous allons explorer les différentes options d'extraction de valeurs dans une colonne de texte. L'idée est de se concentrer sur des parties spécifiques d'une expression textuelle qui nous intéressent, en utilisant des méthodes simples et efficaces.
  2. Longueur du Texte
    La première méthode que nous allons aborder est l'extraction de la longueur d'un texte. Par exemple, si nous avons l'expression 'mon texte', la fonction retournera la valeur 9, car il y a 9 caractères, espaces inclus. Cette méthode est utile pour vérifier si un code, comme un code-barres, a la bonne longueur, ou pour analyser l'impact de la longueur d'un titre sur le taux de clics d'un article.
  3. Extraction des Premiers Caractères
    Cette méthode permet d'extraire un nombre spécifique de caractères à partir du début d'une chaîne. Par exemple, si nous voulons les 2 premiers caractères d'une expression, cela nous donnera les deux premiers éléments. Cela peut être particulièrement utile pour isoler des informations spécifiques, comme un numéro dans une colonne de texte.
  4. Extraction des Derniers Caractères
    Similaire à l'extraction des premiers caractères, cette méthode permet d'extraire un nombre spécifique de caractères à partir de la fin d'une chaîne. Par exemple, pour analyser l'extension d'un site web, nous pourrions vouloir récupérer les 3 ou 4 derniers caractères.
  5. Extraction d'une Plage de Caractères
    Ici, nous spécifions une plage de caractères à extraire. Par exemple, si nous avons un code produit, nous pourrions vouloir extraire les chiffres situés entre deux positions spécifiques dans la chaîne.
  6. Extraction Avant ou Après un Délimiteur
    Cette méthode permet d'extraire une valeur se trouvant avant ou après un certain caractère ou une série de caractères. Par exemple, nous pourrions vouloir récupérer uniquement la partie d'une URL qui se trouve après un double slash.
  7. Extraction entre des Limiteurs
    Cette méthode permet d'extraire une valeur située entre deux caractères spécifiques. Par exemple, nous pourrions vouloir extraire un mot ou une valeur qui se trouve entre des parenthèses dans une chaîne de texte.
  8. Application Pratique
    Nous allons maintenant appliquer ces méthodes sur un tableau de données. En utilisant les délimiteurs appropriés, nous pourrons isoler des valeurs spécifiques, comme le mois d'une date, pour une analyse plus claire.
  9. Conclusion
    En résumé, nous avons exploré plusieurs méthodes d'extraction de valeurs à partir de chaînes de texte. Ces techniques peuvent grandement simplifier l'analyse de données et améliorer la clarté des informations présentées.

FAQ :

Qu'est-ce que l'extraction de valeurs dans une colonne?

L'extraction de valeurs consiste à sélectionner et isoler une partie spécifique d'un texte ou d'une donnée dans une colonne, ce qui permet de travailler plus efficacement avec les données.

Comment calculer la longueur d'une chaîne de texte?

La longueur d'une chaîne de texte est calculée en comptant le nombre total de caractères, y compris les espaces. Par exemple, la chaîne 'mon texte' a une longueur de 9 caractères.

Pourquoi est-il important d'extraire les premiers caractères d'une chaîne?

Extraire les premiers caractères peut être utile pour isoler des informations spécifiques, comme un numéro ou un code, qui se trouvent au début d'une chaîne de texte.

Comment utiliser un délimiteur pour extraire des valeurs?

Un délimiteur permet de séparer des éléments dans une chaîne de texte. Par exemple, vous pouvez extraire tout ce qui se trouve avant ou après un certain caractère, comme un slash dans une URL.

Quels outils peuvent aider à l'extraction de valeurs dans des données?

Des outils comme Excel ou des logiciels de traitement de données peuvent être utilisés pour effectuer des extractions de valeurs, en utilisant des fonctions spécifiques pour manipuler les chaînes de texte.


Quelques cas d'usages :

Analyse de la longueur des titres d'articles

Dans le cadre d'une analyse de données pour un site web, vous pouvez extraire la longueur des titres d'articles pour évaluer leur impact sur le taux de clics. Par exemple, en comparant les titres longs et courts, vous pouvez déterminer lesquels attirent le plus d'attention.

Validation de codes-barres

Lors de la gestion des stocks, vous pouvez utiliser l'extraction de la longueur pour vérifier si les codes-barres respectent la longueur attendue, par exemple 13 chiffres. Cela permet d'assurer l'intégrité des données.

Extraction d'informations spécifiques dans des données clients

Dans un fichier contenant des informations clients, vous pouvez extraire des numéros de téléphone ou des adresses e-mail en utilisant des délimiteurs pour isoler les parties pertinentes des chaînes de texte.

Analyse des URL pour le SEO

En analysant les URL d'un site web, vous pouvez extraire des parties spécifiques pour optimiser le référencement. Par exemple, en isolant les mots-clés dans les URL, vous pouvez mieux comprendre leur impact sur le trafic.

Gestion des données d'analytics

Dans le cadre de l'analyse des données d'analytics, vous pouvez extraire des valeurs spécifiques pour évaluer les performances des campagnes marketing, comme isoler les chiffres de conversion à partir de chaînes de texte.


Glossaire :

extraction de valeurs

Processus de sélection et d'isolation d'une partie spécifique d'un texte ou d'une donnée dans une colonne.

longueur

Nombre total de caractères dans une chaîne de texte, y compris les espaces.

premier caractère

Caractère ou caractères situés au début d'une chaîne de texte. Par exemple, les deux premiers caractères d'une chaîne.

dernier caractère

Caractère ou caractères situés à la fin d'une chaîne de texte. Par exemple, les trois derniers caractères d'une chaîne.

extraction de plage

Sélection d'une sous-chaîne de caractères en spécifiant une position de début et de fin dans la chaîne originale.

délimiteur

Caractère ou série de caractères utilisés pour séparer des éléments dans une chaîne de texte, permettant d'extraire des valeurs avant ou après ce caractère.

nomenclature

Système de noms ou de termes utilisés pour classer ou identifier des éléments, souvent dans un contexte professionnel.

00:00:00
Dans cette partie,
00:00:01
je voudrais vous présenter les différents
00:00:03
types d'extractions de valeurs qui
00:00:04
sont possibles dans une colonne.
00:00:06
Donc imaginons que vous ayez une
00:00:08
expression de texte et qu'il n'y
00:00:09
ait qu'une seule partie de cette
00:00:10
expression de texte qui vous intéresse.
00:00:12
On avait déjà vu ça un petit peu tout
00:00:13
à l'heure avec les les séparations
00:00:15
de colonnes à partir de caractères.
00:00:17
En réalité, certaines des manipulations
00:00:18
que je vous ai fait de faire.
00:00:20
Alors je vous montre certaines choses qui
00:00:21
sont plus simples à faire avec d'autres,
00:00:23
mais c'est histoire d'être exhaustif,
00:00:25
donc vous découvrir des choses qui vous
00:00:27
simplifieront la vie au fur et à mesure,
00:00:28
mais en tous les cas ici en fait,
00:00:30
on a plein d'options qui vont
00:00:32
permettre d'aller sélectionner une
00:00:33
partie du texte et d'isoler donc ça.
00:00:35
Celle qui nous intéresse donc
00:00:37
dans le champ d'extraction.
00:00:38
On va retrouver pas mal de valeurs,
00:00:40
donc longueur, premier,
00:00:41
caractère, dernier caractère.
00:00:42
Et comme la dernière fois,
00:00:44
on va voir comment cela fonctionne et dans
00:00:45
quel cas utiliser telle ou telle méthode.
00:00:50
Alors ?
00:00:55
Donc les premiers, les premiers items,
00:00:57
ça va être la longueur, donc la longueur
00:01:00
va retourner la longueur du texte.
00:01:03
Donc là, par exemple,
00:01:04
j'ai l'expression mon texte qui va me
00:01:06
retourner du coup la valeur 9 puisque
00:01:08
si on compte le nombre de caractères
00:01:11
on retrouvera bien 9 caractères.
00:01:12
Les espaces sont évidemment
00:01:14
comptés dans ce calcul là.
00:01:16
Alors là, c'est un cas un peu
00:01:18
particulier d'utilisation,
00:01:19
ça permet potentiellement déjà de vérifier
00:01:22
si la longueur d'un d'un d'un code
00:01:25
par exemple est au est à la bonne longueur.
00:01:28
Si on attend par exemple 13
00:01:29
chiffres pour un code barre,
00:01:30
Eh bien ça sera assez facilement
00:01:32
vérifiable avec cette méthode là et
00:01:34
l'autre cas que je pourrais vous donner,
00:01:37
c'est par exemple si on a,
00:01:38
on est dans des données d'un site web,
00:01:40
des données Analytics et qu'on
00:01:43
souhaite voir potentiellement l'impact
00:01:44
de la longueur d'un d'un,
00:01:46
d'un titre.
00:01:47
D'une actualité sur un site média par
00:01:49
rapport au fait que les gens vont cliquer
00:01:50
ou pas dessus parce que par exemple,
00:01:52
si un titre est très long il va être
00:01:53
tronqué parce que les gens comprennent
00:01:55
quand même de quoi l'article parle et
00:01:57
vont cliquer dessus donc ça peut être
00:01:59
intéressant de faire une analyse par
00:02:00
exemple de taux de clic sur l'article
00:02:02
versus la longueur de son de son titre.
00:02:05
Ensuite,
00:02:05
les premiers caractères,
00:02:06
donc là c'est assez simple à comprendre,
00:02:08
ça va retourner un nombre de
00:02:11
caractères spécifiques par
00:02:12
rapport au début de l'expression.
00:02:14
Donc si je dis 2 ils vont m'extraire
00:02:16
par exemple là ici je dis que je
00:02:17
veux les 2 premiers caractères donc
00:02:19
ça va aller m'exporter le premier
00:02:21
et le 2e item et dans quel cas ça
00:02:23
peut être intéressant et bien c'est
00:02:25
exactement le cas qu'on va voir dans
00:02:26
dans un instant sur notre fichier,
00:02:28
c'est d'essayer d'extraire une information
00:02:30
donc par exemple le numéro de moi
00:02:32
dans une colonne contenant du texte.
00:02:33
On voit ici qu'on a.
00:02:35
Le 06 et le juin et bien les 2.
00:02:38
Les 2 informations ensemble,
00:02:39
on pourra pas en faire grand chose.
00:02:40
Par contre si on isolé soit
00:02:42
soit l'une soit l'autre,
00:02:44
Eh bien on pourra les retravailler.
00:02:46
Dernier caractère,
00:02:47
ça va être exactement la même chose.
00:02:50
Retourne un nombre spécifique de
00:02:52
caractères à partir de la fin.
00:02:53
Imaginons qu'on souhaite analyser
00:02:55
l'extension ici d'un d'un site web,
00:02:57
puis on va dire que je vais
00:02:59
récupérer uniquement les 3 ou
00:03:01
les 4 derniers caractères pour
00:03:02
isoler par exemple ici le.com.
00:03:06
Extraire une plage.
00:03:07
Ici, on va lui dire,
00:03:10
je veux extraire les
00:03:11
données de tel caractère,
00:03:12
à tel caractère et donc ici,
00:03:14
on va parler de balise.
00:03:15
Imaginons ici que j'ai un code.
00:03:17
Je ne sais pas,
00:03:18
un code produit ou le code du
00:03:20
Festival et qu'en réalité le chiffre
00:03:21
que qui se situe au milieu donc
00:03:23
ici on par exemple on a 0712 et 10,
00:03:26
nous intéressé de de l'extraire
00:03:28
pour l'utiliser ultérieurement
00:03:29
dans dans un autre calcul.
00:03:31
Et bien ça en fait,
00:03:32
je vais pouvoir lui dire,
00:03:32
et bien tu me prends de la 3e.
00:03:35
Au 4e caractère et tu me les extraits.
00:03:38
Du coup, dans dans la
00:03:39
colonne qui m'intéresse.
00:03:42
Texte avant ou après un délimiteur donc ici,
00:03:46
ça va retourner une valeur se trouvant à
00:03:48
se trouvant avant ou après une expression.
00:03:51
Donc on dit bien expression,
00:03:52
ça n'est pas que un un seul caractère,
00:03:55
on va pouvoir rentrer une
00:03:56
série de caractères ici.
00:03:58
On va se retrouver potentiellement
00:04:00
avec les URL d'un site ou un coup.
00:04:03
Je vais avoir du HTTPS,
00:04:04
un coup je vais avoir uniquement les doubles
00:04:06
slash et un coup je n'ai rien du tout.
00:04:08
Et donc pour unifier ça ce qu'on pourrait
00:04:10
dire c'est que je ne récupère que.
00:04:12
La partie qui se trouve après le slash
00:04:14
ou le double Slash, ce qui fait qu'ici,
00:04:17
ça va faire sauter cette valeur là.
00:04:18
Ici on va enlever les doubles
00:04:20
sèches et ici y a rien,
00:04:21
donc il va tout simplement
00:04:22
garder la valeur telle qu'elle.
00:04:26
Et finalement, le dernier quart,
00:04:27
ça sera entre des limiteurs,
00:04:29
donc ici on pourra non pas spécifier
00:04:31
une position mais un caractère
00:04:33
en particulier, par exemple,
00:04:34
et c'est le cas qu'on va réaliser ici.
00:04:37
Je souhaite extraire joint,
00:04:38
donc je vais lui dire que je,
00:04:40
je je prends comme début de délimiteurs
00:04:42
la parenthèse ouvrante et comme fin
00:04:44
délimiteurs la parenthèse fermante
00:04:45
et du coup il va me récupérer la
00:04:47
valeur entre les 2 qui sera joint ?
00:04:50
Et donc ici,
00:04:52
bah ça va être typiquement de
00:04:54
corriger une nomenclature et
00:04:55
d'isoler encore une fois une partie
00:04:57
d'un d'un bloc qui nous intéresse.
00:04:59
On va pouvoir du coup l'appliquer
00:05:02
sur notre tableau donc avec ici
00:05:05
notamment le mot habituel du début.
00:05:07
Alors on pourrait tout à fait
00:05:09
se dire que il serait plus
00:05:12
intéressant d'extraire le chiffre.
00:05:14
Du du mois mais vu qu'on a déjà les
00:05:16
dates de début et les dates de fin,
00:05:18
je préfère plutôt utiliser le le
00:05:21
fait d'isoler le moins en lui-même,
00:05:24
donc la valeur textuelle pour
00:05:26
pouvoir après potentiellement
00:05:27
l'afficher dans un histogramme de
00:05:28
manière un petit peu plus claire.
00:05:30
Donc ici je vais me mettre tout à la fin
00:05:33
de mon expression toujours attention à ça.
00:05:35
Je vais faire un un clic droit et je vais
00:05:38
aller chercher ma valeur d'extraction.
00:05:43
Alors il ne propose pas là ce que
00:05:44
je pense qu'un petit souci au
00:05:45
niveau du ZOOM, c'est pas grave,
00:05:47
on va passer directement par le menu
00:05:49
en cliquant ici sur extraire et donc
00:05:51
ici on va le faire entre délimiteurs
00:05:53
puisque là on va partir sur les
00:05:55
parenthèses et donc le délimiteur de
00:05:58
début ça sera la parenthèse ouvrante.
00:06:00
Ici, la parenthèse fermante et évidemment,
00:06:03
on a des options supplémentaires,
00:06:06
donc potentiellement le fait
00:06:08
qu'on puisse ignorer des des,
00:06:10
des délimiteurs au bout d'un certain
00:06:13
en tout cas au démarrage par exemple,
00:06:16
de dire, Eh bien,
00:06:17
le premier caractère de délimiter en fait,
00:06:19
tu l'Ignores,
00:06:20
tu commences qu'à partir du 2e pour
00:06:22
commencer à travailler et on peut faire
00:06:23
exactement la même chose à partir de la fin,
00:06:25
donc ça permet,
00:06:26
même si on a déjà des parenthèses de
00:06:27
pouvoir en ignorer certaines et se
00:06:29
concentrer sur celles qui nous intéressent.
00:06:30
Réellement ?
00:06:31
Alors nous, on n'a pas du tout ce problème,
00:06:32
donc on va rester là-dessus.
00:06:34
On va cliquer sur OK.
00:06:36
Et maintenant,
00:06:37
on a bien notre moi habituel de début
00:06:40
qui a été isolé par rapport au reste.

Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
Effectuez une autre recherche ou retournez au contenu !

 

Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

Rappel

Afficher