Utiliser la correspondance RegEx dans la segmentation

read
Last updated at:

Cette fonctionnalité est en cours de déploiement et n’est pas encore disponible pour tous les comptes.

Définition Regex Matching

La correspondance Regex vous permet de filtrer les profils en fonction de modèles de texte plutôt que de valeurs exactes. Cela permet de trouver des profils qui suivent un format spécifique, comme des adresses e-mail provenant de certains domaines ou des numéros de téléphone dans un format particulier.

⚠️ Important : Regex correspond toujours à la valeur complète du début à la fin.

 

Comment utiliser Regex

Lorsque vous créez un segment, vous pouvez utiliser deux opérateurs regex :

  • Correspond à l’expression rationnelle : inclut les profils dont la valeur correspond à votre expression rationnelle.
  • Ne correspond pas à l’expression régulière - Inclut les profils dont la valeur ne correspond PAS à votre expression régulière

Il peut être utilisé dans les conditions de segment suivantes :

  1. Propriétés concernant une personne (y compris les objets personnalisés)

 

2. Filtres sur « Ce que quelqu’un a fait ou n’a pas fait » et « Mesures prises par une personne dans un ordre spécifique »

 

Bases de Regex

Caractères correspondants

  • Lettres et chiffres - Saisissez normalement : bonjour correspond à « bonjour »
  • N’importe quel chiffre - Utilisez \d pour faire correspondre n’importe quel nombre 0-9
  • Toute lettre : utilisez [a-z] pour les minuscules, [A-Z] pour les majuscules ou [a-zA-Z] pour les deux
  • Soit/ou - Utiliser | pour faire correspondre les options : gmail|yahoo fait correspondre « gmail » ou « yahoo »
  • Tout - Utilisez .* pour faire correspondre vos caractères

Caractères spéciaux

Ajoutez une barre oblique inverse \ avant ces éléments pour les faire correspondre littéralement :

  • Période : \. correspond à une période
  • Signe plus : \+ correspond à un signe plus
  • Les parenthèses : \( et \) correspondent aux parenthèses

Tendances Répétitives

  • {5} - Exactement 5 fois (par exemple, \d{5} correspond à 5 chiffres)
  • {2,4} - Entre 2 et 4 fois
  • ? - Facultatif (0 ou 1 fois)

Remarque : nous limitons les répétitions à 1 000 répétitions maximum.

 

Exemples courants

Adresses e-mail

  • Domaine spécifique :
    • .*@exemple\.com
    • Matchs : john@example.com, support@example.com
  • Plusieurs domaines :
    • .*@(gmail|yahoo|hotmail).com
    • Matchs : user@gmail.com, user@yahoo.com, user@hotmail.com
  • Tout .com e-mail :
    • .*@.*\.com

Numéros de téléphone

  • Numéro américain à 10 chiffres
    • \d{10}
    • Correspondances : 5551234567
  • Formaté avec des parenthèses :
    • \(\d{3}\) \d{3}-\d{4}
    • Matchs : (555) 123-4567

Codes postaux

  • ZIP à 5 chiffres :
    • \d{5}
    • Correspondances : 12 345
  • ZIP+4 :
    • \d{5}-\d{4}
    • Matchs : 12345-6789

Pour les références avancées : notre implémentation utilise Google RE2 comme norme. En savoir plus ici.

 

Limites d’enregistrement

Limite Valeur Exemple
Longueur Regex 1 000 caractères maximum -
Lignes Regex 100 lignes maximum  -
Répétitions 1 000 répétitions maximum \d{1000} autorisé
\d{1001} non autorisé
Options (|) 5 max au niveau principal a|b|c|d|e|f dépasse la limite (6 options)
Profondeur d’imbrication 5 niveaux maximum ((((a)))) est de 4 niveaux, autorisé

En outre, les fonctionnalités suivantes ne sont pas prises en charge pour le moment.

Fonctionnalité Exemple
Lookahead/Lookbehind (?=...), (?!...), (?<=...), (?<!...)
Backreferences \1, \2, (\w+)\s+\1
Échappements Unicode \uXXXX, \u00A0
Quantificateurs imbriqués (a+)+, (x*)*, (a{2,5})+

 

Conseils

1. Regex correspond à la valeur complète

Votre regex doit décrire l’ensemble de la valeur, et pas seulement une partie.

Erreur : gmail\.com (ne correspond qu’au texte « gmail.com »)

À droite : .*@gmail\.com (correspond à des e-mails complets tels que john@gmail.com)

 

2. Toujours éviter les périodes

Lorsque .com correspond, .net, etc., écrivez-le comme \.com avec une barre oblique inverse.

Faux : @gmail.com (le point correspond à n'importe quel caractère)

Droite : @gmail\.com (correspond à la période littérale)

 

3. Utiliser .* pour « N’importe quoi »

Associez tous les caractères avec .*

  • .*@company\.com - Tout e-mail à l’adresse company.com
  • \+.* - Tout ce qui commence par +
  • .*urgent.* - Texte contenant « urgent »

 

4. Commencez simplement, puis affinez

Commencez par un regex de base et ajoutez des détails progressivement.

  • Exemple : .*@gmail\.com → [a-z]+\.[a-z]+@gmail\.com

Fractionner la logique complexe en plusieurs filtres simples lorsque cela est possible.

  • Exemple pour « Gmail ou Yahoo emails from California » :
    • Filtre 1 : Email correspond à regex .*@(gmail|yahoo)\.com
    • Filtre 2 : État équivaut à Californie

5. RegEx est sensible à la casse par défaut

Si vous souhaitez rendre une instruction insensible à la casse, vous pouvez ajouter (?i) comme préfixe.

  • Correspondance des produits (?i)^iphone$

 

Quand utiliser RegEx vs Opérateurs de Standard

Utilisez l’expression rationnelle lorsque vous avez besoin de correspondre à des formats ou des modèles spécifiques. Pour des besoins plus simples, nous vous recommandons vivement d’utiliser des opérateurs standard :

  • Contient - Le texte apparaît n’importe où
  • Commence par - Correspond au début
  • Se termine par - Correspond à la fin
  • Équivaut à - Correspondance exacte
x
Cet article vous a-t-il été utile ?
Utilisateurs qui ont trouvé cela utile : 0 sur 0