Używanie dopasowania RegEx w segmentacji

read
Last updated at:

Ta funkcja jest obecnie wdrażana i nie jest jeszcze dostępna na wszystkich kontach.

Co to jest Regex Matching?

Dopasowywanie Regex pozwala filtrować profil na podstawie wzorców tekstowych zamiast dokładnych wartości. Jest to przydatne do wyszukiwania profili o określonym formacie, takich jak adresy e-mail z określonych domen lub numery telefonów w określonym formacie.

⚠️ Ważne: Regex zawsze dopasowuje pełną wartość od początku do końca.

 

Jak używać Regex

Podczas tworzenia segmentu możesz użyć dwóch operatorów regex:

  • Pasuje do wyrażenia regularnego - obejmuje profil, którego wartość pasuje do wyrażenia regularnego.
  • Nie pasuje do wyrażenia regularnego - obejmuje profile, których wartość NIE pasuje do Twojego wyrażenia regularnego.

Może być używany w następujących warunkach segmentu:

  1. Właściwości o kimś (w tym obiekty niestandardowe)

 

2. Filtry na "Co ktoś zrobił lub czego nie zrobił" i "Kroki podjęte przez kogoś w określonej kolejności"

 

Podstawy Regex

Dopasowywanie znaków

  • Litery i cyfry - wpisuj normalnie: hello pasuje do "hello"
  • Dowolna cyfra - użyj \d, aby dopasować dowolną cyfrę 0-9
  • Dowolna litera - użyj [a-z] dla małych liter, [A-Z] dla wielkich liter lub [a-zA-Z] dla obu liter.
  • Albo/albo - Użyj |, aby dopasować opcje: gmail|yahoo dopasowuje albo "gmail" lub "yahoo."
  • Anything - Użyj .*, aby dopasować dowolne znaki

Znaki specjalne

Dodaj ukośnik odwrotny \ przed nimi, aby dopasować je dosłownie:

  • Okres: \. pasuje do kropki
  • Znak plus: \+ pasuje do znaku plus
  • Nawiasy: \( i \) pasują do nawiasów

Powtarzające się wzorce

  • {5} - Dokładnie 5 razy (np. \d{5} pasuje do 5 cyfr).
  • {2,4} - Od 2 do 4 razy
  • ? - Opcjonalnie (0 lub 1 raz)

Uwaga: ograniczamy powtarzające się wzory do maksymalnie 1000 powtórzeń.

 

Typowe przykłady

Adresy e-mail

  • Konkretna domena:
    • .*@example\.com
    • Mecze: john@example.com, support@example.com
  • Wiele domen:
    • .*@(gmail|yahoo|hotmail)\.com
    • Mecze: user@gmail.com, user@yahoo.com, user@hotmail.com
  • Dowolna .com e-mail:
    • .*@.*\.com

Numery telefonów

  • 10-cyfrowy numer USA
    • \d{10}
    • Mecze: 5551234567
  • Sformatowane z nawiasami:
    • \(\d{3}\) \d{3}-\d{4}
    • Dopasowania: (555) 123-4567

Kody pocztowe

  • 5-cyfrowy numer ZIP:
    • \d{5}
    • Dopasowania: 12345
  • ZIP+4:
    • \{5}-\d{4}
    • Dopasowania: 12345-6789

Dla zaawansowanych: nasza implementacja wykorzystuje Google RE2 jako nasz standard. Dowiedz się więcej tutaj.

 

Limity RegEx

Limit Wartość Przykład
Długość Regex maksymalnie 1000 znaków -
Linie Regex maksymalnie 100 linii  -
Powtórzenia maks. 1000 powtórzeń \d{1000} dozwolone
\d{1001} niedozwolone
Opcje (|) 5 maks. na poziomie głównym a|b|c|d|e|f przekracza limit (6 opcji)
Głębokość gniazdowania Maksymalnie 5 poziomów ((((a)))) to 4 poziomy, dozwolone

Ponadto następujące funkcje nie są obecnie obsługiwane.

Wyróżnij Przykład
Lookahead/Lookbehind (?=...), (?!...), (?<=...), (?<!...).
Odniesienia \1, \2, (\w+)\s+\1
Ucieczki Unicode \uXXXX, \u00A0
Zagnieżdżone kwantyfikatory (a+)+, (x*)*, (a{2,5})+

 

Wskazówki dotyczące sukcesu

1. Regex dopasowuje pełną wartość

Twój wyrażenie regularne musi opisywać całą wartość, a nie tylko jej część.

Błąd: gmail\.com (pasuje tylko do tekstu "gmail.com")

Prawo: .*@gmail\.com (pasuje do pełnych wiadomości e-mail, takich jak john@gmail.com)

 

2. Zawsze unikaj okresów

Podczas dopasowywania .com, .net, itp., wpisz ją jako \.com z odwrotnym ukośnikiem.

Nieprawidłowo: @gmail.com (kropka pasuje do dowolnego znaku)

Prawo: @gmail\.com (pasuje do dosłownej kropki)

 

3. Użyj .* dla "Cokolwiek"

Dopasuj dowolne znaki z .*

  • .*@company\.com - dowolny adres e-mail w domenie company.com
  • \+.* - Wszystko zaczynające się od +
  • .*urgent.* - Tekst zawierający "pilne"

 

4. Zacznij prosto, a następnie udoskonalaj

Zacznij od podstawowego wyrażenia regularnego i stopniowo dodawaj szczegóły.

  • Przykład: .*@gmail\.com → [a-z]+\.[a-z]+@gmail\.com

Jeśli to możliwe, podziel złożoną logikę na wiele prostych filtrów.

  • Przykład dla "Gmail lub Yahoo e-maile z Kalifornii":
    • Filtr 1: Email pasuje do wyrażenia regularnego .*@(gmail|yahoo)\.com
    • Filtr 2: Stan równy Kalifornia

5. RegEx domyślnie rozróżnia wielkość liter

Jeśli chcesz, aby wielkość liter nie miała znaczenia, możesz dodać (?i) jako przedrostek.

  • Produkt pasuje do (?i)^iphone$

 

Kiedy używać operatorów RegEx vs Standard

Użyj wyrażenia regularnego, aby dopasować określone formaty lub wzorce. W przypadku prostszych potrzeb zdecydowanie zalecamy użycie standardowych operatorów:

  • Zawiera - tekst pojawia się w dowolnym miejscu
  • Zaczyna się od - pasuje do początku
  • Kończy się na - Dopasowuje zakończenie
  • Równa się - Dokładne dopasowanie
x
Czy ten artykuł był pomocny?
Liczba użytkowników, którzy uważają ten artykuł za przydatny: 0 z 0