Regulární výrazy (Regex)
Regex, celým názvem Regular Expressions (regulární výrazy), je speciální sekvence znaků, která definuje vyhledávací vzor. Jde o mocný nástroj pro práci s textem, který umožňuje vyhledávat, filtrovat a manipulovat s textem podle komplexních pravidel.
K čemu se Regex používá?
- Vyhledávání: Regex umožňuje najít specifické vzory v textu, například e-mailové adresy, telefonní čísla nebo URL adresy.
- Validace: Pomocí regexu lze ověřit, zda vstupní data odpovídají určitému formátu (např. správný formát data, např. e-mail, IČO nebo telefonní číslo).
- Extrakce dat: Regex dokáže vytáhnout konkrétní části textu podle definovaného vzoru.
- Nahrazování: Umožňuje nahradit části textu podle specifických pravidel.
Příklady použití Regexu
- Vyhledání všech e-mailových adres v dokumentu
- Ověření správnosti formátu telefonního čísla
- Extrakce všech hashtagu z textu na sociálních sítích
- Nahrazení všech výskytů určitého slova v textu
Kde se s Regexem setkáte?
Regex najdete v mnoha programovacích jazycích, textových editorech, databázových systémech a nástrojích pro práci s daty. V kontextu našich témat se s regexem často setkáte v:
- Automatizačních nástrojích jako Make nebo n8n.
- Pokročilých vyhledávacích funkcích v nástrojích jako Notion nebo Airtable.
Je regex složitý?
Běžně se říká, že pokud máte problém, k jehož vyřešení nejlépe poslouží regex, máte problémy dva 🙂. Nicméně, i když regex působí složitě, jeho základy se dají pochopit poměrně rychle. Pro vytváření samotných výrazů pak můžete využít generativní umělou inteligenci, která takový výraz snadno vytvoří dle zadání.
A pro testování regulárních výrazů můžete použít nástroje jako Regex101.