Cosa sono le espressioni regolari?
In informatica teorica, un’espressione regolare (in gergo regex o regexp) è una sequenza di caratteri e operatori speciali che definiscono le regole di corrispondenza per un linguaggio regolare. Le espressioni regolari sono utilizzate per effettuare corrispondenze di stringhe e riconoscere pattern all’interno di testi o dati.
- In un sistema NLP una regex è utile per rendere un testo più “digeribile” per le successive operazioni.
- Due espressioni regolari si dicono equivalenti se definiscono lo stesso linguaggio.
Esempio di espressione regolare
\d{3}-\d{2}-\d{4}Questa espressione regolare corrisponde a un numero di sicurezza sociale nel formato ”###-##-####”, dove \d rappresenta una cifra.