Cosa sono le espressioni regolari?

In informatica teorica, un’espressione regolare (in gergo regex o regexp) è una sequenza di caratteri e operatori speciali che definiscono le regole di corrispondenza per un linguaggio regolare. Le espressioni regolari sono utilizzate per effettuare corrispondenze di stringhe e riconoscere pattern all’interno di testi o dati.

  • In un sistema NLP una regex è utile per rendere un testo più “digeribile” per le successive operazioni.
  • Due espressioni regolari si dicono equivalenti se definiscono lo stesso linguaggio.

Esempio di espressione regolare

\d{3}-\d{2}-\d{4} Questa espressione regolare corrisponde a un numero di sicurezza sociale nel formato ”###-##-####”, dove \d rappresenta una cifra.