Cos’è una stop-word

In Natural Language Processing (NLP), le stop-words sono parole che vengono escluse dall’attività di elaborazione del testo perché contengono un basso valore informativo (ad esempio “il”, “la”, “di”, “e”, “con”, “che”).

Esempi di stop-words

Ecco alcune stop-words: “a”, “adesso”, “ai”, “al”, “alla”, “anche”, “con”, “da”, “del”, “di”, “e”, “il”, “la”, “le”, “lo”, “ma”, “me”, “molto”, “nei”, “no”, “per”, “più”, “se”, “tra”, “un”, “una”.

Funzione di una stop-word

  • Le stop-word collegano le preposizioni di una frase ma non trasportano alcuna informazione.
  • Vengono rimosse per migliorare l’efficienza e l’accuratezza dell’algoritmo di analisi testuale poiché si concentra lo sforzo computazionale solo sui termini significativi.
  • L’elenco delle stop-words può variare a seconda della lingua e del contesto applicativo: non esiste una lista valida universale