Cos’è una stop-word
In Natural Language Processing (NLP), le stop-words sono parole che vengono escluse dall’attività di elaborazione del testo perché contengono un basso valore informativo (ad esempio “il”, “la”, “di”, “e”, “con”, “che”).
Esempi di stop-words
Ecco alcune stop-words: “a”, “adesso”, “ai”, “al”, “alla”, “anche”, “con”, “da”, “del”, “di”, “e”, “il”, “la”, “le”, “lo”, “ma”, “me”, “molto”, “nei”, “no”, “per”, “più”, “se”, “tra”, “un”, “una”.
Funzione di una stop-word
- Le stop-word collegano le preposizioni di una frase ma non trasportano alcuna informazione.
- Vengono rimosse per migliorare l’efficienza e l’accuratezza dell’algoritmo di analisi testuale poiché si concentra lo sforzo computazionale solo sui termini significativi.
- L’elenco delle stop-words può variare a seconda della lingua e del contesto applicativo: non esiste una lista valida universale