NLP pre-processing Tokenization (NLP): pre-proccessamento che trasforma il testo in una sequenza di segmenti, detti tokens. Word normalization (NLP): Sentence segmentation (NLP):