Definizione di Large Language Model

Un Large Language Model (abbreviato LLM, in italiano Modello Linguistico di Grandi Dimensioni) è un tipo di modello di Intelligenza artificiale basato su reti neurali (solitamente con architettura Transformer) addestrato su enorme quantità di dati testuali.

ChatBot vs LLM

A differenza di un chatbot, un LLM è un modello linguistico nettamente più potente e versatile:ù

| Caratteristica | Chatbot (Tradizionale) | Large Language Model (LLM) | | :--- | :--- | :--- | | Scopo Principale | Applicazione per un compito specifico (es. prenotare un volo, rispondere a FAQ). | Motore di linguaggio per scopi generali. | | Architettura | Spesso basato su regole, script o modelli di recupero. | Rete neurale di grandi dimensioni (es. Transformer). | | Flessibilità | Limitata al suo dominio e agli script predefiniti. | Estremamente flessibile; può affrontare compiti nuovi tramite il prompting. | | Generazione Testo| Solitamente recupera risposte da un database o segue uno script. | Genera testo nuovo e originale in modo dinamico. | | Dati di Addestramento| Addestrato (se basato su ML) su un dataset specifico per il suo compito. | Addestrato su un corpus massivo e diversificato di testo e codice. | | Esempio | Un assistente bancario automatico che risponde a domande sul saldo del conto. | Il modello GPT-3, LaMDA, o Gemini. |

Caratteristiche di un LLM

  • Generalità: è addestrato su un corpus vasto e generico (come gran parte di Internet), il che gli consente di comprendere e generare testo su una gamma quasi illimitata di argomenti.
  • Capacità Generative: può generare testo nuovo e coerente, non solo recuperare risposte predefinite. Questo gli permette di riassumere, tradurre, scrivere codice, rispondere a domande complesse e persino scrivere poesie.
  • Apprendimento Contestuale (In-context Learning): può adattare il suo comportamento in base agli esempi e alle istruzioni fornite nel prompt, senza necessità di ri-addestramento.