Definizione di devianza
La devianza (o somma dei quadrati degli scarti della media, o ancora somma dei quadrati) è un indice di dispersione dell’adattamento di un modello ai dati. In pratica, confronta il modello stimato con un modello perfetto (detto modello saturo, che spiega perfettamente i dati). Più è alta la devianza, peggiore è l’adattamento del modello.
È simile al concetto di somma dei quadrati dei residui nella regressione lineare, ma più generale e adatto a modelli come la Regressione logistica.
Formula della devianza
Dove:
è la media dei dati.
Tipi di devianza
-
Null deviance (devianza nulla):
È la devianza di un modello che non ha predittori, cioè un modello che usa solo la media (o proporzione nel caso binario). -
Residual deviance (devianza residua):
È la devianza del modello con i predittori inclusi. Ci dice quanto del comportamento dei dati non è stato spiegato dal modello. -
Explained deviance (devianza spiegata):
È la parte della devianza nulla che il modello riesce a spiegare. Si calcola così: