Definizione di V di Cramer
Il V di Cramer è un indice di associazione utilizzato per misurare la forza della dipendenza tra due variabili qualitative nominali (o categoriche) in una tabella a doppia entrata. È una versione normalizzata dell’indice Phi-quadro (Φ²) e varia tra 0 e 1.
Relazione con altri indici:
-
Chi-quadro di Pearson (X²): Questo indice misura il grado di dipendenza tra due variabili confrontando le frequenze osservate (nij) con le frequenze teoriche (n̂ij) che si avrebbero in caso di indipendenza. La formula è:
dove R è il numero di righe e C è il numero di colonne della tabella. Un indica indipendenza, mentre indica dipendenza, ma non ne quantifica l’intensità in modo confrontabile tra tabelle diverse a causa della sua dipendenza dalla dimensione del collettivo e dal numero di categorie. -
Phi-quadro (Φ²): Pearson ha proposto l’indice di contingenza quadratica media Φ² come normalizzazione del Chi-quadro per la dimensione del campione
: Questo indice varia tra 0 e . -
V di Cramer: Per ottenere un indice che vari tra 0 e 1, Cramer ha ulteriormente normalizzato il Φ²:
Proprietà e Interpretazione:
- Il V di Cramer assume valori nell’intervallo.
: Indica che i due caratteri sono statisticamente indipendenti. Le frequenze osservate sono uguali a quelle teoriche di indipendenza. : Indica una perfetta associazione tra i due caratteri. Ciò si verifica in situazioni specifiche: - Se
(la tabella è quadrata) e i caratteri sono perfettamente associati. - Se
e la variabile X dipende perfettamente dalla variabile Y. - Se
e la variabile Y dipende perfettamente dalla variabile X.
- Se
Esempio Pratico: Relazione tra Residenza e Tempo per Trovare Lavoro Immagina un gruppo di laureati della facoltà di Economia, intervistati per analizzare la relazione tra la loro zona di residenza (variabile X, qualitativa nominale) e il tempo impiegato per trovare lavoro dopo la laurea (variabile Y, qualitativa ordinale categorizzata in mesi: 6, 12, 18, 24). I risultati sono riportati nella seguente tabella di contingenza:
| Residenza | Tempo (mesi) | Totale |
|---|---|---|
| 6 | 12 | |
| N-OVEST | 3 | 2 |
| N-EST | 1 | 2 |
| Centro | 45 | 26 |
| Sud | 9 | 5 |
| Totale | 58 | 35 |
Per valutare l’associazione tra residenza e tempo di impiego, si calcolano prima le frequenze teoriche di indipendenza e poi il Chi-quadro:
- Frequenze Teoriche (Esempio per N-OVEST, 6 mesi):
- Calcolo del Chi-quadro di Pearson (X²):
.
Successivamente, si calcola il Phi-quadro:
Infine, si calcola il V di Cramer. Il valore di
Commento sull’esempio: Un valore di