Definizione di V di Cramer

Il V di Cramer è un indice di associazione utilizzato per misurare la forza della dipendenza tra due variabili qualitative nominali (o categoriche) in una tabella a doppia entrata. È una versione normalizzata dell’indice Phi-quadro (Φ²) e varia tra 0 e 1.

Relazione con altri indici:

  1. Chi-quadro di Pearson (X²): Questo indice misura il grado di dipendenza tra due variabili confrontando le frequenze osservate (nij) con le frequenze teoriche (n̂ij) che si avrebbero in caso di indipendenza. La formula è: dove R è il numero di righe e C è il numero di colonne della tabella. Un indica indipendenza, mentre indica dipendenza, ma non ne quantifica l’intensità in modo confrontabile tra tabelle diverse a causa della sua dipendenza dalla dimensione del collettivo e dal numero di categorie.

  2. Phi-quadro (Φ²): Pearson ha proposto l’indice di contingenza quadratica media Φ² come normalizzazione del Chi-quadro per la dimensione del campione : Questo indice varia tra 0 e .

  3. V di Cramer: Per ottenere un indice che vari tra 0 e 1, Cramer ha ulteriormente normalizzato il Φ²:

Proprietà e Interpretazione:

  • Il V di Cramer assume valori nell’intervallo.
  • : Indica che i due caratteri sono statisticamente indipendenti. Le frequenze osservate sono uguali a quelle teoriche di indipendenza.
  • : Indica una perfetta associazione tra i due caratteri. Ciò si verifica in situazioni specifiche:
    • Se (la tabella è quadrata) e i caratteri sono perfettamente associati.
    • Se e la variabile X dipende perfettamente dalla variabile Y.
    • Se e la variabile Y dipende perfettamente dalla variabile X.

Esempio Pratico: Relazione tra Residenza e Tempo per Trovare Lavoro Immagina un gruppo di laureati della facoltà di Economia, intervistati per analizzare la relazione tra la loro zona di residenza (variabile X, qualitativa nominale) e il tempo impiegato per trovare lavoro dopo la laurea (variabile Y, qualitativa ordinale categorizzata in mesi: 6, 12, 18, 24). I risultati sono riportati nella seguente tabella di contingenza:

ResidenzaTempo (mesi)Totale
612
N-OVEST32
N-EST12
Centro4526
Sud95
Totale5835

Per valutare l’associazione tra residenza e tempo di impiego, si calcolano prima le frequenze teoriche di indipendenza e poi il Chi-quadro:

  • Frequenze Teoriche (Esempio per N-OVEST, 6 mesi):
  • Calcolo del Chi-quadro di Pearson (X²): .

Successivamente, si calcola il Phi-quadro: .

Infine, si calcola il V di Cramer. Il valore di è . .

Commento sull’esempio: Un valore di indica una debole associazione tra la zona di residenza e il tempo impiegato per trovare lavoro. Se il valore fosse stato più vicino a 1, avremmo dedotto un’associazione più forte. Questo indice è particolarmente utile per confrontare la forza di associazione tra coppie di variabili in diverse tabelle di contingenza, poiché è stato normalizzato e non dipende dalla dimensione del campione o dal numero di categorie, rendendolo un indicatore robusto.