Gli indici di cograduazione sono strumenti statistici utilizzati per misurare l’associazione tra due variabili che sono state espresse in termini di ranghi. Questi indici sono particolarmente utili quando le variabili sono di natura ordinale o quando, pur essendo quantitative, i loro valori grezzi vengono trasformati in ranghi per analizzare l’associazione basata sull’ordinamento piuttosto che sui valori assoluti. La trasformazione in ranghi può anche rendere le misure di correlazione più stabili rispetto agli outlier.

Ranghi: Posizione di un’unità in una serie ordinata

Un rango (rank) è la posizione che un’unità statistica occupa all’interno di una serie di valori ordinata, in modo crescente o decrescente, rispetto a una determinata caratteristica.

Assegnazione dei ranghi:

  1. Il primo passo per convertire i valori grezzi in ranghi consiste nell’ordinare i valori e assegnare a ciascuno un rango intero, tipicamente da 1 a , dove è il numero di osservazioni.
  2. In caso di valori a pari merito (ties), le fonti suggeriscono diverse pratiche:
    • Le fonti menzionano la possibilità di rompere arbitrariamente i pari merito nell’assegnazione dei ranghi.
    • Successivamente, i ranghi dei valori a pari merito vengono mediati, risultando in ranghi che possono essere frazionari. Ad esempio, se i ranghi 2, 3, 4 e 5 sono a pari merito nel valore grezzo, vengono tutti sostituiti da quattro occorrenze di (2+3+4+5)/4 = 3.5.

Implicazioni per variabili ordinali:

  • Il passaggio ai ranghi per variabili qualitative ordinali implica l’ipotesi di uguale distanza tra le modalità.

di Spearman (Coefficiente di Correlazione per Ranghi di Spearman)

Il coefficiente di correlazione per ranghi di Spearman ( o ) è una misura dell’associazione tra due graduatorie (ranghi).

Calcolo e interpretazione:

  • Il coefficiente di Spearman si ottiene sostituendo i valori numerici grezzi con i loro ranghi e calcolando quindi il coefficiente di correlazione di Pearson tra questi ranghi.
  • La formula per il coefficiente di Spearman è: dove è il rango di e è il rango di .
  • Esiste anche una formula semplificata che si applica quando non ci sono pari merito, utilizzando la differenza tra i ranghi : dove e (le medie dei ranghi) sono ciascuna .
  • Il valore di varia tra -1 e 1.
    • Un valore vicino a +1 indica una forte associazione positiva (le graduatorie tendono a essere simili).
    • Un valore vicino a -1 indica una forte associazione negativa (le graduatorie tendono a essere opposte).
    • Un valore vicino a 0 indica l’assenza di una forte associazione basata sui ranghi.
  • Il coefficiente di Spearman è legato alla distanza di Spearman, una misura della differenza tra due classifiche, definita come .

di Kendall (Coefficiente di Correlazione per Ranghi di Kendall)

Il coefficiente di correlazione per ranghi di Kendall ( o ) è un’altra misura popolare di correlazione per ranghi. Esso indica quante volte le coppie di osservazioni hanno lo stesso ordinamento di rango tra due attributi, misurando la concordanza o discordanza tra le coppie di ranghi.

Concetti chiave per il calcolo:

  • Una coppia di osservazioni è detta concordante se e hanno lo stesso ordinamento di rango di e .
  • Una coppia di osservazioni è detta discordante se e hanno un ordinamento di rango diverso da e .
  • Se o , la coppia non è né concordante né discordante (in caso di pari merito, il termine sarà 0).
  • Per il calcolo di , spesso si ordina la prima variabile in senso crescente. Successivamente, si contano per la seconda variabile:
    • C (numero di coppie concordanti): Il numero di valori maggiori di che seguono l’ordinamento naturale.
    • D (numero di coppie discordanti): Il numero di valori minori di .

Formula e interpretazione:

  • La formula per il coefficiente di Kendall è: o, in termini di C e D:
  • Il coefficiente di Kendall è la differenza normalizzata tra il numero di coppie concordanti e il numero di coppie discordanti, dove il fattore di normalizzazione è il numero totale di coppie.
  • Il valore di varia tra -1 e 1.
    • Un valore vicino a +1 indica una forte concordanza (ordinamento simile tra le variabili).
    • Un valore vicino a -1 indica una forte discordanza (ordinamento opposto tra le variabili).
    • Un valore vicino a 0 indica una debole associazione basata sulla concordanza delle coppie.
  • Il coefficiente di Kendall è legato alla distanza di Kendall, una misura della differenza tra due classifiche, definita come You can't use 'macro parameter character #' in math moded_K(r, s) = #{(i, j), i < j, (r_i - r_j)(s_i - s_j) < 0}.

In sintesi, mentre il di Spearman misura la correlazione lineare tra i ranghi, il di Kendall si concentra sulla proporzione di coppie concordanti e discordanti, offrendo prospettive leggermente diverse sull’associazione basata sull’ordinamento dei dati.