Cum se calculează coeficientul de corelație a rangului lui Spearman

Autor: Virginia Floyd
Data Creației: 8 August 2021
Data Actualizării: 20 Iunie 2024
Anonim
How To... Calculate Spearman’s Rank Correlation Coefficient (By Hand)
Video: How To... Calculate Spearman’s Rank Correlation Coefficient (By Hand)

Conţinut

Coeficientul de corelație al rangului lui Spearman vă permite să determinați dacă există o dependență între două variabile, exprimată printr-o funcție monotonă (adică cu creșterea unei variabile, a doua crește și invers). Pașii simpli dați în articol vă vor permite să efectuați calcule manual, precum și să calculați coeficientul de corelație folosind Excel și R.

Pași

Metoda 1 din 3: Calculați manual

  1. 1 Creați un tabel de date. Aceasta va organiza informațiile de care aveți nevoie pentru a calcula coeficientul de corelație a rangului Spearman. În acest caz, veți avea nevoie de:
    • 6 coloane, cu capul așa cum se arată mai sus.
    • Numărul de linii corespunzător numărului de perechi variabile.
  2. 2 Completați primele două coloane cu perechi variabile.
  3. 3 În a treia coloană, scrieți numerele (rangurile) perechilor de variabile de la 1 la n (numărul total de perechi). Atribuiți numărul 1 perechii cu cea mai mică valoare din prima coloană, 2 la următoarea valoare după ea și așa mai departe în ordine crescătoare a valorilor variabilei din prima coloană.
  4. 4 În a patra coloană, procedați la fel ca în a treia, dar de această dată numerotați perechile de variabile în conformitate cu a doua coloană a tabelului.
    • Dacă două (sau mai multe) valori ale unei variabile dintr-o coloană sunt aceleași, aranjați-le una după alta și găsiți media numerelor lor, apoi numerotați-le cu această medie.
      În exemplul din dreapta, cele două valori ale variabilei sunt aceleași și egale cu 5; în cazul numerotării normale, aceste date ar primi rangurile 2 și 3. Deoarece valorile sunt aceleași, găsim valoarea medie a rangurilor lor.Media 2 și 3 este 2,5, deci atribuim ambelor un rang de 2,5.
  5. 5 În coloana „d”, calculați diferența dintre cele două rânduri din cele două coloane anterioare. De exemplu, dacă rangul din a treia coloană este 1, iar în a patra este 3, atunci diferența dintre ele va fi 2. Semnul nu contează, deoarece în pasul următor aceste numere vor fi pătrate.
  6. 6 Păstrați fiecare valoare în coloana „d” și scrieți valorile rezultate în coloana „d”.
  7. 7Adăugați toate valorile din coloana „d”. Veți determina suma Σd.
  8. 8 Utilizați una dintre următoarele formule:
    • Dacă în pașii anteriori nu au îndeplinit aceleași valori, pur și simplu înlocuiți suma rezultată în formula simplificată pentru a calcula coeficientul de corelație a rangului Spearman:

      și înlocuiți „n” cu numărul de perechi de date introduse anterior în tabel.
    • Dacă întâlniți aceleași valori în pașii anteriori, utilizați formula standard pentru a calcula coeficientul de corelație a rangului Spearman:
  9. 9 Analizează rezultatul. Valoarea rezultată este între -1 și 1.
    • Dacă este aproape de -1, corelația este negativă.
    • Dacă este aproape de 0, nu există nicio corelație.
    • Dacă este aproape de 1, există o corelație pozitivă.
    • Nu uitați să împărțiți la suma variabilelor și să luați rădăcina. Apoi împărțiți cu Σd.

Metoda 2 din 3: Calculați în Excel

  1. 1 Creați coloane noi cu ranguri corespunzătoare coloanelor de date. De exemplu, dacă datele sunt introduse în coloana A2: A11, utilizați funcția „= RANK (A2, A $ 2: A $ 11)” și introduceți rezultatele pentru toate rândurile dintr-o nouă coloană.
  2. 2Găsiți rangurile pentru aceleași cantități descrise în pașii 3 și 4 din metoda 1.
  3. 3 Într-o nouă celulă, determinați corelația dintre cele două coloane de rang folosind funcția "= CORREL (C2: C11, D2: D11)". În acest caz, C și D sunt coloane care conțin ranguri. Astfel, în această celulă veți obține coeficientul de corelație a rangului lui Spearman.

Metoda 3 din 3: Calcul în R

  1. 1 Dacă nu aveți deja software-ul R pentru procesarea statisticilor, cumpărați unul (a se vedea. http://www.r-project.org).
  2. 2 Salvați datele în format CSV aranjându-le în două coloane, corelația între care urmează să investigați. Este ușor să salvați fișierul în acest format folosind opțiunea „Salvați ca”.
  3. 3 Deschideți editorul R. Dacă nu sunteți deja conectat la programul R, pur și simplu porniți-l. Pentru a face acest lucru, trebuie doar să faceți clic pe pictograma R de pe desktop.
  4. 4 Tastați comenzile:
    • d - read.csv („NAME_OF_YOUR_CSV.csv”) și apăsați Enter
    • cor (rang (d [, 1]), rang (d [, 2]))

sfaturi

  • De regulă, setul de date ar trebui să aibă cel puțin 5 perechi pentru a putea stabili în mod fiabil orice corelație (3 perechi au fost utilizate în exemplul de mai sus pentru simplitate).

Avertizări

  • Coeficientul de corelație a rangului lui Spearman permite să se stabilească numai dacă ambele variabile cresc sau scad simultan. Dacă răspândirea datelor este prea mare, acest coeficient nu va da exact valoarea corelației.
  • Funcția dată va da rezultatul corect dacă nu există valori identice în matricea de date. Dacă există astfel de valori, ca în exemplul nostru, ar trebui utilizată următoarea definiție: coeficient de corelație bazat pe rang.