Cum se calculează coeficientul de corelație liniară

Autor: Eric Farmer
Data Creației: 7 Martie 2021
Data Actualizării: 1 Iulie 2024
Anonim
Correlation Coefficient
Video: Correlation Coefficient

Conţinut

Coeficientul de corelație (sau coeficientul de corelație liniar) este notat ca „r” (în cazuri rare ca „ρ”) și caracterizează corelația liniară (adică relația dată de o anumită valoare și direcție) a două sau mai multe variabile. Valoarea coeficientului se situează între -1 și +1, adică corelația poate fi atât pozitivă, cât și negativă. Dacă coeficientul de corelație este -1, există o corelație negativă perfectă; dacă coeficientul de corelație este +1, există o corelație pozitivă perfectă. În caz contrar, există o corelație pozitivă între cele două variabile, o corelație negativă sau nicio corelație. Coeficientul de corelație poate fi calculat manual, cu calculatoare online gratuite sau cu un calculator grafic bun.

Pași

Metoda 1 din 4: Calcularea manuală a coeficientului de corelație

  1. 1 Colectați date. Înainte de a începe calcularea coeficientului de corelație, studiați aceste perechi de numere. Mai bine să le scrieți într-un tabel care poate fi aranjat vertical sau orizontal. Etichetați fiecare rând sau coloană cu „x” și „y”.
    • De exemplu, date patru perechi de valori (numere) ale variabilelor „x” și „y”. Puteți crea următorul tabel:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Calculați media aritmetică „x”. Pentru a face acest lucru, adăugați toate valorile x, apoi împărțiți rezultatul la numărul de valori.
    • În exemplul nostru, există patru valori pentru variabila „x”. Pentru a calcula media aritmetică „x”, adăugați aceste valori, apoi împărțiți suma la 4. Calculele sunt scrise după cum urmează:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μX=12/4{ displaystyle mu _ {x} = 12/4}
    • μX=3{ displaystyle mu _ {x} = 3}
  3. 3 Găsiți media aritmetică „y”. Pentru a face acest lucru, urmați aceiași pași, adică adăugați toate valorile y, apoi împărțiți suma la numărul de valori.
    • În exemplul nostru, sunt date patru valori ale variabilei „y”. Adăugați aceste valori, apoi împărțiți suma la 4. Calculele vor fi scrise după cum urmează:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Calculați abaterea standard „x”. După calcularea mijloacelor „x” și „y”, găsiți abaterile standard ale acestor variabile. Abaterea standard este calculată folosind următoarea formulă:
    • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • În exemplul nostru, calculele vor fi scrise astfel:
    • σX=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σX=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σX=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σX=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σX=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Calculați abaterea standard „y”. Urmați pașii descriși în pasul anterior. Utilizați aceeași formulă, dar introduceți valorile y.
    • În exemplul nostru, calculele vor fi scrise astfel:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Notați formula de bază pentru calcularea coeficientului de corelație. Această formulă include mijloacele, abaterile standard și numărul (n) de perechi de numere ale ambelor variabile. Coeficientul de corelație este notat ca "r" (în cazuri rare ca "ρ"). Acest articol folosește o formulă pentru a calcula coeficientul de corelație Pearson.
    • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • Aici și în alte surse, cantitățile pot fi indicate în moduri diferite. De exemplu, unele formule conțin „ρ” și „σ”, în timp ce altele conțin „r” și „s”. Unele manuale oferă formule diferite, dar sunt contrapartide matematice cu formula de mai sus.
  7. 7 Calculați coeficientul de corelație. Ați calculat media și abaterile standard ale ambelor variabile, astfel încât să puteți utiliza formula pentru a calcula coeficientul de corelație. Reamintim că „n” este numărul de perechi de valori pentru ambele variabile. Alte valori au fost calculate mai devreme.
    • În exemplul nostru, calculele vor fi scrise astfel:
    • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} right) * left ({ frac {3-4} {2.58}} right)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1.83}} right) * left ({ frac {7-4} {2.58}} right)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0.988}
  8. 8 Analizează rezultatul. În exemplul nostru, coeficientul de corelație este 0,988. Această valoare caracterizează într-un fel un anumit set de perechi de numere. Acordați atenție semnului și mărimii valorii.
    • Deoarece valoarea coeficientului de corelație este pozitivă, există o corelație pozitivă între variabilele „x” și „y”. Adică, pe măsură ce crește valoarea „x”, crește și valoarea „y”.
    • Deoarece valoarea coeficientului de corelație este foarte apropiată de +1, valorile variabilelor „x” și „y” sunt foarte corelate. Dacă puneți puncte pe planul de coordonate, acestea vor fi situate aproape de o linie dreaptă.

Metoda 2 din 4: Utilizarea calculatoarelor online pentru a calcula coeficientul de corelație

  1. 1 Găsiți un calculator pe Internet pentru a calcula coeficientul de corelație. Acest coeficient este adesea calculat în statistici. Dacă există multe perechi de numere, este aproape imposibil să calculați manual coeficientul de corelație. Prin urmare, există calculatoare online pentru a calcula coeficientul de corelație. Într-un motor de căutare, introduceți „calculatorul coeficientului de corelație” (fără ghilimele).
  2. 2 Introduceți date. Verificați instrucțiunile de pe site pentru a introduce datele corecte (perechi de numere). Este imperativ să introduceți perechile corespunzătoare de numere; în caz contrar, veți obține un rezultat greșit. Amintiți-vă că diferite site-uri web au diferite formate de intrare.
    • De exemplu, la http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, valorile variabilelor x și y sunt introduse în două linii orizontale. Valorile sunt separate prin virgule. Adică, în exemplul nostru, valorile „x” sunt introduse astfel: 1,2,4,5, iar valorile „y” astfel: 1,3,5,7.
    • Pe un alt site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, datele sunt introduse pe verticală; în acest caz, nu confundați perechile de numere corespunzătoare.
  3. 3 Calculați coeficientul de corelație. După introducerea datelor, faceți clic pe butonul „Calculare”, „Calculare” sau buton similar pentru a obține rezultatul.

Metoda 3 din 4: Utilizarea unui calculator grafic

  1. 1 Introduceți date. Luați un calculator grafic, intrați în modul de calcul statistic și selectați comanda „Editați”.
    • Calculatoare diferite necesită apăsarea unor taste diferite. Acest articol discută despre calculatorul Texas Instruments TI-86.
    • Apăsați [2nd] - Stat (deasupra tastei +) pentru a intra în modul de calcul statistic. Apoi apăsați F2 - Editare.
  2. 2 Ștergeți datele salvate anterior. Majoritatea calculatoarelor păstrează statisticile pe care le introduceți până când le ștergeți. Pentru a evita confundarea datelor vechi cu cele noi, ștergeți mai întâi orice informație stocată.
    • Utilizați tastele săgeată pentru a muta cursorul și a evidenția titlul „xStat”. Apoi apăsați Ștergeți și Enter pentru a șterge toate valorile introduse în coloana xStat.
    • Folosiți tastele săgeată pentru a evidenția titlul „yStat”. Apoi apăsați Ștergeți și Enter pentru a șterge toate valorile introduse în coloana yStat.
  3. 3 Introduceți datele inițiale. Utilizați tastele săgeată pentru a muta cursorul în prima celulă sub titlul „xStat”. Introduceți prima valoare și apăsați Enter. În partea de jos a ecranului, se afișează „xStat (1) = __”, valoarea introdusă înlocuind un spațiu. După ce apăsați Enter, valoarea introdusă va apărea în tabel, iar cursorul se va deplasa la următoarea linie; aceasta va afișa „xStat (2) = __” în partea de jos a ecranului.
    • Introduceți toate valorile pentru variabila „x”.
    • După introducerea tuturor valorilor pentru x, utilizați tastele săgeată pentru a naviga la coloana yStat și introduceți valorile pentru y.
    • După introducerea tuturor perechilor de numere, apăsați Ieșire pentru a șterge ecranul și a ieși din modul de agregare.
  4. 4 Calculați coeficientul de corelație. Caracterizează cât de aproape sunt datele de o anumită linie dreaptă. Calculatorul grafic poate determina rapid linia dreaptă adecvată și poate calcula coeficientul de corelație.
    • Faceți clic pe Stat - Calc. Pe TI-86, apăsați [2nd] - [Stat] - [F1].
    • Selectați funcția de regresie liniară. Pe TI-86, apăsați [F3] care este etichetat „LinR”. Ecranul va afișa linia „LinR _” cu un cursor intermitent.
    • Acum introduceți numele a două variabile: xStat și yStat.
      • Pe TI-86, deschideți lista de nume; pentru a face acest lucru, apăsați [2nd] - [List] - [F3].
      • Variabilele disponibile sunt afișate pe linia de jos a ecranului. Selectați [xStat] (probabil că trebuie să apăsați F1 sau F2 pentru a face acest lucru), introduceți o virgulă, apoi selectați [yStat].
      • Apăsați Enter pentru a procesa datele introduse.
  5. 5 Analizează-ți rezultatele. Apăsând Enter, ecranul va afișa următoarele informații:
    • y=A+bX{ displaystyle y = a + bx}: aceasta este funcția care descrie linia. Vă rugăm să rețineți că funcția nu este scrisă în formă standard (y = kx + b).
    • A={ displaystyle a =}... Aceasta este coordonata y a intersecției liniei drepte cu axa y.
    • b={ displaystyle b =}... Aceasta este panta liniei.
    • cor={ displaystyle { text {corr}} =}... Acesta este coeficientul de corelație.
    • n={ displaystyle n =}... Acesta este numărul de perechi de numere care au fost utilizate în calcule.

Metoda 4 din 4: Explicarea conceptelor de bază

  1. 1 Înțelegeți conceptul de corelație. Corelația este relația statistică dintre două mărimi. Coeficientul de corelație este o valoare numerică care poate fi calculată pentru oricare două seturi de date. Valoarea coeficientului de corelație se află întotdeauna în intervalul de la -1 la +1 și caracterizează gradul de relație dintre două variabile.
    • De exemplu, având în vedere înălțimea și vârsta copiilor (aproximativ 12 ani). Cel mai probabil, va exista o puternică corelație pozitivă, deoarece copiii cresc cu vârsta.
    • Un exemplu de corelație negativă: secunde de penalizare și timpul petrecut în antrenamentele de biatlon, adică, cu cât un atlet se antrenează mai mult, cu atât mai puține secunde de penalizare vor fi acordate.
    • În cele din urmă, există uneori foarte puține corelații (pozitive sau negative), cum ar fi între mărimea pantofilor și scorurile matematice.
  2. 2 Amintiți-vă cum să calculați media aritmetică. Pentru a calcula media (sau media) aritmetică, trebuie să găsiți suma tuturor acestor valori și apoi să o împărțiți la numărul de valori. Amintiți-vă că media aritmetică este necesară pentru a calcula coeficientul de corelație.
    • Valoarea medie a unei variabile este indicată de o literă cu o bară orizontală deasupra ei. De exemplu, în cazul variabilelor „x” și „y”, valorile medii ale acestora sunt notate după cum urmează: x̅ și y̅. Media este uneori notată cu litera greacă „μ” (mu). Pentru a scrie media aritmetică a valorilor variabilei „x”, utilizați notația μX sau μ (x).
    • De exemplu, având în vedere următoarele valori pentru variabila "x": 1,2,5,6,9,10. Media aritmetică a acestor valori este calculată după cum urmează:
      • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μX=33/6{ displaystyle mu _ {x} = 33/6}
      • μX=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 Rețineți importanța abaterii standard. În statistici, abaterea standard caracterizează gradul în care numerele sunt împrăștiate în raport cu media lor. Dacă abaterea standard este mică, numerele sunt apropiate de medie; dacă abaterea standard este mare, numerele sunt departe de medie.
    • Abaterea standard este indicată de litera „s” sau de litera greacă „σ” (sigma). Astfel, abaterea standard a valorilor variabilei „x” este notată după cum urmează: sX sau σX.
  4. 4 Amintiți-vă simbolul pentru operația de însumare. Simbolul însumării este unul dintre cele mai comune simboluri în matematică și indică suma valorilor. Acest simbol este litera greacă „Σ” (majusculă sigma).
    • De exemplu, dacă sunt date următoarele valori ale variabilei "x": 1,2,5,6,9,10, atunci Σx înseamnă:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

sfaturi

  • Coeficientul de corelație este uneori numit „coeficientul de corelație Pearson” după dezvoltatorul său Carl Pearson.
  • În majoritatea cazurilor, când coeficientul de corelație este mai mare de 0,8 (pozitiv sau negativ), există o corelație puternică; dacă coeficientul de corelație este mai mic de 0,5 (pozitiv sau negativ), se observă o corelație slabă.

Avertizări

  • Corelația caracterizează relația dintre valorile a două variabile. Amintiți-vă însă că corelația nu are nimic de-a face cu cauzalitatea. De exemplu, dacă comparați înălțimea și dimensiunea pantofilor oamenilor, este probabil să găsiți o corelație pozitivă puternică. În general, cu cât persoana este mai înaltă, cu atât este mai mare dimensiunea pantofului. Dar asta nu înseamnă că o creștere a înălțimii duce la o creștere automată a dimensiunii pantofilor sau că picioarele mai mari vor duce la o creștere mai rapidă. Aceste cantități sunt pur și simplu corelate.