Determinați coeficientul de corelație

Autor: Morris Wright
Data Creației: 28 Aprilie 2021
Data Actualizării: 19 Iunie 2024
Anonim
Coeficientul de Corelatie Pearson - Cum il identificam in #Tableau Software (RO)
Video: Coeficientul de Corelatie Pearson - Cum il identificam in #Tableau Software (RO)

Conţinut

Coeficientul de corelație, notat r sau ρ, este măsura corelației liniare (relația, atât în ​​rezistență, cât și în direcție) între două variabile. Acesta variază de la -1 la +1, folosind semnele plus și minus pentru a reprezenta corelația pozitivă și negativă. Dacă coeficientul de corelație este exact -1, atunci relația dintre cele două variabile este complet negativă; dacă coeficientul de corelație este exact +1, atunci relația este complet pozitivă. Două variabile pot avea o corelație pozitivă, o corelație negativă sau deloc corelație. Puteți calcula corelația manual, utilizând unele dintre calculele de corelație gratuite disponibile online sau utilizând funcțiile statistice ale unui calculator grafic bun.

A calca

Metoda 1 din 4: Calculați manual coeficientul de corelație

  1. Mai întâi colectați-vă datele. Pentru a începe calcularea unei corelații eficiente, examinați mai întâi perechile de date. Este util să le puneți într-un tabel, atât pe verticală, cât și pe orizontală. Etichetați fiecare rând sau coloană x și y.
    • De exemplu, să presupunem că aveți patru perechi de date pentru X și y. Tabelul poate arăta astfel:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Calculați media lui X. Pentru a calcula media, aveți nevoie de toate valorile X adăugați și apoi împărțiți la numărul de valori.
    • Folosind exemplul de mai sus, observați că aveți patru valori pentru X. Pentru a calcula media, adăugați toate valorile X și împărțiți-l la 4. Calculul arată astfel:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Găsiți media y. La media de y Pentru a-l găsi, urmați aceiași pași, adăugând toate valorile lui y împreună și apoi împărțind la numărul de valori.
      • În exemplul de mai sus, aveți și patru valori pentru y. Adăugați toate aceste valori împreună și apoi împărțiți-le la 4. Calculele vor arăta astfel:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Determinați abaterea standard a X. Odată ce ai mijloacele tale, poți calcula abaterea standard. Pentru a face acest lucru, utilizați formula:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Calculați abaterea standard a y. Folosind aceiași pași de bază, găsiți abaterea standard a y. Veți folosi aceeași formulă, folosind punctele de date pentru y.
          • Cu datele eșantion, calculele dvs. vor arăta astfel:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Revedeți formula de bază pentru determinarea unui coeficient de corelație. Formula pentru calcularea unui coeficient de corelație utilizează medii, abateri standard și numărul de perechi dintr-un set de date (reprezentat de n). Coeficientul de corelație în sine este reprezentat de litera minusculă r sau de litera greacă ρ (rho). Pentru acest articol, vom folosi formula cunoscută sub numele de coeficient de corelație Pearson, așa cum se arată mai jos:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Determinați coeficientul de corelație. Acum aveți mijloacele și abaterile standard pentru variabilele dvs., astfel încât să puteți trece la formula coeficientului de corelație. Sa nu uiti asta n reprezintă numărul de valori pe care le aveți. Ați elaborat deja celelalte informații relevante în pașii de mai sus.
              • Folosind datele eșantionului, puteți introduce datele în formula coeficientului de corelație și le puteți calcula după cum urmează:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Interpretează rezultatul. Pentru acest set de date, coeficientul de corelație este 0.988. Acest număr vă spune două lucruri despre date. Uită-te la semnul numărului și la mărimea numărului.
                • Deoarece coeficientul de corelație este pozitiv, puteți spune că există o corelație pozitivă între datele x și datele y. Aceasta înseamnă că, dacă valorile x cresc, vă așteptați să crească și valorile y.
                • Deoarece coeficientul de corelație este foarte apropiat de +1, datele x și datele y sunt foarte strâns legate. Dacă ar fi să graficizați aceste puncte, ați vedea că acestea sunt o foarte bună aproximare la o linie dreaptă.

Metoda 2 din 4: Utilizarea calculatoarelor de corelație online

  1. Căutați online calculatoare de corelație. Măsurarea corelației este un calcul destul de standard pentru statistici. Calculul poate deveni foarte obositor pentru seturile de date mari, dacă se face manual. Prin urmare, multe surse au făcut disponibile calcule de corelație comune online. Utilizați orice motor de căutare și introduceți termenul de căutare „calculator de corelație”.
  2. Introduceți datele. Citiți cu atenție instrucțiunile de pe site, astfel încât să puteți introduce datele corect. Este important ca perechile de date să fie păstrate în ordine sau veți obține un rezultat de corelare incorect. Diferite site-uri web folosesc diferite formate pentru a introduce date.
    • De exemplu, pe site-ul http://ncalculators.com/statistics/correlation-coefficient-calculator.htm veți găsi o casetă orizontală pentru introducerea valorilor x și o a doua casetă orizontală pentru introducerea valorilor y. Introduceți termenii, separați doar prin virgule. Astfel, setul de date x calculat mai devreme în acest articol trebuie introdus ca 1,2,4,5. Setul de date y este introdus ca 1,3,5,7.
    • La un alt site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, puteți introduce date orizontal sau vertical, atâta timp cât păstrați punctele de date în ordine.
  3. Calculați rezultatele. Aceste site-uri de calcul sunt populare, deoarece după introducerea datelor trebuie să faceți clic pe butonul „Calculare” - rezultatul va apărea automat.

Metoda 3 din 4: Utilizarea unui calculator grafic

  1. Introduceți datele dvs. Pe calculatorul dvs. grafic, activați funcția statistică și apoi selectați comanda „Editați”.
    • Fiecare calculator are comenzi de taste ușor diferite. Acest articol oferă instrucțiuni specifice pentru Texas Instruments TI-86.
    • Pentru a accesa funcția Stat, apăsați [2nd] -Stat (deasupra tastei „+”) și apoi apăsați F2-Edit.
  2. Ștergeți toate datele vechi stocate. Majoritatea calculatoarelor vor păstra datele statistice până când vor fi șterse. Pentru a vă asigura că nu confundați datele vechi cu datele noi, trebuie mai întâi să ștergeți toate informațiile salvate anterior.
    • Utilizați tastele săgeată pentru a muta cursorul pentru a evidenția categoria „xStat”. Apoi apăsați „Ștergeți” și „Enter”. Aceasta ar trebui să șteargă toate valorile din coloana xStat.
    • Utilizați tastele săgeată pentru a evidenția categoria „yStat”. Apăsați „Ștergeți” și „Enter” pentru a șterge și datele pentru coloana respectivă.
  3. Introduceți valorile datelor. Utilizați tastele săgeată pentru a muta cursorul în primul spațiu sub antetul xStat. Tastați prima valoare a datelor și apoi apăsați Enter. Ar trebui să vedeți spațiul din partea de jos a ecranului „xStat (1) = __”, unde valoarea dvs. umple spațiul gol. Când apăsați Enter, datele vor umple tabelul, cursorul se va deplasa la următoarea linie, iar linia din partea de jos a ecranului ar trebui să citească acum „xStat (2) = __”.
    • Continuați să introduceți toate valorile x.
    • După ce ați introdus valorile x, utilizați tastele săgeți pentru a vă deplasa la coloana yStat și introduceți valorile y.
    • După introducerea tuturor datelor, apăsați Ieșire pentru a șterge ecranul și a ieși din meniul Stat.
  4. Calculați statisticile de regresie liniară. Coeficientul de corelație este o măsură a gradului de apropiere a datelor de o linie dreaptă. Un calculator grafic cu funcții statistice poate calcula foarte repede cea mai bună linie de potrivire și coeficientul de corelație.
    • Introduceți funcția Stat și apoi apăsați butonul Calc. Pe TI-86, acesta este [2nd] [Stat] [F1].
    • Alegeți calculele de regresie liniară. Pe TI-86, acesta este [F3], etichetat „LinR.” Afișajul grafic va afișa apoi linia „LinR _” cu un cursor intermitent.
    • Acum trebuie să introduceți numele celor două variabile pe care doriți să le calculați. Acestea sunt xStat și yStat.
      • Pe TI-86, selectați lista de nume („Nume”) apăsând pe [2nd] [List] [F3].
      • Linia de jos a ecranului dvs. ar trebui să arate acum variabilele disponibile. Alegeți [xStat] (acesta este probabil butonul F1 sau F2), apoi introduceți o virgulă și apoi [yStat].
      • Apăsați Enter pentru a calcula datele
  5. Interpretează rezultatele. Când apăsați Enter, calculatorul va calcula imediat următoarele informații pentru datele pe care le-ați introdus:
    • y=A+bX{ displaystyle y = a + bx}Înțelegeți conceptul de corelație. Corelația se referă la relația statistică dintre două mărimi. Coeficientul de corelație este un număr unic pe care îl puteți calcula pentru două seturi de puncte de date. Numărul este întotdeauna ceva între -1 și +1 și indică cât de apropiate sunt cele două seturi de date.
      • De exemplu, dacă ați măsura înălțimea și vârsta copiilor până la aproximativ 12 ani, v-ați aștepta să găsiți o corelație pozitivă puternică. Pe măsură ce copiii îmbătrânesc, tind să devină mai înalți.
      • Un exemplu de corelație negativă este compararea timpului pe care cineva îl petrece practicând golf cu scorul de golf al acelei persoane. Pe măsură ce practica progresează, scorul ar trebui să scadă.
      • În cele din urmă, v-ați aștepta la o corelație mică, pozitivă sau negativă, între mărimea pantofilor unei persoane, de exemplu, și notele examenului.
    • Calculați media. Media aritmetică sau „medie” a unui set de date este calculată prin adăugarea tuturor valorilor datelor și apoi împărțirea la numărul de valori din set. Pentru a determina coeficientul de corelație pentru datele dvs., trebuie să calculați media fiecărui set de date.
      • Media unei variabile este indicată de variabila cu o linie orizontală deasupra ei. Aceasta este adesea denumită „x-bar” sau „y-bar” pentru seturile de date ale x și y. Alternativ, media poate fi notată cu litera greacă minusculă μ (mu). De exemplu, pentru a indica media punctelor de date ale lui x, puteți utiliza μX sau μ (x).
      • De exemplu, dacă aveți un set de x (1,2,5,6,9,10), media acestor date se calculează după cum urmează:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Cunoașteți importanța abaterii standard. În statistici, abaterea standard măsoară variația, arătând dispersia numerelor de la medie. Un grup de numere cu o abatere standard redusă este destul de apropiat unul de celălalt. Un grup de numere cu o abatere standard ridicată este mai răspândit.
          • Ca simbol, abaterea standard este exprimată folosind litera minusculă s sau litera greacă σ (sigma). Astfel, abaterea standard a datelor x este scrisă ca sX sau σX.
        • Recunoașteți notația însumării. Operatorul de însumare este unul dintre cei mai comuni operatori în matematică și indică o sumă de valori. Este reprezentat de majuscula greacă, sigma sau ∑.
          • De exemplu, dacă aveți o colecție de puncte de date x (1,2,5,6,9,10), atunci ∑x înseamnă:
            • 1+2+5+6+9+10 = 33

sfaturi

  • Coeficientul de corelație este uneori denumit „coeficientul de corelație produs-moment Pearson” în onoarea lui Karl Pearson, dezvoltatorul său.
  • În general, un coeficient de corelație mai mare de 0,8 (pozitiv sau negativ) reprezintă o corelație puternică; un coeficient de corelație mai mic de 0,5 (pozitiv sau negativ din nou) reprezintă un coeficient de corelație slab.

Avertizări

  • Corelația arată că două seturi de date sunt conectate într-un fel. Cu toate acestea, aveți grijă să nu interpretați acest lucru ca pe o relație cauzală. De exemplu, dacă comparați dimensiunile pantofilor oamenilor și înălțimea lor, veți găsi probabil o corelație pozitivă puternică. Oamenii mai mari au, în general, picioare mai mari. Cu toate acestea, acest lucru nu înseamnă că a te înălța te va face să crești picioarele sau că picioarele mari te vor face să crești înalt. Pur și simplu se întâmplă împreună.