Calculați covarianța

Autor: Judy Howell
Data Creației: 2 Iulie 2021
Data Actualizării: 1 Iulie 2024
Anonim
How To Solve For Covariance
Video: How To Solve For Covariance

Conţinut

Covarianța este un calcul statistic pentru a face relația dintre două seturi de date mai transparentă. De exemplu, să presupunem că antropologii studiază înălțimea și greutatea unei populații într-o anumită cultură. Pentru fiecare persoană din studiu, înălțimea și greutatea pot fi afișate cu o pereche de date (x, y). Aceste valori pot fi utilizate într-o formulă standard pentru calcularea relației de covarianță. Acest articol explică mai întâi calculele pentru determinarea covarianței unui set de date. În continuare, vor fi discutate alte două modalități automate de determinare a rezultatului.

A calca

Metoda 1 din 4: Calculați covarianța manual folosind formula standard

  1. Aflați formula standard de covarianță și părțile sale. Formula standard pentru calcularea covarianței este Σ(XeuXmedie)(yeuymedie)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Construiți-vă tabelul de date. Înainte de a începe, este util să vă colectați datele. Creați un tabel format din cinci coloane. Trebuie să declarați fiecare coloană după cum urmează:
    • X{ displaystyle x}Calculați media punctelor de date x. Acest exemplu de set de date conține 9 numere. Pentru a găsi media, adăugați-le împreună și împărțiți suma la 9. Acest lucru dă rezultatul 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Când împărțiți acest lucru la 9, obțineți media 4,89. Aceasta este valoarea pe care o veți folosi ca x (medie) pentru calculele viitoare.
    • Calculați media punctelor de date y. Această coloană y trebuie să conțină, de asemenea, 9 puncte de date care coincid cu cele x puncte de date. Determinați media acestora. Pentru acest set de date eșantion, acesta devine 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Împarte acest total la 9 pentru a obține o medie de 5,44. Veți folosi 5.44 ca valoare a y (medie) pentru calculele viitoare.
    • Calculați valorile (XeuXmedie){ displaystyle (x_ {i} -x _ { text {avg}})}Calculați valorile (yeuymedie){ displaystyle (y_ {i} -y _ { text {avg}})}Calculați produsele pentru fiecare rând de date. Completați rândurile ultimei coloane înmulțind numerele pe care le-ați calculat în cele două coloane anterioare ale (XeuXmedie){ displaystyle (x_ {i} -x _ { text {avg}})}Găsiți suma valorilor din ultima coloană. Aici intervine simbolul Σ. După ce ați făcut toate calculele de până acum, adăugați rezultatele împreună. Pentru acest exemplu de set de date, ar trebui să aveți acum nouă valori în ultima coloană. Adăugați acele nouă numere împreună. Acordați o atenție deosebită dacă un număr este pozitiv sau negativ.
      • Suma acestui set de date eșantion ar trebui să adauge până la -64,57. Scrieți acest total în spațiul din partea de jos a coloanei. Aceasta este valoarea numărătorului formulei standard de covarianță.
    • Calculați numitorul formulei de covarianță. Numărătorul formulei standard de covarianță este valoarea pe care tocmai ați calculat-o. Numitorul este reprezentat de (n-1) și este cu unul mai mic decât numărul de perechi de date din setul de date.
      • În această problemă de exemplu, există nouă perechi de date, deci n este 9. Prin urmare, valoarea lui (n-1) este egală cu 8.
    • Împarte numeratorul la numitor. Ultimul pas în calcularea covarianței este împărțirea numărătorului, Σ(XeuXmedie)(yeuymedie){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Observați care sunt calculele repetitive. Covarianța este un calcul pe care trebuie să îl faci manual de câteva ori, astfel încât să înțelegi semnificația rezultatului. Cu toate acestea, dacă urmează să utilizați în mod obișnuit covarianța pentru interpretarea datelor, atunci aveți nevoie de un mod mai rapid și mai automat de a obține rezultatele. Până acum ați observat că, cu setul nostru de date relativ mic de doar nouă perechi de date, calculele au constat din două mijloace, optsprezece scăderi separate, nouă înmulțiri, o adunare și, în final, o altă diviziune. Sunt 31 de calcule relativ mici pentru a găsi soluția. Pe parcurs riscați să pierdeți semne negative sau să copiați incorect rezultatele, astfel încât răspunsul să nu mai fie corect.
    • Creați o foaie de lucru pentru calcularea covarianței. Dacă sunteți familiarizat cu Excel (sau un alt program de calcul), puteți crea cu ușurință un tabel pentru determinarea covarianței. Etichetați titlurile celor cinci coloane așa cum ați făcut pentru calcule manual: x, y, (x (i) -x (avg)), (y (i) -y (avg)) și Product.
      • Pentru a simplifica denumirea, numiți a treia coloană de genul „diferență x” și a patra coloană „diferență y”, atâta timp cât vă amintiți semnificația datelor.
      • Dacă tabelul începe în colțul din stânga sus al foii de lucru, celula A1 va fi etichetată x, în timp ce celelalte etichete continuă până la celula E1.
    • Introduceți punctele de date. Introduceți valorile datelor în cele două coloane x și y. Amintiți-vă că ordinea punctelor de date contează, deci trebuie să potriviți fiecare y cu valoarea corespunzătoare a lui x.
      • Valorile x încep în celula A2 și continuă până la numărul de puncte de date de care aveți nevoie.
      • Valorile y încep în celula B2 și continuă până la numărul de puncte de date de care aveți nevoie.
    • Determinați media valorilor x și y. Excel calculează mediile pentru dvs. foarte repede. În prima celulă goală de sub fiecare coloană de date, tastați formula = MEDIE (A2: A ___). Umpleți spațiul gol cu ​​numărul celulei care corespunde ultimului dvs. punct de date.
      • De exemplu, dacă aveți 100 de puncte de date, celulele A2 până la A101 sunt umplute, astfel încât în ​​celulă tastați = MEDIE (A2: A101).
      • Pentru datele y, tastați formula = MEDIE (B2: B101).
      • Amintiți-vă că o formulă din Excel începe cu un semn „=”.
    • Tastați formula pentru coloană (x (i) -x (avg)). În celula C2, introduceți formula pentru calcularea primei scăderi. Această formulă devine: = A2 -___. Umpleți spațiul gol cu ​​adresa celulei care conține media datelor x.
      • De exemplu, din cele 100 de puncte de date, media va fi în celula A103, deci formula dvs. devine: = A2-A103.
    • Repetați formula pentru punctele de date (y (i) -y (avg)). Urmând același exemplu, intră în celula D2. Formula devine: = B2-B103.
    • Tastați formula pentru coloana „Produs”. În a cincea coloană, tastați în celula E2 formula pentru a calcula produsul celor două celule precedente. Aceasta devine apoi: = C2 * D2.
    • Copiați formulele pentru a umple tabelul. Până acum, ați programat doar primele câteva puncte de date din rândul 2. Cu mouse-ul, marcați celulele C2, D2 și E2. Plasați cursorul pe caseta mică din colțul din dreapta jos până când apare un semn plus. Faceți clic și țineți apăsat butonul mouse-ului și trageți mouse-ul în jos pentru a extinde selecția și a completa întregul tabel de date. Acest pas va copia automat cele trei formule din celulele C2, D2 și E2 pe întregul tabel. Tabelul ar trebui să fie completat automat cu toate calculele.
    • Programați suma ultimei coloane. Aveți nevoie de suma articolelor din coloana „Produs”. În celula goală imediat sub ultimul punct de date din acea coloană, tastați formula: = SUM (E2: E ___). Completați spațiul gol cu ​​adresa celulei din ultimul punct de date.
      • În exemplul cu 100 de puncte de date, această formulă intră în celula E103. Tipul: = SUM (E2: E102).
    • Determinați covarianța. De asemenea, puteți cere ca Excel să efectueze calculul final pentru dvs. Ultimul calcul din celula E103 din exemplul nostru reprezintă numerotatorul formulei de covarianță. Chiar sub acea celulă, tastați formula: = E103 / ___. Umpleți spațiul gol cu ​​numărul de puncte de date pe care le aveți. În exemplul nostru, acesta este 100. Rezultatul este covarianța datelor dvs.

Metoda 3 din 4: Utilizarea calculatoarelor de covarianță online

  1. Căutați online calculatoare de covarianță. Diverse școli, companii sau alte surse au site-uri web care calculează foarte ușor valorile covarianței pentru dvs. Utilizați termenul de căutare „calculator de covarianță” într-un motor de căutare.
  2. Introduceți datele dvs. Citiți cu atenție instrucțiunile de pe site pentru a vă asigura că introduceți corect informațiile. Este important ca perechile dvs. de date să fie păstrate în ordine, altfel rezultatul generat va fi o covarianță incorectă. Site-urile web au stiluri diferite de introducere a datelor.
    • De exemplu, pe site-ul http://ncalculators.com/statistics/covariance-calculator.htm, există o casetă orizontală pentru introducerea valorilor x și o a doua casetă orizontală pentru introducerea valorilor y. Trebuie să introduceți datele separate prin virgule. Astfel, setul de date x calculat anterior în acest articol ar trebui apoi introdus ca 1,3,2,5,8,7,12,2,4. Datele y sunt 8,6,9,4,3,3,2,7,7.
    • Pe un alt site, https://www.thecalculator.co/math/Covariance-Calculator-705.html, vi se va cere să introduceți datele x în prima casetă. Datele sunt introduse pe verticală, cu un articol pe rând. Prin urmare, intrarea pe acest site arată ca:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Calculați-vă rezultatele. Aspectul atractiv al acestor calcule online este că, după introducerea datelor, trebuie să faceți clic de obicei pe butonul „Calculați”, iar rezultatele vor apărea automat. Majoritatea site-urilor vă vor oferi calculele intermediare ale x (avg), y (avg) și n.

Metoda 4 din 4: Interpretarea rezultatelor covarianței

  1. Căutați o relație pozitivă sau negativă. Covarianța este un număr statistic unic care indică relația dintre un set de date și altul. În exemplul menționat în introducere, se măsoară înălțimea și greutatea. Te-ai aștepta ca pe măsură ce oamenii cresc, greutatea lor să crească, de asemenea, ducând la o viziune covarianță pozitivă. Un alt exemplu: Să presupunem că sunt colectate date care indică numărul de ore pe care cineva le practică golf și scorul pe care îl obține. În acest caz, vă așteptați la o covarianță negativă, ceea ce înseamnă că odată cu creșterea numărului de ore de antrenament, scorul de golf va scădea. (În golf, un scor mai mic este mai bun).
    • Luați în considerare setul de date eșantion calculate mai sus. Covarianța rezultată este -8.07. Semnul minus înseamnă că, pe măsură ce valorile x cresc, valorile y tind să scadă. Puteți vedea că acest lucru este adevărat uitându-vă la unele dintre valori. De exemplu, valorile x de 1 și 2 corespund valorilor y de 7, 8 și 9. Valorile x de 8 și 12 sunt legate de valorile y de 3 și respectiv 2 .
  2. Interpretează magnitudinea covarianței. Dacă numărul scorului de covarianță este mare, fie un număr mare pozitiv, fie un număr mare negativ, atunci puteți interpreta acest lucru ca două elemente de date care sunt puternic conectate, fie într-un mod pozitiv, fie negativ.
    • Covarianța -8.07 a setului de date eșantion este destul de mare. Rețineți că datele variază de la 1 la 12. Deci 8 este un număr destul de mare. Acest lucru indică o relație destul de puternică între seturile de date x și y.
  3. Înțelegeți lipsa unei relații. Dacă rezultatul dvs. este o covarianță egală sau foarte apropiată de 0, puteți concluziona că punctele de date nu au legătură. Adică, o creștere a unei valori poate, dar nu trebuie să aibă ca rezultat o creștere a celeilalte. Cei doi termeni sunt legați aproape aleatoriu.
    • Să presupunem că raportați mărimea pantofilor la notele examenelor. Deoarece există atât de mulți factori care influențează notele examenului unui elev, se poate aștepta un scor de covarianță apropiat de 0. Acest lucru indică faptul că nu există aproape nicio relație între cele două valori.
  4. Vizualizați relația grafic. Pentru a înțelege vizual covarianța, puteți trasa punctele de date pe un grafic x, y. Când faceți acest lucru, ar trebui să vedeți destul de ușor că punctele, deși nu sunt exact pe o linie dreaptă, tind să se apropie de un cluster într-o linie diagonală de la stânga sus la dreapta jos. Aceasta este descrierea unei covarianțe negative. De asemenea, puteți vedea că valoarea covarianței este egală cu -8.07. Acesta este un număr destul de mare în comparație cu punctele de date. Numărul ridicat sugerează că covarianța este destul de puternică, ceea ce puteți deduce din forma liniară a punctelor de date.
    • Pentru a trece prin asta din nou, citiți articole despre desenarea punctelor într-un sistem de coordonate pe wikiHow.

Avertizări

  • Covarianța are o aplicație limitată în statistici. Este adesea un pas către calcularea coeficienților de corelație sau a altor concepte. Aveți grijă la interpretările prea îndrăznețe bazate pe un scor de covarianță.