Modalități de a calcula varianța

Autor: Robert Simon
Data Creației: 21 Iunie 2021
Data Actualizării: 1 Iulie 2024
Anonim
Testare PH sol în două modalități. Varianta băbească și modernă
Video: Testare PH sol în două modalități. Varianta băbească și modernă

Conţinut

Varianța măsoară dispersia setului de date. Este foarte util în construirea de modele statistice: varianța scăzută poate fi o indicație că descrieți erori aleatorii sau zgomot în loc de relația de bază din date. Cu acest articol, wikiHow vă învață cum să calculați varianța.

Pași

Metoda 1 din 2: Calculați varianța unui eșantion

  1. Scrieți setul de date eșantion. În majoritatea cazurilor, statisticienii au doar informații despre un eșantion sau un subgrup al populației pe care o studiază. De exemplu, în loc să analizeze „costul fiecărei mașini din Germania”, un statistician ar putea găsi costul unui eșantion aleatoriu de câteva mii de mașini. Statisticianul poate folosi acest eșantion pentru a obține o estimare bună a costului mașinilor din Germania. Cu toate acestea, este mai probabil să nu se potrivească exact cu cifrele reale.
    • De exemplu: Când ați analizat numărul de brioșe vândute pe zi la o cafenea, ați luat un eșantion aleatoriu de șase zile și ați obținut următoarele rezultate: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Acesta este un eșantion, nu o populație, deoarece nu aveți date pentru fiecare zi în care magazinul este deschis.
    • Dacă fiecare Puncte de date din master, accesați metoda de mai jos.

  2. Notați formula varianței eșantionului. Varianța unui set de date indică gradul de dispersie a punctelor de date. Cu cât varianța este mai aproape de zero, cu atât punctele de date sunt mai apropiate. Când lucrați cu seturi de date eșantion, utilizați următoarea formulă pentru a calcula varianța:
    • = /(n - 1)
    • este varianța. Varianța este întotdeauna calculată în unități pătrate.
    • reprezintă o valoare în setul dvs. de date.
    • ∑, adică „sumă”, vă spune să calculați următorii parametri pentru fiecare valoare și apoi să îi adăugați împreună.
    • x̅ este media eșantionului.
    • n este numărul de puncte de date.

  3. Calculați media eșantionului. Simbolul x̅ sau „x-orizontal” este utilizat pentru a indica media eșantionului. Calculați așa cum ați face orice medie: adunați toate punctele de date și împărțiți-le la numărul de puncte.
    • De exemplu: Mai întâi, adăugați punctele de date: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Apoi, împărțiți rezultatul la numărul de puncte de date, în acest caz șase: 84 ÷ 6 = 14.
      Media eșantionului = x̅ = 14.
    • Vă puteți gândi la medie ca la „punctul central” al datelor. Dacă datele sunt centrate în jurul valorii medii, varianța este mică. Dacă sunt dispersate departe de medie, varianța este mare.

  4. Scădeți media din fiecare punct de date. Acum este momentul să calculăm - x̅, unde se află fiecare punct din setul de date. Fiecare rezultat va indica abaterea de la media fiecărui punct corespunzător sau, pur și simplu, distanța de la acesta la medie.
    • De exemplu:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Este foarte ușor să vă verificați calculele, deoarece rezultatele trebuie să fie la zero. Acest lucru se datorează faptului că prin medie, rezultatele negative (distanța de la medie la numere mici). rezultatele pozitive (distanța de la numărul mediu la cel mai mare) sunt complet eliminate.
  5. Păstrați toate rezultatele. Așa cum s-a menționat mai sus, lista curentă a deviațiilor (- x̅) are o sumă de zero, ceea ce înseamnă că „deviația medie” va fi întotdeauna zero și nu se poate spune nimic despre dispersia datelor. Pentru a rezolva această problemă, găsim pătratul fiecărei abateri. Datorită acestui fapt, toate sunt numere pozitive, valori negative și valori pozitive nu se mai anulează reciproc și dau suma zero.
    • De exemplu:
      (- X)
      - X)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Aveți acum (- x̅) pentru fiecare punct de date din eșantion.
  6. Găsiți suma valorilor pătrate. Acum este momentul să calculăm întregul numărător al formulei: ∑. Ciclo mare, ∑, necesită să adăugați următoarea valoare a elementului pentru fiecare valoare. Ați calculat (- x̅) pentru fiecare valoare din eșantion, deci nu trebuie decât să adăugați rezultatele împreună.
    • De exemplu: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Împărțiți cu n - 1, unde n este numărul de puncte de date. Cu mult timp în urmă, la calcularea varianței eșantionului, statisticienii au împărțit doar la n. Această diviziune vă va oferi media abaterii pătrate, care se potrivește exact cu varianța eșantionului respectiv. Cu toate acestea, rețineți că eșantionul este doar o estimare a unei populații mai mari. Dacă luați un alt eșantion aleatoriu și faceți același calcul, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n -1 în loc de n vă oferă o estimare mai bună a varianței unei populații mai mari - de care chiar vă pasă. Această corecție este atât de comună încât este acum definiția acceptată a varianței eșantionului.
    • De exemplu: Există șase puncte de date în eșantion, deci n = 6.
      Varianta eșantionului = 33,2
  8. Înțelegeți varianța și deviația standard. Rețineți că, deoarece există puteri în formulă, varianța se măsoară în pătratul unităților din datele originale. Acest lucru este confuz din punct de vedere vizual. În schimb, de multe ori abaterea standard este destul de utilă. Dar nu are rost să pierdem vreun efort, deoarece deviația standard este determinată de rădăcina pătrată a varianței. De aceea, varianța eșantionului este scrisă în termeni, iar abaterea standard a eșantionului este.
    • De exemplu, abaterea standard a eșantionului de mai sus = s = √33.2 = 5.76.
    publicitate

Metoda 2 din 2: Calculați varianța unei populații

  1. Începând cu setul de date master. Termenul „populație” este utilizat pentru a se referi la toate observațiile relevante. De exemplu, dacă cercetați vârsta rezidenților din Hanoi, populația dvs. globală va include vârsta tuturor persoanelor care locuiesc în Hanoi. De obicei, ați crea o foaie de calcul pentru un set de date mare ca acesta, dar iată un exemplu de set de date mai mic:
    • De exemplu: În camera unui acvariu, există exact șase acvarii. Aceste șase tancuri conțin următoarele numere de pești:





  2. Notați formula pentru varianța generală. Deoarece o populație conține toate datele de care avem nevoie, această formulă ne oferă varianța exactă a populației. Pentru a o deosebi de varianța eșantionului (care este doar o estimare), statisticienii folosesc alte variabile:
    • σ = /n
    • σ = varianța eșantionului. Acesta este cârnații în mod normal pătrat. Varianța se măsoară în unități pătrate.
    • reprezintă un element din setul de date.
    • Elementul din ∑ este calculat pentru fiecare valoare și apoi se adaugă.
    • μ este media generală.
    • n este numărul de puncte de date din populație.
  3. Găsiți media populației. Când se analizează o populație, simbolul μ ("mu") reprezintă media aritmetică. Pentru a găsi media, adăugați toate punctele de date, apoi împărțiți la numărul de puncte.
    • Vă puteți gândi la medie ca fiind „mediu”, dar aveți grijă, deoarece cuvântul are multe definiții matematice.
    • De exemplu: valoarea medie = μ = = 10,5
  4. Scădeți media din fiecare punct de date. Punctele de date mai apropiate de medie au o diferență mai aproape de zero. Repetați problema scăderii pentru toate punctele de date și probabil veți începe să simțiți dispersia datelor.
    • De exemplu:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Pătrat fiecare semn. În acest moment, unele dintre rezultatele obținute din pasul anterior vor fi negative, iar altele vor fi pozitive.Dacă vizualizați datele pe o linie izomorfă, aceste două elemente reprezintă numerele din stânga și din dreapta mediei. Acest lucru nu ar fi de nici un folos în calcularea varianței, deoarece aceste două grupuri s-ar anula reciproc. În schimb, pătrate-le pe toate astfel încât să fie toate pozitive.
    • De exemplu:
      (- μ) pentru fiecare valoare de eu rulează de la 1 la 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Găsiți media rezultatelor dvs. Acum aveți o valoare pentru fiecare punct de date, legată (nu direct) de cât de departe este punctul de date de media. Media adăugându-le împreună și împărțind la numărul de valori pe care le aveți.
    • De exemplu:
      Varianța generală = 24,25
  7. Rețetă de contact. Dacă nu sunteți sigur cum se potrivește acest lucru cu formula prezentată la începutul metodei, scrieți întreaga problemă cu mâna și nu abreviați:
    • După ce ați găsit diferența față de medie și pătrat, obțineți (- μ), (- μ) și așa mai departe până când (- μ), unde este ultimul punct de date. în setul de date.
    • Pentru a găsi media acestor valori, adăugați-le împreună și împărțiți la n: ((- μ) + (- μ) + ... + (- μ)) / n
    • După rescrierea numărătorului cu notație sigmoidă, aveți /n, varianța formulei.
    publicitate

Sfat

  • Deoarece varianța este dificil de interpretat, această valoare este adesea calculată ca punct de plecare pentru găsirea abaterii standard.
  • Folosirea „n-1” în loc de „n” în numitor este o tehnică numită corecție Bessel. Eșantionul este doar o estimare a unei populații complete, iar media eșantionului are o anumită părtinire pentru a se potrivi cu această estimare. Această corecție elimină părtinirea de mai sus. Se referă la faptul că odată enumerate n - 1 puncte de date, ultimul punct n a fost o constantă, deoarece numai anumite valori au fost utilizate pentru a calcula media eșantionului (x̅) în formula varianței.