Cum se evaluează semnificația statistică: 15 pași (cu fotografie) - Sfaturi

Video: Understanding Statistical Significance - Statistics help

Conţinut

Pași
Sfat
Avertizare

Testarea ipotezei este ghidată de analiza statistică. Încrederea semnificativă statistic este calculată folosind valoarea p - care indică probabilitatea unui rezultat observat atunci când o anumită propoziție (ipoteza nulă) este adevărată. Dacă valoarea p este mai mică decât nivelul de semnificație (de obicei 0,05), experimentatorul poate concluziona că există suficiente dovezi pentru a contesta ipoteza nulă și a admite ipoteza inversă. Folosind un test t simplu, puteți calcula valoarea p și puteți determina semnificația dintre două grupuri diferite de date.

Pași

Partea 1 din 3: Configurați experimentele

Determinați-vă ipoteza. Primul pas în evaluarea semnificației statistice este identificarea întrebărilor la care să răspundeți și declararea ipotezei dumneavoastră. Ipoteza este o afirmație a datelor empirice și a posibilelor discrepanțe ale populației. Fiecare experiment are o ipoteză nulă și o ipoteză inversă. În general, veți compara două grupuri pentru a vedea dacă sunt aceleași sau diferite.
- În general, ipoteza nu este (H₀) confirmați că nu există nicio diferență între cele două grupuri de date. Exemplu: Elevii care citesc materialul înainte de curs nu primesc note finale mai bune.
- Ipoteza inversă (H_A) este contrar ipotezei nule și este o afirmație pe care încercați să o susțineți cu datele empirice. De exemplu: Elevii care citesc materialul înainte de curs primesc note finale mai bune.
Selectați nivelul de semnificație pentru a determina gradul de diferență care poate fi văzut ca semnificativ în date. Nivelul de semnificație (cunoscut și ca alfa) este pragul pe care îl alegeți pentru a determina semnificația. Dacă valoarea p este mai mică sau egală cu un anumit nivel de semnificație, datele sunt considerate semnificative statistic.
- Ca regulă generală, nivelul de semnificație (sau alfa) este de obicei ales la nivelul 0,05 - ceea ce înseamnă că probabilitatea de a observa diferența văzută pe date este aleatorie doar de 5%.
- Cu cât este mai ridicat nivelul de încredere (și, prin urmare, cu cât este mai mică valoarea p), cu atât rezultatele sunt mai semnificative.
- Dacă este necesară mai multă încredere, reduceți valoarea p la 0,01. O valoare p scăzută este adesea utilizată în fabricare pentru a detecta defectele produsului. Un grad ridicat de fiabilitate este esențial pentru a accepta că fiecare piesă va funcționa așa cum ar trebui.
- Pentru majoritatea experimentelor bazate pe ipoteze, este acceptabil un nivel de semnificație de 0,05.
Decideți dacă utilizați un test cu o coadă sau cu două cozi. Una dintre ipotezele testului t este că datele dvs. se află într-o distribuție normală. Distribuția normală va forma o curbă de clopot cu majoritatea observațiilor centrate. Testul t este un test matematic care verifică dacă datele dvs. se încadrează în exteriorul distribuției normale, deasupra sau dedesubt, în partea „superioară” a curbei.
- Dacă nu sunteți sigur dacă datele sunt deasupra sau sub grupul de control, utilizați un test cu două cozi. Vă permite să verificați nivelul de semnificație în ambele direcții.
- Dacă știți care este direcția preconizată a datelor dvs., utilizați un test cu o singură coadă. În exemplul de mai sus, vă așteptați ca scorurile elevului să se îmbunătățească. Prin urmare, utilizați testul cu o singură coadă.
Determinați dimensiunea eșantionului cu analiza forței. Forța unui test este capacitatea de a observa rezultatul scontat cu o dimensiune eșantion dată. Pragul comun pentru forță (sau β) este de 80%. Analiza forței poate fi destul de complicată fără unele date preliminare, deoarece aveți nevoie de informații despre media așteptată între grupuri și abaterile standard ale acestora. Utilizați analiza forței online pentru a determina dimensiunea optimă a eșantionului pentru datele dvs.
- Cercetătorii efectuează adesea un mic studiu de premisă pentru a informa analiza forței și a decide mărimea eșantionului necesară pentru un studiu amplu și cuprinzător.
- Dacă nu există mijloace pentru a face cercetări premise complexe, estimați media posibilă pe baza lecturii articolelor și a cercetărilor pe care alte persoane le-au făcut. Vă poate oferi un început bun în determinarea dimensiunilor eșantionului.
publicitate

Partea 2 din 3: Calculați abaterea standard

Determinați formula abaterii standard. Abaterea standard măsoară dispersia datelor. Vă oferă informații despre identitatea fiecărui punct de date din eșantion. La început, ecuațiile pot părea destul de complicate. Cu toate acestea, pașii de mai jos vă vor ajuta să înțelegeți cu ușurință procesul de calcul. Formula este s = √∑ ((x_eu - µ) / (N - 1)).
- s este abaterea standard.
- ∑ indică faptul că va trebui să adăugați toate observațiile colectate.
- X_eu fiecare reprezintă valoarea datelor dvs.
- µ este media datelor pentru fiecare grup.
- N este numărul total de observații.
Numărul mediu de observații din fiecare grup. Pentru a calcula abaterea standard, trebuie mai întâi să calculați media observațiilor pentru fiecare grup individual. Această valoare este simbolizată cu litera greacă mu sau µ. Pentru a face acest lucru, pur și simplu adăugați observațiile și împărțiți la numărul total de observații.
- De exemplu, pentru a găsi scorul mediu al grupului care citește documentul înainte de curs, să analizăm câteva date. Pentru simplitate, vom folosi un set de date de 5 puncte: 90, 91, 85, 83 și 94 (pe o scară de 100 de puncte).
- Adăugați toate observațiile: 90 + 91 + 85 + 83 + 94 = 443.
- Împarte suma de mai sus la numărul de observații N (N = 5): 443/5 = 88.6.
- Scorul mediu pentru acest grup este de 88,6.
Scădeți media din fiecare valoare observată. Următorul pas implică partea (x_eu - µ) al ecuației. Scădeți media din fiecare valoare observată. Cu exemplul de mai sus, avem cinci scăderi.
- (90 - 88,6), (91- 88,6), (85 - 88,6), (83 - 88,6) și (94 - 88,6).
- Valoarea calculată este 1,4; 2.4; -3,6; -5,6 și 5,4.
Păstrați diferențele de mai sus și adăugați-le. Fiecare valoare nouă tocmai calculată va fi acum pătrată. Aici, semnul negativ va fi, de asemenea, eliminat. Dacă apare un semn negativ după acest pas sau la sfârșitul calculului, este posibil să fi uitat să faceți pasul de mai sus.
- În exemplul nostru, vom lucra acum cu 1.96; 5,76; 12,96; 31.36 și 29.16.
- Adăugați aceste pătrate împreună: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
Împărțiți la numărul total de observații minus 1. Împărțirea la N - 1 ajută la compensarea unui calcul care nu se efectuează pe ansamblul populației, ci se bazează pe un eșantion de toți elevii.
- Scădeți: N - 1 = 5 - 1 = 4
- Împărțiți: 81,2 / 4 = 20,3
Obțineți rădăcina pătrată. Odată împărțit la numărul de observații minus 1, luați rădăcina pătrată a valorii obținute. Acesta este ultimul pas în calcularea abaterii standard. Unele programe statistice vă vor ajuta să efectuați acest calcul după importul datelor originale.
- Cu exemplul de mai sus, abaterea standard a clasei de sfârșit de semestru a elevilor care citesc documentul înainte de curs este: s = √20,3 = 4,51.
publicitate

Partea 3 din 3: Determinarea semnificației statistice

Calculați varianța dintre cele două grupuri de observații. Până în acest moment, exemplul a tratat doar un singur grup de observații. Pentru a compara două grupuri, evident aveți nevoie de date de la ambele. Calculați abaterea standard a celui de-al doilea grup de observații și folosiți-o pentru a calcula varianța dintre cele două grupuri experimentale. Formula pentru calcularea varianței este: s_d = √ ((s₁/ N₁) + (s₂/ N₂)).
- S_d este varianța dintre grupuri.
- S₁ este deviația standard a grupelor 1 și N₁ este mărimea grupului 1.
- S₂ este deviația standard a grupelor 2 și N₂ este mărimea grupului 2.
- În exemplul nostru, să spunem că datele din grupul 2 (elevii care nu au citit textul înainte de curs) au o dimensiune de 5 și o abatere standard de 5,81. Varianța este:
  - S_d = √ ((s₁) / N₁) + ((s₂) / N₂))
  - S_d = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
Calculați scorul t al datelor. Statisticile T vă permit să convertiți datele într-un formular care este comparabil cu alte date. Valoarea t vă permite, de asemenea, să efectuați un test t, un test care vă permite să calculați probabilitatea unei diferențe semnificative statistic între cele două grupuri. Formula pentru calcularea statisticii t este: t = (µ₁ – µ₂) / S_d.
- µ₁ este media primului grup.
- µ₂ este media celui de-al doilea grup.
- S_d este varianța dintre observații.
- Utilizați media mai mare ca µ₁ pentru a nu obține o statistică t negativă.
- Pentru exemplul nostru, să presupunem că media observată pentru grupul 2 (care nu a citit articolul precedent) este 80. Scorul t este: t = (µ₁ – µ₂) / S_d = (88,6 – 80)/3,29 = 2,61.
Determinați gradul de libertate al probei. Când se utilizează statistica t, gradele de libertate sunt determinate pe baza mărimii eșantionului. Adună numărul de observații pentru fiecare grup și apoi scade două. În exemplul de mai sus, gradul de libertate (d.f.) este 8 deoarece există 5 probe în primul grup și 5 probe în al doilea grup ((5 + 5) - 2 = 8).
Utilizați tabelul t pentru a evalua semnificația. Tabelele valorilor t și gradele de libertate pot fi găsite într-o carte de statistici standard sau online. Găsiți rândul care conține gradele de libertate a datelor și valoarea p care corespunde statisticii t pe care o aveți.
- Cu grade de libertate 8 și t = 2,61, valoarea p pentru un test cu o singură coadă se situează între 0,01 și 0,025. Deoarece nivelul de semnificație ales este mai mic sau egal cu 0,05, datele noastre sunt semnificative statistic. Cu aceste date, respingem ipoteza nulă și acceptăm ipoteza inversă: elevii care citesc materialul înainte de curs au note finale mai mari.
Luați în considerare efectuarea unor cercetări suplimentare. Mulți cercetători efectuează studii de premise cu mai multe valori pentru a înțelege cum să proiectăm un studiu mai amplu. Efectuarea altor cercetări cu mai multe valori vă va crește încrederea în concluziile dvs. publicitate

Sfat

Statistica este un domeniu larg și complex. Faceți un curs de testare a ipotezelor statistice de liceu sau universitate (sau mai mare) pentru a înțelege semnificația statistică.

Avertizare

Această analiză se concentrează pe testul t pentru a verifica diferența dintre cele două populații normale de distribuție. În funcție de complexitatea datelor, este posibil să aveți nevoie de un alt test statistic.