Evaluați semnificația statistică

Testarea unei ipoteze se bazează pe analiza statistică. Semnificația statistică este calculată folosind o valoare p care vă spune cât de probabil este că rezultatul va avea loc, cu condiția ca o anumită declarație (ipoteza nulă) să fie adevărată. Dacă această valoare p este mai mică decât nivelul de semnificație (de obicei 0,05), atunci experimentatorul poate presupune că ipoteza nulă este falsă și ipoteza alternativă este acceptată. Folosind un simplu test t, puteți calcula valoarea p și puteți determina semnificația dintre două grupuri diferite de date.

metodă

Partea 1
Creați experimentul

Imaginea intitulată Evaluați semnificația statistică Pasul 1
1
Definiți-vă ipoteza. Primul pas în evaluarea semnificației statistice este definirea întrebării care trebuie răspunsă și stabilirea ipotezei. Ipoteza este o declarație cu privire la datele experimentale și posibilele diferențe în populație. Pentru fiecare experiment există o ipoteză nulă și o ipoteză alternativă. În mod obișnuit, comparați două grupuri pentru a vedea dacă acestea sunt identice sau nu.
  • Ipoteza nulă (H0) spune de obicei că nu există nicio diferență între cele două înregistrări. De exemplu, studenții care au citit materialul înainte de curs nu vor obține note mai bune.
  • Ipoteza alternativă (Ha) este opusul ipotezei nula și deci afirmația pe care doriți să o demonstrați prin datele experimentale. De exemplu, elevii care au citit materialul înainte de curs, obțin note finale mai bune.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 2
    2
    Determinați nivelul de semnificație pentru a determina cât de neobișnuit trebuie să fie datele dvs. pentru a fi considerate semnificative. Nivelul de semnificație (numit și alfa) este pragul setat pentru a determina semnificația. Dacă valoarea p este mai mică sau egală cu nivelul de semnificație, atunci datele sunt considerate semnificative din punct de vedere statistic.
    • În general, nivelul de semnificație (sau alfa) este adesea stabilit la 0,05, ceea ce înseamnă că șansa de a observa aleatoriu diferențele dintre datele dvs. este de numai 5%.
    • Un nivel de încredere mai mare (și, prin urmare, o valoare p mai mică) înseamnă că rezultatele sunt mai semnificative.
    • Dacă doriți o mai mare încredere în datele dvs., setați valoarea p sub 0,01. Valorile p mai mici sunt adesea folosite în fabrică atunci când vine vorba de descoperirea defectelor produselor. Este foarte important să aveți un înalt grad de încredere că fiecare parte va funcționa exact așa cum ar trebui.
    • Pentru majoritatea experimentelor bazate pe ipoteze, este acceptabil un nivel de semnificație de 0,05.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 3
    3
    Decideți dacă doriți să utilizați un test cu o singură cale sau cu două fețe. Una dintre ipotezele dintr-un test t este că datele dvs. sunt distribuite în mod normal. O distribuție normală a datelor formează o curbă clopot cu majoritatea datelor care se încadrează în mijloc. Testul t este un test matematic pentru a vedea dacă datele dvs. se află în afara distribuției normale - fie deasupra fie dedesubt, în capetele curbei.
    • Dacă nu sunteți sigur dacă datele dvs. vor fi deasupra sau sub grupul de control, utilizați un test pe două fețe. Acest lucru vă permite să testați semnificația în ambele direcții.
    • Dacă știți ce direcție este posibil să faceți, atunci folosiți un test unilateral. În exemplul nostru, vă așteptați ca gradele elevilor să se îmbunătățească - așadar, veți folosi un test de o pagină.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 4
    4
    Determinați dimensiunea eșantionului cu o analiză a performanței. Performanța unui test este probabilitatea ca un rezultat așteptat să fie respectat pentru o anumită dimensiune a eșantionului. Limita uzuală pentru performanță (sau ß) este de 80%. Analiza performanței poate fi dificilă fără primii informații deoarece aveți nevoie de date despre mijloacele așteptate ale fiecărui grup, precum și despre deviațiile lor standard. Utilizați un calculator de analiză a performanței pe Internet pentru a determina dimensiunea optimă a eșantionului pentru datele dvs.
    • Oamenii de stiinta fac de obicei un mic studiu pilot pentru a-si informa analizele de performanta si pentru a determina marimea esantionului pentru un studiu mai amplu si mai cuprinzator.
    • Dacă nu aveți resursele necesare pentru a realiza un studiu pilot complex, faceți unele estimări ale unor medii posibile. Puteți baza pe acestea pe citirea literaturii de specialitate și a unor studii similare efectuate deja. Aceasta vă oferă un bun punct de pornire pentru dimensiunea eșantionului.
  • Partea 2
    Calculați deviația standard

    Imaginea intitulată Evaluați semnificația statistică Pasul 5
    1
    Definiți formula pentru deviația standard. Deviația standard măsoară modul în care datele dvs. sunt distribuite. Acesta vă oferă informații despre modul în care fiecare punct de date similar este în eșantionul dvs. La prima vedere, ecuația poate părea un pic mai complicată, dar în etapele următoare vă vom îndruma prin construirea calculului. Formula este s = √Σ ((xi-μ) 2 / (N-1)).
    • s este abaterea standard.
    • Σ indică că veți rezuma toate valorile probelor colectate.
    • xi reprezintă fiecare valoare a datelor dvs.
    • μ reprezintă media (medie) a datelor dvs. pentru fiecare grup.
    • N este numărul total de eșantioane.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 6
    2
    Luați media probelor pentru fiecare grup. Pentru a calcula deviația standard, trebuie mai întâi să luați media probelor din fiecare grup. Media este notată cu litera greacă Mu sau μ. Pur și simplu adăugați toate eșantioanele individuale împreună și apoi împărțiți-le cu numărul total de eșantioane.
    • De exemplu, pentru a afla gradul mediu al grupului care a citit materialul înainte de curs, ne uităm la date. Din motive de simplitate, folosim un set de date cu 5 puncte: 90, 91, 83, 85 și 94.
    • Contorizați toate probele împreună: 90 + 91 + 85 + 83 + 94 = 443.
    • Împărțiți suma cu numărul de probe, N = 5: 443/5 = 88.6.
    • Gradul mediu pentru acest grup este 88,6.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 7
    3
    Luați fiecare eșantion în afara mediei. Următoarea parte a calculului include partea (xi - μ) a ecuației. Veți scăpa fiecare probă din media calculată. În exemplul nostru veți termina cu cinci subtracții.
    • (90-88,6), (91-88,6), (85-88,6), (83-88,6) și (94-88,6).
    • Numerele calculate sunt acum 1,4, 2,4, 3,6, 5,6 și 5,4.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 8
    4


    Testați fiecare dintre aceste numere și numărați-le împreună. Fiecare dintre numerele noi pe care tocmai le-ați calculat este acum pătrat. Acest pas elimină, de asemenea, toate semnele negative. Dacă aveți un semn negativ după acest pas sau la sfârșitul calculului dvs., este posibil să fi omis acest pas.
    • În exemplul nostru, lucrăm acum cu 1.96-5.76- 12.96-31.36 și 29.16.
    • Dacă adăugăm aceste pătrate împreună, obținem: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 9
    5
    Împărțiți cu numărul total de probe minus 1. Formula împărțită la N-1 deoarece corectează pentru faptul că nu ați numărat o populație totală - luați o mostră din populația tuturor studenților pentru a obține o estimare.
    • Scădere: N - 1 = 5-1 = 4
    • Împărțiți: 81,2 / 4 = 20,3
  • Imaginea intitulată Evaluați semnificația statistică Pasul 10
    6
    Trageți rădăcina pătrată. Dacă împărțiți numărul eșantionului minus 1, trageți rădăcina pătrată a acestui număr final. Acesta este ultimul pas pentru a calcula abaterea standard. Există programe statistice care fac acest calcul după ce ați introdus datele brute.
    • În exemplul nostru, deviația standard este clasa finală a studenților care au citit înainte de curs: s = √20.3 = 4.51.
  • Partea 3
    Determinați semnificația

    Imaginea intitulată Evaluați semnificația statistică Pasul 11
    1
    Calculați deviația dintre cele două grupuri de studiu. Până acum, exemplul nostru a tratat doar unul dintre grupurile de studiu. Desigur, dacă doriți să comparați două grupuri, veți avea nevoie de date din ambele. Se calculează deviația standard a celui de-al doilea grup de studiu și se utilizează pentru a determina varianța dintre cele două grupuri de studiu. Formula pentru varianță este sd = √ ((s1 / r1) + (s2 / r2))
    • sd este varianța dintre grupurile dvs.
    • s1 este abaterea standard a grupului 1 și N1 este dimensiunea eșantionului din grupa 1.
    • s2 este abaterea standard a grupului 2 și N2 este dimensiunea eșantionului din grupa 2.
    • Pentru exemplul nostru, spunem că datele din Grupul 2 (elevii care nu au citit înainte de curs) au avut o mărime a eșantionului de 5 și o deviație standard de 5,81. Varianța este:
      • sd = √ ((s1) 2 / r1) + ((s2) 2 / r2))
      • sd = √ ((4,51) 2/5) + ((5,81) 2/5)) = √ (20,34 / 5) + (33,76 / 5) 07 + 6,75) = √10,82 = 3,29.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 12
    2
    Calculați valoarea t a datelor. Valoarea t aduce datele într-o formă care vă permite să le comparați cu alte date. Utilizând valorile t, puteți efectua un test t care vă permite să calculați probabilitatea ca două grupuri să fie semnificativ diferite una de cealaltă. Formula pentru valoarea t este: t = (μ1 - μ2) / sd.
    • μ1 este media primului grup.
    • μ2 este media celui de-al doilea grup.
    • sd este varianța dintre eșantioanele dvs.
    • Utilizați media mai mare decât μ1, deci nu veți obține o valoare t negativă.
    • Pentru exemplul nostru spunem că media pentru grupul 2 (cei care nu au citit) a fost 80. Valoarea t este: t = (μ1 - μ2) / sd = (88,6 - 80) / 3,29 = 2,61.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 13
    3
    Determinați gradul de libertate al eșantionului. În calculul cu o valoare t, numărul de grade de libertate este determinat de mărimea grupului de studiu. Numără numărul de eșantioane din fiecare grup și apoi scade două. În exemplul nostru, gradele de libertate sunt 8 deoarece există cinci probe în primul grup și cinci în cel de-al doilea (5 + 5) - 2 = 8).
  • Imaginea intitulată Evaluați semnificația statistică Pasul 14
    4
    Utilizați o tabelă t pentru a evalua semnificația. Puteți găsi un tabel cu valori t și grade de libertate într-o lucrare standard pentru statistici sau online. Uitați-vă la linia care conține gradele de libertate pentru datele dvs. și găsiți valoarea p care se potrivește cu valoarea t.
    • Pentru 8 grade de libertate și o valoare t de 2,61, valoarea p pentru un test unilateral ar fi cuprinsă între 0,01 și 0,025. Deoarece ne-am stabilit nivelul de semnificație mai mic sau egal cu 0,05, datele noastre sunt semnificative din punct de vedere statistic. Cu aceste date respingem ipoteza nulă și acceptăm ipoteza alternativă: elevii care citesc înainte de curs obține note finale mai bune.
  • Imaginea intitulată Evaluați semnificația statistică Pasul 15
    5
    Luați în considerare un studiu ulterior. Mulți oameni de știință fac un mic studiu pilot, cu doar câteva citiri, pentru a înțelege mai bine cum pot construi un studiu mai amplu. Dacă faceți un alt studiu cu mai multe măsurători, veți avea mai multă încredere în concluzia dvs.
  • Sfaturi

    • Statisticile sunt un domeniu mare și dificil. Dovedește un curs de inferență statistică la școală sau universitate pentru a înțelege mai bine semnificația statistică.

    avertismente

    • Această analiză este specifică unui test t pentru a testa diferențele dintre două populații distribuite în mod normal. Este posibil să fie nevoie să utilizați un test statistic diferit, în funcție de complexitatea setului de date.
    Distribuiți pe rețelele sociale:

    înrudit