Calculați valoarea P

Valoarea P sau valoarea probabilității este o măsură statistică care ajută oamenii de știință să determine dacă ipotezele lor sunt corecte. Ea este direct legată de gradul de semnificație, care este o componentă importantă în determinarea faptului dacă datele obținute din studiul științific sunt semnificative din punct de vedere statistic. De obicei, atunci când valoarea P dintr-o serie de date este sub o limită predeterminată (cum ar fi 0,05), oamenii de știință resping "ipoteza nulă" a experimentului - cu alte cuvinte, exclud ipoteza că variabilele din experiment nu

a avut un efect semnificativ asupra rezultatului. În prezent, puteți găsi valoarea P în tabelele corespunzătoare, dacă ați determinat anterior valoarea chi-pătrat corespunzătoare.

metodă

Imaginea intitulată Calculați valoarea P Pasul 1
1
Determinați rezultatul "așteptat". De obicei, oamenii de știință au un rezultat "normal" sau "tipic" în mintea lor atunci când încearcă să privească rezultatele. Aceasta se bazează pe experimente anterioare, analiză de încredere a datelor, literatură științifică și / sau alte surse. Determinați rezultatul așteptat și exprimați-l într-un număr.
  • De exemplu, să presupunem că studiile anterioare au arătat că biletele de depășire a vitezei sunt emise pentru autovehicule roșii, mai degrabă decât albastre, în țara dvs. Să presupunem că această valoare este de 2: 1 la nivel național "în favoarea mașinilor roșii". Acum vrem să aflăm dacă această tendință este răspândită și în poliția locală din orașul tău. Deci, dacă ne asumăm un total de 150 de bilete de trafic, ne așteptăm la un rezultat așteptat 100 pentru masini rosii si 50 ieșiți pentru mașini albastre, poliția locală trebuie să urmeze tendința națională.
  • Imaginea cu titlul Calculați valoarea P Pasul 2
    2
    Determinați rezultatul "observat". După ce ați determinat rezultatul așteptat, puteți efectua experimentul și puteți determina valoarea actuală (sau "observată"). Exprimați această valoare în cifre. Dacă influențăm anumite variabile experimentale și rezultatele observate se abat de la cele așteptate, pot exista două motive: fie acest lucru se întâmplă din întâmplare, fie influența noastră asupra experimentului a făcut diferența. Scopul valorii P este de a determina, dacă este cazul, dacă rezultatele observate diferă de cele așteptate într-o asemenea măsură încât "ipoteza nulă" - adică ipoteza că nu există corelație între variabilele experimentului și rezultatele observate - este puțin probabil să o respingă.
  • Exemplu: Să presupunem că în orașul nostru alegem 150 de bilete la viteză aleatorie pentru a conduce prea repede. Observăm asta 90 de la ei pentru mașinile roșii și 60 au fost emise pentru autoturismele albastre. Aceasta se abate, în fiecare caz, de rezultatul nostru așteptat 100 și 50 din. Întrebarea este că influența noastră asupra experimentului (trecerea de la un nivel național la unul local) a adus această schimbare sau poliția locală este la fel de "părtinitoare", așa cum sugerează valoarea națională și observăm doar una aleatorie? O valoare P ne va ajuta să răspundem la această întrebare.
  • Imaginea cu titlul Calculați valoarea P Pasul 3
    3
    Determinați "gradele de libertate" ale experimentului dvs. Gradul de libertate este în esență cantitatea de variabilitate care este inclusă în căutare, care este limitată de numărul de categorii pe care le priviți. Ecuația pentru gradele de libertate este Numărul de grade de libertate = n - 1, în care n reprezintă numărul de categorii sau variabile analizate pentru experiment.
  • Exemplu: Experimentul nostru are două categorii de rezultate: unul pentru mașini roșii și unul pentru mașini albastre. Deci, în experimentul nostru avem 2-1 = 1 grad de libertate. Dacă ne uităm la mașini roșii, albastre și verzi, am avea 2 grade de libertate etc.
  • Imaginea intitulată Calculate P Value Step 4
    4


    Comparați rezultatele așteptate cu rezultatele observate folosind "chi-squared". Piața Chi (scrisă x2) este o cantitate numerică care indică diferența dintre un rezultat așteptat al unui experiment și valoarea care trebuie observată. Ecuația este: x2 = Σ ((o-e)2/ S), unde "o" corespunde datelor observate sau reale, iar "e" corespunde datelor așteptate. Faceți o sumă a tuturor rezultatelor pentru a obține toate ieșirile posibile (vedeți mai jos).
  • După cum puteți vedea, această ecuație conține una Σ (Sigma). Cu alte cuvinte, trebuie să ((| o-e | -.05)2/ e) calculați pentru fiecare rezultat posibil și apoi adăugați-vă pentru a obține valoarea dvs. Chi-pătrat. În exemplul nostru, există două opțiuni - fie că mașina este roșie sau albastră. Așa că trebuie să ((o-e)2/ e) calculați de două ori - o dată pentru mașinile roșii, o dată pentru cele albastre.
  • Exemplu: Am pus valorile noastre așteptate și observate în ecuația x2 = Σ ((o-e)2/ e). Rețineți că datorită caracterului sigma trebuie să folosim ecuația ((o-e)2/ e) calculați de două ori - o dată pentru roșu și o dată pentru autovehiculele albastre. Ar trebui să arate astfel:
  • x2 = ((90-100)2/ 100) + (60-50)2/ 50)
  • x2 = ((-10)2/ 100) + (10)2/ 50)
  • x2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • Imaginea intitulată Calculate Value Value Pasul 5
    5
    Alegeți nivelul de semnificație. După ce am determinat gradele libertății experimentului și valoarea lui chi-pătrat, trebuie să determinăm încă un lucru înainte de a putea determina valoarea p - trebuie să alegem un grad de semnificație. Gradul de semnificație indică cât de încrezători vrem să mergem în rezultat - o valoare mică corespunde unei probabilități scăzute că rezultatele sunt coincidențe și invers. Nivelul de semnificație este dat ca număr zecimal (cum ar fi 0,01) și corespunde probabilității procentuale ca rezultatul experimentului să aibă loc la întâmplare (în acest caz 1%).
  • Este o presupunere generală că p = 0.01 are o șansă de 99% ca rezultatele să fie produse prin influențarea oamenilor de știință din variabilele experimentale. Nu este corect. Dacă îți poți purta pantalonii norocoși în șapte zile diferite și bursa a crescut în fiecare zi, vei avea un rezultat de<0.01, dar probabil că veți crede că rezultatul a fost aleator și nu a fost generat de norocul dvs.
  • În cele mai multe cazuri, oamenii de știință folosesc un nivel de semnificație de 0,05 în experimentele lor, adică 5%. Aceasta înseamnă că rezultatele dintr-un experiment cu acest nivel de semnificație au cel mult o șansă de 5% de a fi aleatorii. Cu alte cuvinte, în cel puțin 95% din cazuri, rezultatele se bazează pe influența variabilelor de experiment de către om de știință și nu pe șansă. În majoritatea experimentelor, o certitudine de 95% despre o relație între două variabile este considerată o dovadă "de succes" a relației dintre cele două.
  • Exemplu: Pentru exemplul nostru de mașină roșu și albastră, urmăm convenția științifică și alegem un nivel de semnificație 0,05.
  • Imaginea cu titlul Calculați valoarea P Pasul 6
    6
    Utilizați o tabelă de distribuție chi-squared pentru a găsi valoarea p. Oamenii de știință și statisticienii folosesc tabele mari de valori pentru a determina valoarea P pentru experimentul lor. Aceste tabele sunt de obicei construite astfel încât în ​​stânga să fie o coloană pentru gradele de libertate și deasupra unui rând pentru valoarea P corespunzătoare. Alegeți seria cu gradul de libertate al experimentului dvs. și mergeți la dreapta în acest rând până când ajungeți la prima valoare mai mare este valoarea calculată chi-pătrat. Apoi treceți de la această valoare până la linia orizontală P - valoarea P pentru experiment se situează între această valoare și următoarea valoare mai mare (una imediat spre stânga).
  • Chi-pătrat tabele pot fi obținute dintr-o varietate de surse - acestea sunt ușor de găsit on-line, dar, de asemenea, în științe și statistici cărți. Dacă nu aveți o diagramă la îndemână, utilizați cea din imaginea de mai sus sau căutați una on-line.
  • Exemplu: Valoarea chi-squared este 3. Deci, putem folosi tabelul din imaginea de mai sus pentru a determina cu aproximație valoarea P. Știm doar experimentul nostru 1 Libertatea are, deci începem în rândul de sus. Acum mergem de la stânga la dreapta prin acest rând până când trecem prima valoare 3 mai mare decât valoarea chi-pătratului nostru. Găsim 3.84. Dacă acum mergem de la această valoare la seria de valori P, se spune 0,05. Asta înseamnă că valoarea noastră P este între 0,05 și 1 (următoarea valoare P mai mare în tabel).
  • Imaginea cu titlul Calculați valoarea P Pasul 7
    7
    Decideți dacă respingeți sau păstrați ipoteza nulă. Acum, că am determinat valoarea P a experimentului nostru, putem decide acum dacă să respingem ipoteza nulă sau nu (amintim, ipoteza afirmă că influențarea variabilelor experimentale nu au influențat rezultatul observat). Dacă valoarea P este mai mică decât nivelul dvs. de semnificație, atunci felicitări - atunci ați dovedit că există un grad ridicat de corelație între variabilele pe care le influențați și rezultatele pe care le observați. Dacă valoarea P este mai mare decât nivelul dvs. de semnificație, atunci nu puteți spune cu convingerea fermă că rezultatele observate nu s-au întâmplat din întâmplare.
  • Exemplu: Valoarea noastră P este între 0,05 și 1. Aceasta înseamnă că este definită nu mai puțin de 0,05. Din păcate, putem face acest lucru Nu respingeți ipoteza nulă. Aceasta înseamnă că nu am atins limita de probabilitate de 95% și, prin urmare, nu putem spune sigur că poliția din orașul nostru distribuie bilete de trafic în mod semnificativ diferit față de media națională.
  • Cu alte cuvinte, există o probabilitate de 5-10% ca rezultatele observate să nu fie cauzate de schimbarea locației (analiza orașului nostru și nu a întregii țări), ci doar întâmplător. De vreme ce căutam o probabilitate mai mică de 5%, nu putem în siguranță fie că poliția din orașul nostru este mai puțin părtinitoare față de mașinile roșii - există șansele mici, dar semnificative din punct de vedere statistic, că nu este.
  • Sfaturi

    • Un calculator științific face mult mai ușor calculul. De asemenea, obțineți calculatoare pe internet.
    • Puteți calcula valoarea P utilizând mai multe programe de calculator, inclusiv software de distribuție utilizat în mod obișnuit și software statistic mai specializat.
    Distribuiți pe rețelele sociale:

    înrudit