Kuidas võrrelda kahte proportsiooni

Kahe proportsiooni võrdlemine on sageli vajalik, et näha, kas need erinevad üksteisest oluliselt. Oletame näiteks, et teete randomiseeritud kontrolluuringu 40 inimesega, kellest pooled on määratud ravile ja teisele poolele platseebot. Katserühmast läks paremaks 18/20, kontrollrühmast aga 15/20. Kas need kaks proportsiooni erinevad üksteisest oluliselt? Kas ravi on efektiivne? Kui teate, kuidas proportsioone võrrelda, saate neile küsimustele vastata.

1
Seadke üles nullhüpotees ja alternatiivne hüpotees. Nullhüpotees (H0{displaystyle H_{0}}) sisaldab alati võrdsust ja on see, mida proovite ümber lükata. Alternatiivne (uurimis)hüpotees ei sisalda kunagi võrdsust ja see on see, mida proovite kinnitada. Need kaks hüpoteesi on esitatud nii, et need välistavad üksteist ja on ühiselt ammendavad. Üksteist välistav tähendab, et kui üks on tõene, peab teine ​​olema vale ja vastupidi. Kollektiivselt ammendav tähendab, et vähemalt üks tulemustest peab toimuma. Teie hüpoteesid sõnastatakse olenevalt sellest, kas see on 1- või 2-sabaline: Ühesabaline: Uurimisküsimus: kas üks osakaal on suurem kui teine? Teie hüpoteesid esitatakse järgmiselt: {H0:p^1≤p^2Ha:p^1>p^2{displaystyle {begin{cases}H_{0}:{hat {p}}_{ 1}leq {hat {p}}_{2}\H_{a}:{hat {p}}_{1}>{hat {p}}_{2}end{cases} }}. Kasutage ühepoolset, kui olete huvitatud erinevusest ainult ühes suunas. Näiteks selle näite puhul huvitab meid ainult see, kas ravi toimib, see tähendab, et osakaal on ravigrupis suurem. Kui määrame ravirühmaks 1 ja kontrollrühmaks 2, on hüpoteesid {H0:p^1≤p^2Ha:p^1>p^2{displaystyle {begin{cases}H_{0} :{hat {p}}_{1}leq {hat {p}}_{2}\H_{a}:{hat {p}}_{1}>{hat {p} }_{2}end{cases}}}. Kahepoolne: uurimisküsimus: kas valimi osakaal erineb oletatavast populatsiooni osakaalust? Teie hüpoteesid esitatakse järgmiselt: {H0:p^=p0Ha:p^≠p0{displaystyle {begin{cases}H_{0}:{hat {p}}=p_{0}\H_ {a}:{hat {p}}neq p_{0}end{cases}}}. Kui pole a priori põhjust arvata, et erinevus on ühesuunaline, eelistatakse kahepoolset testi, nagu see on rangem test.

2
Määrake sobiv olulisuse tase (α{displaystyle alpha } ehk “alpha”). Definitsiooni järgi on alfatase nullhüpoteesi tagasilükkamise tõenäosus, kui nullhüpotees on tõene. Enamasti määratakse alfa väärtuseks 0,05, kuigi selle asemel saab kasutada ka muid väärtusi (0 ja 1 vahel, välja arvatud). Muud tavaliselt kasutatavad alfaväärtused on 0,01 ja 0,10.

3
Arvutage kaks proovi proportsiooni. Proportsioon on “edumiste” arv jagatud rühma koguvalimiga. Selles näites on {p^1=1820=0,9p^2=1520=0,75{displaystyle {begin{cases}{hat {p}}_{1}={frac {18}{20}} =0,9\{hat {p}}_{2}={frac {15}{20}}=0,75end{cases}}}.

4
Arvutage kogu valimi osakaal. Valimi üldine osakaal, p^{displaystyle {hat {p}}}, on õnnestumiste koguarv jagatud kõigi rühmade valimi koguarvuga. Valem on p^=n1p^1+n2p^2n1+n2{displaystyle {hat {p}}={frac {n_{1}{hat {p}}_{1}+n_{2}{ hat {p}}_{2}}{n_{1}+n_{2}}}}, kus n1{displaystyle n_{1}} ja n2{displaystyle n_{2}} on näidissuurused rühmad 1 ja 2 vastavalt. Selles näites p^=18+1520+20=0,825{displaystyle {hat {p}}={frac {18+15}{20+20}}=0,825}.

5
Arvutage erinevuse standardviga. Standardviga SE arvutatakse p^(1−p^)(1n1+1n2){displaystyle {sqrt {{hat {p}}(1-{hat {p}})left( {frac {1}{n_{1}}}+{frac {1}{n_{2}}}right)}}}. Selles näites SE=0.825(1−0.825)(120+120)=0.120156{displaystyle SE={sqrt {0.825(1-0.825)left({frac {1}{20}}+{ murd {1}{20}}right)}}=0,120156}.

6
Arvutage testi statistika, z. Valem on z=p^1−p^2SE{displaystyle z={frac {{hat {p}}_{1}-{hat {p}}_{2}}{SE}}} . Selles näites z=0.9−0.750.120156=1.248{displaystyle z={frac {0.9-0.75}{0.120156}}=1.248}.

7
Teisendage testi statistika p-väärtuseks. p-väärtus on tõenäosus, et n-st juhuslikult valitud valimi statistika erineb vähemalt samavõrra kui saadud. p-väärtus on saba pindala normaalkõvera all alternatiivse hüpoteesi suunas. Näiteks kui kasutatakse parempoolset testi, on p väärtus parempoolse küljega ala või z väärtusest paremal asuv ala. Kui kasutatakse kahepoolset testi, on p-väärtus mõlema saba pindala. p-väärtuse saab leida, kasutades ühte mitmest meetodist: Normaaljaotuse tõenäosuse z-tabel. Näiteid leiab veebist. Oluline on lugeda tabeli kirjeldust, et märkida, milline tõenäosus on tabelis loetletud. Mõnedes tabelites on loetletud kumulatiivne (vasakpoolne) ala, teistes parempoolne sabaala, kolmandates on loetletud ainult ala keskmisest kuni positiivse z-väärtuseni.Excel. Exceli funktsioon =norm.s.dist(z,kumulatiivne). Asendage z arvväärtusega ja kumulatiivse väärtusega “tõene”. See Exceli valem annab kumulatiivse ala antud z väärtusest vasakul. Kui vajate õiget saba pindala, lahutage 1-st. Selles näites vajame õiget saba pindala, nii et p-väärtus = 1-NORM.S.DIST(1,248,TRUE) = 0,106. Texase instrumendi kalkulaator, näiteks TI-83 või TI-84. Võrgupõhised normaaljaotuse kalkulaatorid, näiteks see.

8
Otsustage nullhüpoteesi või alternatiivse hüpoteesi vahel. Kui pvalue<α{displaystyle p_{value}