Dispersioon on andmekogumi hajuvuse mõõt. See on kasulik statistiliste mudelite loomisel, kuna madal dispersioon võib olla märk sellest, et kohandate oma andmeid liiga palju. Dispersiooni arvutamine võib olla keeruline, kuid kui olete valemiga selgeks saanud, peate vastuse leidmiseks sisestama õiged numbrid.
1
Kirjutage oma näidisandmekogum üles. Enamikul juhtudel on statistikutel juurdepääs ainult valimile või uuritava populatsiooni alamhulgale. Näiteks selle asemel, et analüüsida populatsiooni “iga Saksamaa auto maksumust”, võiks statistik leida mõnest tuhandest autost koosneva juhusliku valimi maksumuse. Ta saab kasutada seda näidist Saksa autode kulude hea hinnangu saamiseks, kuid see ei vasta tõenäoliselt täpselt tegelikele numbritele.Näide. Analüüsides kohvikus iga päev müüdud muffinite arvu, valite kuuel päeval juhuslikult ja saate need tulemused : 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. See on valim, mitte populatsioon, kuna teil pole andmeid iga kohviku avatud päeva kohta. Kui teil on populatsioonis kõik andmepunktid, minge selle asemel alloleva meetodi juurde.
2
Kirjutage üles näidise dispersiooni valem. Andmekogumi dispersioon näitab, kui hajutatud on andmepunktid. Mida lähemal on dispersioon nullile, seda tihedamalt on andmepunktid rühmitatud. Näidisandmekomplektidega töötades kasutage dispersiooni arvutamiseks järgmist valemit: s2{displaystyle s^{2}} = âˆ'[(xi{displaystyle x_{i}} – xÌ…)2{displaystyle ^{2 }}]/(n – 1)s2{displaystyle s^{2}} on dispersioon. Dispersiooni mõõdetakse alati ruuduühikutes.xi{displaystyle x_{i}} tähistab teie andmekogus olevat terminit.−, mis tähendab “summat”, käsib teil arvutada järgmised terminid iga xi{displaystyle x_{ väärtuse jaoks i}}, seejärel lisage need kokku.xÌ… on valimi keskmine.n on andmepunktide arv.
3
Arvutage valimi keskmine. Sümbol xÌ… või “x-bar” viitab valimi keskmisele. Arvutage see nii, nagu te mõtlete: lisage kõik andmepunktid kokku, seejärel jagage andmepunktide arvuga.Näide. Esmalt lisage andmepunktid kokku: 17 + 15 + 23 + 7 + 9 + 13 = 84Järgmiseks jagage oma andmepunktid. vastake andmepunktide arvu järgi, antud juhul kuus: 84 ÷ 6 = 14. Valimi keskmine = xÌ… = 14. Keskmist võib pidada andmete “keskpunktiks”. Kui andmed koonduvad keskmise ümber, on dispersioon väike. Kui see on keskmisest kaugel, on dispersioon suur.
4
Lahutage igast andmepunktist keskmine. Nüüd on aeg arvutada xi{displaystyle x_{i}} – xÌ…, kus xi{displaystyle x_{i}} on iga arv teie andmekogus. Iga vastus ütleb teile selle arvu kõrvalekalde keskmisest või lihtsas keeles, kui kaugel see keskmisest on.Näide:x1{displaystyle x_{1}} – xÌ… = 17 – 14 = 3×2{displaystyle x_{ 2}} – xÌ… = 15 – 14 = 1×3{displaystyle x_{3}} – xÌ… = 23 – 14 = 9×4{displaystyle x_{4}} – xÌ… = 7 – 14 = -7×5{displaystyle x_{5}} – xÌ… = 9 – 14 = -5×6{displaystyle x_{6}} – xÌ… = 13 – 14 = -1Teie tööd on lihtne kontrollida, kuna teie vastuste summa peaks olema null. See on tingitud keskmise määratlusest, kuna eitavad vastused (kaugus keskmisest väiksemate arvudeni) tühistavad positiivsed vastused (kaugus keskmisest suuremate arvudeni) täpselt.
5
Iga tulemus ruut. Nagu eespool märgitud, on teie praegune kõrvalekallete loend (xi{displaystyle x_{i}} – xÌ…) kokku null. See tähendab, et ka “keskmine hälve” on alati null, nii et see ei näita midagi andmete jaotumise kohta. Selle ülesande lahendamiseks leidke iga kõrvalekalde ruut. See muudab need kõik positiivseteks arvudeks, nii et negatiivsed ja positiivsed väärtused ei muutu enam nulliks.Näide:(x1{displaystyle x_{1}} – xÌ…)2=32=9{displaystyle ^{2}= 3^{2}=9}(x2{displaystyle (x_{2}} – xÌ…)2=12=1{displaystyle ^{2}=1^{2}=1}92 = 81(-7 )2 = 49(-5)2 = 25(-1)2 = 1Teil on nüüd väärtus (xi{displaystyle x_{i}} – xÌ…)2{displaystyle ^{2}} iga andmepunkti jaoks teie näidis.
6
Leidke väärtuste ruudu summa. Nüüd on aeg arvutada kogu valemi lugeja: ∑[(xi{displaystyle x_{i}} – xÌ…)2{displaystyle ^{2}}]. Suurtäheline sigma, −, käsib teil liita järgmise liikme väärtuse iga xi{displaystyle x_{i}} väärtuse kohta. Olete juba arvutanud (xi{displaystyle x_{i}} – xÌ…)2{displaystyle ^{2}} iga xi{displaystyle x_{i}} väärtuse jaoks oma proovis, nii et kõik, mida vajate liidage kõigi hälvete ruudus tulemused kokku.Näide: 9 + 1 + 81 + 49 + 25 + 1 = 166.
7
Jagage arvuga n – 1, kus n on andmepunktide arv. Kaua aega tagasi jagasid statistikud valimi dispersiooni arvutamisel n-ga. See annab teile ruudu hälbe keskmise väärtuse, mis sobib ideaalselt selle valimi dispersiooniga. Kuid pidage meeles, et valim on vaid hinnang suurema populatsiooni kohta. Kui võtaksite teise juhusliku valimi ja teeksite sama arvutuse, saaksite teistsuguse tulemuse. Nagu selgub, annab n asemel n-ga jagamine 1-ga parema hinnangu suurema populatsiooni dispersioonile, mis on see, mis teid tegelikult huvitab. See parandus on nii tavaline, et see on nüüdseks valimi aktsepteeritud määratlus. dispersioon.Näide: valimis on kuus andmepunkti, seega n = 6. Valimi dispersioon = s2=1666−1={displaystyle s^{2}={frac {166}{6-1}} =} 33.2
8
Mõistke dispersiooni ja standardhälvet. Pange tähele, et kuna valemis oli eksponent, mõõdetakse dispersiooni algandmete ruuduühikus. See võib raskendada intuitiivset mõistmist. Selle asemel on sageli kasulik kasutada standardhälvet. Kuid te ei raisanud oma jõupingutusi, kuna standardhälve on defineeritud kui dispersiooni ruutjuur. Seetõttu kirjutatakse valimi dispersioon s2{displaystyle s^{2}} ja valimi standardhälve on s{displaystyle s}. Näiteks ülaltoodud valimi standardhälve = s = √33 .2 = 5,76.
9
Alustage rahvastikuandmete kogumiga. Mõiste “rahvastik” viitab asjakohaste vaatluste kogumile. Näiteks kui uurite Texase elanike vanust, hõlmaks teie populatsioon iga Texase elaniku vanust. Tavaliselt loote sellise suure andmekogumi jaoks arvutustabeli, kuid siin on väiksem andmekogumi näide:Näide: akvaariumi ruumis on täpselt kuus paaki. Kuus paaki sisaldavad järgmist arvu kalu:x1=5{displaystyle x_{1}=5}x2=5{displaystyle x_{2}=5}x3=8{displaystyle x_{3}=8}x4 =12{displaystyle x_{4}=12}x5=15{displaystyle x_{5}=15}x6=18{displaystyle x_{6}=18}
10
Kirjutage populatsiooni dispersiooni valem. Kuna populatsioon sisaldab kõiki vajalikke andmeid, annab see valem teile populatsiooni täpse dispersiooni. Et eristada seda valimi dispersioonist (mis on vaid hinnang), kasutavad statistikud erinevaid muutujaid:σ2{displaystyle ^{2}} = (âˆ'(xi{displaystyle x_{i}} – μ)2{ kuvastiil ^{2}})/nσ2{displaystyle ^{2}} = populatsiooni dispersioon. See on väiketäheline sigma, ruudus. Dispersiooni mõõdetakse ruuduühikutes.xi{displaystyle x_{i}} tähistab teie andmekogumis olevat terminit. − sees olevad terminid arvutatakse iga xi{displaystyle x_{i}} väärtuse jaoks ja seejärel liidetakse.μ on populatsiooni keskmine on andmepunktide arv populatsioonis
11
Leia rahvaarvu keskmine. Populatsiooni analüüsimisel tähistab sümbol μ (“mu”) aritmeetilist keskmist. Keskmise leidmiseks lisage kõik andmepunktid kokku ja jagage seejärel andmepunktide arvuga.Võite mõelda keskmisele kui “keskmisele”, kuid olge ettevaatlik, kuna sellel sõnal on matemaatikas mitu definitsiooni.Näide: keskmine = μ = 5+5+8+12+15+186{displaystyle {frac {5+5+8+12+15+18}{6}}} = 10,5
12
Lahutage igast andmepunktist keskmine. Keskmisele lähedased andmepunktid annavad erinevuse nullile lähemal. Korrake iga andmepunkti jaoks lahutamisülesannet ja võite hakata aru saama, kuidas andmed on hajutatud.Näide:x1{displaystyle x_{1}} – μ = 5 – 10,5 = -5,5×2{displaystyle x_ {2}} – μ = 5 – 10,5 = -5,5 x 3{displaystyle x_{3}} – μ = 8 – 10,5 = -2,5×4{displaystyle x_{4}} – μ = 12 – 10,5 = 1,5×5{ displaystyle x_{5}} – μ = 15 – 10,5 = 4,5×6{displaystyle x_{6}} – μ = 18 – 10,5 = 7,5
13
Ruudu iga vastus. Praegu on mõned teie viimase sammu numbrid negatiivsed ja mõned positiivsed. Kui kujutate oma andmeid arvureal, esindavad need kaks kategooriat keskmisest vasakul olevaid numbreid ja keskmisest paremal olevaid numbreid. See ei sobi dispersiooni arvutamiseks, kuna need kaks rühma tühistavad teineteise. Tehke iga arv ruudus, nii et need oleksid kõik positiivsed.Näide:(xi{displaystyle x_{i}} – μ)2{displaystyle ^{2}} iga i väärtuse jaoks vahemikus 1 kuni 6:(-5,5)2{ displaystyle ^{2}} = 30,25(-5,5)2{displaystyle ^{2}} = 30,25(-2,5)2{displaystyle ^{2}} = 6,25(1,5)2{displaystyle ^{2} } = 2,25(4,5)2{displaystyle ^{2}} = 20,25(7,5)2{displaystyle ^{2}} = 56,25
14
Leidke oma tulemuste keskmine. Nüüd on teil iga andmepunkti väärtus, mis on (kaudselt) seotud sellega, kui kaugel see andmepunkt on keskmisest. Võtke nende väärtuste keskmine, liites need kõik kokku ja jagades seejärel väärtuste arvuga.Näide: üldkogumi dispersioon = 30,25+30,25+6,25+2,25+20,25+56,256=145,56={displaystyle {frac {30,25+ 30,25+6,25+2,25+20,25+56,25}{6}}={frac {145,5}{6}}=} 24,25
15
Seostage see valemiga. Kui te pole kindel, kuidas see vastab selle meetodi alguses olevale valemile, proovige kogu probleem pika käega välja kirjutada: pärast keskmise ja ruutude erinevuse leidmist on teil väärtus (x1{displaystyle x_{1} } – μ)2{displaystyle ^{2}}, (x2{displaystyle x_{2}} – μ)2{displaystyle ^{2}} ja nii edasi kuni (xn{displaystyle x_{n }} – μ)2{displaystyle ^{2}}, kus xn{displaystyle x_{n}} on komplekti viimane andmepunkt. Nende väärtuste keskmise leidmiseks peate need kokku liitma ja jagama n-ga : ( (x1{displaystyle x_{1}} – μ)2{displaystyle ^{2}} + (x2{displaystyle x_{2}} – μ)2{displaystyle ^{2}} + .. . + (xn{displaystyle x_{n}} – μ)2{displaystyle ^{2}} ) / nPärast lugeja ümberkirjutamist sigma-vormingus on teil (âˆ'(xi{displaystyle x_{i}} – μ)2{displaystyle ^{2}})/n, dispersiooni valem.