Kui tegelete statistika vaatlemisega või tehniliste andmete vaatamisega, peate võib-olla suutma lugeda histogrammi. Histogramm on andmete konkreetne visuaalne esitus, tavaliselt graafik, mis kasutab ilma tühikuteta tulpasid, et näidata juhtumite arvu eraldi rühmas või näidiskomplektis. Algajatele, kes peavad mõistma, mida histogramm sisaldab ja kuidas seda tõlgendada, on siin mõned olulised sammud.
1
Tunnistage tulpdiagrammi ja histogrammi erinevust. Lintdiagrammid ja histogrammid on sarnased, kuid neil on mõned väga spetsiifilised erinevused. Lintdiagramm rühmitab numbrid kategooriatesse, histogrammid aga vahemikesse. Histogramme kasutatakse tavaliselt pideva andmekogumi tulemuste (nt pikkus, kaal, aeg jne) kuvamiseks. Tulbadiagrammil on tulpade vahel tühikud, histogrammil aga mitte. Histogramm näitab sageli sündmuse toimumise sagedust määratletud vahemik. See näitab, mitu korda see sündmus juhtub.
2
Lugege graafiku telgesid. X-telg on horisontaaltelg ja y-telg vertikaaltelg. Mõlemad annavad teile histogrammi lugemiseks olulist teavet. Paljud histogrammid näitavad teile esinemise sageduse tulemusi ja neil on sagedust näitav y-telg. X-telg näitab teile vahemikke, millesse andmed on rühmitatud. Näiteks professionaalses pesapallis viskajate kõrguste sagedust kirjeldaval histogrammil on kõrguse x-telg ja sageduse y-telg.
3
Tehke kindlaks kasutatavad vahemikud. Andmed rühmitatakse graafiku tegemiseks vahemikesse või lahtritesse. Õige prügikasti suuruse valimine on oluline graafiku koostamiseks, mis aitab teil tulemusi tõlgendada. Soovite valida vahemikud, mis ei ole liiga laiad ega liiga spetsiifilised ja võimaldavad teil näha andmetes sageduse aluseks olevat mustrit. Näiteks on professionaalse pesapalliviskaja keskmine kõrgus 6’2â€, kuid ilmselgelt on erandid. Kuna kõrguse vahemikud jäävad tõenäoliselt vahemikku 5’6″ kuni 6’6″ keskpaigani, peaksid prügikastid erinema vaid umbes ühe või kahe tolli võrra. Veel üks märkus vahemike kohta: kõige esimene rühm võib ulatuda 5’6″ € kuni 5’8â€, kuid see ei sisalda 5’8â€. Iga rühm sisaldab kõike kuni järgmise rühma alguseni.
4
Kasutage selle rühma sageduse lugemiseks riba ülaosa. Kui soovite teada, mitu korda sündmus konkreetses vahemikus aset leidis, vaadake lihtsalt riba ülaosa ja lugege selles punktis y-teljel olevat väärtust. Näiteks histogrammi vaadates näete mängijate arvu vahemik 6’0†kuni veidi alla 6’2†on 50.
5
Koguge andmeid graafiku tegemiseks. Kui soovite koguda andmeid millegi sageduse kohta, on histogrammi graafiku koostamine hea viis oma andmete vaatamiseks. Ükskõik, kas vaatate konkreetse raamatu müüdud eksemplaride arvu või lehmade kaalujaotust farmis, on histogrammid lihtsaks viisiks andmete leviku üldisest mustrist laiaulatusliku ülevaate saamiseks.
6
Valige oma prügikastid. Andmete joonistamisel peate esmalt otsustama, kuidas soovite need vahemikeks jagada. Soovite valida prügikastid, mis annavad teile hea esituse, nii et te ei soovi, et need oleksid liiga laiad ega liiga täpsed. Oletame näiteks, et teie farmis oli 10 andmepunkti lehmade kaalu kohta: 1150, 1400 , 1100, 1600, 1800, 1550, 1750, 1350, 1400 ja 1300. Need kaalud varieeruvad sadade naela võrra, nii et soovite, et teie prügikastid erineksid ka sadade naelte võrra. Määrake prügikastid iga 200 naela kohta10, alates 10 naelast10 kuni 1900 naela.1100-1300, 1300-1500, 1500-1700, 1700-1900 kokku 4 prügikasti.
7
Eraldage andmed prügikastidesse. Kui olete prügikastid välja valinud, peate andmed nendesse prügikastidesse tellima ja sorteerima. Alustuseks pange kõik oma väärtused kasvavasse järjekorda. Seejärel tõmmake prügikastide jaotusele joon. Loendage igasse prügikasti langevate väärtuste arv. See arv on iga vahemiku sagedus. Pidage meeles, et kui väärtus on võrdne prügikasti piiriga, langeb see parempoolsesse prügikasti. Oletame näiteks, et teie farmis oli 10 andmepunkti lehmade kaalu kohta : 1150, 1400, 1100, 1600, 1800, 1550, 1650, 1350, 1400 ja 1300. Nende sortimine kasvavas järjekorras: 1100, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 1150, 1300, 100 D, 50,10,1450,1400,1450,1450 : 1100, 1150| 1300, 1350, 1400, 1400| 1550, 1600, 1650| 1800 Loendage sagedusi: salv 1: 2, salv 2: 4, salv 3: 3, salv 4: 1
8
Joonistage histogramm. Saate oma histogrammi käsitsi koostada, kasutades sorditud andmeid, või kasutada mõnda programmi, näiteks Excelit või mõnda muud statistikaprogrammi. Käsitsi joonistamiseks tõmmake lihtsalt välja x- ja y-telg ning määrake kummagi jaoks skaala. X-telg määratakse juba valitud ribade järgi ja y-telje skaala määratakse sagedusandmetega. Joonistage iga salve jaoks ribad, mis ulatuvad salvega seotud sageduse väärtuseni. Värvige need sisse ja veenduge, et kõik vardad puudutaksid üksteist. Näiteks lehmade kaalu puhul on x-telg vahemikus 1100–1900 sammuga 200; y-telje skaala on vahemikus 1 kuni 4 sammuga 1. Esimese salve, 1100-1300, sagedus on 2, seega tõmmake riba kuni 2 ja värvige see sisse. Otse esimese riba kõrval , tõmmake teine riba teise salve jaoks, mille sagedus on 4. Kolmas riba tõuseb 3-ni ja viimane riba tõuseb 1-ni.
9
Märgistage mõlemad teljed. Ükski graafik pole täielik ilma märgistatud telgedeta. Muutke need suureks ja julgeks, et need silma paistaksid. Veenduge, et sildid kajastaksid esitatavaid andmeid täpselt. Y-telg on märgistatud sagedusega, samas kui x-telje silt sõltub kogutud andmete tüübist. Näiteks on x-telg sildiga “Lehmade kaal naelades” ja y-telg. on sildiga “Sagedus”.