Statistikas on arvude komplekti režiim see arv, mis esineb komplektis kõige sagedamini. Andmehulgal ei pea tingimata olema ainult üks režiim – kui kaks või enam väärtust on kõige levinumaks “seotud”, võib komplekti öelda vastavalt bimodaalseks või multimodaalseks – teisisõnu, kõik kõige levinumad. ühised väärtused on komplekti režiimid. Andmekogumi režiimi(de) määramise protsessi üksikasjaliku ülevaate saamiseks vaadake alustamiseks allolevat sammu 1.
1
Kirjutage numbrid oma andmekogumisse. Režiimid võetakse tavaliselt statistiliste andmepunktide komplektidest või arvväärtuste loenditest. Seega on režiimi leidmiseks vaja andmekogumit, mille jaoks see leida. Režiimiarvutusi on keeruline teha kõigi, välja arvatud väikseimate andmehulkade puhul, seega on enamikul juhtudel mõistlik alustada oma andmete kirjutamisest (või tippimisest). Kui töötate paberi ja pliiatsiga, piisab lihtsalt andmekogumi väärtuste järjestikusest kirjutamisest, samas kui kasutate arvutit, võiksite protsessi sujuvamaks muutmiseks kasutada arvutustabeliprogrammi.Leidmisprotsess andmekogumi režiimi on lihtsam mõista, järgides näiteprobleemi. Selles jaotises kasutame oma näite jaoks seda väärtuste komplekti: {18, 21, 11, 21, 15, 19, 17, 21, 17}. Järgmise paari sammuna leiame selle komplekti režiimi.
2
Järjesta numbrid väikseimast suurimani. Järgmiseks on sageli mõistlik sorteerida andmekogumi väärtused nii, et need oleksid kasvavas järjekorras. Kuigi see pole rangelt nõutav, muudab see režiimi leidmise lihtsamaks, kuna rühmitab identsed väärtused üksteise kõrvale. Suurte andmehulkade puhul võib see olla praktiliselt vajalik, kuna pikkade väärtusloendite sorteerimine ja iga numbri loendis esinemiskordade peatamine on keeruline ja võib põhjustada vigu. Kui töötate paberi ja pliiats, ümberkirjutamine võib pikemas perspektiivis aega säästa. Skannige arvude komplektist väikseim arv ja kui leiate selle, kriipsutage see esimeses andmekogumis maha ja kirjutage see uude andmekogumisse uuesti. Korrake väikseimalt teise, kolmanda ja nii edasi, kirjutades kindlasti iga numbrit nii palju kordi, kui see esineb algses andmekogumis. Arvutiga on teie valikud ulatuslikumad – näiteks enamik arvutustabeliprogramme on võimalus väärtuste loendeid vaid mõne klõpsuga ümber järjestada väikseimast suurimaks. Meie näites peaks pärast ümberjärjestamist uus väärtuste loend olema järgmine: {11, 15, 17, 17, 18, 19, 21, 21, 21}.
3
Loendage iga numbri korduste arv. Järgmisena loendage iga komplekti kuuluvate numbrite ilmumiskordade arv. Otsige väärtust, mis andmekogumis kõige sagedamini esineb. Suhteliselt väikeste andmekogumite puhul, mille punktid on järjestatud kasvavas järjekorras, on tavaliselt lihtne leida identsete väärtuste suurim “klaster” ja lugeda esinemiste arv. Kui töötate pliiatsi ja paberiga, tuleb jälgida oma arvud, proovige kirjutada iga väärtuse esinemiskordade arv iga identsete numbrite klastri kohale. Kui kasutate arvutis arvutustabeliprogrammi, saate teha sama, kirjutades kogusummad külgnevatesse lahtritesse või teise võimalusena kasutades ühte programmi suvanditest andmepunktide kokkuvõtmiseks. Meie näites ({11, 15, 17, 17, 18, 19, 21, 21, 21}),11 esineb üks kord, 15 esineb üks kord, 17 esineb kaks korda, 18 esineb üks kord, 19 esineb üks kord ja 21 esineb kolm korda. 21 on selle andmekogumi kõige levinum väärtus.
4
Määrake kõige sagedamini esinev väärtus (või väärtused). Kui teate, mitu korda iga väärtus teie andmekogumis esineb, leidke väärtus, mis esineb kõige rohkem kordi. See on teie andmekogumi režiim. Pange tähele, et andmekogumis võib olla rohkem kui üks režiim. Kui kaks väärtust on seotud, kuna need on komplektis kõige levinumad väärtused, võib andmehulga öelda, et see on bimodaalne, samas kui kolm väärtust on seotud, on komplekt trimodaalne ja nii edasi. Meie näitekomplektis ({11 , 15, 17, 17, 18, 19, 21, 21, 21}), kuna 21 esineb rohkem kordi kui ükski teine väärtus, on režiim 21. Kui väärtus peale 21 oleks samuti esinenud kolm korda (nagu näiteks , kui andmekogumis oleks veel üks 17), oleks režiim 21 ja see teine number.
5
Ärge ajage andmekogu režiimi segamini selle keskmise või mediaaniga. Kolm statistilist mõistet, mida sageli koos arutatakse, on keskmised, mediaanid ja viisid. Kuna kõigil neil mõistetel on sarnase kõlaga nimed ja kuna ühe andmekogumi puhul võib üks väärtus mõnikord olla rohkem kui üks, on neid lihtne segi ajada. Olenemata sellest, kas andmekogumi režiim on ka mediaan või keskmine, on oluline mõista, et need kolm mõistet on üksteisest täiesti sõltumatud. Vaadake allpool: andmekogumi keskmine on selle keskmine. Keskmise leidmiseks liitke kõik andmekogumis olevad väärtused ja jagage seejärel komplektis olevate väärtuste arvuga. Näiteks meie näidisandmestiku ({11, 15, 17, 17, 18, 19, 21, 21, 21}) puhul oleks keskmine 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78. Pange tähele, et jagasime väärtuste summa 9-ga, kuna andmekogumis on kokku 9 väärtust. Andmekogumi mediaan on “keskmine arv”, mis eraldab andmekogumi madalamad ja kõrgemad väärtused kaheks võrdseks pooleks. Näiteks meie näidisandmekogumis ({11, 15, 17, 17, 18, 19, 21, 21, 21}) on 18 mediaan, kuna see on keskmine arv – sellest on täpselt neli numbrit kõrgemad ja sellest neli numbrit madalam. Pange tähele, et kui andmekogumis on paarisarv väärtusi, pole ühtset mediaani. Nendel juhtudel peetakse mediaaniks tavaliselt kahe keskmise arvu keskmist.
6
Võtke arvesse, et andmekogumite jaoks, milles iga väärtus esineb sama arv kordi, pole režiimi. Kui antud komplekti väärtused esinevad kõik sama arv kordi, pole andmehulgal režiimi, kuna ükski number pole tavalisem kui ükski teine. Näiteks andmekogumitel, milles iga väärtus esineb üks kord, puudub režiim. Sama kehtib andmekogumite kohta, milles iga väärtus esineb kaks korda, kolm korda jne. Kui muudame oma näidisandmekomplekti väärtuseks {11, 15, 17, 18, 19, 21}, nii et iga väärtus esineb ainult üks kord, andmekogumil pole nüüd režiimi. Sama kehtib ka siis, kui muudame andmekogumit nii, et iga väärtus esineks kaks korda: {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
7
Arvestage, et mittenumbriliste andmekogumite režiimid on leitavad samal viisil kui numbriliste andmekogumite jaoks. Üldiselt on enamik andmekogumeid kvantitatiivsed – need käsitlevad andmeid numbrite kujul. Mõned andmekogumid käsitlevad aga andmeid, mida ei väljendata arvudena. Nendel juhtudel võib öelda, et “režiim” on üks väärtus, mis esineb andmekogumis kõige rohkem, nagu see on numbriliste andmekogumite puhul. Sellistel juhtudel võib olla võimalik leida režiimi, samas kui andmestiku jaoks on võimatu leida tähenduslikku mediaani või keskmist. Näiteks oletame, et bioloogiline uuring määrab kindlaks iga puu liigi väikeses kohalikus osas. Pargi puude tüüpide andmekogum on {Seeder, lepp, seeder, mänd, seeder, seeder, lepp, sanglepp, mänd, seeder}. Seda tüüpi andmekogumit nimetatakse nominaalseks andmekogumiks, kuna andmepunkte eristatakse ainult nende nimede järgi. Sel juhul on andmestiku režiimiks seeder, kuna seda esineb kõige sagedamini (viis korda, erinevalt kolmest lepa ja kahe männi puhul). Pange tähele, et ülaltoodud näidisandmekogumi puhul on võimatu arvutada keskmist või mediaan, kuna andmepunktidel pole numbrilist väärtust.
8
Arvestage, et unimodaalsete sümmeetriliste jaotuste puhul langevad mood, keskmine ja mediaan kokku. Nagu eespool märgitud, võib teatud juhtudel režiim, mediaan ja/või keskmine kattuda. Erijuhtudel, kus andmekogumi tihedusfunktsioon moodustab ühe režiimiga täiesti sümmeetrilise kõvera (näiteks Gaussi või “kellukujuline” kõver), on režiim, keskmine ja mediaan samad. Kuna jaotusfunktsioon kujutab andmepunktide suhtelise esinemise graafikut, asub režiim loomulikult täpselt sümmeetrilise jaotuskõvera keskel, kuna see on graafiku kõrgeim punkt ja vastab kõige tavalisemale väärtusele. Kuna andmekogum on sümmeetriline, vastab see graafiku punkt mediaanile – andmekogumi keskmisele väärtusele – ja keskmisele – andmekogumi keskmisele. Näiteks vaatleme andmekogumit {1, 2, 2, 3, 3, 3, 4, 4, 5}. Kui me joonistaksime selle andmekogumi jaotuse graafiku, saaksime sümmeetrilise kõvera, mis saavutab kõrguse 3, kui x = 3 ja väheneb kõrguseni 1, kui x = 1 ja x = 5. Kuna 3 on Kõige tavalisem väärtus on režiim. Kuna andmestiku kesksel 3-l on mõlemal pool 4 väärtust, on 3 ka mediaan. Lõpuks saadakse andmekogumi keskmine 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3, mis tähendab, et 3 on ka keskmine. Selle reegli erand on sümmeetrilised andmekogumid, millel on rohkem kui üks režiim – kuna antud juhul võib andmestikul olla ainult üks mediaan ja keskmine, ei lange mõlemad režiimid nende teiste punktidega kokku.