Mis on viltune jaotus?

Kaldus jaotus viitab tõenäosusjaotusele, mis on olemuselt ebaühtlane ja asümmeetriline. Erinevalt standardsest normaaljaotusest, mis meenutab kujult kellakõverat, on kallutatud jaotused nihutatud ühele küljele, kusjuures ühel küljel on mediaani teise külje suhtes pikem saba. Kõvera teisel poolel on väärtuste rühmitatud tipp, kus esineb enamik andmepunkte. Seda tüüpi jaotuskõver klassifitseeritakse tavaliselt kas positiivse või negatiivse kaldega, olenevalt kõvera nihke suunast.

Üldiselt öeldakse, et viltune jaotus omab positiivset viltu, kui kõvera saba on parempoolses osas pikem kui vasakpoolne. Seda kallutatud jaotust nimetatakse ka paremale kalduks, kuna paremal küljel on andmepunktide laiem laiend. Positiivsetel kaldkõveratel on suurim arv väärtusi kõvera vasaku poole suunas.

Seevastu negatiivselt kallutatud jaotustel on kõige rohkem andmepunkte kõvera paremal küljel. Nendel kõveratel on vasakpoolsed sabad pikemad, nii et väidetavalt on need vasakule kaldu. Kaldumissuuna määramisel on oluline reegel võtta arvesse pigem saba pikkust kui keskmise või mediaani asukohta. Selle põhjuseks on asjaolu, et kalduvus on lõpuks põhjustatud kõige kaugematest väärtustest, mis venitavad kõverat graafiku selle poole suunas.

Kallutatud jaotuse omaduste mõistmine on paljudes statistikarakendustes oluline. Paljud inimesed eeldavad, et andmed järgivad kellakõverat ehk normaaljaotust, seega eeldavad nad ka, et graafikul on nulli kalduvus. Need eeldused võivad aga viia selleni, et nad tõlgendavad teavet tegeliku jaotuse kohta valesti.

Kaldus jaotus on oma olemuselt ebaühtlane, mistõttu see ei järgi standardseid tavalisi mustreid, näiteks standardhälvet. Normaaljaotused hõlmavad üht standardhälvet, mis kehtib kõvera mõlemale küljele, kuid kallutatud jaotustel on kõvera mõlemal küljel erinevad standardhälbe väärtused. Selle põhjuseks on asjaolu, et kaks külge ei ole üksteise peegelpildid, mistõttu ei saa ühte poolt kirjeldavaid võrrandeid teisele rakendada. Pikema sabaga poole puhul on standardhälbe väärtus üldiselt suurem, kuna sellel poolel on lühema sabaga võrreldes laiem andmete levik.