Mis on heteroskedastilisus?

Heteroskedastilisus on statistiline termin, mida kasutatakse valimi dispersiooni ja standardhälbe käitumise kirjeldamiseks. Kui kvaliteet on olemas, siis ei ole muutuja dispersioon ja standardhälve kogu valimiandmete graafiku ulatuses konstantsed. Kui need mõõdud on püsivad, siis öeldakse, et andmed on homoskedastilised.

Muutuja dispersioon on mõõt selle kohta, kui kaugele on vaadeldud väärtused hajutatud keskmisest ehk keskmisest väärtusest. Standardhälve on dispersiooni ruutjuur ja seda kasutatakse sageli jaotuste kirjeldamiseks. Tšebõševi teoreemiga kirjeldatud seose kohaselt peab teatud protsent andmeid jääma iga standardhälbe piiresse keskmisest väärtusest. Näiteks peab vähemalt 75 protsenti valimi andmepunktidest olema keskmisest kahe standardhälbe piires. Seega annab valimi standardhälve ligikaudset teavet iga andmepunkti suhtelise asukoha kohta.

Heteroskedastilisust on kahte tüüpi: tingimuslik ja tingimusteta. Kui andmed on tinglikult heteroskedastilised, ei oska analüütikud ennustada, millal on andmed rohkem hajutatud ja millal vähem hajutatud. See kehtib finantstoodete, sealhulgas aktsiate hindade kohta.

Tingimusteta heteroskedastilisus on etteaimatav. Seda omadust näitavad tavaliselt muutujad, mis on oma olemuselt tsüklilised. Muutujad, mille dispersioon muutub koos tasemega, on samuti tingimusteta heteroskedastilised. Näiteks võite ennustada, et kui suudate midagi käes hoida, saate selle kaalu üsna täpselt mõõta; võite olla kõige rohkem mõne naela või kilogrammi alla. Kui teil palutakse hinnata hoone kaalu, võite siiski olla tuhandete naelte või kilogrammide võrra vale – teie oletuse dispersioon suureneb prognoositavalt koos objekti kaaluga.

See, kas heteroskedastilisus esineb või mitte, mõjutab andmete statistilise analüüsi õiget tõlgendamist. Kvaliteet ei mõjuta regressiooni; see tähendab, et kõige sobivamate graafikute paigutamise meetodid töötavad võrdselt hästi nii heteroskedastiliste kui ka homoskedastiliste andmetega. Need graafikud luuakse andmete koefitsientide leidmisega, mis mõõdavad, kui palju konkreetne muutuja tulemust mõjutab. Heteroskedastilisus moonutab mudelite tagastatud koefitsientide dispersiooni väärtusi.

On mitmeid matemaatilisi teste, mille abil saab kindlaks teha, kas muutuja valimil esineb heteroskedastilisust. Paljud neist testidest on saadaval statistikaanalüüsi tarkvaras. Vaatleja saab tuvastada mõningaid heteroskedastilisuse juhtumeid ka valimi graafikut vaadates. Otsige graafikult enam-vähem hajutatud alasid; Siiski on oluline teha vahet hajumise hulga tõelistel variatsioonidel ja klastritel, mida oodatakse juhuslikkuse elemendiga jaotustes.