Mis on lihtne lineaarne regressioon?

Lihtne lineaarne regressioon kehtib statistika kohta ja aitab kirjeldada (x, y) andmeid, millel näib olevat lineaarne seos, võimaldades y teatud prognoosimist, kui x on teada. Need andmed kantakse sageli hajuvusgraafikutele ja lineaarse regressiooni valem loob sirge, mis sobib kõige paremini kõikide punktidega, eeldusel, et neil on tõesti lineaarne korrelatsioon. See ei mahu täpselt kõikidele punktidele, kuid see peaks olema joon, kus tegelike andmete ja eeldatavate andmete (jääkide) erinevuse ruutude summa loob väikseima arvu, mida sageli nimetatakse vähimruutude jooneks või jooneks. parim sobivus. Valimiandmete ja populatsiooniandmete sirge võrrand on järgmine: y = b0 + b1x ja Y = B0 + B1x.

Igaüks, kes tunneb algebrat, võib märgata selle sirge sarnasust y = mx + b-ga ja tegelikult on need kaks suhteliselt identsed, välja arvatud kaks võrrandi paremal küljel olevat liiget, nii et B1 võrdub kaldega või m. Selle ümberkorraldamise põhjuseks on see, et seejärel on elegantselt lihtne lisada täiendavaid termineid koos funktsioonidega, nagu eksponendid, mis võivad kirjeldada erinevaid mittelineaarseid seoseid.

Lihtsa lineaarse regressioonijoone saamise valemid on suhteliselt keerulised ja tülikad ning enamik inimesi ei kuluta nende üleskirjutamisele palju aega, kuna nende täitmine võtab kaua aega. Selle asemel saavad erinevad programmid, näiteks Exceli või mitut tüüpi teaduslike kalkulaatorite jaoks, hõlpsasti arvutada vähimruutude rea. Rida sobib ennustamiseks ainult siis, kui on selgeid tõendeid tugeva korrelatsiooni kohta (x,y) andmehulkade vahel. Kalkulaator loob rea olenemata sellest, kas seda on mõtet kasutada.

Samal ajal luuakse lihtne lineaarse regressioonijoone võrrand, inimesed peavad vaatama korrelatsioonitaset. See tähendab korrelatsioonikordaja r hindamist väärtuste tabeli alusel, et teha kindlaks, kas lineaarne korrelatsioon on olemas. Lisaks on andmete hindamine hajuvusdiagrammina joonistades hea viis saada aimu, kas andmetel on lineaarne seos.

Mida saab siis teha lihtsa lineaarse regressioonijoonega, eeldusel, et sellel on lineaarne korrelatsioon, on see, et väärtused saab asendada x-ga, et saada y ennustatud väärtus. Sellel ennustusel on oma piirid. Olemasolevatel andmetel, eriti kui tegemist on vaid näidisega, võib praegu olla lineaarne korrelatsioon, kuid hiljem täiendava proovimaterjali lisamisega ei pruugi see olla.

Teise võimalusena võib kogu valim jagada korrelatsiooni, samas kui terve populatsioon seda ei tee. Seetõttu on ennustamine piiratud ja olemasolevatest andmeväärtustest palju kaugemale jõudmist nimetatakse ekstrapoleerimiseks ja seda ei soovitata. Veelgi enam, kas inimesed peaksid teadma, et kui lineaarne korrelatsioon puudub, on x parim hinnang kõigi y andmete keskmine.

Põhimõtteliselt on lihtne lineaarne regressioon kasulik statistiline tööriist, mida saab oma äranägemise järgi kasutada y väärtuste ennustamiseks ax väärtuse põhjal. Seda õpetatakse peaaegu alati lineaarse korrelatsiooni ideega, kuna regressioonijoone kasulikkuse määramine nõuab r analüüsi. Õnneks saavad inimesed paljude kaasaegsete tehniliste programmidega joonistada hajuvusgraafikuid, lisada regressioonijooni ja määrata paari kirjega korrelatsioonikordaja r.

SmartAsset.