Lineaarse regressiooni puudused

Posted on
Autor: Peter Berry
Loomise Kuupäev: 19 August 2021
Värskenduse Kuupäev: 13 November 2024
Anonim
Webinar KUKA ConveyorTech
Videot: Webinar KUKA ConveyorTech

Sisu

Lineaarne regressioon on statistiline meetod sõltuva muutuja vahelise seose uurimiseks, mida tähistatakse kui y, ja üks või mitu sõltumatut muutujat, tähistatud kui x. Sõltuv muutuja peab olema pidev, nii et see võib võtta mis tahes väärtuse või vähemalt pideva lähedal. Sõltumatud muutujad võivad olla mis tahes tüüpi. Ehkki lineaarne regressioon ei saa ise põhjuslikku seost näidata, mõjutavad sõltumatud muutujad tavaliselt sõltuvat muutujat.


Lineaarne regressioon piirdub lineaarsete suhetega

Oma olemuselt vaatab lineaarne regressioon ainult lineaarseid seoseid sõltuvate ja sõltumatute muutujate vahel. See tähendab, et eeldatakse, et nende vahel on sirgjooneline suhe. Mõnikord on see vale. Näiteks sissetuleku ja vanuse suhe on kõver, s.t sissetulek kipub täiskasvanueas tõusma, hilisemas täiskasvanueas lahenema ja pärast inimeste pensionile jäämist vähenema. Suhete graafiliste kujutiste abil saate teada, kas see on probleem.

Ainult lineaarne regressioon vaatab sõltuva muutuja keskmist

Lineaarne regressioon vaatleb suhet sõltuva muutuja keskmise ja sõltumatute muutujate vahel. Näiteks kui vaadata imikute sünnikaalu ja emade omaduste, näiteks vanuse vahelist seost, siis lineaarse regressiooniga võetakse arvesse erinevas vanuses emadele sündinud imikute keskmist kaalu. Kuid mõnikord peate vaatama sõltuva muutuja äärmusi, nt kui imikud on ohus, kui nende kaal on väike, nii et soovite vaadata selle näite äärmusi.


Nii nagu keskmine ei ole ühe muutuja täielik kirjeldus, pole ka lineaarne regressioon muutujate vaheliste seoste täielik kirjeldus. Selle probleemiga saab hakkama kvantitatiivse regressiooni abil.

Lineaarne regressioon on kõrvalnähtude suhtes tundlik

Kõrvalekalded on üllatavad andmed. Kõrvalekalded võivad olla ühe- ja mitme muutujaga (põhinevad ühel muutujal). Kui vaadata vanust ja sissetulekut, võiksid muutumatuteks välisnäitajateks olla näiteks 118-aastane inimene või see, kes teenis eelmisel aastal 12 miljonit dollarit. Mitmemõõtmeline välismaalane oleks 18-aastane inimene, kes teenis 200 000 dollarit. Sel juhul ei ole vanus ega sissetulek väga ekstreemne, kuid väga vähesed 18-aastased inimesed teenivad nii palju raha.

Kõrvalised väärtused võivad regressioonile tohutult mõjuda. Selle probleemiga saab hakkama, kui taotlete mõjutustatistikat oma statistiliselt tarkvaralt.


Andmed peavad olema sõltumatud

Lineaarne regressioon eeldab, et andmed on sõltumatud. See tähendab, et ühe subjekti (näiteks inimese) hinded ei ole midagi pistmist teise subjekti hindega. See on sageli, kuid mitte alati, mõistlik. Kaks levinud juhtumit, kus sellel pole mõtet, on ruumis ja ajas klastrid.

Klassikaline näide klastrite moodustamisest kosmoses on õpilaste testide hinded, kui teil on õpilasi erinevatest klassidest, klassidest, koolidest ja koolirajoonidest. Sama klassi õpilased kipuvad olema mitmes mõttes sarnased, s.t nad on sageli pärit samadest linnaosadest, neil on samad õpetajad jne. Seega ei ole nad iseseisvad.

Ajalised rühmitused on näiteks uuringud, kus mõõdetakse samu subjekte mitu korda. Näiteks võiksite toitumise ja kehakaalu uuringus iga inimest mitu korda mõõta. Need andmed ei ole sõltumatud, kuna see, mida inimene ühel korral kaalub, on seotud sellega, mida ta kaalub muudel juhtudel. Üks võimalus sellega toime tulla on mitmetasandilised mudelid.