Sisu
Mitme sõltumatu muutuja ja sõltuva muutuja vahelise seose uurimiseks kasutatakse mitmekordset regressiooni. Kuigi mitmed regressioonimudelid võimaldavad teil analüüsida nende sõltumatute või ennustavate muutujate suhtelisi mõjusid sõltuval või kriteeriumi muutujal, võivad need sageli keerulised andmekogumid põhjustada valejäreldusi, kui neid ei analüüsita õigesti.
Mitme regressiooni näited
Kinnisvaramaakler võiks majade väärtuse analüüsimiseks kasutada mitut regressiooni. Näiteks võiks ta kasutada iseseisvate muutujatena majade suurust, vanust, magamistubade arvu, naabruses asuva keskmise kodu hinda ja koolide lähedust. Kaardistades need mitme regressioonimudeliga, saaks ta neid tegureid kasutada, et näha nende seost kodude hindadega kui muutujat.
Teine näide mitme regressioonimudeli kasutamisest võiks olla keegi personalijuhtimises ametikohtade palka määravast kriteeriumikriteeriumist. Ennustavateks muutujateks võivad olla iga juhi staaž, keskmine töötundide arv, hallatavate inimeste arv ja juhtide osakonna eelarve.
Mitme regressiooni eelised
Andmete analüüsimisel mitme regressioonimudeli abil on kaks peamist eelist. Esimene on võime määrata ühe või mitme ennustava muutuja suhteline mõju kriteeriumi väärtusele. Kinnisvaramaakler võiks leida, et kodude suurusel ja magamistubade arvul on tugev seos kodu hinnaga, samas kui koolide lähedusel puudub igasugune korrelatsioon või isegi negatiivne korrelatsioon, kui tegemist on peamiselt pensioniga kogukond.
Teine eelis on võime tuvastada kõrvalekaldeid ehk kõrvalekaldeid. Näiteks juhtkonna palkadega seotud andmeid üle vaadates leidis personalijuht, et töötundide arv, osakonna suurus ja selle eelarve olid palgaga tugevalt seotud, tööstaaž aga mitte. Teise võimalusena võib juhtuda, et kõik loetletud ennustaja väärtused olid korrelatsioonis iga uuritava palgaga, välja arvatud ühe juhi puhul, kellele maksti teistega võrreldes liiga palju.
Mitme regressiooni puudused
Mitme regressioonimudeli kasutamise miinused taanduvad tavaliselt kasutatavatele andmetele. Kaks näidet selle kohta on mittetäielike andmete kasutamine ja ekslik järeldus, et korrelatsioon on põhjuslik.
Näiteks oletame, et kinnisvaramaakler vaatas kodude hinda üle vaadates vaid 10 kodu, millest seitse ostsid noored vanemad. Sel juhul võib koolide läheduse suhe arvata, et see mõjutas kõigi kogukonnas müüdavate kodude müügihinda. See illustreerib puudulike andmete puudusi. Kui ta oleks kasutanud suuremat valimit, oleks ta võinud leida, et sajast müüdud kodust oli vaid kümme protsenti kodu väärtustest seotud kooli lähedusega. Kui ta oleks ostjate vanust ennustava väärtusena kasutanud, oleks ta võinud leida, et nooremad ostjad olid nõus maksma kogukonna kodude eest rohkem kui vanemad ostjad.
Juhtkonna palkade näitel oletagem, et oli üks kõrvaline isik, kellel oli väiksem eelarve, vähem tööstaaži ja vähem hallatavat personali, kuid kes teenis rohkem kui keegi teine. Personalijuht võiks andmed üle vaadata ja järeldada, et sellele inimesele makstakse enam. See järeldus oleks siiski ekslik, kui ta ei võtaks arvesse, et see juht vastutab ettevõtte veebisaidi eest ja omab võrguturbe alal väga ihaldatud oskusi.