Sisu
Andmete komplektile sirgjoone sobitamisel võiksite olla huvitatud sellest, kui hästi saadud tulemus andmetele sobib. Üks viis selleks on ruutude summa (SSE) arvutamine. See väärtus näitab, kui hästi joon sobib kõige paremini andmekogumiga. SSE on oluline katseandmete analüüsi jaoks ja see määratakse kindlaks vaid mõne lühikese sammuga.
Leidke rida, mis sobib andmete modelleerimiseks regressiooni abil kõige paremini. Kõige paremini sobivad read on kujul y = ax + b, kus a ja b on parameetrid, mida peate määrama. Need parameetrid leiate lihtsa lineaarse regressioonanalüüsi abil. Näiteks oletagem, et kõige sobivam rida on kujul y = 0,8x + 7.
Kasutage võrrandit, et määrata iga y-väärtuse väärtus, mida ennustatakse kõige sobivam joon. Selleks võite asendada iga x-väärtuse rea võrrandiga. Näiteks kui x on võrdne 1-ga, siis selle asendamine võrrandisse y = 0,8x + 7 annab y-väärtuseks 7,8.
Määrake kõige sobivama võrrandi joonelt ennustatud väärtuste keskmine väärtus. Selle saate teha, summeerides kõik võrranditest ennustatud y-väärtused ja jagades saadud arvu väärtuste arvuga. Näiteks kui väärtused on 7,8, 8,6 ja 9,4, annab nende väärtuste liitmine 25,8 ja jagades selle arvu väärtuste arvuga 3 sel juhul 8,6.
Lahutage keskväärtusest kõik üksikud väärtused ja saadud arv ruutke ruuduga. Meie näites, kui lahutame väärtuse 7,8 keskmisest 8,6, on saadud arv 0,8. Selle väärtuse ruutumine annab 0,64.
Summeerige kõik etapi 4 ruutväärtused. Kui rakendate 4. näites toodud juhiseid kõigi kolme näite väärtuse jaoks, leiate väärtused 0,64, 0 ja 0,64. Nende väärtuste liitmisel saadakse 1,28. See on ruutude summa viga.