Sisu
Jaotusgraafik on graafik, mis näitab seost kahe andmekogumi vahel. Mõnikord on kahe muutuja vahelise matemaatilise seose saamiseks kasulik kasutada hajutatud graafikul sisalduvaid andmeid. Jaotusgraafiku võrrandi saab käsitsi, kasutades ühte kahest peamisest viisist: graafilist tehnikat või tehnikat, mida nimetatakse lineaarseks regressiooniks.
Hajumiskaardi loomine
Hajakrundi loomiseks kasutage graafikpaberit. Joonistage x- ja y-teljed, veenduge, et need lõikuvad ja märgistavad päritolu. Veenduge, et ka x- ja y-teljel oleksid õiged pealkirjad. Seejärel joonistage graafikus iga andmepunkt. Kõik suundumused joonestatud andmekogumite vahel peaksid nüüd ilmnema.
Parima sobivuse rida
Kui hajutusgraafik on loodud, eeldades, et kahe andmekogumi vahel on lineaarne korrelatsioon, võime võrrandi saamiseks kasutada graafilist meetodit. Võtke joonlaud ja tõmmake joon kõigile punktidele võimalikult lähedale. Proovige tagada, et joone kohal oleks nii palju punkte kui joone all. Kui joon on tõmmatud, kasutage sirgjoone võrrandi leidmiseks standardmeetodeid
Sirge võrrand
Kui hajutatud graafikule on asetatud kõige sobivam joon, on võrrandi leidmine lihtne. Sirgjoone üldvõrrand on järgmine:
y = mx + c
Kus m on joone kalle (gradient) ja c on y-ristlõige. Gradiendi saamiseks leidke joonelt kaks punkti. Oletame selle näite huvides, et kaks punkti on (1,3) ja (0,1). Gradiendi arvutamiseks võetakse y-koordinaatide erinevus ja jagatakse x-koordinaatide erinevusega:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Gradient on sel juhul võrdne 2. Siiani on sirge võrrand
y = 2x + c
C väärtuse saab teada oleva punkti väärtuste asendamise teel. Näite järel on üks teadaolevatest punktidest (1,3). Ühendage see võrrandiga ja paigutage c ümber:
3 = (2 * 1) + c
c = 3 - 2 = 1
Lõplik võrrand on sel juhul järgmine:
y = 2x + 1
Lineaarne regressioon
Lineaarne regressioon on matemaatiline meetod, mida saab kasutada hajuvusgraafiku sirgjoone võrrandi saamiseks. Alustuseks pange oma andmed tabelisse. Oletame selle näite puhul, et meil on järgmised andmed:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Arvutage x-väärtuste summa:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Seejärel arvutage y-väärtuste summa:
y_sum = 2,2 + 4,4 + 10,4 = 17
Nüüd summeerige iga andmepunkti komplekti tooted:
xy_sum = (4,1 * 2,2) + (6,5 * 4,4) + (12,6 * 10,4) = 168,66
Seejärel arvutage ruudus x-väärtuste ja y-väärtuste summa:
x_square_sum = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y_square_sum = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Lõpuks loendage andmepunktide arv. Sel juhul on meil kolm andmepunkti (N = 3). Parima sobivuse joone gradiendi saab:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23,2 * 17) / (3 * 217,82) - (23,2 * 23,2) = 0,968
Sobivaima joone pealtkuulamise saab:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Lõplik võrrand on seega:
y = 0,968x - 1,82