Sisu
- Vajalike andmete tüüp
- Sobivuse test
- Chi-ruudu statistika arvutamine
- Chi-Square'i statistika tõlgendamine
Katsed testivad ennustusi. Need prognoosid on sageli arvulised, mis tähendab, et teadlaste andmete kogumisel eeldatakse, et numbrid lagunevad teatud viisil. Reaalse maailma andmed vastavad harva teadlaste ennustustele, seega vajavad teadlased testi, et selgitada, kas erinevus vaadeldava ja eeldatava arvu vahel on juhusliku juhu või mõne ettenägematu teguri tõttu, mis sunnib teadlast selle aluseks olevat teooriat kohandama . Chi-square test on statistiline vahend, mida teadlased kasutavad selleks.
Vajalike andmete tüüp
Chi-square testi kasutamiseks vajate kategoorilisi andmeid. Kategooriliste andmete näide on küsimusele "jah" vastanud inimeste arv võrreldes küsimusega "ei" vastanud inimeste arvuga (kaks kategooriat) või roheliste, kollaste või hallide elanike konnade arvuga (roheline, kollane või hall) ( kolm kategooriat). Pidevate andmete puhul ei saa kasutada chi-square-testi, nagu näiteks uuringu käigus kogutud küsitlus, mille käigus küsitakse inimestelt, kui pikk ta on. Sellisest küsitlusest saaksite mitmesuguseid kõrgusi. Kui aga jagate kõrgused kategooriateks, nagu näiteks “alla 6 jalga pikk” ja “6 jalga pikk, üle selle”, võiksite andmete põhjal kasutada chi-square testi.
Sobivuse test
Sobivuse test on tavaline ja võib-olla ka kõige lihtsam test, mille puhul kasutatakse chi-square statistikat. Sobivuse testis teeb teadlane konkreetse prognoosi numbrite kohta, mida ta loodab näha oma andmete igas kategoorias. Seejärel kogub ta reaalmaailma andmeid - nn vaatlusandmeid - ja kasutab chi-square testi, et näha, kas vaadeldud andmed vastavad tema ootustele.
Kujutage näiteks ette, et bioloog uurib konnaliigi pärimisharjumusi. Konnavanemate komplekti 100 järglase hulgas lubab bioloogide geneetiline mudel oodata 25 kollast, 50 rohelist ja 25 halli järglast. Mida ta tegelikult täheldab, on 20 kollast järglast, 52 rohelist ja 28 halli järglast. Kas tema ennustus on toetatud või on tema geneetiline mudel vale? Ta saab seda teada saada chi-square testi abil.
Chi-ruudu statistika arvutamine
Alustage chi-ruutstatistika arvutamist, lahutades iga eeldatava väärtuse vastavast vaadeldavast väärtusest ja korrutades iga tulemuse. Konna järglaste näite arvutus näeks välja järgmine:
kollane = (20 - 25) ^ 2 = 25 roheline = (52 - 50) ^ 2 = 4 hall = (28 - 25) ^ 2 = 9
Nüüd jagage iga tulemus vastava oodatava väärtusega.
kollane = 25 ÷ 25 = 1 roheline = 4 ÷ 50 = 0,08 hall = 9 ÷ 25 = 0,36
Lõpuks lisage kokku eelmise sammu vastused.
chi-ruut = 1 + 0,08 + 0,36 = 1,44
Chi-Square'i statistika tõlgendamine
Chi-square statistika näitab, kui erinevad olid teie vaadeldud väärtused prognoositud väärtustest. Mida suurem arv, seda suurem on erinevus. Saate kindlaks teha, kas teie ruutväärtus on liiga kõrge või madal, et ennustust toetada, nähes, kas see on alla teatud väärtuse kriitiline väärtus chi-ruudu jaotustabelil. See tabel vastab chi-ruudu väärtustele tõenäosustega, mida nimetatakse p-väärtused. Täpsemalt, tabel näitab teile tõenäosust, et vaadeldud ja eeldatavate väärtuste erinevused tulenevad lihtsalt juhuslikust juhusest või sellest, kas on mõni muu tegur. Sobivuse testi jaoks, kui p-väärtus on 0,05 või väiksem, peate oma ennustuse tagasi lükkama.
Peate määrama vabadusastmeid (df) oma andmetes, enne kui saate jaotustabelist otsida kriitilist chi-ruudu väärtust. Vabadusastmed arvutatakse, lahutades teie andmetes kategooriate arvust 1. Selles näites on kolm kategooriat, seega on 2 vabadusastet. Pilk sellele chi-ruutjaotustabelile ütleb teile, et 2 vabadusastme korral on 0,05 tõenäosuse kriitiline väärtus 5,99. See tähendab, et seni kuni teie arvutatud chi-ruudu väärtus on väiksem kui 5,99, on teie eeldatavad väärtused ja seega ka aluseks olev teooria kehtiv ja toetatud. Kuna konna järglaste andmete chi-ruudu statistika oli 1,44, võib bioloog nõustuda tema geneetilise mudeliga.