Sisu
Statistikas kasutatakse paljude teguritega keerukate süsteemide iseloomustamiseks Gaussi ehk normaaljaotust. Nagu kirjeldati Stephen Stigleri ajakirjas The History of Statistics, leiutas Abraham De Moivre jaotuse, mis kannab Karl Fredrick Gaussi nime. Gaussi panus seisnes jaotuse rakendamises vähimruutude meetodil, et minimeerida vigasid andmete sobitamisel kõige parema joonega. Ta tegi sellest statistika kõige olulisema vigade jaotuse.
Motivatsioon
Milline on andmete valimi jaotus? Mis saab siis, kui te ei tea andmete levitamise aluseks olevaid andmeid? Kas on mingit võimalust andmete hüpoteeside kontrollimiseks, ilma et oleks teada nende jaotust? Tänu keskse piiri teoreemile on vastus jah.
Teoreemi väide
Selles öeldakse, et lõpmatu populatsiooni valimi keskmine väärtus on ligikaudu normaalne ehk Gaussi väärtus, kusjuures keskmine on sama kui aluseks olev populatsioon ja dispersioon võrdub populatsiooni dispersiooniga, mis on jagatud valimi suurusega. Lähenemine paraneb, kuna valimi suurus suureneb.
Lähenemislause normaaljaotusele lähenemise kohta on mõnikord valesti esitatud. Kuna ligikaudne normaaljaotus muutub valimi suuruse kasvades, on selline väide eksitav.
Teoreemi töötas välja Pierre Simon Laplace.
Miks see on kõikjal
Normaalne jaotus on kõikjal olemas. Põhjus pärineb keskse piiri teoreemist. Sageli on väärtuse mõõtmisel paljude sõltumatute muutujate summaarne efekt. Seetõttu on mõõdetaval väärtusel iseenesest valimi keskmine. Näiteks võib sportlaste esinemiste jaotusel olla kelluke kuju, mis on tingitud erinevustest toitumises, treenimises, geneetikas, juhendamises ja psühholoogias. Isegi meeste kõrgused on normaaljaotusega, sõltudes paljudest bioloogilistest teguritest.
Gaussi kopulad
Seda, mida Gaussi jaotusega nn kopulafunktsiooniks nimetatakse, oli 2009. aasta uudis, kuna seda kasutati tagatud võlakirjadesse investeerimise riski hindamisel. Funktsiooni kuritarvitamine oli oluline finantskriisi ajal aastatel 2008–2009. Ehkki kriisil oli palju põhjuseid, ei oleks tagantjärgi Gaussi jaotusi tõenäoliselt tulnud kasutada. Paksema sabaga funktsioon oleks ebasoodsate sündmuste tõenäosuse suuremaks määranud.
Tuletus
Keskpiiril põhinevat teoreemi saab tõestada paljudes ridades, analüüsides momendi tekitavat funktsiooni (mgf) (valimi keskmine - populatsiooni keskmine) / a (populatsiooni dispersioon / valimi suurus) kui aluseks oleva populatsiooni mgf funktsiooni. Teoreemi ligikaudse osa sissejuhatuseks laiendatakse aluspopulatsiooni mgf-i võimsuse seeriana, mis näitab enamiku mõistete tähtsust, kuna valimi suurus muutub suureks.
Seda saab tõestada palju vähem ridu, kasutades sama funktsiooni iseloomulikul võrrandil Taylori laiendamist ja muutes valimi suuruseks.
Arvutuslik mugavus
Mõne statistilise mudeli puhul eeldatakse, et vead on Gaussi vead. See võimaldab hüpoteesi testimisel kasutada normaalmuutujate funktsioonide jaotusi, nagu näiteks chi-ruut ja F-jaotus. Täpsemalt, F-testis koosneb F-statistika chi-ruutjaotuse suhtest, mis ise on normaalse dispersiooniparameetri funktsioonid. Nende kahe suhe põhjustab variatsiooni kadumise, võimaldades hüpoteesi kontrollimist, ilma et oleks teada variatsioone peale nende normaalsuse ja püsivuse.