Sisu
Klastrianalüüs ja faktoranalüüs on kaks andmeanalüüsi statistilist meetodit. Neid kahte analüüsivormi kasutatakse laialdaselt loodus- ja käitumisteadustes. Nii klastrianalüüs kui ka tegurianalüüs võimaldavad kasutajal sõltuvalt analüüsi tüübist rühmitada andmed osadeks klastriteks või teguriteks. Mõnede klastrite ja faktorianalüüside meetoditega tutvunud teadlaste arvates võivad need kaks analüüsi tüüpi olla üldiselt sarnased. Kuigi klastrianalüüs ja tegurianalüüs näivad pinnalt sarnased, erinevad nad mitmel viisil, sealhulgas nende üldiste eesmärkide ja rakenduste osas.
Objektiivne
Klastrianalüüsil ja faktorianalüüsil on erinevad eesmärgid. Faktorianalüüsi tavaline eesmärk on selgitada korrelatsiooni andmestikus ja seostada muutujaid üksteisega, samas kui klastrianalüüsi eesmärk on käsitleda iga andmekogumi heterogeensust. Vaimus on klastrianalüüs kategoriseerimise vorm, tegurianalüüs aga lihtsustamise vorm.
Keerukus
Keerukus on üks küsimus, mille osas faktoranalüüs ja klastrianalüüs erinevad: andmete suurus mõjutab iga analüüsi erinevalt. Andmekogumi kasvades muutub klastrianalüüs arvutuslikult raskesti teostatavaks. See on tõsi, kuna klastrianalüüsis olevate andmepunktide arv on otseselt seotud võimalike klastrilahenduste arvuga. Näiteks on kahekümne objekti jagamiseks 4 võrdse suurusega klastriks üle 488 miljoni viisi. See muudab otsese arvutusmeetodi, sealhulgas meetodikategooria, kuhu faktoranalüüs kuulub, võimatuks.
Lahendus
Ehkki nii faktoranalüüsi kui ka klastrianalüüsi probleemide lahendused on mingil määral subjektiivsed, võimaldab faktorianalüüs teadlasel leida “parima” lahenduse selles mõttes, et teadlane saab optimeerida lahenduse teatud aspekti (ortogonaalsus, lihtsus tõlgendamine ja nii edasi). See ei kehti klastrianalüüsi puhul, kuna kõik algoritmid, mis võiksid anda parima klastrianalüüsi lahenduse, on arvutuslikult ebaefektiivsed. Seetõttu ei suuda klastrianalüüsi kasutavad teadlased optimaalset lahendust tagada.
Rakendused
Faktorianalüüs ja klastrianalüüs erinevad selle poolest, kuidas neid rakendatakse tegelike andmete suhtes. Kuna faktoranalüüsil on võime redutseerida koormamatu muutujate kogum palju väiksemaks tegurite kogumiks, sobib see keerukate mudelite lihtsustamiseks. Faktorianalüüsil on ka kinnitav kasutus, mille puhul teadlane saab välja töötada hüpoteeside komplekti selle kohta, kuidas andmete muutujad on omavahel seotud. Seejärel saab teadlane käivitada andmekogumiga faktoranalüüsi, et neid hüpoteese kinnitada või ümber lükata. Klastrianalüüs seevastu sobib objektide klassifitseerimiseks vastavalt teatud kriteeriumidele. Näiteks saab teadlane klastrianalüüsi abil mõõta äsja avastatud taimede rühma teatud aspekte ja paigutada need taimed liikide kategooriasse.