Kuidas leida tsentroidi klastrianalüüsis

Posted on
Autor: Judy Howell
Loomise Kuupäev: 1 Juuli 2021
Värskenduse Kuupäev: 15 November 2024
Anonim
Kuidas leida tsentroidi klastrianalüüsis - Teadus
Kuidas leida tsentroidi klastrianalüüsis - Teadus

Sisu

Klastrianalüüs on meetod andmete järjestamiseks sarnaste tunnuste alusel esindusrühmadesse. Igal klastri liikmel on rohkem ühist sama klastri teiste liikmetega kui teiste rühmade liikmetega. Rühma kõige esinduslikumat punkti nimetatakse tsentroidiks. Tavaliselt on see klastri andmepunktide väärtuste keskmine.


    Korrastage andmed. Kui andmed koosnevad ühest muutujast, võib olla sobiv histogramm. Kui tegemist on kahe muutujaga, joonistage andmed koordinaaditasandil. Näiteks kui vaatate klassiruumis koolinoorte kõrgust ja kaalu, joonistage graafikul iga lapse andmepunktid nii, et kaal oleks horisontaaltelg ja kõrgus vertikaaltelg. Kui kaasatud on rohkem kui kaks muutujat, võib andmete kuvamiseks vaja minna maatriksit.

    Rühmitage andmed klastritesse. Iga klaster peaks koosnema sellele lähimatest andmepunktidest. Kõrguse ja kaalu näites grupeerige kõik punktid, mis näivad olevat lähestikku. Klastrite arv ja see, kas iga andmepunkt peab paiknema klastris, võib sõltuda uuringu eesmärkidest.

    Lisage iga klastri jaoks kõigi liikmete väärtused.Näiteks kui andmete klaster koosneks punktidest (80, 56), (75, 53), (60, 50) ja (68,54), oleks väärtuste summa (283, 213).

    Jagage koguarv klastri liikmete arvuga. Ülaltoodud näites on neljaga jagatud 283 väärtuseks 70,75 ja 213 jagatud neljaga jagatud väärtuseks 53,25, seega klastri keskpunkt on (70,75, 53,25).


    Joonistage klastri tsentrid ja määrake, kas mõni punkt asub mõne teise klastri tsentridile lähemal kui nende enda klastri tsentrid. Kui mõni punkt asub mõnele teisele keskpunktile lähemal, jagage need ümber klastri, mis sisaldab lähemat keskpunkti.

    Korrake 3., 4. ja 5. toimingut, kuni kõik andmepunktid asuvad klastris, mille keskpunkt on neile lähim.

    Näpunäited