Иерархиялык VS Partitional кластердик

Кластерлөө маалыматтарды анализдөө жана ушул сыяктуу маалыматтар боюнча топторго бөлүүнүн үчүн машина окутуу ыкмасы болуп саналат. ушул сыяктуу маалыматтар боюнча бул топтор же топтому кластерлер деп аталат. жазуусу кластерлерди аныктай алат класстерлерди алгоритмдердин боюнча кластердик талдоо карайт. Иерархиялык жана Partitional класстерлерди алгоритмдердин эки класс болуп саналат. Иерархиялык кластердик алгоритмдер кластерлер бир иерархияда үчүн маалыматтарды талкалоо. Paritional алгоритмдер ара кесилишпеген тосмолор салып маалыматтар топтомун бөлүп.

Иерархиялык кластерлөө деген эмне?

Иерархиялык кластердик алгоритмдер да көп адамдар менен аралашып кичинекей кластерлерди же кичинекей балдар да көп кластерлерди бөлүнүп айлампасын кайталап. Кандай болбосун, бул dendogram деп кластерлерди иерархияны чыгарат. Agglomerative кластердик стратегиясы бөлүнүп кластердик стратегиясы чакан үчүн майдалоо жогорудан-төмөн ыкманы колдонуп, ал эми көп адамдарга кластерлерди бириктирүү менен төмөндөн жогору карай мамилени колдонот. Эреже катары, ач көз мамиле көп / аз кластерлерди бөлүнүп / бириктирүү үчүн колдонулганын дагы эле чечим кабыл колдонулат. Euclidean расстояние, Манхэттен аралык жана косинус окшоштук сандык маалыматтардын окшоштуктарын абдан көп колдонулган ченемдер болуп саналат. сандык эмес маалыматтар боюнча, мындай Hamming расстояние ченемдер колдонулат. Бул аралыкта гана Булакта жетиштүү болот, себеби иш жүзүндө байкоолор (учурлар), иерархиялык кластердик үчүн зарыл эмес экенин белгилеп кетүү маанилүү. Dendogram абдан так баскычтарын көрсөтөт кластерлерди, бир көрсөтмө өкүлчүлүгү болуп саналат. Колдонуучу dendogram кыйылып турган даражасына жараша ар кандай кластердик алууга болот.

Partitional кластерлөө деген эмне?

Partitional кластердик алгоритмдер ар кандай бөлүмдөрдү түзүү жана андан кийин кээ бир критерий менен аларга баа берүү. Ошондой эле алар ар бир мисалы к ара өзгөчө кластерлерин так биринде жайгаштырылган эле nonhierarchical деп аталат. кластерлердин бир гана топтому бир типтүү partitional кластердик Алгоритмдин чыгаруу болгондуктан, колдонуучунун киргизмесине кластерлер керектүү санын (адатта к деп аталат) талап кылынат. көбүнчө колдонулган partitional кластердик алгоритмдердин бири алгоритмин класстерлерди к-каражаты болуп саналат. Колдонуучу к тосмолор бышты (к) баштап жана борборлору алгоритмин биринчи баштаган (же centroids) чейин санын камсыз кылуу талап кылынат. Кыскача айтканда, к-каражат алгоритмин класстерлерди анда дайындалган учурдагы мүчөлөрү негизинде учурдагы борборлордун жана кайра баа берүү борборлорунун негизинде мүчөлөрү. Бул эки кадам бир ички кластердик окшоштук объективдүү милдети аралык кластердик эместик объективдүү милдети оптималдаштырылган чейин кайталанат. Ошондуктан, борборлордун эстүү демилгеленген partitional кластердик алгоритмдердин сапаттуу жыйынтыктарды алуу абдан маанилүү болуп саналат.

Иерархиялык жана Partitional кластердик ортосунда кандай айырма бар?

Иерархиялык жана Partitional кластерлөө чуркоо жолу, жол, кириш параметрлер жана пайда кластерлерин негизги айырмачылыктар бар. Эреже катары, partitional кластердик тезирээк иерархиялык кластердик болуп саналат. Иерархиялык кластердик partitional кластердик мындай кластерлерди жана баштапкы борборлордун саны күчтүү түшүнүктөн талап кылат, ал эми бир окшоштугу чараларды талап кылат. Иерархиялык кластердик partitional кластердик алгоритмдер иштеп баштоо үчүн кластерлер санын талап кылат, ал эми ар кандай киргизүү параметрлерин талап кылбайт. так к кластерлерин кластерлер, бирок partitional кластердик жыйынтыгы бир кыйла мааниге ээ жана жекече бөлүмүнүн иерархиялык кластердик кайтат. Иерархиялык кластердик алгоритмдер окшоштук чара жараша аныкталат көп болуп категориялык маалыматтар үчүн ылайыктуу болуп саналат.