Иерархическая кластеризация
Типы иерархической кластеризации
Расстояние на практике
Агломеративная кластеризация Ланса-Уильямса
Свойство монотонности
Свойства растяжения и сжатия
Свойство редуктивности
Быстрая агломеративная кластеризация на основе редуктивности
Определение числа кластеров
Достоинства и недостатки
Источники
Спасибо за внимание!
313.85K
Категория: МатематикаМатематика

Иерархическая кластеризация

1. Иерархическая кластеризация

Камалов М.В.

2.

• Иерархическая кластеризация – алгоритмы
таксономии (биологическая таксономия)
• Дендограмма
• Многомерное шкалирование
• Карты Кохонена

3. Типы иерархической кластеризации

• Дивизимный (нисходящий)
• Алгомеративный (восходящий)

4.

Расстояния между кластерами
• Для одноэлементных кластеров
• Универсальная формула расстояние между
кластерами. Ланс и Уильямс 1967 году

5. Расстояние на практике

6. Агломеративная кластеризация Ланса-Уильямса

7. Свойство монотонности

• Теорема Миллигана 1997г.
• Из перечисленных выше
монотонным
не является

8. Свойства растяжения и сжатия


Растягивающие
Сжимающие
Сохраняющие метрику пространства
Определяется через отношение
Гибкое расстояние

9. Свойство редуктивности

• Ускорение алгоритма кластеризации
• Определение Брюиноша 1978г.
• Теорема Диде и Моро 1984г.

10. Быстрая агломеративная кластеризация на основе редуктивности

11. Определение числа кластеров

• Число кластеров
• Ограничение
• Выбор количество t множеств

12. Достоинства и недостатки

• Метод ближнего соседа обладает
цепочечным эффектом
• Метод дальнего соседа на раннем этапе
может объединять довольно несхожие
группы
• Метод расстояние между центрами масс
«золотая середина»
• Метод Уорда чаще восстанавливает
наилучшую кластеризацию

13. Источники

• http://www.ccas.ru/voron/download/Clusteri
ng.pdf
• https://yadi.sk/i/MelajPEXcG84H
• http://logic.pdmi.ras.ru/~sergey/teaching/ml/
11-cluster.pdf

14. Спасибо за внимание!

English     Русский Правила