КЛАСТЕРНЫЙ АНАЛИЗ
Сегментация потребителей
Меры расстояния между объектами
Расстояние между кластерами
Качество классификации
Классификация методов
Иерархические агломеративные методы
Иерархические дивизимные методы
Итеративный метод k-средних
448.00K
Категория: СоциологияСоциология

Кластерный анализ

1. КЛАСТЕРНЫЙ АНАЛИЗ

План:
1. Общие сведения о кластеризации:
1.1. Понятие о кластеризации. Примеры.
1.2. Меры сходства объектов и кластеров.
1.3. Качество классификации.
1.4. Классификация методов кластерного анализа.
2. Кластеризация в SPSS:
2.1. Иерархическая кластеризация. Анализ
результатов.
2.2. Кластеризация k-средними. Интерпретация
результатов
2.3. Двухэтапный кластерный анализ.
3. Практикум

2.

Признак Y
50
испытуемый
признак X
признак Y
45
A
27
19
B
11
46
C
25
15
35
D
36
27
30
E
35
25
F
10
43
G
11
44
20
H
36
24
15
I
26
14
J
26
14
K
9
45
5
L
33
23
0
M
27
16
40
25
10
5
10
N
15
20
10
25
30
47
35
Признак X
40

3. Сегментация потребителей

4. Меры расстояния между объектами

Евклидово расстояние:
d ij
m
2
(
x
x
)
ik jk
k 1
Взвешенное евклидово расстояние:
d ij
Расстояние Минковского:
m
2
w
(
x
x
)
k ik jk
k 1
m
d ij ( x ik x jk
Расстояние city-block:
k 1
m
d ij x ik x jk
k 1
p 1/ p
)

5. Расстояние между кластерами

а) метод «ближнего соседа»
б) метод «дальнего соседа»
в) центроидный метод
г) метод межгрупповых связей
в
б
а

6. Качество классификации

Функционалы качества
p
• сумма внутриклассовых дисперсий
Q 1 (S )
2
d
(xi , x )
1 x i S
• сумма попарных внутриклассовых
расстояний между элементами
p
Q2 (S)
2
d
(xi , x j )
1 x i , x j S
Кластерные профили
Кла- Муж. 30-50
стер
лет
> 50
лет
Рук.
Мед.
Льготы
З/п
Стаж Образов.
1
80
90
5
70
10
12
95
30
30
2
50
70
45
13
60
70
60
40
20
3
90
35
10
5
30
20
70
20
50

7. Классификация методов

Методы кластерного
анализа
Иерархические
Агломеративные
Дивизимные
1. Одиночной связи
2. Полных связей
3. Средней связи
4. Метод Уорда
Итеративные
1.Поиска сгущений
2. k-средних

8. Иерархические агломеративные методы

dij
1
2
3
4
5
6

9. Иерархические дивизимные методы

dij
Объект

10. Итеративный метод k-средних

English     Русский Правила