Критерии различий
Сравнение более двух независимых выборок
Сравнение более двух зависимых выборок
271.00K
Категория: МатематикаМатематика

Статистические критерии различий (3). Критерии различий. Сравнение более двух выборок

1. Критерии различий

Сравнение более двух
выборок

2. Сравнение более двух независимых выборок

Критерий H Краскала-Уоллеса
• Критерий является непараметрическим.
• Аналог – однофакторный
дисперсионный анализ ANOVA для
независимых выборок.

3.

k
2
i
R
12
H
3( N 1)
N ( N 1) i 1 ni
где
N – суммарная численность всех выборок
k – количество сравниваемых выборок
Ri – сумма рангов для выборки i
ni – численность выборки i

4.

• Ho: Отсутствуют статистически
достоверные различия между
выборками.
• H1: Имеются статистически
достоверные различия между
выборками.

5.

• Чем сильнее различаются выборки, тем
больше вычисленное значение H и тем
меньше p-уровень значимости.
p=0,05
p=0,01
зона незначимости
зона значимости
зона неопределенности

6.

• Если сравниваются 3 выборки и объем
каждой выборки меньше 5, то
пользуются таблицей критических
значений H-Краскала-Уоллеса.
• Если объем хотя бы одной выборки
больше 5 либо количество выборок
больше 3, то пользуются таблицей
критических значений χ2 для df=k-1
(k – число выборок)

7.


Выборка 1 Выборка 2 Выборка 3
1
3
5
14
2
4
9
16
3
6
12
17
4
7
15
5
8
19
6
10
7
11
8
13

8.

Значения
Выборка
Ранги
Ранги 1
3
1
1
1
4
1
2
2
5
2
3
6
1
4
4
7
1
5
5
8
1
6
6
9
2
7
10
1
8
8
11
1
9
9
12
2
10
13
1
11
14
3
12
15
2
13
16
3
14
14
17
3
15
15
19
2
16
Суммы рангов
Ранги 2
Ранги 3
3
7
10
11
12
13
16
46
49
41

9.

• 1. Значения выборок объединяются в
один ряд, упорядоченный в порядке
возрастания или убывания.
Обозначается принадлежность каждого
значения к той или иной выборке.
• 2. Значения выборок ранжируются и
выписываются отдельно ранги для
каждой выборки.
• 3. Вычисляются суммы рангов.

10.

• 4. Вычисляется H по формуле.
• 5. Определяется p-уровень значимости.
• 6. Принимается статистическое
решение.
• H=6,575

11.

12.

p=0,05
p=0,01
зона незначимости
зона значимости
зона неопределенности
5,992
6,575
9,211
Подтверждается гипотеза
H 1.
Имеются значимые
различия между
выборками

13. Сравнение более двух зависимых выборок

• Непараметрический критерий χ2Фридмана (хи-квадрат).
• Аналог – однофакторный
дисперсионный анализ ANOVA для
повторных измерений.

14.

12
2
Ri 3N (k 1)
Nk (k 1) i 1
df k 1
k
2
где
N – число объектов (испытуемых)
k – количество условий (повторных измерений)
Ri – сумма рангов для условия i

15.

• Если k=3, N>9 или k>3, N>4, то
пользуются обычной таблицей для χ2.
• Если k=3, N<10 или k=4, N<5, то
пользуются дополнительными
таблицами критических значений χ2Фридмана.

16.

1. Для каждого объекта условия ранжируются (по
строке).
2. Вычисляется сумма рангов для каждого условия.
3. Вычисляется эмпирическое значение χ2 по формуле.
4. Определяется уровень значимости.
5. Принимается статистическое решение.

17.

• χ2=8,6
• df=3

18.

19.

p=0,05
p=0,01
зона незначимости
зона значимости
зона неопределенности
7,815
8,6
11,346
Подтверждается гипотеза
H 1.
Имеются значимые
различия между
выборками
English     Русский Правила