Лекция 11. Двухфакторный дисперсионный анализ
Пример
Пример
Дисперсионный анализ (Analysis of Variance)
Однофакторный и двухфакторный анализ
11-1. Двухфакторный дисперсионный анализ
Постановка проблемы
Эффект обработки и эффект взаимодействия
Эффект обработки и эффект взаимодействия
Другие схемы
Гипотезы
Таблица результатов
Обозначения
Изменчивость в двухфакторном анализе
Формулы для вычислений
Условия применения
Пример
Последовательность действий
Шаг 1. Сформулировать гипотезы
Шаг 2. Критические значения для F-критерия
Шаг 2. Критические значения для F-критерия
Замечание
Шаг 3. Заполняем таблицу
Шаг 3. Заполняем таблицу
Шаг 3. Заполняем таблицу
Шаг 3. Заполняем таблицу
Шаг 3. Можем использовать SPSS
Шаг 4-5. Принять решение и подвести итог
Итоги
11-2. Анализ взаимодействия
Интерпретация результатов анализа
Вычислим средние по группам
Беспорядочное взаимодействие
Порядковое взаимодействие
Отсутствие взаимодействия
Пример
Отсутствие взаимодействия
Порядковое взаимодействие
Беспорядочное взаимодействие
11-2. Решение задачи в SPSS
Ввод данных
Выбираем переменные
Отчет
505.50K
Категория: МатематикаМатематика

Двухфакторный дисперсионный анализ

1. Лекция 11. Двухфакторный дисперсионный анализ

11-1. Описание метода и пример
11-2. Анализ взаимодействия
11-3. Решение в SPSS
22 августа 2017 г.

2. Пример

Компания хочет проверить эффективность своей рекламы.
Выбран продукт, и созданы два типа рекламных роликов:
серьезный и смешной. Реклама размещена в рабочие и
выходные дни. Выбраны 16 потенциальных клиентов и наугад
распределены на 4 группы. После того, как каждый покупатель
просмотрел ролик, его просят оценить эффективность рекламы
по двадцатибалльной шкале. Различные баллы даются за
привлекательность, ясность, краткость ролика и т.д.
Иванов О.В., 2005
2

3. Пример

При α = 0,01 проанализируйте данные, используя двусторонний
дисперсионный анализ.
Тип ролика
Смешной
Серьезный
Иванов О.В., 2005
День
Рабочий
Выходной
6, 10, 11, 9
15, 18, 14, 16
8, 13, 12, 10
19, 20, 13, 17
3

4. Дисперсионный анализ (Analysis of Variance)

F-критерий, который мы использовали при сравнении дисперсий,
может применяться для сравнения трех и более средних.
Этот метод называется дисперсионным анализом или в
англоязычной аббревиатуре ANOVA (Analysis of Variance).
F-критерий можно использовать при сравнении двух средних. Но
в этом случае он становится идентичным t-критерию.
Иванов О.В., 2005
4

5. Однофакторный и двухфакторный анализ

Дисперсионный анализ, который рассматривает только одну
переменную называется однофакторным дисперсионным
анализом (One-Way ANOVA). Дисперсионный анализ может
также применяться в случае двух переменных - это
двухфакторный дисперсионный анализ (Two-Way ANOVA).
Фактор
Зависимая
переменная
Иванов О.В., 2005
Фактор А
Фактор B
Зависимая
переменная
5

6. 11-1. Двухфакторный дисперсионный анализ

Описание метода и пример
22 августа 2017 г.

7. Постановка проблемы

При применении двухфакторного дисперсионного анализа
исследователь
проверяет
влияние
двух
независимых
переменных (факторов) на зависимую переменную. Может быть
изучен также эффект взаимодействия двух переменных.
Фактор А
Фактор B
Зависимая
переменная
Иванов О.В., 2005
7

8. Эффект обработки и эффект взаимодействия

Исследуемые группы называют эффектами
(treatment groups):
Группа 1: Смешной ролик, рабочий день
Группа 2: Смешной ролик, выходной день
Группа 3: Серьезный ролик, рабочий день
Группа 4: Серьезный ролик, выходной день
обработки
Зрители распределяются по группам случайным образом. Эта
схема 2×2, так как каждая переменная состоит из двух уровней,
или двух разных вариантов обработки.
Иванов О.В., 2005
8

9. Эффект обработки и эффект взаимодействия

Двухфакторный
дисперсионный
анализ
позволяет
исследователю проверить эффекты влияния типа ролика и типа
дня одновременно, а не по отдельности.
Кроме
этого,
исследователь
может
проверить
также
дополнительную гипотезу об эффекте взаимодействия между
двумя переменными. Наличие значимого эффекта будет
означать, что тип ролика по-разному влияет на эффективность
рекламы, в зависимости от типа дня.
Иванов О.В., 2005
9

10. Другие схемы

Двухфакторный дисперсионный анализ типа 3 х 2 и 3 х 3.
В1
В2
В1
А1
А1
А2
А2
А3
А3
Иванов О.В., 2005
В2
В3
10

11. Гипотезы

Схема
двухфакторного
дисперсионного
анализа
имеет
несколько нулевых гипотез: одна для каждой независимой
переменной и одна для взаимодействия.
Н0: Тип ролика и день не имеют эффекта взаимодействия на
эффективность рекламы.
Н1: Тип ролика и день имеют эффект взаимодействия на
эффективность рекламы.
Н0: Эффективность рекламы не зависит от типа ролика.
Н1: Эффективность рекламы зависит от типа ролика.
Н0: Эффективность рекламы не зависит от типа дня.
Н1: Эффективность рекламы зависит от типа дня.
Иванов О.В., 2005
11

12. Таблица результатов

Результаты вычислений представляют
таблицы:
в виде
следующей
Сумма
квадратов
df
Среднее
квадратичное
F
Фактор A
SSA
a–1
MSA
FA
Фактор B
SSB
b–1
MSB
FB
Взаимодействие, AxB
SSAxB
(a – 1)(b – 1)
MSAxB
FAxB
Ошибка
SSerror
ab(n – 1)
MSerror
ИТОГО


...
Иванов О.В., 2005
12

13. Обозначения

SSA – сумма квадратов для фактора А
SSB – сумма квадратов для фактора В
SSAxB – сумма квадратов для взаимодействия факторов
SSerror – сумма квадратов для ошибки
а – количество уровней фактора А
b – количество уровней фактора В
n – количество объектов в каждой группе
Иванов О.В., 2005
13

14. Изменчивость в двухфакторном анализе

Общая
изменчивость
Между группами
Между
столбцами
Между
строками
Внутри групп
Взаимодействие
SStotal SS colum n SS row SSint eraction SS within
Иванов О.В., 2005
14

15. Формулы для вычислений

SSвнутри
SS A
SSB
SS A B
MS A
; MSB
; MS A B
; MSвнутри
a 1
b 1
(a 1)(b 1)
ab(n 1)
MS B
FB
MSвнутри
FA B
MS A B
MSвнутри
MS A
FA
MSвнутри
Иванов О.В., 2005
df.N. = b – 1
df.D. = ab(n – 1)
df.N. = (a – 1)(b – 1)
df.D. = ab(n – 1)
df.N. = a – 1
df.D. = ab(n – 1)
15

16. Условия применения

1. Генеральные совокупности, из которых извлечены выборки,
должны быть нормально распределены.
2. Выборки должны быть независимыми.
3. Дисперсии
генеральных
совокупностей,
из
которых
извлекались выборки, должны быть равными.
4. Группы должны иметь одинаковый объем выборки.
Иванов О.В., 2005
16

17. Пример

Исследователь
хочет
выяснить,
оказывают
ли
тип
потребляемого бензина и тип автомобиля влияние на расход
топлива. Для этого будут использованы два типа бензина –
обычный и высокооктановый, и для каждой группы будут
использованы два типа автомобилей – с двумя ведущими
колесами и с четырьмя. Для каждой группы будут использованы
по два автомобиля, всего восемь.
Тип автомобиля
Топливо
два колеса
четыре колеса
Обычное
26,7
25,2
28,6
29,3
Высокооктановое
32,3
32,8
26,1
24,2
Иванов О.В., 2005
Расход топлива
в милях на
галлон
17

18. Последовательность действий

ШАГ 1. Сформулировать гипотезы.
ШАГ 2. Найти критическое значение для каждого значения Fкритерия при заданном α, например, α = 0,05.
ШАГ 3. Заполнить итоговую таблицу, чтобы получить значение
критерия.
ШАГ 4. Принять решение.
ШАГ 5. Подвести итоги.
Иванов О.В., 2005
18

19. Шаг 1. Сформулировать гипотезы

Гипотезы для взаимодействия:
Н0: Тип топлива и тип автомобиля не оказывают эффекта взаимодействия на
потребление бензина.
Н1: Тип топлива и тип автомобиля оказывают эффекта взаимодействия на
потребление бензина.
Гипотезы для типов топлива:
Н0: Для двух типов топлива нет разницы между средним потреблением
бензина.
Н1: Для двух типов топлива существует разница между средним
потреблением бензина.
Гипотезы для типов автомобилей:
Н0: Для автомобилей с двумя и четырьмя ведущими колесами нет разницы в
среднем потреблении бензина.
Н1: Для автомобилей с двумя и четырьмя ведущими колесами существует
разница в среднем потреблении бензина.
Иванов О.В., 2005
19

20. Шаг 2. Критические значения для F-критерия

Каждая независимая переменная, или фактор, имеет два уровня
(принимает два значения).
Фактор А - тип топлива: обычное и высокооктановое, а = 2.
Фактор В - тип автомобиля: также имеет два значения, b = 2.
Степени свободы для каждого фактора:
Фактор А:
df.N = a – 1 = 2 – 1 = 1
Фактор В:
df.N = b – 1 = 2 – 1 = 1
Взаимодействие (A×B): df.N = (a – 1)(b – 1) = (2 – 1)(2 – 1) = 1
Ошибка внутри группы: df.D = ab(n – 1) = 2×2(2 – 1) = 4
n – число объектов в каждой группе. В данном случае n = 2.
Иванов О.В., 2005
20

21. Шаг 2. Критические значения для F-критерия

Критические значения:
FA
α = 0,05 df.N = 1 df.D = 4 FA = 7,71

α = 0,05 df.N = 1 df.D = 4 FВ = 7,71
FАхВ
α = 0,05 df.N = 1 df.D = 4 FАхВ =7,71
Иванов О.В., 2005
21

22. Замечание

Если факторы принимают различное число
критические значения не всегда будут одинаковыми.
значений,
Например, если фактор А имеет три значения, а фактор В –
четыре, и при этом в каждой группе по два объекта, то степени
свободы будут следующие:
df.N. = a – 1 = 3 – 1 = 2
df.N. = b – 1 = 4 – 1 = 3
df.N. = (a – 1)(b – 1) = (3 – 1)(4 – 1) = 6
df.D. = ab(n – 1) = 3×4(2 – 1) = 12
Иванов О.В., 2005
для фактора А
для фактора В
для фактора A×B
ошибка внутри группы
22

23. Шаг 3. Заполняем таблицу

Таблица результатов вычислений SS
Топливо, А
Автомобиль, В
Взаимодействие, (А×В)
Ошибка внутри группы
Итого
Иванов О.В., 2005
df
MS
F
3,920
9,680
54,080
3,300
70,980
23

24. Шаг 3. Заполняем таблицу

SS A 3,920
MS A
3,920
a 1 2 1
SS B 9, 680
MS B
9, 680
b 1 2 1
SS A B
54, 080
MS A B
54, 080
(a 1)(b 1) (2 1)(2 1)
MSвнутри
Иванов О.В., 2005
SSвнутри
3,300
3,300
0,825
ab(n 1) 2 2(2 1)
4
24

25. Шаг 3. Заполняем таблицу

MS A
3,920
FA
4,753
MSвнутри 0,825
df.N. = a 1 1; df.D. ab(n 1) 4
MS B
9, 680
FB
11, 733
MSвнутри 0,825
df.N. b 1 1; df.D. ab(n 1) 4
FA B
MS A B
54,080
65,552
MSвнутри
0,825
df.N. (a 1)(b 1) 1; df .D. ab(n 1) 4
Иванов О.В., 2005
25

26. Шаг 3. Заполняем таблицу

Топливо, А
Автомобиль, В
Взаимодействие, (А×В)
Ошибка внутри группы
Итого
Иванов О.В., 2005
SS
3,920
9,680
54,080
3,300
70,980
df
1
1
1
4
7
MS
3,920
9,680
54,080
0,825
F
4,752
11,733
65,552
26

27. Шаг 3. Можем использовать SPSS

Tests of Between-Subjects Effects
Dependent Variable: VAR00001
Source
Corrected Model
Intercept
VAR00002
VAR00003
VAR00002 * VAR00003
Error
Total
Corrected Total
Type III Sum
of Squares
67,680a
6339,380
9,680
3,920
54,080
3,300
6410,360
70,980
df
3
1
1
1
1
4
8
7
Mean Square
22,560
6339,380
9,680
3,920
54,080
,825
F
27,345
7684,097
11,733
4,752
65,552
Sig.
,004
,000
,027
,095
,001
a. R Squared = ,954 (Adjusted R Squared = ,919)
Иванов О.В., 2005
27

28. Шаг 4-5. Принять решение и подвести итог

Поскольку FB = 11,733 и FА×В = 65,522, что превышает
критический уровень 7,71, нулевые гипотезы об эффекте
взаимодействия и о типе автомобиля отвергаются.
Итог. Поскольку нулевая гипотеза об эффекте взаимодействия
была отвергнута, можно сделать вывод о том, что сочетание
типа топлива и типа автомобиля оказывает существенное
влияние на потребление топлива.
Иванов О.В., 2005
28

29. Итоги

Подводя итоги, можно сказать, что двумерный дисперсионный
анализ является продолжением одномерного. Двумерный
анализ может использоваться для проверки воздействия двух
независимых
переменных
и
возможного
эффекта
взаимодействия на зависимую переменную.
Иванов О.В., 2005
29

30. 11-2. Анализ взаимодействия

Метод
Пример
22 августа 2017 г.

31. Интерпретация результатов анализа

В предыдущем примере влияние типа бензина и типа
автомобиля называются основными или главными эффектами.
Если нет значимого эффекта взаимодействия, основные
эффекты можно интерпретировать независимо друг от друга.
Однако, если существует значимый эффект взаимодействия,
надо более внимательно интерпретировать основные эффекты.
Чтобы
интерпретировать
результаты
двумерного
дисперсионного
анализа,
исследователи
предлагают
нарисовать график, на который наносятся средние значения
каждой
группы.
Затем
проанализировать
график
и
интерпретировать результаты.
Иванов О.В., 2005
31

32. Вычислим средние по группам

Тип автомобиля
Топливо
два колеса
четыре колеса
Обычное
26, 7 25, 2
28, 6 29,3
X
25,95 X
28,95
2
2
Высокооктанов
ое
26,1 24, 2
32,3 32,8
25,15
X
32,55 X
2
2
Иванов О.В., 2005
32

33. Беспорядочное взаимодействие

33
32
Высокооктановое
31
Обычное
30
29
28
27
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
На этом графике прямые пересекаются. В случае
такого пересечения и при значительном эффекте
взаимодействия, это взаимодействие называется
беспорядочным.
В случае беспорядочного взаимодействия не
следует интерпретировать основные эффекты без
учета эффекта взаимодействия.
33

34. Порядковое взаимодействие

28
Высокооктановое
27
Обычное
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
Другой возможный тип взаимодействия –
порядковое взаимодействие.
Если значение F-критерия для взаимодействия
оказывается значимым и прямые не
пересекаются, тогда взаимодействие называется
порядковым, и основные эффекты можно
интерпретировать отдельно друг от друга.
34

35. Отсутствие взаимодействия

29
Высокооктановое
28
Обычное
27
26
25
24
2 колеса
Иванов О.В., 2005
4 колеса
Наконец, когда нет значительного эффекта
взаимодействия, прямые на графике будут
параллельными или почти параллельными. В
подобной ситуации основные эффекты можно
интерпретировать независимо друг от друга,
поскольку не существует значимого
взаимодействия. На рисунке приведен график
двух переменных, когда эффект взаимодействия
незначителен, прямые параллельны.
35

36. Пример

20
18
16
14
Смешной ролик
12
Серьезный ролик
10
8
Какой вывод можно сделать из этого
графика?
6
Рабочий день Выходной день
Иванов О.В., 2005
36

37. Отсутствие взаимодействия

20
18
Смешной ролик
16
Серьезный ролик
14
12
10
8
6
Рабочий
Иванов О.В., 2005
Выходной
Поскольку прямые почти параллельны, не
существует значимого взаимодействия
между факторами. Основные эффекты
можно интерпретировать независимо друг от
друга.
37

38. Порядковое взаимодействие

20
18
16
14
Смешной ролик
12
Серьезный ролик
10
8
6
Рабочий день Выходной день
Иванов О.В., 2005
38

39. Беспорядочное взаимодействие

20
18
16
14
Смешной ролик
12
Серьезный ролик
10
8
6
Рабочий день Выходной день
Иванов О.В., 2005
39

40. 11-2. Решение задачи в SPSS

Ввод данных
Анализ
Отчет
22 августа 2017 г.

41. Ввод данных

Иванов О.В., 2005
41

42. Выбираем переменные

Grade является зависимой
Trailer и Day независимые
Иванов О.В., 2005
42

43. Отчет

Tests of Between-Subjects Effects
Dependent Variable: GRADE
Source
Model
DAY
TRAILER
DAY * TRAILER
Error
Total
Type III Sum
of Squares
2968,750a
175,563
10,563
6,250E-02
66,250
3035,000
df
4
1
1
1
12
16
Mean Square
742,188
175,563
10,563
6,250E-02
5,521
F
134,434
31,800
1,913
,011
Sig.
,000
,000
,192
,917
a. R Squared = ,978 (Adjusted R Squared = ,971)
Иванов О.В., 2005
43
English     Русский Правила