Гетероскедастичность
1/37
822.53K

Гетероскедастичность

1. Гетероскедастичность

2. ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

Гетероскедастичность – это неоднородность
наблюдений. Она характеризуется тем, что не
выполняется предпосылка 20 использования МНК:
2 . D[ ] const
0
2
Выполнимость предпосылки 20 называется
гомоскедастичностью.
2

3. ИЛЛЮСТРАЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ

3

4. ГЕТЕРОСКЕДАСТИЧНОСТЬ ОШИБОК

2
Причиной непостоянства дисперсии
эконометрической модели часто является ее зависимость
от масштаба рассматриваемых явлений.
В модель ошибка входит как аддитивное слагаемое.
В то же время часто она имеет относительный
характер и определяется по отношению к
измеренному уровню рассматриваемых факторов.
4

5. Примеры моделей с гетероскедастичным случайным членом

а)
б)
в)
а) Дисперсия 2 растет по мере увеличения значений
объясняющей переменной X
б) Дисперсия 2 имеет наибольшие значения при средних
значениях X, уменьшаясь по мере приближения к крайним
значениям
в) Дисперсия ошибки наибольшая при малых значениях X,
быстро уменьшается и становится однородной по мере
увеличения X
5

6. ИСТИННАЯ И ЛОЖНАЯ ГЕТЕРОСКЕДАСТИЧНОСТЬ

1. Истинная гетероскедастичность
Вызывается непостоянством дисперсии случайного
члена, ее зависимостью от различных факторов.
2. Ложная гетероскедастичность
Вызывается ошибочной спецификацией
модели регрессии.
6

7. Источники гетероскедастичности – 1

Истинная гетероскедастичность возникает в
перекрестных выборках при зависимости
масштаба изменений зависимой переменной
от некоторой переменной, называемой
фактором пропорциональности (Z).
7

8. Источники гетероскедастичности – 1

Наиболее распространенный случай истинной
гетероскедастичности – 1: дисперсия растет с
ростом одного из факторов.
8

9. Источники гетероскедастичности – 2

Истинная гетероскедастичность возникает также и
во временных рядах, когда зависимая переменная
имеет большой интервал качественно
неоднородных значений или высокий темп
изменения (инфляция, технологические сдвиги,
изменения в законодательстве, потребительские
предпочтения и т.д.).
9

10. Гетероскедастичность простейшего вида

Мы в дальнейшем будем рассматривать, главным
образом, только гетероскедастичность простейшего
вида:
Var( i ) Z
2
i
2
i
10

11. СЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ

1. Истинная гетероскедастичность не приводит к
смещению оценок коэффициентов регрессии
2. Стандартные ошибки коэффициентов
(вычисленные в предположении.
гомоскедастичности) будут занижены. Это
приведет к завышению t-статистик и даст
неправильное (завышенное) представление о
точности оценок.
11

12. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

Обнаружение гетероскедастичности в каждом конкретном
случае – довольно сложная задача.
2
Для знания i необходимо знать распределение случайной
величины Y/X=xi . На практике часто для каждого
конкретного значения xi известно лишь одно yi, что не
позволяет оценить дисперсию случайной величины Y/X=xi.
Не существует какого-либо
однозначного метода определения
гетероскедастичности.
12

13. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

Тесты:
1. Тест ранговой корреляции Спирмена.
2. Тест Парка.
3. Тест Глейзера.
4. Тест Голдфелда-Квандта.
5. Тест Уайта.
6. Тест Бреуша-Пагана.
13

14. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА

При использовании данного теста
предполагается, что дисперсии отклонений
остатков будут монотонно изменятьcя
(увеличиваться или уменьшаться) с увеличением
фактора пропорциональности Z.
Поэтому значения ei и zi будут
коррелированы (возможно, нелинейно!).
14

15. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения

1. Рассчитываются ранги (порядковые номера)
значений фактора пропорциональности zi = xik.
2. Рассчитывается уравнение
m
y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1,.n
3. Рассчитываются ранги остатков ei.
15

16. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения

4. Рассчитывается коэффициент ранговой корреляции
Спирмена
z / e 1
6 D
2
i
, Di – разность рангов z и e.
n(n 1)
2
5. Рассчитывают статистику u z / e n , 1
распределенную нормально N(0,1) при отсутствии
гетероскедастичности.
16

17. ТЕСТ ПАРКА

Здесь предполагается, что дисперсии i связаны
с фактором пропорциональности Z в виде:
2
2 i
i
z e
2
i
ln
ln i ln ln zi i
2
2
Т.к. дисперсии i неизвестны, то их заменяют
оценками квадратов отклонений ei2.
2
17

18. ТЕСТ ПАРКА. Алгоритм применения

m
1. Строится уравнение регрессии: y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1, .n
2. Выбирается фактор пропорциональности Z и
оценивают вспомогательное уравнение регрессии:
ln( e ) 0 1 ln zi i , i 1, n
2
i
3. Проверяют значимость коэффициента при ln zi
18

19. ТЕСТ ГЛЕЙЗЕРА

Здесь предполагается, что дисперсии i связаны
с фактором пропорциональности Z в виде:
2
zi i
i
Т.к. средние квадратические отклонения i
неизвестны, то их заменяют модулями оценок
отклонений ei .
19

20. ТЕСТ ГЛЕЙЗЕРА. Алгоритм применения

m
1. Строится уравнение регрессии: y i b0 b j xij
j 1
и вычисляются остатки ei yi y i , i 1., n
2. Выбирается фактор пропорциональности Z и оценивают
вспомогательное уравнение регрессии: ei 0 1zi i , i 1, n
Изменяя , строят несколько моделей: , 1, 0,5, 0,5,1,
3. Статистическая значимость коэффициента 1 в каждом случае
означает наличие гетероскедастичности.
4. Если для нескольких моделей будет получена значимая
оценка 1 , то характер гетероскедастичности определяют по
наиболее значимой из них.
20

21. ТЕСТЫ ПАРКА и ГЛЕЙЗЕРА. Выводы

Отметим, что как в тесте Парка, так и в тесте
Глейзера для отклонений i может нарушаться
условие гомоскедастичности.
Однако, во многих случаях используемые в
тестах модели являются достаточно хорошими
для определения гетероскедастичности.
21

22. ТЕСТ БРЕУШ-ПАГАНА

Тест применим в предположении, что:
Дисперсии зависят от некоторых
i
дополнительных переменных Z j , j 1, p :
2
p
0 j Zij , i 1, n
2
i
j 1
22

23. ТЕСТ БРЕУШ-ПАГАНА. Алгоритм применения

1. Строится уравнение регрессии: y i b0
m
b x
j 1
j ij
и вычисляются остатки: ei yi y i , i 1, n
2. Вычисляют оценку дисперсии остатков:
~e2
2
e
i
n
3. Строят вспомогательное уравнение регрессии:
p
ei2
0 j z ji i , i 1, n
2
~
e
j 1
23

24. ТЕСТ БРЕУШ-ПАГАНА. Алгоритм применения

4. Для вспомогательного уравнения регрессии определяют
объясненную часть вариации RSS.
5. Находим тестовую статистику:
RSS
BP
2
6. Если верна гипотеза H0: гомоскедастичность остатков, то
статистика BP имеет распределение 2 . Т.е. о наличии
p
гетероскедастичности остатков на уровне значимости
свидетельствует:
2
BP ; p
24

25. ТЕСТ БРЕУШ-ПАГАНА. Замечания

p 1
При
гетероскедастичность может быть
скорректирована:
m
y i b0 b j xij
j 1
При
xij
b0 m
yi
bj
zi1 j 1 zi1
p 1 не существует естественного
преобразования, корректирующего гетероскедастичность
25

26. ТЕСТ ГОЛДФЕЛДА-КВАНДТА

В этом тесте предполагается:
1. Стандартные отклонения остатков i
пропорциональны фактору пропорциональности
Z, т.е.
2
2 2
i
i
z , i 1, n
2. Случайный член имеет нормальное
распределение и отсутствует автокорреляция
остатков (предпосылка 30).
26

27. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Алгоритм применения

1. Выделяют фактор пропорциональности Z = Xk.
Данные упорядочиваются в порядке возрастания
величины Z.
2. Отбрасывают среднюю треть упорядоченных
наблюдений. Для первой и последней третей
строятся две отдельные регрессии, используя ту же
спецификацию модели регрессии.
3. Количество наблюдений в этих подвыборках
должно быть одинаково. Обозначим его l.
27

28. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Алгоритм применения

4. Берутся суммы квадратов остатков для регрессий по
первой трети RSS1 и последней трети RSS3. Рассчитывают
их отношение:
RSS 3
GQ
RSS1
5. Используем F-тест для проверки гомоскедастичности.
Если статистика GQ удовлетворяет неравенству
GQ F ; l m 1; l m 1
то гипотеза гомоскедастичности остатков отвергается на
уровне значимости .
28

29. ТЕСТ ГОЛДФЕЛДА-КВАНДТА. Замечание

Тест Голдфелда-Квандта применим и для случая
обратной пропорциональности:
2
i
2
2
i
z
, i 1, n
При этом используется та же процедура, но тестовая
статистика равна:
RSS1
GQ
RSS 3
29

30. ТЕСТ УАЙТА

Предполагается, что дисперсии i связаны
с объясняющими переменными X j , j 1, m в виде:
2
f ( X i1, X i 2 , , X im ) i , i 1, n
2
i
где f( ) – квадратичная функция от аргументов.
Т.к. дисперсии i неизвестны, то их заменяют
оценками квадратов отклонений ei2.
2
30

31. ТЕСТ УАЙТА. Алгоритм применения (на примере трех переменных)

1. Строится уравнение регрессии:
y i b0 b1 xi1 b2 xi 2 b3 xi 3
и вычисляются остатки
ei yi y i , i 1,. n
2. Оценивают вспомогательное уравнение регрессии:
ei2 0 1 X i1 2 X i 2 3 X i 3 4 X i21 5 X i22
6 X 7 X i1 X i 2 8 X i1 X i 3 9 X i 2 X i 3 i
2
i3
31

32. ТЕСТ УАЙТА. Алгоритм применения (на примере трех переменных)

3. Определяют из вспомогательного уравнения тестовую
статистику U nR 2
4. Проверяют общую значимость уравнения с помощью
критерия 2. Если
2
; k
U
то гипотеза гомоскедастичности отвергается. Число
степеней свободы k равно числу объясняющих
Переменных вспомогательного уравнения. В частности,
Для рассматриваемого случая k = 9.
32

33. ТЕСТ УАЙТА. Замечания

Тест Уайта является более общим чем тест
Голдфелда-Квандта.
Неудобство использования теста Уайта:
Если отвергается нулевая гипотеза о наличии
гомоскедастичности
H0 : ,
2
1
2
2
то неясно, что делать дальше.
2
n
33

34. КОРРЕКЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ

1. Использовать обобщенный метод наименьших
квадратов.
2. Переопределить переменные.
3. Вычисление стандартных ошибок с поправкой на
гетероскедастичность (метод Уайта).
34

35. ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

При нарушении гомоскедастичности и наличии автокорреляции
остатков рекомендуется вместо традиционного МНК
использовать обобщенный МНК. Его для случая устранения
гетероскедастичности часто называют методом взвешенных
наименьших квадратов.
Метод применим, если известны дисперсии
наблюдения.
2
для каждого
i
Основан на делении каждого наблюдаемого значения на
соответствующее ему стандартное отклонение остатков.
35

36. МЕТОД ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии

Yi 0 1 X i i
1
Xi
Yi
i
Yi ,
Zi ,
X ,
i
i
i
i
i
Yi
i
0 1
i
i
i i
i
i
1
Xi
Yi 0 Z i 1 X i i
Получили уравнение регрессии без свободного члена, но с
дополнительной объясняющей переменной Z и с
«преобразованным» остатком . Можно показать, что для
него выполняются предпосылки 10 – 50 МНК.
36

37. МЕТОД ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии

На практике, значения дисперсии остатков, как
правило, не известны. Для применения метода ВНК
необходимо сделать реалистичные предположения об этих
значениях. Например:
2
Дисперсии
i
Дисперсии
2
i
пропорциональны Xi:
пропорциональны
Xi2:
2 2 xi , i 1, n
i
2 2 xi2 , i 1, n
i
37
English     Русский Правила