Гетероскедастичность случайной составляющей
ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)
ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)
ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)
График остатков в зависимости от ВРП также позволяет увидеть гетероскедастичность, чем больше ВРП, тем больше по модулю остатки
ПОСЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Устранение ГЕТЕРОСКЕДАСТИЧНОСТИ
Устранение гетероскедастичности пример
Устранение гетероскедастичности пример
Устранение гетероскедастичности пример
Устранение гетероскедастичности пример
2) Изменить функциональную форму модели
2) Изменить функциональную форму модели
1.28M
Категория: МатематикаМатематика

Гетероскедастичность случайной составляющей

1.

Модель множественной регрессии всегда включает случайную составляющую
B c aYD bP
Наличие случайной составляющей связано в тем, что помимо факторов,
вошедших в модель на зависимую переменную могут влиять и другие
неучтенные факторы.
Метод наименьших квадратов является наилучшим только если случайная
составляющая обладает двумя свойствами
1) случайная составляющая является гомоскедастичной
(имеет постоянную дисперсию)
2) в случайной составляющей отсутствует автокорреляция
1

2. Гетероскедастичность случайной составляющей

Пусть нарушено первое условие
D const
Тогда говорят, что имеет место
гетероскедастичность, т.е. ошибки регрессии
имеют непостоянные дисперсии
В этом случае МНК не является лучшим методом.
2

3.

Условия Гаусса-Маркова
Иллюстрация гомоскедастичности. МНК можно использовать. Разброс вокруг
линии регрессии постоянный
Регрессия
y = 3,4931+1,9952*x
400
350
300
250
y
200
150
100
50
0
-50
-20
0
20
40
60
80
100
x
120
140
160
180
200

4.

Условия Гаусса-Маркова
Иллюстрация гетероскедастичности. МНК нельзя использовать, разброс вокруг
линии регрессии увеличивается с ростом х.
Регрессия
y = -5,741+2,1624*x
1400
1200
1000
800
y
600
400
200
0
-200
-400
-600
-20
0
20
40
60
80
100
x
120
140
160
180
200

5. ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)

Регион
Белгородская область
VRP
INV
119673,20
48422
Брянская область
61888,30
10973
Владимирская область
76328,10
20292
Воронежская область
70849,40
36265
Ивановская область
47949,80
14652

6. ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)

Коэффи
циенты
Станда
ртная
ошибка
Yпересечение
5164,439
11352,89 0,454901 0,650428
VRP
0,345983 0,070519 4,906268
INV 0,346 VRP 5164
tстатис
тика
PЗначени
е
4,88E-06

7. ПРИМЕР (зависимость инвестиций от ВРП в 2006г. по российским регионам)

600000
500000
INV
400000
300000
y = 0,346x + 5164,4
200000
100000
0
0,00
200000,0 400000,0 600000,0 800000,0 1000000,
0
0
0
0
00
VRP
Разброс вокруг линии регрессии увеличивается с ростом ВРП. Есть
непостоянство дисперсии (гетероскедастичность)

8. График остатков в зависимости от ВРП также позволяет увидеть гетероскедастичность, чем больше ВРП, тем больше по модулю остатки

e
Остатки
500000
400000
300000
200000
100000
0
-1000000,00
-200000
-300000
Остатки
200000 400000 600000 800000 100000
,00
,00
,00
,00
0,00
VRP
8

9. ПОСЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ

1. Обычная МНК оценка становится не самой
точной (есть более точные оценки).
2. Проверка значимости коэффициентов
становится некорректной
9

10. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

1.
Визуальный метод.
Диаграмма рассеяния
Y
Y
X
Гомоскедастичность
X
Гетероскедастичность
10

11. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

1.
Визуальный метод.
Графики остатков после построения оценок по
методу МНК
e
e
X или Y
Гомоскедастичность
X или Y
Гетероскедастичность
11

12.

ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
5E5
5,5578E5
4E5
3E5
e
INV
2E5
2,2503E5
1,5894E5
1E5
0
1,0411E5
-1E5
47208
481
-2E5
42728,4
1,6877E5
1,0377E5
-3E5
4,9319E5
2,8986E5
7,8243E5
VRP
42728,4
1,6877E5
1,0377E5
4,9319E5
2,8986E5
7,8243E5
VRP
19

13. ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

Кроме визуального метода используются более точные методы
Тесты:
1. Тест ранговой корреляции Спирмена.
2. Тест Глейзера.
3. Тест Голдфелда-Квандта.
4. Тест Уайта.
В специализированных эконометрических пакетах эти тесты есть
13

14. Устранение ГЕТЕРОСКЕДАСТИЧНОСТИ

1) Использовать обобщенный метод
наименьших квадратов
В этом методе предполагается, что
стандартное отклонение остатков
пропорционально одной из объясняющих
переменных
Например,
INV aVRP b k VRP
14

15. Устранение гетероскедастичности пример

INV aVRP b
k VRP
Делим уравнение на эту объясняющую переменную (в примере на ВРП )
INV
1
a b
VRP
VRP VRP
Тогда
1
1
2
2
2
D
D
k
VRP
k
const
2
2
VRP VRP
VRP

16. Устранение гетероскедастичности пример

INV
1
a b
VRP
VRP VRP
Создаем новые переменные
INV
1
,
VRP VRP
Регион
Белгородская область
VRP
INV
INV/VRP
1/VRP
119673,20
48422
0,40
8,36E-06
Брянская область
61888,30
10973
0,18
1,62E-05
Владимирская область
76328,10
20292
0,27
1,31E-05
Воронежская область
70849,40
36265
0,51
1,41E-05
Ивановская область
47949,80
14652
0,31
2,09E-05
Калужская область
83817,40
16268
0,19
1,19E-05

17. Устранение гетероскедастичности пример

INV
1
a b
VRP
VRP VRP
Коэффициент
ы
Стандартная
ошибка
t-статистика
Y-пересечение
0,491025
0,0864
5,683151
2,13E-07
1/VRP
-11337,2
7354,391
-1,54156
0,127178
INV
1
0,5 11,337
,
VRP
VRP
INV 0,5 VRP 11,337
P-Значение

18. Устранение гетероскедастичности пример

INV
1
a b
VRP
VRP VRP
Остатки
1,5
1
0,5
e
Остатки
0
-0,5 0
5E-06
0,00001 1,5E-05 0,00002 2,5E-05
-1
1/VRP
Визуально гетероскедастичность отсутствует

19. 2) Изменить функциональную форму модели

Scatterplot (Spreadsheet1 10v*119c)
y = -2554,0902+132,073*x
35000
30000
25000
y
20000
15000
10000
5000
0
-5000
-20
0
20
40
60
80
100
120
140
x
С ростом х растет разброс вокруг линии регрессии. Есть гетероскедастичность

20. 2) Изменить функциональную форму модели

Прологарифмируем данные и построим модель в логарифмах
Scatterplot (Spreadsheet1 10v*119c)
12
10
8
ln(y)
6
4
2
0
-2
-1
0
1
2
3
4
5
ln(x)
Разброс постоянный вокруг линии регрессии. Нет гетероскедастичности.
Таким образом, нужно строить степенную модель вместо линейной
English     Русский Правила