МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Пример: Множественная регрессия
МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы
Условия Гаусса-Маркова для модели линейной множественной регрессии
ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы
Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы
ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
586.00K
Категория: МатематикаМатематика

Модель множественной линейной регрессии

1. МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

y a1 x1 a2 x2
ar 1 xr 1 ar
y – зависимая или объясняемая переменная
x1 , x2
, xr 1
- независимые или объясняющие переменные
- случайная составляющая.
Задача множественного регрессионного анализа – оценить
a1 , a2
ar

2. Пример: Множественная регрессия

Мы хотим определить связь между потреблением, доходом
семьи, финансовыми активами семьи и размером семьи.
• y – потребительские расходы.
• x1 – доход семьи
• x2 – финансовые активы семьи
• x3 – размер семьи
y a1 x1 a2 x2 a3 x3 a4

3. МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

y a1 x1 a2 x2 a3 x3 a4
Для оценки необходима выборка (большое количество семей)

семьи
y
x1
потребительские
расходы
доход
семьи
x2
x3
финансовые
активы семьи
размер
семьи
1
100
20
300
2
2
120
30
50
3
3
230
100
400
4
4
150
80
200
1
5
340
170
140
3

4.

n – объем выборки
yi
xi1
xi 2
доходы i-й семьи
xi 3
размер i-й семьи
потребительские расходы i-й семьи
доход i-й семьи
i 1 n
4

5.

Уравнение для i-й семьи
yi a1 xi1 a2 xi 2 a3 xi 3 a4 i
Чтобы подобрать наилучшие a , a , a , a
1
2
3
4
n
S (a1 , a2 , a3 , a4 ) yi a1 xi1 a2 xi 2 a3 xi 3 a4
2
i 1
min S (a1 , a2
a1 , a2
ar
ar )
5

6.

y a1 x1 a2 x2 a3 x3 a4
Для оценки необходима выборка (большое количество семей)

семьи
y
x1
потребительские
расходы
доход
семьи
x2
x3
финансовые
активы семьи
const
размер
семьи
1
100
20
300
2
1
2
120
30
50
3
1
3
230
100
400
4
1
4
150
80
200
1
1
5
340
170
140
3
1
вектор Y
матрица Х

7.


семьи
y
x1
потребительские
расходы
доход
семьи
x2
x3
финансовые
активы семьи
const
размер
семьи
1
100
20
300
2
1
2
120
30
50
3
1
3
230
100
400
4
1
4
150
80
200
1
1
5
340
170
140
3
1
вектор Y
a1
a2
a
a3
a4
1
2
3
4
матрица Х
Y Xa

8.

Оценки наименьших квадратов (ОНК) в
КЛММР
n
S (a1 , a2 , a3 , a4 ) yi a1 xi1 a2 xi 2 a3 xi 3 a4
2
i 1
min S (a1 , a2
a1 , a2
ar
a X X X TY
T
ar )
1
оценка наименьших квадратов (ОНК)
параметров линейной множественной
регрессии
8

9.


семьи
y
x1
потребительские
расходы
доход
семьи
x2
x3
финансовые
активы семьи
const
размер
семьи
1
100
20
300
2
1
2
120
30
50
3
1
3
230
100
400
4
1
4
150
80
200
1
1
5
340
170
140
3
1
вектор Y
a X X X TY
T
1
матрица Х

10. Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы

Коэффициен
ты
Стандартна
я ошибка
tстатист
ика
PЗначение
Y-пересечение
-26,93164811
4,523407834
-5,95384
4,73E-09
N
2,674036105
0,231999296
11,52605
1,28E-27
0,59409725
0,137923673
4,307435
1,96E-05
Nrab
Zpl = 2.67*N + 0.59*NRab -26.93
10

11.

3D Scatterplot (1 9v*541c)
Function = 2,67*x + 0,59*y -26,93
40
20
0
11

12. Условия Гаусса-Маркова для модели линейной множественной регрессии

yi a1 xi1 a2 xi 2
Y Xa
1. M i 0
ar 1 xir 1 ar i
i 1, n
i 1, n
На самом деле это требование несущественно,
если в модель включена константа

13.

Условия Гаусса-Маркова для модели
линейной множественной регрессии
yi a1 xi1 a2 xi 2
Y Xa
2
i 1, n
D
2.
i
ar 1 xir 1 ar i
i 1, n
условие гомоскедастичности
(постоянства дисперсии)

14.

Условия Гаусса-Маркова для модели
линейной множественной регрессии
yi a1 xi1 a2 xi 2
Y Xa
3. cov i , j 0
ar 1 xir 1 ar i
i j
i 1, n
автокорреляция
отсутствует

15.

Условия Гаусса-Маркова для модели
линейной множественной регрессии
yi a1 xi1 a2 xi 2
Y Xa
4.
Случайные ошибки
переменных x , x
1
2
ar 1 xir 1 ar i
i
, xr 1
i 1, n
не зависят от объясняющих

16.

Условия Гаусса-Маркова для модели
линейной множественной регрессии
yi a1 xi1 a2 xi 2
Y Xa
5.
ar 1 xir 1 ar i
i 1, n
n r , rangX r
– число наблюдений больше
числа оцениваемых параметров и все r столбцов матрицы
X линейно независимы.
Для обеспечения статистической надежности должно
выполняться условие: n 3r

17.

Условия Гаусса-Маркова
Модель Y Xa , удовлетворяющая условиям 1-5
называется классической линейной моделью
множественной регрессии (КЛММР)

18.

Условия Гаусса-Маркова
Если к 5-ти условиям добавляют шестое
6) Нормальность ошибок: i
N 0, 2
То модель Y Xa
называется
классической нормальной линейной моделью
множественной регрессии (КНЛММР)

19.

CВОЙСТВА ОЦЕНОК КОЭФФИЦИЕНТОВ в
КЛММР (ТЕОРЕМА ГАУССА-МАРКОВА)
В КЛАССИЧЕСКОЙ ЛИНЕЙНОЙ МОДЕЛИ МНОЖЕСТВЕННОЙ
РЕГРЕССИИ (выполнены 5 условий Гаусса-Маркова) ОЦЕНКИ
НАИМЕНЬШИХ КВАДРАТОВ
a X X X Y
T
1
T
ЯВЛЯЮТСЯ НЕСМЕЩЕННЫМИ , СОСТОЯТЕЛЬНЫМИ,
ЭФФЕКТИВНЫМИ
Если модель является нормальной (выполнены 6 условий
Гаусса-Маркова), то оценки наименьших квадратов имеют
нормальное распределение. Это позволяет проверять гипотезы и
строить прогнозы с заданным уровнем надежности.

20. ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ

y a1 x1 a2 x2
ar 1 xr 1 ar
Интерпретация: коэффициент регрессии при переменной xi
показывает на сколько единиц изменится переменная y при
изменении переменной xi на 1 единицу, при условии
постоянства других переменных:

21. Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы

Коэффициен
ты
Стандартна
я ошибка
tстатист
ика
PЗначение
Y-пересечение
-26,93164811
4,523407834
-5,95384
4,73E-09
N
2,674036105
0,231999296
11,52605
1,28E-27
0,59409725
0,137923673
4,307435
1,96E-05
Nrab
Zpl = 2.67*N + 0.59*NRab -26.93
21

22. Пример оценки параметров в модели зависимости заработной платы от числа лет обучения и опыта работы

Коэффициен
ты
Стандартна
я ошибка
tстатист
ика
PЗначение
Y-пересечение
-26,93164811
4,523407834
-5,95384
4,73E-09
N
2,674036105
0,231999296
11,52605
1,28E-27
0,59409725
0,137923673
4,307435
1,96E-05
Nrab
Zpl = 2.67*N + 0.59*NRab -26.93
Каждый дополнительный год обучения при данном опыте работы увеличивает
часовой заработок на 2,67$
Каждый дополнительный год опыта работы при данной продолжительности
обучения увеличивает часовой заработок на 0,59$
-26,93 не имеет содержательной интерпретации.
22

23. ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Пример y – затраты на питание (млрд. $)
x1 – личный располагаемый доход (млрд. $)
x2 – индекс цен на продукты питания (%)
y 0,112 x1 0,739 x2 116,7

24. ИНТЕРПРЕТАЦИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Пример y – затраты на питание (млрд. $)
x1 – личный располагаемый доход (млрд. $)
x2 – индекс цен на продукты питания (%)
y 0,112 x1 0,739 x2 116,7
При увеличении личного располагаемого дохода на 1 млрд. $ (при
сохранении неизменной цены) расходы на питание увеличатся на
112 млн.$
При увеличении индекса цен на 1 процентный пункт (при сохранении
постоянных доходов) расходы на питание сократятся на 739 млн.$
116,7 не интерпретируется, т.к. x1 и x2 не могут быть равными 0.

25.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Пример y – затраты на питание (млрд. $)
x1 – личный располагаемый доход (млрд. $)
x2 – индекс цен на продукты питания (%)
y 0,112 x1 0,739 x2 116,7
При увеличении личного располагаемого дохода на 1 млрд. $ (при
сохранении неизменной цены) расходы на питание увеличатся на
112 млн.$
При увеличении индекса цен на 1 процентный пункт (при сохранении
постоянных доходов) расходы на питание сократятся на 739 млн.$
116,7 не интерпретируется, т.к. x1 и x2 не могут быть равными 0.
Какой фактор (доход или цена) оказывают большее влияние на расходы на
питание?

26.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Расчет средних эластичностей
Ej aj
xj
y
Средняя эластичность j-го фактора. Показывает на сколько %
изменится среднее значение фактора y при увеличении среднего
значения фактора xj
на 1% от среднего значения

27.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Пример y – затраты на питание (млрд. $)
x1 – личный располагаемый доход (млрд. $)
x2 – индекс цен на продукты питания (%)
y 0,112 x1 0,739 x2 116,7
y 128 ì ëðä$ x1 780 ì ëðä$ x2 120

28.

Сравнение влияния на зависимую переменную
различных объясняющих переменных
Пример y – затраты на питание (млрд. $)
x1 – личный располагаемый доход (млрд. $)
x2 – индекс цен на продукты питания (%)
y 0,112 x1 0,739 x2 116,7
y 128 ì ëðä$ x1 780 ì ëðä$ x2 120
780
E1 0,112
0, 68
128
120
E2 0, 739
0, 69
128
English     Русский Правила