МОДЕЛЬ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
1/25

Модель парной линейной регрессии

1. МОДЕЛЬ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ


домохозяйства
Среднедушевой доход
домохозяйства, д.е.
Объем спроса, ед.
1
100
24
2
200
42
3
150
35
4
80
24
5
160
39

2.

Сервис – Анализ данных
Коэффицие Стандарт
нты
ная ошибка
tстатисти
ка
P-Значение
Y-пересечение
9,334052
3,296116
2,831833
0,06609
Переменная X 1
0,170043
0,0228
7,458124
0,004991
y=0,17x+9,33 - функция спроса в зависимости
от дохода.
С ростом дохода на 1 ден.ед. спрос на товар
растет на 0,17 ед.

3. ПОКАЗАТЕЛИ КАЧЕСТВА УРАВНЕНИЯ РЕГРЕССИИ

Все показатели качества используют остатки:
Y
y ax b
y3
e3
e4
y4
y1
e1
e2
y2
x1
x2
ei yi yi yi axi b
x3
x4
называется остатком

4. Как оценить качество построенной модели?

Построим прогноз по модели по формуле
y 0,17x+9,33

5. Как оценить качество построенной модели?

Вычисляем остатки
e y y

6. Как оценить качество построенной модели?

Находим относительную ошибку аппроксимации
A
y y
y
Процентный формат

7. Как оценить качество построенной модели?

Находим среднюю относительную ошибку аппроксимации
среднее по столбцу
В среднем прогноз отличается от наблюдаемого значения на 4,83%

8. Как оценить качество построенной модели?

Еще один показатель качества – коэффициент детерминации
Для его вычисления вычисляем сумму квадратов остатков ESS
(Error Sum of Squares)
Сумма по столбцу

9. Вычисляем суммы квадратов - остаточную, регрессионную и общую

n
ESS yi yi
i 1
n
2
– error sum of squares, остаточная сумма квадратов
отклонений
TSS yi y ns y2
2
i 1
n
RSS yi y
i 1
2
– total sum of squares, общая сумма квадратов
отклонений
– regression sum of squares, регрессионная сумма
квадратов отклонений
Теорема TSS=RSS+ESS

10. Коэффициент детерминации R2

Коэффициентом детерминации называют число
RSS
R
TSS
2
TSS ESS
ESS
R
1
TSS
TSS
2
Коэффициентом детерминации - это доля дисперсии признака y, объясненная
регрессией в общей дисперсии признака y

11. Свойства коэффициента детерминации R2

RSS
R
TSS
2
1)
0 R2 1

12. Свойства коэффициента детерминации R2

RSS
ESS
R
1
TSS
TSS
2
2) Если
R 2 1 , то линия регрессии точно соответствует всем наблюдениям
и между x и y существует линейная функциональная зависимость.
y = 3-2*x
5
45
0
40
-5
35
-10
30
-15
25
-20
y
y
y = 3+2*x
50
20
-25
15
-30
10
-35
5
-40
0
-45
0
2
4
6
8
10
12
x
14
16
18
20
22
0
2
4
6
8
10
12
x
14
16
18
20
22

13. Свойства коэффициента детерминации R2

RSS
ESS
R
1
TSS
TSS
2
3) Если
R 2 0 , то линия регрессии параллельна оси абсцисс и переменная y
не зависит от переменной x.
y = -0,086+0,0002*x
4
3
2
1
y
0
-1
-2
-3
-4
-20
0
20
40
60
80
100
120
x
140
160
180
200
220
240
260

14. Свойства коэффициента детерминации R2

RSS
ESS
R
1
TSS
TSS
2
4) В случае парной линейной регрессии
R cor ( x, y )
2
2

15.

ДИСПР(y)
ESS
R 1
2
n sy
2
94,9% вариации спроса на продукт объясняется доходом и остальные 5,1%
прочими факторами, не включенными в модель

16.

50
y = 0,17x + 9,3341
45
R2 = 0,9488
40
35
30
25
20
15
10
5
0
0
50
100
150
200
250

17. Стандартная ошибка регрессии (средняя квадратическая ошибка) s

1
1 n
s
ESS
yi axi b
n 2
n 2 i 1
2

18. Пример построения уравнения регрессии

При анализе зависимости объема потребления Y (у.е.)
домохозяйства от располагаемого дохода X (у.е.) отобрана
выборка объема n = 12 (помесячно в течение года), результаты
которой приведены в таблице:
18

19. Пример построения уравнения регрессии

Т.о., уравнение парной линейной регрессии имеет вид:
Y 0,9361X 3, 423
150
y = 0,9361x + 3,4226
140
y
130
120
110
100
90
100
110
120
130
140
150
160
x
19

20. Пример построения уравнения регрессии

R 2 0,98
1 n
s
yi axi b
n 2 i 1
2
RSS
ESS
TSS
Y 0,9361X 3, 423
20

21.

Y 0,9361X 3, 423
e Y Y
a=abs(e)/y
A 1, 08%

22.

ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ
140
120
zpl
100
80
60
40
20
0
0
5
10
15
20
25
n
Данные 2002 г. о часовой заработной плате ($ США) и уровне образования (лет) по 540
респондентам из национального опроса в США.
12 лет – средняя школа
13-16 лет – колледж (бакалавриат)
17-18 лет – университет ( магистратура)
19-20 лет - PhD

23.

ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ
Zpl=-12,6188+2,3651N
140
y = 2,3651x - 12,617
R2 = 0,1714
120
zpl
100
80
60
40
20
0
0
5
15
10
20
25
n
Увеличении уровня образования на один год приведет в среднем к увеличению
почасовой заработной платы на $2.37

24.

ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ
R 2 0,17
1 n
s
yi axi b
n 2 i 1
Zpl=-12,6168+2,3651N
2

25.

Zpl=-12,6188+2,3651N
e=zpl-прогноз
a=abs(e)/zpl*100
A 56,51%
English     Русский Правила