Э К О Н О М Е Т Р И К А
Тема 2. Корреляция. Парная регрессия.
Функциональные и корреляционные типы связей
Корреляция
Оценка значимости коэффициента корреляции
Вычисление коэффициентов парной корреляции
Влияние аномальных наблюдений на результаты вычислений
Матрица коэффициентов парной корреляции
Задача 1. Задание по эконометрическому моделированию стоимости квартир в Московской области
Примеры задач, решаемых с помощью регрессионных моделей
Регрессионные модели с переменной структурой (фиктивные переменные).
Прогноз по модели Y=10,25+4,69X
Построение доверительного интервала прогноза
Построение доверительного интервала прогноза
График прогноза
556.50K
Категория: МатематикаМатематика

Корреляция. Парная регрессия

1. Э К О Н О М Е Т Р И К А

ЭКОНОМЕТРИКА

2. Тема 2. Корреляция. Парная регрессия.

1. Функциональные и корреляционные типы связей. Ковариация, корреляция.
2. Анализ линейной статистической связи экономических данных, корреляция;
вычисление коэффициентов корреляции, проверка значимости.
3. Измерение тесноты связи между показателями. Анализ матрицы коэффициентов
парной корреляции.
4. Понятия регрессионного анализа: зависимые и независимые переменные.
5. Предпосылки применения метода наименьших квадратов (МНК).
6. Свойства оценок метода наименьших квадратов (МНК).
7. Линейная модель парной регрессии. Оценка параметров модели с помощью
метода наименьших квадратов (МНК).
8. Показатели качества регрессии модели парной регрессии.
9. Анализ статистической значимости параметров модели парной регрессии.
10. Интервальная оценка параметров модели парной регрессии.
11. Проверка выполнения предпосылок МНК.
12. Интервалы прогноза по линейному уравнению парной
регрессии.(Прогнозирование с применением уравнения регрессии).
13. Понятие и причины гетероскедастичности. Последствия гетероскедастичности.
Обнаружение гетероскедастичности.
14. Нелинейная регрессия. Нелинейные модели и их линеаризация.
2

3. Функциональные и корреляционные типы связей

Рассматривая зависимости между признаками,
выделяют две категории зависимости:
1) функциональные и 2) корреляционные.
Зависимость величины Y от Х называется
функциональной, если каждому значению
величины Х соответствует единственное
значение величины У.
Корреляционная связь - это связь, где воздействие
отдельных факторов проявляется только как
тенденция (в среднем) при массовом
наблюдении фактических данных.
3

4.

4

5. Корреляция

Основная
задача
корреляционного
анализа
заключается
в
выявлении
взаимосвязи
между
случайными
переменными
путем
точечной
и
интервальной оценки парных (частных) коэффициентов
корреляции, вычисления и проверки значимости
множественных
коэффициентов
корреляции
и
детерминации. Кроме того, с помощью корреляционного
анализа решаются следующие задачи:
• отбор факторов, оказывающих наиболее существенное
влияние на результативный признак, на основании
измерения степени связи между ними;
• обнаружение ранее неизвестных причинных связей.
5

6.

• При изучении взаимосвязи между двумя
факторами их, как правило, обозначают X и Y
• Для измерения силы связи между двумя
переменными используется статистическая
характеристика, называемая
• коэффициентом корреляции
n
1
( xi x )( yi y )
n 1 i 1
rx, y
Sx S y
n
i 1 ( xi x )( yi y )
n
n
i 1 ( xi x ) i 1 ( yi y )
2
6
2

7. Оценка значимости коэффициента корреляции

при малых объемах выборки выполняется с использованием t критерия Стьюдента.
Вычисленное по этой формуле значение tнабл сравнивается с
критическим значением t-критерия, которое берется из таблицы
значений t Стьюдента с учетом заданного уровня значимости и
числа степеней свободы (n-2).
Если tнабл > tкр, то полученное значение коэффициента корреляции
признается значимым.
При этом фактическое (наблюдаемое) значение этого критерия
определяется по формуле:
7

8. Вычисление коэффициентов парной корреляции

Объем продаж
Вычисление коэффициентов парной
корреляции
500
450
400
350
300
250
200
150
100
50
0
107,23;
306,81
96
98 100 102 104 106 108 110 112 114
Индекс потребительских расходов
8

9.

Вычисление коэффициентов парной
корреляции

10. Влияние аномальных наблюдений на результаты вычислений

10

11.

11

12. Матрица коэффициентов парной корреляции

• Коэффициенты парной корреляции используются
для измерения силы линейных связей различных
пар признаков из их множества. Для множества
признаков получают матрицу коэффициентов парной
корреляции R.
12

13. Задача 1. Задание по эконометрическому моделированию стоимости квартир в Московской области

1. Рассчитайте матрицу парных коэффициентов корреляции;
оцените статистическую значимость коэффициентов
корреляции.
2. Постройте поле корреляции результативного признака и
наиболее тесно связанного с ним фактора.
3. Рассчитайте параметры линейной парной регрессии.
4. Оцените качество каждой модели через коэффициент детерминации,
среднюю ошибку аппроксимации и F-критерий Фишера.
5. Осуществите прогнозирование среднего значения показателя при
уровне значимости , если прогнозное значения фактора составит
80% от его максимального значения. Представьте графически:
фактические и модельные значения, точки прогноза.
6. Используя пошаговую множественную регрессию (метод исключения
или метод включения), постройте модель формирования цены
квартиры за счёт значимых факторов. Дайте экономическую
интерпретацию коэффициентов модели регрессии.
7. Оцените качество построенной модели. Улучшилось ли качество
модели по сравнению с однофакторной моделью? Дайте оценку
влияния значимых факторов на результат с помощью коэффициентов
13
эластичности, - и - коэффициентов.

14.

Регрессионный анализ
• предназначен для исследования зависимости
исследуемой переменной от различных факторов и
отображения их взаимосвязи в форме
регрессионной модели.
• В регрессионных моделях зависимая переменная Y
может быть представлена в виде функции f (Х), где
- Х1,Х2,…,Хm независимые (объясняющие)
переменные, или факторы.
• Связь между переменной Y и m независимыми
факторами Х можно охарактеризовать функцией
регрессии Y= f (Х1,Х2,…,Хm ), которая показывает,
каково будет в среднем значение переменной yi,
если переменные Xi примут конкретные значения.
14

15. Примеры задач, решаемых с помощью регрессионных моделей

• Исследование зависимости заработной платы (Y)
от возраста (X1), уровня образования (X2), пола (X3),
стажа работы (X4) ( y a0 a1 x1 a2 x2 a3 x3 a4 x4 )
• Прогноз и планирование выпускаемой продукции по
факторам производства (производственная функция
Кобба – Дугласа означает, что объем выпуска
продукции (Y), является функцией количества капитала
a1 a2
( K ) и количества (L) труда y a0 K L
).
• Прогноз объемов потребления продукции или услуг
определенного вида (кривая Энгеля
a0
y
1 a1e a2 x
где Y -удельная величина спроса, Х - среднедушевой
доход).
15

16. Регрессионные модели с переменной структурой (фиктивные переменные).

• Построена регрессионная модель зависимости
заработной платы работника (Y) от возраста (Х) с
использованием фиктивной переменной по фактору
пол по 20 работникам одного предприятия
y 60, 71 6,98 x 17, 27 z
• Из полученного уравнения регрессии следует, что
при одном и том же возрасте заработная плата у
работников мужчин на 17,27$ в месяц выше, чем у
женщин.
• Из модели, включающей фиктивную переменную
можно получить частные уравнения регрессии для
работников мужчин (z=1) и женщин (z=0):
y 77,98 6,98 x
y 60, 71 6,98 x
( z 1)
( z 0).
16

17.

17

18.

Администрация страховой компании
приняла решение о введении нового
вида услуг – страхование на случай
пожара. С целью определения тарифов
по выборке из 10 случаев пожаров
анализируется зависимость стоимости
ущерба, нанесенного пожаром от
расстояния до ближайшей пожарной
станции.
18

19.

Y-Общая
сумма
ущерба.
тыс.руб.
XРасстоян
ие до
ближайш
ей
станции.
км
1
2
26.2
17.8
3.4
1.8
3
4
31.3
23.1
4.6
2.3
5
6
27.5
36
3.1
5.5
7
8
14.1
22.3
0.7
3
9
19.6
2.6
Общая сумма ущерба. млн.руб.

40
35
30
25
20
15
10
5
0
0
1
2
3
4
6
5
Расстояние до ближайшей
станции. км
19

20. Прогноз по модели Y=10,25+4,69X

Прогноз Х
По исходным данным полагают, что расстояние до
ближайшей пожарной станции уменьшится на 5% от
своего среднего уровня
x 3.13км
xпрогноз 3.13 0.95 2.97 км
Прогноз Y
yпрогноз a b xпрогноз 10.25 4.69 2.97 24.2 тыс. руб.
20

21. Построение доверительного интервала прогноза

U = S yˆ × tα × 1+1/n+
(x прогноз - х ср )2
n
2
(x
x
)
i ср
i=1
1 0, 026
1,801 1,86 1
3,51
10 17,881
Стандартная ошибка 1.801
t(0,1; 8) 1,86
21

22. Построение доверительного интервала прогноза

U = S yˆ × tα × 1+1/n+
(x прогноз - х ср )2
n
(x
i=1
1,801 1,86 1
i
- x ср )2
1 0, 026
3,51
10 17,881
Стандартная ошибка 1.801
Строим доверительный интервал прогноза ущерба с
вероятностью 0,90 (t=1,86). Из полученных результатов видно,
что интервал от 20,67 до 27,7 тыс. руб. ожидаемой величины
ущерба довольно широкий. Значительная неопределенность
прогноза линии регрессии, связана, прежде всего с малым
объемом выборки (n=10), а также тем, что по мере удаления
прогнозного знаения Х от среднего ширина доверительного
интервала увеличивается.
22

23. График прогноза

Общая сумма ущерба.
млн.руб.
40
35
30
25
20
15
10
5
0
0
1
2
3
4
5
6
Расстояние до ближайшей
станции. км
23
English     Русский Правила