Похожие презентации:
Эконометрика
1. Эконометрика
2. Эконометрика и эконометрическое моделирование: основные понятия и определения
3.
• Под экономическим объектом будемпонимать любой элемент экономики
(микроуровень: фирмы, семьи,
предприятия; мезоуровень: регионы,
отдельный сектор экономики, отрасли,
корпорации; макроуровень: экономика
страны в целом).
• Экономические переменные — это набор
количественных характеристик,
описывающий деятельность
экономического объекта.
4.
• Эконометрика — это научная дисциплина,объединяющая совокупность теоретических
результатов, приемов, методов и моделей,
предназначенная для того, чтобы на базе:
экономической теории, экономической
статистики и экономических измерений,
математико-статистического инструментария
придавать конкретное количественное
выражение общим (качественным)
закономерностям, обусловленным
экономической теорией).
5.
Эконометрика является одним из разделовматематического моделирования экономических
процессов, который базируется:
• на экономической теории;
• экономической статистике и экономических
измерениях;
• математико-статистическом инструментарии,
и предназначена для построения эконометрических
моделей, которые используются для оценивания и
прогнозирования значений экономических
переменных, недоступных для измерения.
6. Этапы построения эконометрических моделей и принципы спецификации
7.
Построение эконометрических моделей (как иэкономико-математических) выполняется в
несколько этапов:
1) спецификация модели;
2) сбор статистической информации об объекте
исследования;
3) оценка параметров модели
(параметризация, настройка);
4) проверка адекватности модели
(верификация).
8.
• Экономико-математическая модель объекта(математическая модель экономического
объекта) представляет собой математически
выраженную связь между его
экономическими переменными.
• Это либо набор графиков или таблиц, либо
система математических уравнений
(алгебраических, конечно-разностных,
дифференциальных, интеральных и т. д.) и,
возможно, неравенств, связывающих воедино
экономические переменные объекта.
9.
По отношению к выбранной спецификации всеэкономические переменные объекта
подразделяются на два типа:
• эндогенные
• экзогенные.
10.
Определение• Экзогенными (независимыми)
называются экономические переменные,
значения которых определяются вне
данной модели.
11.
• Эндогенными (зависимыми)называются экономические
переменные, значения которых
определяются (объясняются) внутри
модели в результате одновременного
взаимодействия соотношений,
образующих модель.
12.
Определение• При наличии хотя бы одной экзогенной
переменной модель называется
открытой, в противном случае —
замкнутой.
13. Первый принцип спецификации
• Экономико-математическая модельстроится по результатам математической
формализации закономерностей общей
экономической теории.
14. Второй принцип спецификации
• В правильно составленнойспецификации содержится столько
уравнений, сколько эндогенных
переменных включается в модель
15. Третий принцип спецификации
• Учет фактора времени в экономическихмоделях, или датирование
экономических переменных.
16.
Определение• Переменные модели называются
датированными, если обозначена их
зависимость от времени.
17.
• Если экономические утвержденияотражают статическую (относящуюся к
одному периоду времени) взаимосвязь
всех включённых в модель переменных,
то значения таких переменных принято
называть пространственными
данными.
И надобности в их датировании нет.
18.
• Если экономические утвержденияотражают динамическую (зависящую
от фактора времени) взаимосвязь
включённых в модель переменных, то
значения таких переменных датируют
и называют динамическими или
временными рядами
19.
Определение• Лаговыми называются экзогенные или
эндогенные переменные
экономической модели, датированные
предыдущими моментами времени и
находящиеся в уравнении с текущими
переменными.
20.
• Модели, включающие лаговыепеременные, относятся к классу
динамических моделей.
21.
ОпределениеПредопределёнными называются лаговые
и текущие экзогенные переменные, а
также лаговые эндогенные переменные.
22. Четвертый принцип спецификации
• Включение случайных возмущений вспецификацию экономической модели.
23.
• Экономические модели сослучайными возмущениями принято
называть эконометрическими.
24.
• На первом этапе построенияэконометрических моделей, то есть —
спецификации модели привлекается
общая экономическая теория и
математика и не содержат
информацию о конкретных значениях
параметров модели.
25.
• Поэтому для построения оценок (илипрогнозов) значений эндогенных
переменных необходимо привлечь
результаты статистических наблюдений
за данным экономическим объектом,
полученные на втором этапе
построения модели.
26.
• Далее, на основании статистическойинформации при помощи статистических
методов (как правило, методов
регрессионного анализа) выполняется
оценка параметров модели — третий
этап построения модели (этап
настройки).
27.
• Таким образом, на втором и третьемэтапах привлекается третья
составляющая эконометрики —
статистика (теория статистических
измерений и математическая
статистика).
28.
• Следующий этап построенияэконометрической модели —
верификация (проверка адекватности
модели).
• На данном этапе проверяется
соответствие модели эмпирическим
данным.
29. Структурная и приведенная формы эконометрических моделей
Для построения прогнозов эндогенных переменныхнеобходимо
выразить
текущие
эндогенные
переменные модели в виде явных функций
предопределённых
переменных.
Последняя
спецификация,
полученная
путем
включения
случайных возмущений получена в результате
математической
формализации
экономических
закономерностей. Такая форма спецификации
называется структурной. В общем случае в
структурной спецификации эндогенные переменные
не выражены в явном виде через предопределенные.
30.
Вмодели
равновесного
рынка
только
переменная предложения выражена в явном
виде через предопределенную переменную,
поэтому
для
представления
эндогенных
переменных
через
предопределенные
необходимо
выполнить
некоторые
преобразования структурной формы. Решим
систему уравнений для последний спецификации
относительно эндогенных переменных.
31.
ПолучимYtd =a0+a1 pt+a2 xt+ut,
Ys =b0+b1 pt-1+vt,
b1>0
Ytd =Yts
a1<0,
a2>0,
32.
Подставим первое и второе уравнения в третье,а0 + а1 pt +а2 хt +ut =b0 +b1 pt-1 + vt ,
и выразим текущее значение цены равновесия
через предопределенные переменные:
33.
Окончательно получим выражение спроса черезпредопределенные переменные:
Таким образом, после преобразований
спецификация модели принимает следующий вид:
Ytd =b0+b1 pt-1+vt,
Ys =b0+b1 pt-1+vt,
pt=c0 + c1 pt-1+c2 xt +εt,
с1<0, с2>0, b1>0
34.
Таким образом, эндогенные переменныемодели выражены в явном виде через
предопределенные
переменные.
Такая
форма спецификации получила название
приведенной. В частном случае структурная и
приведённая формы модели могут совпадать.
При правильной спецификации модели пере
ход от структурной к приведённой форме
всегда
возможен,
обратный
переход
возможен не всегда.
35. Матричная запись структурной и приведенной форм моделей
Введем следующие обозначения:• Yt — вектор-столбец текущих значений эндогенных переменных;
• Xt — расширенный вектор-столбец предопределённых
переменных, значения которых известны к моменту t;
• А и В — матрицы коэффициентов структурной формы модели
(структурные коэффициенты);
• Vt — вектор-столбец текущих возмущений.
С учетом данных обозначений матричная запись структурной
формы эконометрической модели принимает вид
A Yt +B Xt=Vt .
36.
Представим спецификацию модели равновесногорынка в матричной форме. Для этого
предварительно в каждом уравнении системы
перенесем все члены (кроме случайных
возмущений) в левую часть:
Ytd – a0 – a1 pt – a2 xt =ut, a1<0, a2>0,
Ys – b0 – b1 pt-1=vt, b1>0
Ytd – Yts = 0
Элементы вектора эндогенных переменных
следующие:
Yt=(Ytd,Yts,pt)T
37.
Предопределенные переменные модели:лаговое значение цены товара;
текущий доход потребителя.
Расширенный вектор X, включает три элемента:
Xt=(1, pt-1, xt)T
Элементами вектора Vt в модели являются текущие возмущения
соответствующих поведенческих уравнений и нулевой элемент
— правая часть уравнения тождества
Vt=( ut, vt , 0)T .
Матрицы структурных коэффициентов А и В состоят из
следующих элементов:
a0
B b0
0
0
b1
0
a2
0
0
38.
Матричное представление приведённой формыспецификации следующее:
Yt=M Xt+Ut,
где М— матрица приведенных коэффициентов,
то есть
М = –А-1 В.
Или
Окончательно получим
39.
Окончательно получимВектор случайных возмущений в приведённой форме
получается в результате преобразования
Ut = A-1 Vt
40.
Или в координатной форме41. Пример. Модель формирования национального дохода (Дж. М. Кейнс)
42.
Исследуемым экономическим объектомявляется закрытая национальная
экономика без государственного
вмешательства.
Экономические переменные модели:
Y, С, I,
где Y— уровень совокупного выпуска
(национальный доход), С — объём
потребления, I— величина инвестиций. I.
43.
Требуется:A. Составить спецификацию
макромодели, позволяющей
объяснять величины Y (национального
дохода) и С (объем потребления)
уровнем инвестиций
44.
При составлении спецификации моделивоспользоваться следующими
утверждениями экономической теории:
1) потребление возрастает с увеличением
совокупного выпуска, причём рост
потребления происходит медленнее
роста совокупного выпуска;
2) в закрытой экономике без
государственного вмешательства
потребление и инвестиции в сумме
равны совокупному выпуску (тождество
системы национальных счетов).
45.
Б. Уточнить спецификацию путемдатирования переменных. При да
тировании экономических переменных
данной модели следует учесть еще один
факт экономической теории: текущее
потребление зависит от совокупного
выпуска предыдущего периода.
46.
B. Уточнить спецификацию включениемслучайного возмущения.
Г. Составить приведенную форму
спецификации.
Д. Записать структурную и приведенную
формы в матричном виде.
47.
Решение.Воспользуемся
первым
принципом
спецификации
и
формализуем
экономические законы, характеризующие
данный экономический объект.
48.
А. Исходя из первой закономерностиэкономической теории, имеем:
C = a+bY, 0<b<1, а>0,
где а — базовое потребление, b —
предельное потребление в
зависимости от дохода (склонность к
потреблению).
49.
Из второй предпосылки следует тождествоY = C + I.
Таким образом, структурная форма
модели, полученная в результате
формализации экономических
закономерностей, имеет вид
C = a + bY, 0<b<l, а>0,
Y = C + I.
50. Вывод
Спецификация составлена правильно, так какв структурной форме, в соответствии со
вторым принципом, должно быть два
уравнения — модель включает две
эндогенные переменные модели:
уровень дохода Y;
уровень потребления С.
Экзогенной переменной является I — уровень
инвестиций.
51.
Б. Третий принцип спецификации —датирование переменных. Необходимо
уточнить спецификацию: датировать
экономические переменные, т. е. учесть их
зависимость от фактора времени.
52.
При датировании экономическихпеременных данной модели следует
учесть тот факт, что текущее
потребление зависит от совокупного
выпуска предыдущего периода, поэтому
уточненная датированная структурная
спецификация принимает вид:
Ct=a+bYt-1 0<b<1, а>0,
Yt = Ct+It.
53.
В. Уточним спецификацию включениемслучайного возмущения, г. с. перейдем
от экономической модели к
эконометрической. Случайные
возмущения включаются в
поведенческие уравнения системы и не
включаются в уравнения тождества.
54.
В спецификации поведенческим уравнением является первое, таким
образом, спецификация
эконометрической модели,
составленная с использованием
четырех принципов, следующая:
Сt =a+b Yt-1 + εt , 0<b<1, а>0,
Yt = Сt +It
где εt — случайное возмущение,
учитывающее влияние не включенных
н данное уравнение факторов.
55.
Г. Составим приведенную форму спецификации. Решимсистему и выразим эндогенные переменные модели
через предопределенные и явном виде. В первом
уравнении системы эндогенная переменная уже явно
выражена через предопределенную (лаговое значение
эндогенной переменной Yt-1), поэтому оставим его без
изменения. Подставим первое уравнение системы во
второе и выразим текущую эндогенную переменную Yt
через предопределенные переменные модели (Yt-1, It):
Yt = a + bYt-1+It+ εt .
Таким образом, приведенная форма модели
принимает вид:
Сt =a + bYt-1 + εt , Yt =a + bYt-1 + It + εt .
56.
Д. Матричный вид структурной иприведенной форм спецификации.
Сформируем векторы эндогенных и
предопределенных переменных модели.
Вектор-столбец эндогенных переменных
модели:
Yt =(Ct,Yt)T;
расширенный вектор-столбец
предопределенных переменных модели:
Xt=(1, Yt-1, It)T .
57.
Запишем уравнения структурной формы вследующем виде:
Сt – a bYt-1 = εt , Yt – Ct – It =0 .
тогда матричный вид структурной формы
следующий
58.
Решим матричное уравнение относительновектора эндогенных переменных
Yt=–A-1B Xt +A-1 Vt = M Xt + Ut,
где Ut = A-1 Vt.
Обратим матрицу А, выразим элементы
матрицы
М
через
структурные
коэффициенты, а вектор возмущений
приведенной
формы
через
вектор
возмущений структурной формы:
59.
Приведенная форма модели принимает вид60. Парная линейная регрессия
Сущностьрегрессионного анализа
61.
Функция регрессии Y на X.M(Y│x) = f(x),
Где X - независимая (объясняющая)
переменная (регрессор),
Y — зависимая (объясняемая) переменная
Множественная регрессия
M(Y│x1, x2, ..., хт) =f(x1, х2, ..., хт),
62. Регрессионные модели (уравнения)
Y = M(Y│x) + ε,Y = M(Y│x1, x2, ...,xm) + ε,
63. Причины обязательного присутствия в регрессионных моделях случайного фактора (отклонения)
1. Невключение в модель всех объясняющихпеременных.
2. Неправильный выбор функциональной
формы модели.
3. Агрегирование переменных.
4. Ошибки измерений.
5. Ограниченность статистических данных.
6. Непредсказуемость человеческого фактора.
64. Этапы построения уравнения регрессии
1) выбор формулы уравнения регрессии;2) определение параметров выбранного
уравнения;
3) анализ качества уравнения и проверка
адекватности уравнения эмпирическим
данным, совершенствование уравнения.
65. Корреляционное поле (диаграмма рассеивания)
66. Парная линейная регрессия
Модель КейнсаI = С = С0 + bI,
где С0 —величина автономного потребления,
b (0 < b < 1) — предельная склонность к
потреблению
67.
68. линейная регрессия (теоретическое линейное уравнение регрессии)
М(Y|х = xi)=β0 + β1 xi,Или со случайным параметром ε
yi = M(Y│X=xi ) + εi = β0 + β1 xi + εi.
где
β0 и β1 — теоретические параметры регрессии;
εi — случайное отклонение.
69. Задачи линейного регрессионного анализа
1. По имеющимся статистическим данным (xi, yi), i =1, 2, ..., n, для переменных X и Y;
а) получить наилучшие оценки неизвестных
параметров β0 и β1 ;
б) проверить статистические гипотезы о параметрах
модели;
в) проверить, достаточно ли хорошо модель
согласуется со статистическими данными
(адекватность модели данным наблюдений).
70. Эмпирическое уравнение регрессии
=b0 + b1 x1,ˆyiгде ˆyi — оценка условного математического
ожидания M(Y │X = xi );
b0 и b1 — оценки неизвестных параметров β0 и β1,
называемые эмпирическими
коэффициентами регрессии.
Тогда
yi = b0 + b1 xi + ei.
где отклонение ei — оценка теоретического
случайного отклонения εi.
71.
72. Оценка тесноты связи
Мерой линейной зависимости двух случайныхвеличин является ковариация этих величин,
определяемая выражением
Cov(x, y) S xy
x2 S x2
y
2
x
x
i
n
i
y хi x
n
73. Нахождение коэффициентов b0 и b1 эмпирического уравнения регрессии
74. Возможные методы нахождения коэффициентов b0 и b1 эмпирического уравнения регрессии
метод наименьших модулей (МНМ).метод наименьших квадратов (МНК)
метод моментов (ММ)
метод максимального правдоподобия (ММП)
75. Метод наименьших квадратов
76.
77.
78. Если, кроме уравнения регрессии Y на X (Y = b0 + b1Х), для тех же эмпирических данных найдено уравнение регрессии X на Y (X = с0 + byY), то произведение к
Если, кроме уравнения регрессии Y на X (Y = b0 +b1Х), для тех же эмпирических данных найдено
уравнение регрессии X на Y (X = с0 + byY), то
произведение коэффициентов bх и by равно r2 ху:
79. Выводы
1. Оценки МНК являются функциями от выборки,что позволяет их легко рассчитывать.
2. Оценки МНК являются точечными оценками
теоретических коэффициентов регрессии.
3. Эмпирическая прямая регрессии обязательно
проходит через точку
.
4. Эмпирическое уравнение регрессии построено
таким образом, что сумма отклонений
,а
также среднее значение отклонения
равны
нулю.
80.
5.П Случайные отклонения ei не коррелированы снаблюдаемыми значениями yi зависимой
переменной Y.
6. Случайные отклонения еi не коррелированы с
наблюдаемыми значениями xi независимой
переменной X.
81. Пример
Для анализа зависимости объема потребленияY(у.е.) домохозяйства от располагаемого дохода
X(у.е.) отобрана выборка объема п = 12
(помесячно в течение года), результаты которой
приведены в таблице. Необходимо определить
вид зависимости; по МНК оценить параметры
уравнения регрессии У на X; оценить силу
линейной зависимости между X и Y;
спрогнозировать потребление при доходе X =
160.
82. Исходные данные
i1
2
3
4
5
6
7
8
9
10
11
12
xi
107 109 110 113 120 122 123 128 136 140 145 150
yi
102 105 108 110 115 117 119 125 132 130 141 144
83. Поле корреляции
84.
85.
86. Выводы
Прогнозируемое потребление прирасполагаемом доходе х = 160 по данной
модели составит y(160) ≈ 153,12.
• коэффициент b1 может трактоваться как
предельная склонность к потреблению (МРС ≈
0,9339). Фактически он показывает, на какую
величину изменится объем потребления, если
располагаемый доход возрастает на одну
единицу.
87.
• На графике коэффициент b1 определяеттангенс угла наклона прямой регрессии
относительно положительного направления
оси абсцисс (объясняющей переменной).
Поэтому часто он называется угловым
коэффициентом.
• Свободный член y0 уравнения регрессии
определяет прогнозируемое значение Y при
величине располагаемого дохода X, равной
нулю (т.е. автономное потребление).
88.
• Очень важно, насколько далеко данные наблюдений за объясняющей переменной отстоят от
оси ординат (зависимой переменной), так как
даже при удачном подборе уравнения
регрессии для интервала наблюдений нет
гарантии, что оно останется таковым и вдали от
выборки. В нашем случае значение b0 = 3,699
говорит о том, что при нулевом располагаемом
доходе расходы на потребление составят в
среднем 3,699 у.е.
89.
Этот факт можно объяснить для отдельногодомохозяйства (оно может тратить накопленные
или одолженные средства), но для совокупности
домохозяйств он теряет смысл. В любом случае
значение коэффициента b0 определяет точку
пересечения прямой регрессии с осью ординат и
характеризует сдвиг линии регрессии вдоль оси
У.
90.
• Следует помнить, что эмпирическиекоэффициенты регрессии b0 и b1 являются лишь
оценками теоретических коэффициентов β0 и
β1, а само уравнение отражает лишь общую тен
денцию в поведении рассматриваемых
переменных. Индивидуальные значения
переменных в силу различных причин могут
отклоняться от модельных значений. В нашем
примере эти отклонения выражены через
значения еi которые являются оценками
отклонений εi для генеральной совокупности.
91.
Однако при определенных условиях уравнениерегрессии служит незаменимым и очень
качественным инструментом анализа и
прогнозирования. Обсуждение этих условий
будет проведено в последующих главах.
• После интерпретации результатов закономерен
вопрос о качестве оценок и самого уравнения в
целом.
92. Проверка качества уравнения регрессии
ПРОВЕРКА КАЧЕСТВАУРАВНЕНИЯ РЕГРЕССИИ
Классическая линейная регрессионная
модель
93.
Рассмотрим модель парной линейнойрегрессии
Y = β0 + β 1X + ε.
94. Предпосылки метода наименьших квадратов
1 . Математическое ожидание случайногоотклонения εi равно нулю: M(εi) = 0 для всех
наблюдений.
Данное условие означает, что случайное
отклонение в среднем не оказывает влияния на
зависимую переменную. В каждом конкретном
наблюдении случайный член может быть либо
положительным, либо отрицательным, но он не
должен иметь систематического смещения.
Отметим, что выполнимость M(εi) =0 влечет
выполнимость M(Y │X = x ) = β + β x .
95.
2. Дисперсия случайных отклонений, постоянна:D(εi) = D(εj) =σ2 для любых наблюдений i и j.
Данное условие подразумевает, что несмотря на то,
что при каждом конкретном наблюдении случайное
отклонение может быть либо большим, либо
меньшим, не должно быть некой априорной
причины, вызывающей большую ошибку
(отклонение).
Выполнимость данной предпосылки называется
гомоскедастичностъю (постоянством дисперсии
отклонений). Невыполнимость данной предпосылки
называется гетероскедастичностъю
(непостоянством дисперсий отклонений).
96.
3. Случайные отклонения εi и εj являютсянезависимыми друг от друга для i ≠ j.
Выполнимость данной предпосылки
предполагает, что отсутствует
систематическая связь между любыми
случайными отклонениями. Другими
словами, величина и определенный знак
любого случайного отклонения не должны
быть причинами величины и знака любого
другого отклонения.
97.
98.
4. Случайное отклонение должно бытьнезависимо от объясняющих переменных.
Обычно это условие выполняется
автоматически, если объясняющие переменные
не являются случайными в данной модели.
5 . Модель является линейной относительно
параметров.
99. Теорема Гаусса-Маркова
Если предпосылки 1 — 5 выполнены, тооценки, полученные по МНК, обладают
следующими свойствами:
1. Оценки являются несмещенными, т.е.
М(b0) = β0, М(b1) = β1. Это вытекает из того, что
М(εi) = 0, и говорит об отсутствии
систематической ошибки в определении
положения линии регрессии.
100.
2. Оценки состоятельны, так как дисперсияоценок параметров при возрастании числа п
наблюдений стремится к нулю. Другими
словами, при увеличении объема выборки
надежность оценок увеличивается (b0
наверняка близко к β0, b1 — близко к β1).
3. Оценки эффективны, т.е. они имеют
наименьшую дисперсию по сравнению с
любыми другими оценками данных па
раметров, линейными относительно величин
yi.
101. Анализ точности определения оценок коэффициентов регрессии
• Модель парной линейной регрессииY = β0 + β 1X + ε.
• Пусть на основе выборки из n наблюдений
оценивается регрессия
102.
• гдеТо есть коэффициент b1 также является
случайным, так как значение выборочной
ковариации Sxy зависит от того, какие
значения принимают Х и Y. Если X можно
рассматривать как экзогенный фактор,
значения которого известны, то значения Y
зависят от случайной составляющей εi.
103.
Теоретически коэффициент b1 можно разложитьна неслучайную и случайную составляющие.
Sxy = cov (X, β0 + β1X +ε) = cov(X, β0) + cov (X, β1X) +
cov (X, ε) =>
Sxy = β1 + cov (X, ε).
Здесь использовались правила вычисления
ковариации:
cov(X, β0) = 0, так как β0 = const,
cov(X, β1X) = β1cov(X, X) =
.
104.
Следовательно,Здесь β1 — постоянная величина (истинное
значение коэффициента регрессии);
— случайная компонента.
Аналогичный результат можно получить и для
коэффициента b0.
105.
ВыводНа практике такое разложение осуществить невоз
можно, поскольку неизвестны истинные значения
β0 и β1, а также значения отклонений для всей
генеральной совокупности.
106.
Найдем формулы связи дисперсийкоэффициентов D(b0) и D(b1) с дисперсией σ2
случайных отклонений εi.
Для этого представим формулы определения
коэффициентов b0 и b1 в виде линейных функций
относительно значений Y:
107.
имеем:b1 ci yi
где
b0 d i yi
1
d i ci x
n
108.
109.
выводы• Дисперсий b0 и b1 прямо пропорциональны
дисперсии случайного отклонения σ2.
Следовательно, чем больше фактор случайности,
тем менее точными будут оценки.
• Чем больше число n наблюдений, тем меньше
дисперсии оценок. Это вполне логично, так как
чем большим числом данных мы располагаем,
тем вероятнее получение более точных оценок.
110.
• Чем больше дисперсия (разброс значений )объясняющей переменной, тем меньше
дисперсия оценок коэффициентов.
Другими словами, чем шире область
изменений объясняющей переменной, тем
точнее будут оценки (тем меньше доля
случайности в их определении).
111.
В силу того что случайные отклонения εi повыборке определены быть не могут, при анализе
надежности оценок коэффициентов регрессии
они заменяются отклонениями
ei = yi — b0 — b1xi
значений yi переменной Y от оцененной линии
регрессии.
112.
Диcперсия случайных отклонений D(εi) = σ2заменяется ее несмещенной оценкой
2
1
ei
2
S
yi b0 b1 xi
n 2
n 2
2
Тогда
S x
2
2
D b0 S
x
S
2
b
n xi x
2
2
b0
2
i
1
113.
Где- необъясненная дисперсия (мера
разброса зависимой переменной вокруг линии
регрессии).
Корень квадратный из необъясненной дисперсии
называется стандартной ошибкой оценки
(стандартной ошибкой регрессии).
— стандартные отклонения случайных
величин b0 и b1, называемые стандартными
ошибками коэффициентов регрессии.
114. Графическая интерпретация
Коэффициент b1 определяет наклон прямойрегрессии. Чем больше разброс значений Y вокруг
линии регрессии, тем больше (в среднем) ошибка
определения наклона прямой регрессии.
115.
Например, на рис. а все наблюдаемые точкилежат на одной прямой. Тогда через любой набор
точек проводится одна и та же прямая.
На рис. б точки не лежат на одной прямой, но для
трех точек прямая регрессии будет такой же (хотя
отклонения от линии регрессии существенны), как
и на рис. а. Однако при исключении из
рассмотрения любой из указанных трех точек
прямые регрессии будут существенно отличаться
друг от друга ((1, 2), (1, 3), (2, 3)). Следовательно,
значительно различаются их углы наклона, а
значит, стандартная ошибка коэффициента
регрессии будет существенной.
116.
В выражении, определяющим значениестандартной ошибки коэффициента регрессии
b1, стоит сумма квадратов отклонений xi от
среднего значения. Эта сумма велика (а
следовательно, вся дробь мала, и дисперсия
оценки меньше), если регрессия определяется на
широком диапазоне значений переменной X.
117.
Например, на рис. через пары точек (1, 3) и(2, 3) проведена одна и та же прямая. Но
диапазон (1, 3) шире диапазона (2, 3). Если
вместо точки 3 рассмотреть либо точку 3а,
либо 3б (т.е. при случайном изменении
выборки), то наклон прямой для пары (1, 3)
изменится значительно меньше, чем для
пары (2, 3).
118.
119.
Дисперсия свободного члена уравнения регрессиипропорциональна дисперсии коэффициента
регрессии.
Действительно, чем сильнее меняется наклон
прямой, проведенной через данную точку, тем
большее разброс значений свободного члена,
характеризующего точку пересечения этой прямой
с осью 0Y.
120.
121.
На рис. через пары точек (1, 2) и (3, 4) проходитодна и та же прямая, пересекающая ось ОY в
точке (0, b0). Для второй из этих пар значения
переменной X больше по абсолютной величине
(при одинаковом диапазоне изменений X и Y),
чем для первой. Если в этих парах точки 1 и 3
изменить на одну и ту же величину (новые точки
1а, 3а), то углы наклона новых прямых (1a, 2) и (3а,
4) будут одинаковы. Но свободный член b01 для
первой прямой будет существенно меньше
отличаться от b0, чем свободный член b02 для
второй прямой.
122. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
Эмпирическоеуравнение
регрессии
определяется на основе конечного числа
статистических данных. Поэтому коэффициенты
эмпирического уравнения регрессии являются
СВ, изменяющимися от выборки к выборке.
123.
При проведении статистического анализа передисследователем зачастую возникает
необходимость сравнения эмпирических
коэффициентов регрессии b0 и b1 с некоторыми
теоретически ожидаемыми значениями β0 и β1
этих коэффициентов.
Данный анализ осуществляется по схеме
статистической проверки гипотез.
124.
Статистической называют гипотезу о видезакона распределения или о параметрах
известного распределения. В первом случае
гипотеза называется непараметрической, а во
втором — параметрической.
• Гипотеза Н0, подлежащая проверке, называется
нулевой (основной).
• Наряду с нулевой рассматривают гипотезу Н1,
которая будет приниматься, если отклоняется Н0.
Такая гипотеза называется альтернативной
(конкурирующей).
125.
Например, если проверяется гипотеза оравенстве параметра θ некоторому значению
θ0, т.е. Н0: θ = θ0, то в качестве альтернативной
могут рассматриваться следующие гипотезы:
126.
Гипотезу называют простой, если она содержитодно конкретное предположение
Гипотезу называют сложной, если она состоит из
конечного или бесконечного числа простых
гипотез
127.
• При проверке гипотезы выборочные данныемогут противоречить гипотезе Н0. Тогда она
отклоняется.
• Если же статистические данные согласуются с
выдвинутой гипотезой, то она не отклоняется.
В последнем случае часто говорят, что нулевая
гипотеза принимается (такая формулировка не
совсем точна, однако она широко
распространена).
• Статистическая проверка гипотез на основании
выборочных данных неизбежно связана с
риском принятия ложного решения.
128.
При этом возможны ошибки двух родов:• Ошибка первого рода состоит в том, что
будет отвергнута правильная нулевая
гипотеза.
• Ошибка второго рода состоит в том, что
будет принята нулевая гипотеза, в то время
как в действительности верна аль
тернативная гипотеза.
129. результаты статистических выводов
Результатыпроверки
гипотезы
Возможные состояния
гипотезы
верна Н0
верна H1
Гипотеза
Ошибка
Н„ отклоняется первого рода
Гипотеза Н0 не Правильный
вывод
отклоняется
Правильный
вывод
Ошибка
второго рода
130.
Вероятность совершить ошибку первого родапринято обозначать буквой α, и ее называют
уровнем значимости. Вероятность совершить
ошибку второго рода обозначают β. Тогда веро
ятность не совершить ошибку второго рода (1 — β)
называется мощностью критерия.
Проверку статистической гипотезы осуществляют
на основании данных выборки. Для этого
используют специально подобранную случайную
величину (статистику, критерий), точное или
приближенное значение которой известно.
131.
Наиболее известные случайные величины(статистики, критерии)
• U (или Z) — стандартизированное нормальное
распределение;
• Т — если она распределена по закону Стьюдента;
— если она распределена по закону ;
• F — если она имеет распределение Фишера.
132.
В целях общности будем обозначать такуюслучайную величину через К.
Основной принцип проверки статистических
гипотез можно сформулировать так: если
наблюдаемое значение критерия К (вычисленное
по выборке) принадлежит критической области,
то нулевую гипотезу отклоняют. Если же
наблюдаемое значение критерия К принадлежит
области принятия гипотезы, то нулевую гипотезу
не отклоняют (принимают).
• Точки, разделяющие критическую область и
область принятия гипотезы, называют
критическими.
133.
Вероятность того, что случайная величина К попадет в произвольный интервал (
), можно
найти по формуле
Зададим эту вероятность равной 1 — α и
вычислим критические точки (квантили) Kраспределения
P K k 2 f k H 0 dk
k
2
2
134.
СледовательноP K k1 2 K k 2
135.
• двусторонней критической областью136.
односторонняя критическая область —правосторонняя или левосторонняя
137. Общая схема проверки гипотез
1. Формулировка проверяемой (нулевой — Н0) иальтернативной (H1) гипотез.
2. Выбор соответствующего уровня значимости α.
3. Определение объема выборки п.
4. Выбор критерия К для проверки Н0.
5. Определение критической области и области
принятия гипотезы.
6. Вычисление наблюдаемого значения критерия
Кнабл.
7. Принятие статистического решения.
138. Проверка гипотез и доверительные интервалы
Для проверки гипотезыH0 : b1 = β1, H1 : b1 ≠ β1,
используется статистика
которая
при
справедливости
H0
имеет
распределение Стьюдента с числом степеней
свободы v = п — 2, где п — объем выборки.
139.
Следовательно, H0 : b1 = β1 отклоняется наосновании данного критерия, если
где α — требуемый уровень значимости.
При невыполнении этого соотношения
считается, что нет оснований для отклонения
Н0.
140.
• Наиболее важной на начальном этапестатистического анализа построенной модели
все же является задача установления наличия
линейной зависимости между Y и X. Эта
проблема может быть решена по той же схеме:
Н0 : b1 = 0, Н1 : b1 ≠ 0.
Гипотеза в такой постановке обычно называется
гипотезой о статистической значимости
коэффициента регрессии. При этом, если Н0
принимается, то есть основания считать, что ве
личина Y не зависит от X.
141.
В этом случае говорят, что коэффициент b1статистически незначим (он слишком близок к
нулю).
При отклонении Н0 коэффициент b1 считается
статистически значимым, что указывает на
наличие определенной линейной зависимости
между Y и X.
В данном случае рассматривается двусторонняя
критическая область, так как важным является
именно отличие от нуля коэффициента регрессии,
и он может быть как положительным, так и
отрицательным.
142.
Поскольку полагается, что β1 = 0, то формальнозначимость оцененного коэффициента регрессии
b1 проверяется с помощью анализа отношения его
величины к его стандартной ошибке .
При выполнении исходных предпосылок модели
эта дробь имеет распределение Стьюдента с
числом степеней свободы v = п — 2, где n — число
наблюдений. Данное отношение называется tстатистикой:
143.
Для t-статистики проверяется нулеваягипотеза о равенстве ее нулю.
Очевидно, t = 0 равнозначно b1 = 0, поскольку
t пропорциональна b1.
Фактически это свидетельствует об отсутствии
линейной связи между X и Y.
144. Гетероскедастичность
• Предпосылки МНК (условия Гаусса—Маркова)2°. Дисперсия случайных отклонений εi
постоянна:
D(εi) = D(εj) = а
для любых наблюдений i и j.
145.
Выполнимость данной предпосылкиназывается гомоскедастичностъю
(постоянством дисперсии отклонений).
Невыполнимость данной предпосылки
называется гетероскедастичностью
(непостоянством дисперсий отклонений).
146.
• Данное условие подразумевает, что, несмотряна то, что при каждом конкретном
наблюдении случайное отклонение может
быть большим либо маленьким,
положительным либо отрицательным, не
должно быть априорной причины,
вызывающей большую ошибку (отклонение)
при одних наблюдениях и меньшую — при
других.
147.
148.
149. Последствия гетероскедастичности
• При гетероскедастичности последствия примененияМНК будут следующими.
1. Оценки коэффициентов по-прежнему останутся
несмещенными и линейными.
2. Оценки не будут эффективными (т.е. они не будут
иметь наименьшую дисперсию по сравнению с
другими оценками данного параметра). Они не будут
даже асимптотически эффективными. Увеличение
дисперсии оценок снижает вероятность получения
максимально точных оценок.
150.
3. Дисперсии оценок будут рассчитываться сосмещением. Смещенность появляется
вследствие того, что не объясненная
уравнением регрессии дисперсия, которая
используется при вычислении оценок
дисперсий всех коэффициентов, не является
более несмещенной.
151.
4. Вследствие вышесказанного все выводы,получаемые на основе соответствующих t- и Fстатистик, а также интервальные оценки будут
ненадежными. Следовательно, статистические
выводы, получаемые при стандартных
проверках качества оценок, могут быть
ошибочными и приводить к неверным за
ключениям по построенной модели. Вполне
вероятно, что стандартные ошибки
коэффициентов будут занижены, а следова
тельно, t-статистики будут завышены. Это
может привести к признанию статистически
значимыми коэффициентов, таковыми на
самом деле не являющихся.
152.
Причина неэффективности оценок МНК пригетероскедастичности
153. Обнаружение гетероскедастичности
Не существует какого-либо однозначногометода определения гетероскедастичности.
Рассмотрим наиболее популярные и
наглядные:
• графический анализ отклонений,
• тест ранговой корреляции Спирмена,
• тест Парка,
• тест Глейзера,
• тест Голдфелда—Квандта.
154. Графическое представление отклонений
• по оси абсцисс откладываются значения (хi)объясняющей переменной X (либо
линейной комбинации объясняющих
переменных
Y = b0 + b1 X1 + ... + bmХm,
• а по оси ординат либо отклонения еi, либо
их квадраты ei2, i = 1, 2, ..., п.
155.
156.
• На рис. а все отклонения ei2 находятся внутриполуполосы постоянной ширины, параллельной оси
абсцисс. Это говорит о независимости дисперсий ei2 от
значений переменной X и их постоянстве, т.е. в этом
случае выполняются условия гомоскедастичности.
• На рис. б—д наблюдаются некоторые систематические
изменения в соотношениях между значениями
переменной X и квадратами отклонений . ei2
• Cитуации, представленные на рис. б — д, отражают
большую вероятность наличия гетероскедастичности
для рассматриваемых статистических данных.
157. Тест ранговой корреляции Спирмена
ПредположениеДисперсия отклонения будет либо увеличиваться,
либо уменьшаться с увеличением значений X.
Поэтому для регрессии, построенной по МНК,
абсолютные величины отклонений еi и значения
xi случайной величины X будут коррелированы.
158.
• Ранжируем, то есть упорядочиваем повеличинам значения xi и еi .
• Определяем коэффициент ранговой
корреляции:
где di — разность между рангами xi и еi, i = 1,
2, ... , n; n — число наблюдений.
159.
• Если коэффициент корреляции rхe для генеральной совокупности равен нулю, то статистика
t
rxe n 2
1 rxe2
имеет распределение Стьюдента с числом
степеней свободы v=n-2.
160.
• Следовательно, если наблюдаемое значение tстатистики, превышает tкp = ta/2,n-2 (определяемоепо таблице критических точек распределения
Стьюдента), то необходимо отклонить гипотезу о
равенстве нулю коэффициента корреляции rxie, а
следовательно, и об отсутствии ге
тероскедастичности.
• В противном случае гипотеза об отсутствии
гетероскедастичности принимается.
161.
• Если в модели регрессии больше чем однаобъ