Статистическая значимость коэффициента корреляции (Критерий Стьюдента)

Методы определения коэффициентов регрессии

Оценка качества парных регрессионных моделей

Оценка качества парных регрессионных моделей Статистическая значимость коэффициента детерминации

4.Интервальная оценка коэффициентов регрессионного уравнения при заданном уровне значимости

Регрессионные модели с переменной структурой

Задание по эконометрике для студентов заочного отделения Института экономики отраслей, бизнеса и администрирования

3.67M

Категории: $Математика$ Математика

Экономика

Похожие презентации:

Предмет и методы эконометрики

Линейная модель парной регрессии. Метод наименьших квадратов

Эконометрика. Методы исследования в эконометрике

Эконометрика. Место эконометрики в управленческом процессе

Парная линейная регрессия и метод наименьших квадратов

Эконометрика

Эконометрика. Модель парной и множественной линейной регрессии

Эконометрика. Парная регрессия

Парная регрессия

Математическое моделирование и количественные методы исследований в менеджменте

Эконометрики, как наука. Математические методы в экономике

1.

ФГБОУ ВПО «Челябинский государственный университет»
Институт экономики отраслей, бизнеса и администрирования
Кафедра экономики отраслей и рынков
Эконометрика
Курс лекций
Автор: канд. экон. наук Е.А. Бирюкова
Челябинск, 2018
1

2.

Список литературы
Бигильдеева, Т. Б. Эконометрика: учебное пособие /
Т. Б. Бигильдеева, Е. А. Постников .— Челябинск.
Доугерти, К. (Кристофер). Введение в эконометрику: учебник для студентов вузов.
Эконометрика: учебник / И. И. Елисеева [и др.];
под ред. И. И. Елисеевой .— 2-е изд., перераб. и доп. — М.
Магнус, Я. Р. Эконометрика: начальный курс :
учебник / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий .— 8-е изд. — М.
Замков, О. О. Математические методы в экономике:
Учебник / О. О. Замков, А. В. Толстопятенко, Ю. Н. Черемных; — М.
Бородич, С. А. Эконометрика: учебное пособие / С. А. Бородич .— Минск.
Орлов, А. И. Эконометрика:
Учебник для вузов / А. И. Орлов .— 2-е изд., перераб. и доп. — М.
2

3.

Рекомендуемые сайты
для поиска статистических данных
1 www.moex.ru
2. www.gks.ru
3. www.rbc.ru
4. www.cbr.ru
5. www.skrin.ru
6. www.finam.ru
……………………
Journal of Econometrics (Швеция),
Econometric Reviews (США),
Econometrica (США),
Sankhya. Indian Journal of Statistics.
Ser.D. Quantitative Economics (Индия),
Publications Econometriques (Франция)
3

4.

Разделы дисциплины
№ темы
Наименование разделов, тем дисциплины
1
Предмет и метод эконометрики
2
Экономические показатели как случайные величины.
Показатели связи, используемые в эконометрике
3
Парный регрессионный анализ
4
Множественный регрессионный анализ
5
Регрессионные модели с переменной
(использование фиктивных переменных)
6
Специфика построения динамических регрессионных
моделей
7
Гетероскедастичность в регрессионных моделях
8
Эконометрические
модели
одновременных уравнений
в
виде
структурой
системы
4

5.

Задачи курса
1. Получение и систематизирование знания в области
эконометрического анализа
2. Практическое применение эконометрических
методов и моделей
3.Использование пакетов прикладных программ в
эконометрическом анализе
5

6.

Определение эконометрики
Термин «эконометрика» был впервые введен бухгалтером П.
Цьемпой (Австро-Венгрия, 1910 г.) («эконометрия» – у
Цьемпы).
Цьемпа считал, что если к данным бухгалтерского учета
применить методы алгебры и геометрии, то будет получено
новое, более глубокое представление о результатах
хозяйственной деятельности.
Концепция не прижилась, но название «эконометрика»
оказалось весьма удачным для определения нового направления
в экономической науке, которое выделилось в 1930-х г.
6

7.

Определение эконометрики
Термин эконометрика впервые был введен Р. Фришем в 1926
году и в дословном переводе означает «экономические
измерения» или «измерения в экономике».
Создание «Эконометрического общества».
Наряду с широким пониманием, существует узкая трактовка
эконометрики как совокупность методов анализа связей между
различными экономическими показателями (факторами) на
основании реальных статистических данных с использованием
аппарата теории вероятностей и математической статистики.
7

8.

Эконометрика как наука
Экономическая
теория
Эконометрика
Математические
методы
Статистика
8

9. Цели и задачи эконометрики

Задача эконометрики состоит в выявлении связей
между количественными характеристиками
экономических объектов в целях построения
математических правил прогноза (вычисления
приближённых значений) недоступных для
наблюдения количественных характеристик объектов
по наблюдённым или заданным значениям других
количественных характеристик объектов.
Эмпирическим материалом для построения правил
прогноза служат результаты наблюдений за
изучаемыми экономическими объектами (статистика).
9

10.

История эконометрических исследований
1. Политическая арифметика. ( У. Петти, Ч. Давенант, Г.
Кинг) Расчет национального дохода.
У. Петти
10

11.

История эконометрических исследований
2. Статистическая теория. (Гальтон, К. Пирсон, Ф. Эджворт,
Дж.Э. Юл, Г. Хукер)
Связь между уровнем бедности и формами помощи бедным.
Связь между уровнем брачности и благосостоянием,
в котором использовалось несколько индикаторов благосостояния,
Временные ряды.
Ф. Эджворт
11

12.

История эконометрических исследований
3. Г. Мур «Законы заработной платы: эссе по статистической
экономике».
Анализ рынка труда.
Проверка теории производительности Дж. Кларка.
Стратегия
объединения
пролетариата.
4.
Теории по
цикличности
экономики.
К. Жугляр. - 7-11-летние циклы инвестиций.
С. Китчин - 3-5-летнюю периодичность обновления оборотных средств.
С. Кузнец - 15-20-летние циклы в строительстве.
Н. Кондратьев - «длинные волны» продолжительностью 45-60 лет.
12

13.

14.

Гипотеза 2. Возникновение экономического цикла в рыночной
экономике развитых стран обусловлено воздействием экзогенных факторов
денежно-кредитного характера.
14

15.

Гипотеза 3. Возникновение экономического цикла в современной
экономике России обусловлено воздействием экзогенных факторов
внешнеторгового характера.
Полученный коэффициент корреляции r = 0,91619, данное значение
коэффициента характеризует прямую и тесную взаимосвязь.
Тесная взаимосвязь между темпами роста ВВП и темпами роста
экспорта свидетельствует о наличии зависимости объема ВВП России от
внешнеторговых факторов, в частности, от уровня мировых цен на
минеральное сырье, которое имеет преобладающую долю в составе
отечественного экспорта.
15

16.

История эконометрических исследований
5. Макроэкономический анализ.
Межотраслевой баланс В. В. Леонтьева.
6.Ч. Кобб и П. Дуглас «Теория производства».
Влияние затрачиваемого капитала и труда на объем
выпускаемой продукции в обрабатывающей промышленности США.
Впервые производственная функция была рассчитана в 1920-е годы для
обрабатывающей промышленности США в виде равенства
16

17.

Наиболее известные
эконометрические исследования
1) модели потребительского и сберегательного
потребления;
2) модели взаимосвязи риска и доходности ценных
бумаг;
3) модели предложения труда;
4) макроэкономические модели (модель роста);
5) модели инвестиций;
6) маркетинговые модели;
7) модели валютных курсов и валютных кризисов и
17

18. Этапы эконометрического исследования

Анализ социальноэкономических явлений и
процессов
Разработка экономической
модели
Построение эконометрической
модели
Статистические данные
Оценка параметров модели
Проверка качества
построенной модели
нет
Модель адекватна?
да
Использование модели для
целей прогнозирования и
разработки экономической
политики
18

19.

Этапы эконометрического исследования
Подходы к формированию эконометрической модели
«сверху вниз»
«снизу вверх»
19

20.

Спецификация модели
Классификация переменных
Определение. Эндогенной (зависимой) переменной
называется такая переменная, значение которой
формируется внутри модели в результате
взаимодействия с другими переменными.(y)
Определение. Экзогенной (независимой) переменной
называется переменная, значение которой формируется
вне модели.(x)
20

21.

Классификация статистических данных
1. Перекрестные данные или пространственные данные
2.Временные ряды
3.Панельные данные.
Перекрестные (пространственные) данные – это данные по
какому-либо экономическому показателю, полученные для
однотипных объектов и относящиеся к одному периоду
времени.
Например:
данные о расходах разных семей в зависимости от дохода и
состава семьи;
данные о зарплате в зависимости от возраста, стажа,
образования и пр. различных сотрудников;
сведения об объеме производства, количестве работников,
сумме уплаченных налогов по нескольким однотипным
фирмам на один и тот же момент времени.
21

22.

Классификация статистических данных
Временные ряды – данные об одном объекте, процессе за
несколько последовательных моментов времени.
Например:
ежеквартальные (ежемесячные, годовые и пр.) данные по
инфляции или средней заработной плате, или национальному
доходу;
ежедневный курс валют;
котировки ГКО на бирже.
Панельные данные – занимают промежуточное положение: они
отражают наблюдения по большому количеству объектов,
показателей за несколько моментов времени.
Например:
финансовые показатели работы нескольких крупных паевых
инвестиционных фондов за несколько месяцев;
суммы уплаченных налогов нефтяными компаниями за последние
22
несколько лет.

23.

Базовые понятия эконометрики
Случайная величина
Дискретная
Непрерывная
Совокупность
Генеральная
Выборочная
Математическим ожиданием дискретной случайной величины называется
сумма произведений всех ее значений на соответствующие вероятности:
n
M ( x ) x i pi
i 1
23

24.

Базовые понятия эконометрики
Теоретическая
(генеральная)
дисперсия
случайной
величины
определяется как математическое ожидание квадрата отклонения
случайной
относительно ее математического ожидания
D( x ) M x m x
2
Выборочная дисперсия (вариация) представляет собой среднее
арифметическое квадратов отклонений случайной величины от
среднего значения: (ДИСПР(х))
.
.
1 n
2
var( x ) x i x
n i 1
Для разных выборок, взятых из одной и той же генеральной совокупности,
выборочные средние и выборочные дисперсии будут различны (выборочные
характеристики – случайные величины)
24

25.

Базовые понятия эконометрики
Выборочное среднее (СРЗНАЧ(х))
n
1
x xi
n i 1
Для разных выборок, взятых из одной и той же генеральной совокупности,
выборочные средние и выборочные дисперсии будут различны (выборочные
характеристики – случайные величины)
25

26.

Базовые понятия эконометрики
var( x )
Выборочная дисперсия
является смещенной оценкой генеральной дисперсии.
В качестве несмещенной оценки этой дисперсии используется уточненная величина
(исправленная дисперсия): (ДИСП(х))
n
n
1
2
2
S
var( x )
xi x
n 1 оценка дисперсии
n 1генеральной
i 1
несмещенная
S2
совокупности;
S
несмещенная
n
xi
i
оценка
стандартного
отклонения
генеральной
совокупности;(СТАНДОТКЛОН(х))
число
измерений
в
выборке;
i - е значение измеренного показателя в выборке;
порядковый номер измерения.
26

27. Базовые понятия эконометрики

• Ковариация – абсолютный показатель связи двух
показателей. Характеризует направление линейной связи
двух показателей. (Ковар(x,y))
Анализ данных – Ковариация( парный коэффициент)
n
1
xi x yi y
cov x, y
n 1 i 1
cov x, y x y x y
• Коэффициент корреляции – относительный показатель
связи , который характеризует силу и направление
линейной связи двух признаков и изменяется в пределах
от –1 до 1. (Коррел(x,y), Пирсон (x,y))
rx , y
cov x, y
sx s y
27

28.

ЗАДАНИЕ 1
Произвести статистическую выборку 2 параметров
экономического характера, объем выборки 10 единиц, с
предполагаемой взаимосвязью между ними.
Определить количественные показатели линейной взаимосвязи
между этими параметрами.
Выводы
28

29.

Базовые понятия эконометрики
коэффициент частной корреляции x и y при условии постоянства z
Анализ данных - Корреляция
rx , y / z
rx , y rx , z ry , z
(1 rx , z ) (1 ry , z )
2
2
коэффициент полной корреляции
R
rx2, y 2rx , y rx , z ry , z ry2, z
1 rx2, y
29

30. Типы эконометрических оценок

•Точечная оценка. Представляет собой конкретное число,
которое используется в качестве характеристики
случайной величины. Она не дает точного представления
о распределении показателя, однако определяет
их наиболее вероятные значения.
• Интервальная оценка. Представляет собой интервал,
в котором с известной вероятностью находится истинное
значение исследуемого признака.
30

31.

Точечная оценка
Основных свойства точечных оценок:
Несмещенность;
Эффективность;
Состоятельность;
Достаточность
31

32.

Несмещенность;
Точечное значение параметра называется несмещенным,
если математическое ожидание значения оценки равно
истинному значению параметра,
(другими словами, если оценки располагаются симметрично
относительно истинного значения характеристики
генеральной совокупности )
смещенная
оценка
f(x)
E (x )
несмещенная
оценка
X
32

33.

Эффективность;
Оценка называется эффективной,
если она максимально точно описывает истинное
значение.
( мера разброса точечных оценок, получаемых в
различных наблюдениях, минимальна )
эффективная
оценка
f(x)
неэффективная
оценка
X
33

34.

Состоятельность;
Оценка является состоятельной,
если по мере увеличения числа единиц в
анализируемой выборке ее значение стремится к
истинному значению показателя
n=1000
n=200
f(x)
n=50
X
34

35.

Достаточность
Под достаточностью понимают свойство точечной
оценки, согласно которому для ее проведения
используется максимум информации.
При наличии перечисленных свойств оценки
получаются качественные и дают хороший прогноз
35

36.

Интервальная оценка
Интервальная оценка - интервал, в котором с известной
вероятностью находится истинное значение исследуемого
признака.
Такой интервал называется доверительным, а соответствующая
ему вероятность – доверительной вероятностью (p).
Наряду с доверительной вероятностью (p) используют термин
уровень значимости (α=1-p) – вероятность допущения
исследователем ошибок.
В практическом статистическом анализе большую ценность
представляет именно интервальная оценка.
36

37.

Интервальная оценка
Стандартный уровень значимости (α=1-p)
0, 1
0, 01
0, 05
37

38.

Интервальная оценка
доверительный интервал – интервалов, в которых с
известной вероятностью находится изучаемая переменная.
Величина интервала прямо пропорциональна
дисперсии рассматриваемой случайной величины и
обратно зависима от требуемого уровня
значимости.
38

39.

Проверка статистических гипотез
Статистическая гипотеза - некоторое предположение о
законе распределения случайной величины или о параметрах
этого закона, формулируемое на основе выборки
Н0.
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками
отсутствует, называют нулевой (основной)
НА.
Наряду с основной гипотезой рассматривают альтернативную
гипотезу.
И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная
гипотеза.
39

40.

Проверка статистических гипотез
Статистический критерий — строгое математическое правило, по которому
принимается или отвергается та или иная статистическая гипотеза с
известным уровнем значимости.
1 способ проверки гипотез
1. Стандартным уровням значимости соответствуют табличные,
критические значения tкрит (приложение).
2. Если наблюдаемое значение критерия tрасч > tкрит , то гипотеза
нулевая отвергается на заданном уровне значимости. . Исследуемый
показатель статистически значим.
40

41.

Проверка статистических гипотез
tкрит = СТЬЮДРАСПОБР(уровень значимости; степень свободы)
степень свободы = n-k-1
41

42.

Проверка статистических гипотез
2 способ проверки гипотез
1. Наблюдаемому значению критерия соответствует определенный
уровень значимости значимостьt
2. Если значимостьt меньше заданного стандартного уровня
значимости, то нулевая гипотеза отвергается.
3. .Исследуемый показатель статистически значим.
Значимость t =СТЬЮДРАСП(t, степень свободы, 2)
степень свободы = n-k-1
42

43. Статистическая значимость коэффициента корреляции (Критерий Стьюдента)

Проверка гипотезы H0: r = 0
1. Формируем случайную величину
r2
n 2
t расч1
2
1 r
t расч 2
r2
n
2
1 r
где n – количество наблюдений в выборке.
Формула 1 применяется при выборках не более 100 единиц.
Случайная величина tрасч подчиняется закону распределения вероятностей
Стьюдента (приложение).
2. Расчетное значение tрасч сравнивается с критическим
значением tкрит при n-2 степенях свободы и требуемом уровне
значимости (0,05 или 0,01, 0,1).
Если tрасч > tкрит
коэффициент корреляции значимо
отличается от 0 и связь между анализируемыми признаками
статистически значима.
43

44.

ЗАДАНИЕ 2
По ранее выбранным статистическим данным (задание 1)
определить статистическую значимость полученного
коэффициента корреляции для различных стандартных
уровней значимости.
44

45. Классификация эконометрических моделей

В зависимости от цели исследования и специфики
экономической модели:
факторные (регрессионные) статические модели:
y f x1 , x2 , , xm ε
динамические модели:
y f t , x t
модель системы одновременных уравнений:
y1 f x1 , x2 , , xm ε
y f x , x , , x ε
2
1
2
m
y m f x1 , x2 , , xm ε
В зависимости от количества изучаемых факторов:
парная эконометрическая модель (одна факторная переменная)
множественная эконометрическая модель (более одной факторной
переменной)
45

46. Парный регрессионный анализ

Регрессионная модель – это эконометрическая модель,
описывающая зависимость между двумя факторами.
y f x
Уравнение линейной регрессии
yˆ f ( x) a0 a1 x
где a0 и a1 – оценки коэффициентов регрессии
регрессионную модель можно представить в виде:
y yˆ
где yˆ – объясненная на основе построенной модели составляющая
y,
а ε –случайная составляющая, ошибка.
46

47. Методы определения коэффициентов регрессии

Меторы расчета параметров в
уравнении регрессии
«Наивные» методы
Метод средних
Метод проб
Метод
выбранных
точек
Математические методы
МНК, МНМ
Комбинированные
методы
Метод
максимального
правдоподобия
47

48.

Математические методы
Смысл математических методов можно определить как
решение
задачи
минимизации
функционала
F,
формируемого на основе суммирования отклонений
эмпирических данных от результата расчета по
регрессионной модели:
n
n
i 1
i 1
F g ( yi yˆi ) g (ei )
где g() – функция, определяющая аналитическую форму измерения разброса
фактических данных от модели.
48

49.

Математические методы
Наиболее распространены два вида функции g():
g ( yi yˆi ) ( yi yˆi )
2
метод наименьших квадратов (МНК)
g ( yi yˆi ) yi yˆi
методе наименьших модулей (МНМ)
49

50.

недостатки
достоинства
метод наименьших квадратов
метод наименьших модулей
легкость
нечуствительность к
вычислительной
процедуры,
«выбросам»
хорошие статистические
(робастность)
свойства
чувствительность к
«выбросам»
сложность вычислительной
процедуры, неоднозначность,
равнозначность для метода
больших и маленьких
отклонений при условии
равенства их общей суммы
50

51.

функция Хубера
Для совмещения достоинств этих методов разработана более слож
кусочно заданная :
yi yˆi 2 , yi yˆi c
2
ˆ
ˆ
g ( yi yi ) 2c yi yi c , yi yˆi ñ
2
ˆ
2
c
y
y
c
, yi yˆi ñ
i
i
где с – параметр, показывающий границу, начиная с которой в
качестве меры отклонения используется модуль (при меньших – квадрат),
чем он больше, тем сильнее чувствительность .
51

52.

Метод наименьших квадратов
Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Для получения по МНК наилучших результатов (при этом оценки коэффициентов
обладают свойствами состоятельности, несмещенности и эффективности)
необходимо выполнение ряда предпосылок
1. Случайное отклонение имеет нулевое математическое ожидание.
Данное условие означает, что случайное отклонение в среднем не оказывает
влияния на зависимую переменную.
2. Дисперсия случайного отклонения постоянна.
Из данного условия следует, что несмотря на то, что при каждом конкретном
наблюдении случайное отклонение ei может быть различным, но не должно
быть причин, вызывающих большую ошибку
52

53.

54.

Метод наименьших квадратов
Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
1.Математическое ожидание случайного отклонения равно 0 для
M(ε)=0
всех наблюдений:
2.Дисперсия случайных отклонений постоянна:
s const
2
ε
3. Случайные отклонения независимы друг от
друга:
reie j 0 i, j
4 Модель линейна относительно параметров
54

55.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Для получения по МНК наилучших результатов (при этом оценки
коэффициентов обладают свойствами состоятельности, несмещенности и
эффективности)
необходимо выполнение ряда предпосылок
1. Математическое ожидание случайного отклонения равно 0
для всех наблюдений:
M(ε)=0
Ошибка не имеет систематического смещения.
55

56.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
2. Дисперсия случайных отклонений постоянна: для всех
наблюдений (гомоскедастичность)
s const
2
ε
Условие независимости
дисперсии случайной
составляющей
ГОМОСКЕДАСТИЧНОСТЬ
Условие зависимости дисперсии
случайной составляющей от
номера наблюдения
ГЕТЕРОСКЕДАСТИЧНОСТЬ
56

57.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
ГОМОСКЕДАСТИЧНОСТЬ
ГЕТЕРОСКЕДАСТИЧНОСТЬ
57

58.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
3. Случайные отклонения независимы друг от друга:
r i j 0 i, j
Некоррелированность ошибок в разных наблюдениях
58

59.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
59

60.

Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
4. Модель линейна относительно параметров
теорема Гаусса – Маркова
Если условия 1-4 регрессионного анализа выполняются, то
оценки, сделанные с помощью МНК, являются
наилучшими линейными несмещенными оценками
коэффициентов регрессии.
60

61. Метод наименьших квадратов

12
Идея метода
10
8
Пусть имеем выборку n=4.
Задача: оценить с некоторой точностью,
как может проходить эта прямая.
6
4
2
0
0
5
10
15
20
25
Из всего множества регрессий линия выбирается так, чтобы сумма квадратов
расстояний по вертикали между точками и этой линией была бы минимальной .
n
i 1
yi y xi
2
n
i2 min
i 1
61

62.

Метод наименьших квадратов
Коэффициенты линии регрессии
yˆ f ( x) a0 a1 x
Угловой
коэффициент
наклона
Коэффициент
отрезка
sy
xy x y cov( x, y )
r
a1 2
x, y
2
2
sx
sx
x x
a y a x
1
0
Для нахождения коэффициентов а1 и а0 служат функции НАКЛОН
и ОТРЕЗОК. категории «Статистические»
62

63.

Метод наименьших квадратов
Функция ЛИНЕЙН- функция, которая рассчитывает все
основные характеристики линейной регрессии
Коэффициент а1
Коэффициент а0
Стандартная ошибка m а1
Стандартная ошибка m а0
Коэффициент детерминации
Среднеквадратическое отклонение у
F – статистика
Степени свободы п-2
Регрессионная сумма квадратов
Остаточная сумма квадратов
63

64.

ЗАДАНИЕ 3
По выбранным самостоятельно статистическим данным с
помощью функции ЛИНЕЙН () построить и графически
отобразить линейную парную регрессию без свободного члена.
Оценить адекватность модели с помощью коэффициента
детерминации и критерия Фишера.
64

65.

Метод наименьших квадратов
Важно, чтобы регрессионная сумма (объясненная
регрессией) была намного больше остаточной (не
объясненная регрессией, вызванная случайными
факторами).
65

66.

Пример применения МНК
X
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
11,0
12,0
13,0
14,0
15,0
16,0
17,0
18,0
19,0
20,0
Y
1,91
2,76
2,67
4,03
4,12
2,81
6,53
6,24
9,03
6,87
9,09
7,08
7,79
8,75
11,19
10,15
10,52
10,89
10,59
13,40
ỹ
2,17
2,72
3,26
3,80
4,34
4,88
5,42
5,97
6,51
7,05
7,59
8,13
8,68
9,22
9,76
10,30
10,84
11,38
11,93
12,47
е
-0,26
0,04
-0,59
0,23
-0,22
-2,07
1,11
0,27
2,52
-0,18
1,50
-1,05
-0,89
-0,47
1,43
-0,15
-0,32
-0,49
-1,34
0,93
e 2
0,07
0,00
0,35
0,05
0,05
4,30
1,22
0,07
6,36
0,03
2,24
1,11
0,78
0,22
2,05
0,02
0,10
0,24
1,78
0,87
σ(y)
1,20
1,19
1,17
1,16
1,15
1,15
1,14
1,14
1,13
1,13
1,13
1,13
1,14
1,14
1,15
1,15
1,16
1,17
1,19
1,20
X-стаж работы сотрудника;
Y- часовая оплата труда.
Модель: Y=a0+a1X+e
Σxi=210; Σyi=146.42;
Σxi2=2870; Σxiyi=1897.66
20 1897.66 210 146.42
1.63
20 2870 44100
1
a 0 20 155.42 1.63 210 0.54
21.93
2
u 20 2 1.10
a1
66

67.

Пример применения МНК
Графическое отображение результатов
16,00
14,00
12,00
10,00
Y 8,00
6,00
4,00
2,00
0,00
0,00
5,00
10,00
15,00
20,00
25,00
X
67

68.

Нелинейная регрессия.
алгоритм применим только в случае монотонной зависимости между факторами.
Упорядочивание исходных данных по величине x
(объясняющей переменной)
Расчет
ys
и
xs
по фактическим данным
68

69.

Нелинейная регрессия.
Предполагаема
я форма
модели
Уравнение
линейная
y α 0 α1 x ε
показательная
y α0 α1 ε
x
степенная
гиперболическая
(1)
гиперболическая
(2)
y α 0 x α1 ε
α1
y α0 ε
x
1
y
α 0 α, 1 x ε
x
y
,
гиперболическая
α 0 α1 x ε
(3)
логарифмическ
ая
y α0 α1 ln x ε
xs
x1 x n
2
ys
y1 y n
2
x1 xn
2
y1 y n
x1 xn
y1 y n
2 x1 x n
x1 x n
y1 y n
2
x1 xn
2
2 y1 y n
y1 y n
2 x1 x n
x1 x n
2 y1 y n
y1 y n
x1 xn
y1 y n
2
69

70.

Нелинейная регрессия.
ys
значение y, соответствующее
если среди исходных
данных существует
xs
xi ; xi 1
yi 1 yi
xs xi
y s yi
xi 1 xi
xs
:
xi xs xi 1
– фактические значения x, между которыми заключено значение
xs
, а yi и yi+1 – соответствующие им значения зависимой переменной
70

71.

Нелинейная регрессия.
Расчет разницы и выбор формы, которой
соответствует наименьшая разница
ys ys
min
71

72.

Расчет параметров нелинейных регрессионных моделей
Основное требование – уравнение регрессии должно быть либо
линейно относительно параметров, либо преобразуемо в такое
уравнение (это преобразование называется линеаризацией)
В случае линеаризации происходит замена переменных в уравнении
регрессии с тем, чтобы привести его к линейному виду.
Линеаризованы могут быть функции с числом параметров, равным
числу параметров в соответствующей линейной модели (для парной
регрессии – с двумя параметрами),
72

73.

№
п/п
Вид модели
1.
Степенная
2.
Показательная
3.
Логарифмичес
кая
4а.
Гиперболическ
ая
тип 1
4б
.
4в.
5.
8.
Аналитическое выражение
y 1x 2
x ln x
y ln y
ln y ln 1
ln
x
2
, y x
1
2
y ln y
ln y ln 1 2 x α ' ln α
1
α1
y α0
ε
x
,
Гиперболическ
ая
тип 3
,
Тригонометрическая
1
Линеаризованное уравнение
y ln 1 2 x
y '1 2 x
y α0 α1 ln x ε x ln x y α1 α2 x ε
Гиперболическ
ая
тип 2
Логистическая
Замена
переменных
1
y
α 0 α1 x ε
x
y
α 0 α1 x ε
y
1
α 0 α1 e x ε
y α 0 α1 sin x ε
x 1
y 1
x
y
x 1
x
y 1
y
x
x e
y 1
y
x sin x
y α1 α2 x ε
y α1 α2 x ε
y α1 α2 x ε
y α1 α2 x ε
y α1 α2 x ε
73

74.

№п/п
Вид модели
1.
Линейная
Аналитическое выражение
Соответствующее корреляционное поле
y
, где α0 – начальный уровень
y,
y α0 α1 x εα 1 – скорость изменения y
при росте x
x
y
x
, где α0 – начальный уровень
y,
α
y α 0 α1 x ε α
и α2 – параметры,
1
характеризующие скорость
изменения y при росте x
Степенная
2
y
3.
где α 0 – начальный уровень
y,
α 1 – скорость изменения y
при росте x,
2 – величина ускорения
y α 0 α1 x α 2 x 2 α
ε
изменения у при росте х
Параболиче
ская
y
2.
x
x
74

75.

y α0 α1 α 2 ε
y
, где (α0 + α1) – начальный
уровень y,
α1 и α2 – параметры,
характеризующие скорость
изменения y при росте x
Показательная
x
x
y
α2 > 1
0 < α2 < 1
x
, где α0 – уровень y при
x=1,
α1 и α2 – параметры,
характеризующие
скорость изменения y при
y α 0 α1 log α x εросте x
1. 0 < α2 < 1
y
Логарифмическая
x
2
y
5.
2. α2
>1
x
75

76.

y α0
Тригонометричес
кая
y
, где α0 – уровень y при x ∞,
α1 –скорость уменьшения y при
росте x
α2 – предельное значение х,
начиная с которого начинает
убывать y
x
α1
ε
α2 x
, где α0 – значение ряда, вокруг
которого осуществляется
колебательный процесс
α1 – амплитуда колебания y,
α2 – скорость изменения y
y α 0 α1 sin α 2 x ε
y
Гиперболическая
x
76

77. Оценка качества парных регрессионных моделей

Оценка качества регрессионной модели
оценка адекватности
модели в целом
интервальная оценка
составляющих уравнения
регрессии
расчет
коэффициента
детерминации
анализ точности определения коэффициентов
регрессии
(расчет дисперсии коэффициентов)
проверка
статистической
значимости
коэффициента
детерминации
проверка
статистической
значимости
коэффициентов
уравнения регрессии
интервальная оценка
зависимой
переменной (для
средней и для
индивидуальных
значений)
интервальная оценка
коэффициентов
регрессии
77

78.

ЗАДАНИЕ 4
По
исходным
данным
экономического
характера
проанализировать выбор оптимального типа эконометрической
модели :
линейная
a a х
y
0
1
нелинейная вида
y a
0
a1 x
нелинейная вида.
a1
y a0 x
78

79.

Оценка качества парных регрессионных моделей
В оценке качества парных регрессионных моделей можно
выделить следующие основные этапы
:
Анализ адекватности модели в целом
Анализ точности определения (дисперсии и стандартные ошибки) оценок
коэффициентов регрессии
Проверка статистической значимости коэффициентов регрессионного
уравнения
Интервальная оценка коэффициентов регрессионного уравнения при
заданном уровне значимости
Определение доверительных интервалов для зависимой переменной
79

80. Оценка качества парных регрессионных моделей

1. Для определения адекватности
коэффициент детерминации R2.
1 n
s
( yˆ i y) 2
n 1 i 1
модели
в
целом
2
yˆ
R
2
s y2
n
1
( yi y ) 2
n 1 i 1
используется
s
2
yˆ
s
2
y
Если R2 =1, то такая модель называется «абсолютно хорошей». Это означает,
что выбранный регрессор полностью объясняет поведение эндогенной
переменной.
Если R2 =0, то такую модель называют «абсолютно плохой». В этом случае
весь диапазон изменения эндогенной переменной объясняется влиянием
случайного возмущения, а выбранный регрессор не оказывает влияния, не
объясняет поведение эндогенной переменной.
80

81. Оценка качества парных регрессионных моделей Статистическая значимость коэффициента детерминации

2. Проверка статистической гипотезы о равенстве нулю R2: (H0: R2=0).
Внимание! Формулируется гипотеза о равенстве нулю R2, т.е гипотеза о том,
что модель плохая.
Для проверки гипотезы H0: R2=0:
2.1. Формируем случайную величину с известным законом
распределения
2
R
F
n 2
2
1 R
1 способ проверки
2.2. Вычисляется по данным выборки значение Fрасч.
2.3. Находится по таблице значение Fкрит(Pдоверит., k, n-k-1).
Fкрит = FРАСПОБР(α, k, n-k-1)
81

82.

Оценка качества парных регрессионных моделей
Статистическая значимость коэффициента
детерминации
Для проверки гипотезы H0: R2=0:
2.4. Сравниваются значения Fкрит и Fрасч
Если Fрасч ≤ Fкрит,
то гипотеза не отвергается. Значит модель имеет плохое качество
спецификации. Т.е. выбранный регрессор не объясняет поведение
эндогенной переменной.
2 способ проверки
1. Наблюдаемому значению критерия соответствует определенный уровень
значимости
значимостьF=FРАСП(Fрасч;k;n-k-1)
2. Если значимостьF меньше заданного стандартного уровня значимости,
исследуемый показатель статистически значим.
82

83.

Пример оценки значимости R2
Зависимость сбережений граждан (Y) от размера располагаемого дохода
( X) в Великобритании
Y
X
ỹ
8,8
0,36
12,5
9,4
0,21
11,4
10,0
0,08
10,4
10,6
0,20
11,3
11,0
0,10
10,5
11,9
0,12
10,7
12,7
0,41
12,9
13,5
0,50
13,6
14,3
0,43
13,1
30,0
15,5
0,59
14,3
25,0
16,7
0,90
16,6
20,0
18,6
0,82
16,0
15,0
19,7
1,04
17,7
10,0
21,1
1,53
21,4
22,8
1,94
24,6
23,9
1,75
23,1
25,2
1,99
24,9
26,0
2,03
25,3
26,8
2,40
28,1
R2 =0,940367
Fкрит=F(0.95,1,17)=4.4
Fрасч =268,0791
Fрасч > Fкрит
Вывод: Спецификация
модели качественная
5,0
0,0
0,00
0,50
1,00
1,50
2,00
2,50
3,00
83

84.

2. Анализ точности определения оценок регрессии
Осуществляется путем вычисления
дисперсий коэффициентов регрессии.
Для линейной регрессионной модели
y a0 a1 x e
значения выборочных дисперсий будут равны
s
2
a1
s e2
2
x
x
i
s a20
se2 xi2
n xi x
2
x 2 sa21
оценки коэффициентов будут тем точнее,
чем меньше значение необъясненной дисперсии.
84

85.

Оценка качества парных регрессионных моделей
3. Оценка статистической значимости коэффициента регрессии
Гипотеза о равенстве коэффициента регрессии 0.
Для коэффициента a1 такая гипотеза будет иметь вид:
H0 : a1 = 0
H1 : a1 ≠ 0
Для проверки этой гипотезы пользуются t-статистикой для каждого коэффициента:
t
a1
sa1
Правило «грубой» оценки статистической значимости
коэффициентов регрессионного уравнения
№п/п
Значения t
Описание значимости
коэффициента
Доверительная
вероятность
1.
t 1
практически незначим
меньше 0,7
2.
относительно (слабо) значим
от 0,7 до 0,95
3.
1 t 2
2 t 3
существенно значим
от 0,95 до 0,99
4.
3 t
гарантированно значим
больше 0,99
85

86.

3. Оценка статистической значимости коэффициента регрессии
Стандартный, табличный способ
2 способ проверки гипотез
1. Стандартным уровням значимости соответствуют табличные,
критические значения tкрит (приложение).
2. Если наблюдаемое значение критерия tрасч > tкрит , то гипотеза
нулевая отвергается на заданном уровне значимости. . Исследуемый
показатель статистически значим.
tкрит = СТЬЮДРАСПОБР(уровень значимости; степень свободы)
степень свободы = n-k-1
86

87.

3. Оценка статистической значимости коэффициента регрессии
Стандартный, табличный способ
3 способ проверки гипотез
1. Наблюдаемому значению критерия соответствует определенный
уровень значимости значимостьt
2. Если значимостьt меньше заданного стандартного уровня
значимости, то нулевая гипотеза отвергается.
3. .Исследуемый показатель статистически значим.
Значимость t =СТЬЮДРАСП(t, степень свободы, 2)
87

88. 4.Интервальная оценка коэффициентов регрессионного уравнения при заданном уровне значимости

Интервальная оценка коэффициентов регрессионного уравнения
осуществляется для того, чтобы получить более полное представление о
характере регрессионной зависимости между переменными. Ее
результатом будут доверительные интервалы для каждого коэффициента:
Доверительный интервал определяет границы, в которых будет
находиться значение теоретического коэффициента регрессии с уровнем
значимости α.
для a1 –
a1 tα
s
;
a
t
s
a
1
α
a
1
1
; n 2
; n 2
2
2
для a0 –
a0 tα
s
;
a
t
s
a
0
α
a
0
0
; n 2
; n 2
2
2
Уровень значимости α определяется исходя из требуемой точности.
88

89.

5. Определение доверительных интервалов для зависимой переменной
Позволяет решить две задачи:
во-первых, провести интервальную оценку математического ожидания
зависимой переменной для конкретного значения независимой переменной и
заданного уровня значимости,
и, во-вторых, определить границы, за пределами которых может оказаться не
более чем α-ая доля индивидуальных значений зависимой переменной для
конкретного значения независимой переменной.
89

90.

5. Определение доверительных интервалов для зависимой переменной
Ошибка предсказания
Δ=ŷp – yp – разность между предсказанным и действительным
значением результирующей переменной
ПРОГНОЗ
ТОЧЕЧНЫЙ
ИНТЕРВАЛЬНЫЙ
ŷp =ПРЕДСКАЗ(Xp; X;Y)
90

91.

Расчет доверительных интервалов для зависимой переменной
интервальной оценкой прогнозного значения y p :
y p y y p y p y ,
p
где
y my tтабл , а my
p
p
p
–
средняя
ошибка
прогнозируемого
p
индивидуального значения:
1 xp x
my Sост 1
.
2
p
n
n x
2
(1.16)
91

92.

Расчет доверительных интервалов для зависимой переменной
ГДЕ
2
y
y
x
0,1257
2
0, 021 ошибка регрессии
1 Sост
- стандартная
n 2
8 2
Sост=CTOYX(Y, X)
2
x
2
- дисперсия
x
3
tтабл
2
= ДИСПР(X)
= СТЬЮДРАСПОБР(уровень значимости; степень свободы)
92

93.

94.

6. Средняя ошибка аппроксимации
Чтобы иметь общее суждение о качестве модели из относительных
отклонений по каждому наблюдению, определяют среднюю ошибку
аппроксимации:
y yx
1
A
100%
n
y
Средняя ошибка аппроксимации не должна превышать 8–10%.
94

95.

ЗАДАНИЕ 5
По выбранным статистическим данным с помощью функции
ЛИНЕЙН () построить и графически отобразить линейную
парную
регрессию
со
свободным
членом.
Оценить
статистическую значимость коэффициента наклона 3
способами для стандартного уровня значимости 5%.
95

96.

пример
Расходы на продукты питания, ,
y
тыс. руб.
0,9
1,2
1,8
2,2
2,6
2,9
3,3
3,8
Доходы семьи, , тыс. руб. x
1,2
3,1
5,3
7,4
9,6
11,8
14,5
18,7
Предположим, что связь между доходами семьи и расходами на
продукты питания линейная. Для подтверждения нашего предположения
построим поле корреляции.
96

97.

98.

1
1
2
3
4
5
6
7
8
Итого
Среднее
значение
2
yx
y yx
y y
6
0,81
1,44
3,24
4,84
6,76
8,41
10,89
14,44
50,83
7
1,038
1,357
1,726
2,079
2,449
2,818
3,272
3,978
18,717
8
–0,138
–0,157
0,074
0,121
0,151
0,082
0,028
–0,178
–0,017
9
0,0190
0,0246
0,0055
0,0146
0,0228
0,0067
0,0008
0,0317
0,1257
10
15,33
13,08
4,11
5,50
5,81
2,83
0,85
4,68
52,19
110,66
6,35
2,34
–
0,0157
6,52
–
–
–
–
–
–
–
–
–
–
–
–
x
y
x y
x
2
1,2
3,1
5,3
7,4
9,6
11,8
14,5
18,7
71,6
3
0,9
1,2
1,8
2,2
2,6
2,9
3,3
3,8
18,7
4
1,08
3,72
9,54
16,28
24,96
34,22
47,85
71,06
208,71
5
1,44
9,61
28,09
54,76
92,16
139,24
210,25
349,69
885,24
8,95
2,34
26,09
–
–
5,53 0,935
30,56 0,874
2
y
2
x
2
Ai , %
98

99.

Рассчитаем параметры линейного уравнения парной регрессии
yx a b x
b
cov x, y
2
x
x y x y
x2 x 2
26,09 8,95 2,34
0,168
30,56
a y b x 2,34 0,168 8,95 0,836
Получили уравнение:
y x 0,836 0,168 x . Т.е. с увеличением
дохода семьи на 1000 руб. расходы на питание увеличиваются на 168 руб.
99

100.

уравнение линейной регрессии всегда дополняется показателем
тесноты связи – линейным коэффициентом корреляции rxy :
x
5,53
rxy b
0,168
0,994 .
y
0,935
Оценим качество уравнения регрессии в целом с помощью F -критерия
Фишера. Сосчитаем фактическое значение F -критерия:
F
rxy2
1 rxy2
n 2
0,987
6 455,54 .
1 0,987
Табличное значение ( k1 1 , k2 n 2 6 ,
0,05 ): Fтабл 5,99 .
Так как Fфакт Fтабл , то признается статистическая значимость уравнения в
целом.
100

101.

Для оценки статистической значимости коэффициентов регрессии и
корреляции рассчитаем t -критерий Стьюдента
0,168
18,065 ,
Фактические значения t -статистик: tb
0,0093
0,836
0,994
ta
8,574 , tr
21,376 . Табличное значение t 0,0975
0,0465
критерия Стьюдента при 0,05 и числе степеней свободы n 2 6
есть tтабл 2,447 . Так как tb tтабл , ta t табл и tr tтабл , то признаем
статистическую значимость параметров регрессии и показателя тесноты
101

102.

И, наконец, найдем прогнозное значение результативного фактора y p
при значении признака-фактора, составляющем 110% от среднего уровня
x p 1,1 x 1,1 8,95 9,845 , т.е. найдем расходы на питание, если доходы
семьи составят 9,85 тыс. руб.
y p 0,836 0,168 9,845 2, 490 (тыс. руб.)
Значит, если доходы семьи составят 9,845 тыс. руб., то расходы на
питание будут 2,490 тыс. руб.
Найдем доверительный интервал прогноза. Ошибка прогноза
my
p
1
Sост 1
n
xp x
2
n x2
1 9,845 8,95 2
0,021 1
0,154 ,
8
8 30,56
а доверительный интервал ( y p y y p y p y ):
p
p
2,113 y p 2,867 .
Т.е. прогноз является статистически надежным.
102

103.

103

104.

Пакет EXCEL
1.Загрузка надстройки «Пакет анализа»
2. Нажмите кнопку Microsoft Office
3. Щелкните Параметры Excel, а затем выберите категорию Надстройки.
2. В списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.
3. В списке Доступные надстройки выберите Пакет анализа и нажмите кнопку ОК.
4. Выполните инструкции программы установки, если это необходимо.
5. В диалоговом окне Анализ данных выберите название нужного инструмента (регрессия)
анализа и нажмите кнопку ОК.
6. Для выбранного инструмента укажите в диалоговом окне нужные параметры анализа.
Пример реализации в Excel
По данным проведенного опроса восьми групп семей известны данные связи расходов
населения на продукты питания с уровнем доходов семьи.
Расходы на продукты
питания, y , тыс. руб.
Доходы семьи, x , тыс. руб.
0,9
1,2
1,8
2,2
2,6
2,9
3,3
3,8
1,2
3,1
5,3
7,4
9,6
11,8 14,5 18,7
104

105.

Пакет EXCEL
(офис 2003)
1. Excel
2. Сервис
Надстройки
3. Анализ данных
4. Регрессия
105

106.

1
9
7
5
3
Индекс РТС ВВП
Y
X1
Годы
Инвестици
Уровень
ив
монетизац
основной Остатки на ии
Остатки на
капитал деп. Счетах экономики кор/ счетах
X2
X3
X4
X5
2005
667,00
33410,50
3611,10
86,00
22,20
385,80
2006
1123,00
36134,60
4730,00
110,00
25,60
485,00
2007
1705,00
39217,70
6626,80
124,00
31,10
580,00
2008
1196,00
41246,80
8781,10
248,00
33,10
633,00
2009
1226,74
38786,40
7976,00
227,00
33,50
566,00
2010
1620,87
39640,20
9152,00
526,00
39,10
620,00
2011
2134,50
41421,00
10776,00
450,00
40,40
793,00
106

107.

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R
R-квадрат
Нормированный
R-квадрат
Стандартная
ошибка
Наблюдения
0,997711
0,995427
0,972565
78,9934
7
Дисперсионный анализ
df
Регрессия
Остаток
Итого
Y-пересечение
Переменная X 1
Переменная X 2
Переменная X 3
Переменная X 4
Переменная X 5
5
1
6
SS
1358412
6239,957
1364652
Коэффицие Стандарт
нты
ная ошибка
-3129,78
1290,498
-0,00251
0,045717
-0,45396
0,087086
-0,8439
0,671823
150,2883
30,08599
5,756647
0,89834
MS
271682,3
6239,957
Значимост
F
ьF
43,53914
0,114534
tстатисти
ка
P-Значение
-2,42525
0,248975
-0,055
0,96502
-5,21278
0,120661
-1,25613
0,428034
4,995293
0,125781
6,408092
0,098551
Нижние
Верхние
95%
95%
-19527,1
13267,55
-0,5834
0,578375
-1,56049
0,652571
-9,38022
7,692422
-231,99
532,5671
-5,65785
17,17114
Нижние
Верхние
95,0%
95,0%
-19527,1
13267,55
-0,5834
0,578375
-1,56049
0,652571
-9,38022
7,692422
-231,99
532,5671
-5,65785
17,17114
107

108.

Коэффициенты эластичности
Для регрессионной модели актуален вопрос о том, какова сила влияния различных
факторов на значение зависимой переменной.
Коэффициент эластичности показывает,
на сколько процентов изменится в среднем результат,
если фактор изменится на 1%.
x
Э f x
y
108

109.

Вид функции
y a b x
b
y a
x
y a xb
Средний коэффициент эластичности,
b x
a b x
b
a x b
b
109

110.

ЗАДАНИЕ 6
По исходным данным экономического характера построить с
помощью инструмента Регрессия пакета «Анализ данных»
регрессионную зависимость. Сделать выводы по полученной
аналитике. Как изменится результирующая переменная y, если х
изменить на 10% в сторону увеличения?
110

111.

Множественная регрессия
y x a b1 x1 b2 x2 ... bm xm
МНК
y y
i
i
xi
2
min
111

112.

Мультиколлинеарность в множественной регрессии
Мультиколлинеарность –
тесная линейная взаимосвязь объясняющих переменных
a)
b)
y
y
x1
x2
с)
x1
x2
d)
y
x1
y
x2
x1
x2
1 Мультиколлинеарность между x1 и x2
a) мультиколлиенеарности нет; b) умеренная мультиколлиенарность;
с) сильная мультиколлинеарность;
d) совершенная мультиколлинеарность
112

113.

Последствия мультиколлинеарности:
высокие значения дисперсии оценок коэффициентов и ухудшение точности их
интервальных оценок
чувствительность оценок коэффициентов к изменениям исходных данных
сложность оценки влияния каждой из объясняющих переменных на объясняемую
получение неверного знака у коэффициента перед объясняющей переменной
113

114.

Метод обнаружения мультиколлинеарности
На первом этапе построения модели составляется матрица корреляции размером
(m+1) x (m+1), где m – общее число всех возможных независимых переменных (факторов).
В нее помещаются коэффициенты корреляции между факторами и результативным
признаком, а также попарно между всеми факторами. В ячейке rij указывается
коэффициент корреляции между i-м и j-м фактором. Эта матрица будет симметричной
относительно главной диагонали, причем на диагонали будут значения, равные 1:
rx1 x2 rx1 xm rx1 y
rx1 x1 rx1 x2 rx1 xm rx1 y 1
rx2 xm rx2 y
rx2 x1 rx2 x2 rx2 xm rx2 y rx2 x1 1
r
rxm x2 rxm xm rxm y rxm x1 rxm x2 1
rxm y
x m x1
ryx
1 ryx2 ryxm ryy ryx1 ryx2 ryxm 1
После этого в модель включаются факторы, для которых значение rij по модулю
варьируется в пределах от 0,4 до 0.8.
Анализ данных - Корреляция
114

115.

Методы устранения мультиколлинеарности
:
исключение коррелированных переменных из модели
проведение нового наблюдения
изменение спецификации модели
использование предварительной информации о значениях
параметров
преобразования переменных
115

116.

ЗАДАНИЕ 7
Сделать статистическую выборку 2 факторов и результирующего
признака экономического характера. С помощью инструмента
«Корреляция» определить целесообразность включения в модель
каждого фактора. Построить уравнения зависимости каждого
фактора от результирующего признака, а также уравнение
множественной регрессии. Какая регрессия из 3 более
достоверна?(R*R).
116

117.

Гетероскедастичность
Гетероскедастичность – это различие в дисперсиях случайных отклонений при
различных значениях зависимой переменной.
Наличие гетероскедастичности фактически означает невыполнение одной из
предпосылок применения МНК (условие постоянства дисперсий).
117

118.

Гетероскедастичность
Последствия гетероскедастичности:
неэффективность оценок
признание статистической значимости незначимых переменных
сужение доверительных интервалов относительно их действительных значений
Методы обнаружения гетероскедастичности:
графический анализ остатков
тест ранговой корреляции Спирмена
тест Парка
тест Глейзера
тест Голдфельда – Квандта
тест Уайта
118

119.

Гетероскедастичность
Тест Голдфельда-Квандта
Исходная совокупность упорядочивается по мере возрастания значений независимой переменной.
Исходная совокупность делится на 3 части размерами p, n-2p, p.
Для первой и третьей подвыборок строят отдельно регрессионные модели в Excel
(Пакет анализа «Регрессия»)
Расчет ошибок и суммы квадратов отклонений:
p
S e
2
1
i 1
2
i
S32
n
2
e
i
i n p 1
119

120.

Гетероскедастичность
Расчет F-статистики по формуле:
если S3 > S1, то
если S1 > S3, то
S1
F
S3
S3
F
S1
F > Fα;ν1;ν2
ν1=ν2=p-m-1
нет
да
гетероскедастичность есть
гетероскедастичности нет
Рекомендуемые значения p для выборок различных размеров
n
p
30
11
60
22
120

121.

ЗАДАНИЕ 8
Проверить гипотезу об отсутствии гетероскедастичности для
построенной модели множественной регрессии (тест Г-К).
121

122.

Автокорреляция
Автокорреляция остатков означает наличие корреляции между остатками текущих
и предыдущих (последующих) наблюдений
Вообще под автокорреляцией i-го порядка понимают зависимость между et и et-i.
Причины возникновения автокорреляции:
ошибки спецификации
инерционность экономических законов
временные лаги в равновесных моделях
сглаживание данных
122

123.

Автокорреляция
r i j 0 i, j
Отсутствие автокорреляции
Методы обнаружения автокорреляции:
графический метод
метод рядов
критерий Дарбина-Уотсона
123

124.

критерий Дарбина-Уотсона
T
DW
2
e
e
t t 1
t 2
T
et
2
t 1
Доказано, что статистика Дарбина-Уотсона связана с коэффициентом
корреляции между соседними отклонениями по формуле:
DW 2 1 ret et 1
№п/п
Значения DW
Вывод о наличии автокорреляции
Значения ret et 1
1
близко к 0
близко к 1
сильная положительная
автокорреляция
2
близко к 2
близко к 0
автокорреляция отсутствует
3
близко к 4
близко к –1
сильная отрицательная
автокорреляция
124

125.

Ограничения регрессионного анализа
1.
Использование регрессионной модели для прогнозирования вне границ
изменения наблюдаемых данных. Прогнозирование на основе
регрессионных моделей может осуществляться только на основе
экстраполяции, в противном случае возможны серьезные ошибки.
2.
Смешение понятий причинно-следственной и регрессионной
зависимости. По наличию статистической связи нельзя делать вывод о
том, что взаимосвязанные явления влияют друг на друга.
3.
Перенесение прошлых тенденций в ряде динамики на будущее.
Поскольку исторические условия в прошлом и будущем различаются.
4.
Выявление нереальных (ошибочных) связей. Для проведения
регрессионного анализа и трактовки его результатов необходима
теоретическая гипотеза о взаимосвязи исследуемых переменных.
125

126. Множественная регрессионная модель

• Стандартная форма нормальных уравнений для
вычисления коэффициентов линии регрессии
n
n
n
n
yi
a1 x1i a 2 x 2i a m x mi
na0
i 1
i 1
i 1
i 1
n
n
n
n
n
2
a0 x1i a1 x1i a 2 x1i x 2i a m x1i x mi yi x1i
i 1
i 1
i 1
i 1
i 1
n
n
n
n
n
2
a0 x 2i a1 x1i x 2i a 2 x 2i a m x 2i x ni yi x 2i
i 1
i 1
i 1
i 1
i 1
n
n
n
n
n
2
a
x mi a1 x1i x mi a 2 x 2i x mi a m x mi yi x mi
0
i 1
i 1
i 1
i 1
i 1
126

127. Регрессионные модели с переменной структурой

• Использование моделей с переменной структурой
МОДЕЛИ С ПЕРЕМЕННОЙ СТРУКТУРОЙ
учет
сезонных
колебаний
учет
институциональных
изменений
учет качественных
признаков
• Виды моделей с переменной структурой
ANOVA - модели, содержащие только фиктивные объясняющие переменные
ANCOVA - модели, содержащие и количественные, и фиктивные
объясняющие переменные
127

128.

Математико-статистические таблицы
Таблица значенийF -критерия Фишера при уровне значимости
0,05
k1
k2
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
8
12
24
2
161,5
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
3
199,5
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,88
3,80
3,74
4
215,7
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
5
224,6
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
6
230,2
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,02
2,96
7
233,9
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
8
238,9
19,37
8,84
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
9
243,9
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
10
249,0
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,50
2,42
2,35
11
254,3
19,50
8,53
5,63
4,36
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
128

129.

Критические значения
t
-критерия
Стьюдента при уровне значимости 0,10, 0,05, 0,01 (двухсторонний)
Число
степене
й
свободы
d.f.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
00,10
0,05
0,01
6,3138
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7530
1,7459
1,7396
12,706
4,3027
3,1825
2,7764
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1315
2,1199
2,1098
63,657
9,9248
5,8409
4,5041
4,0321
3,7074
3,4995
3,3554
3,2498
3,1693
3,1058
3,0545
3,0123
2,9768
2,9467
2,9208
2,8982
Число
степене
й
свободы
d.f.
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
00,10
0,05
0,01
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,7056
1,7033
1,7011
1,6991
1,6973
1,6839
1,6707
1,6577
1,6449
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0555
2,0518
2,0484
2,0452
2,0423
2,0211
2,0003
1,9799
1,9600
2,8784
2,8609
2,8453
2,8314
2,8188
2,8073
2,7969
2,7874
2,7787
2,7707
2,7633
2,7564
2,7500
2,7045
2,6603
2,6174
2,5758
129

130. Задание по эконометрике для студентов заочного отделения Института экономики отраслей, бизнеса и администрирования

Проведите эконометрическое исследование
1. Поиск статистических данных по выбранной Вами тематике.
Минимальный объем выборки составляет 7 периодов для одного
объекта исследования или, соответственно, 7 объектов анализа для
одного периода исследования (например, 1 год). Обязательно
отобразить статистические данные в домашней контрольной работе, а
также источник информации. (сайт, литература и т.д.)
2. 2. Разработка эконометрической модели с минимум 2 факторами
(регрессорами) и определение параметров в Excel. Отразить
результаты в печатном виде.
3. Ваши выводы по оценке качества построенной модели: а) уравнение
регрессии; б) коэффициент детерминации; в) статистическая
значимость коэффициента детерминации; г) статистическая значимость
каждого коэффициента уравнения.
130

English Русский Правила