Похожие презентации:
Структурно-детерминированные временные ряды. Тема 2
1. Лекция
Тема 2. Структурнодетерминированные временные ряды2. Цель лекции
Цель лекции - формирование теоретическихзнаний
о
моделях,
позволяющих
с
использованием
данных,
представленных
одномерными временными рядами, моделировать
и прогнозировать экономические явления и
процессы
на
краткои
среднесрочную
перспективу
2
3. План лекции
1.Математические
модели
детерминированных временных рядов
структурно-
2.
Линейное
прогнозирование
детерминированных временных рядов
структурно-
3.
Анализ остатков модели (тестирование остаточной
компоненты).
4.
Верификация прогноза
3
4. Реализуемые компетенции
ОПК-1 готовностью к самостоятельной работе
ОПК-2 способностью использовать современные математические методы и
современные прикладные программные средства и осваивать современные
технологии программирования
ПК-1 способностью использовать стандартные пакеты прикладных программ
для решения практических задач на электронных вычислительных машинах,
отлаживать, тестировать прикладное программное обеспечение
ПК-9 способностью выявить естественнонаучную сущность проблем,
возникающих в ходе профессиональной деятельности, готовностью
использовать для их решения соответствующий естественнонаучный аппарат
ПК-10 готовностью применять математический аппарат для решения
поставленных задач, способностью применить соответствующую процессу
математическую модель и проверить ее адекватность, провести анализ
результатов моделирования, принять решение на основе полученных
результатов
ПК-12 способностью самостоятельно изучать новые разделы
фундаментальных наук
4
5. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядовДопустим, что имеется апостериорный временной ряд y1 , y 2 ,..., y N ,
ему соответствует априорный временной ряд 1 , 2 ,..., N . Будем всякий
уровень временного ряда i , i 1, N представлять в виде некоторой
неслучайной
(квазидетерминированной
или
структурнодетерминированной) составляющей f i и центрированной случайной
величиной i , i 1, N :
i f i i , i 1, N
(1)
f ,
(2)
или
где ( 1 ,..., N ) Т , f (f1 ,...,f N ) T , ( 1 ,..., N ) T .
5
6. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядовОпределение. Выражение (1)~(2) называется априорной структурнодетерминированной моделью временного ряда, а соответствующая ей
модель
y i f i z i , i 1, N
(3)
Y f Z,
(4)
или
где
Y ( y1 , y 2 ,..., y N ) T ,
Z (z1 , z 2 ,..., z N ) T ,
называется
апостериорной моделью временного ряда.
Определение.
f i f ( t i ), i 1, N
Квазидетерминированная
называется
трендом
временного
составляющая
ряда,
zi ,
i=1,N–
апостериорные остатки, характеризующие отклонения f i от y i , i=1,N.
6
7. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядовНаша задача определить тренд таким образом, чтобы минимизировать
влияние остатков. Поскольку f это элемент N-мерного векторного
пространства, то выбрав базис из «n» линейно независимых векторов
1 (ti ), 2 (ti )... n (ti ), i 1, N будем искать представление:
f i f ( t i ) 1 1 ( t i ) ... n n ( t i ), i 1, N
(5)
или
f ,
(6)
где
1 ( t1 ) 2 ( t1)
...
...
N*n
...
...
1 ( t N ) 2 ( t N )
... n ( t1 )
...
...
,
...
...
... n ( t N )
1
...
n*1
n
матрица, ранг n которой n N .
(7)
(8)
7
8. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядов1. Общий случай n N .
Используя модель (2-3) получим
y i 1 1 ( t i ) ... n n ( t i ) z i , i 1, N
(9)
или
Y Z
(10)
Коэффициенты можно искать, например, минимизируя сумму
квадратов остатков z i , i=1,N, то есть методом наименьших квадратов.
Как известно задача сводится к решению нормальной системы:
Т Т У
(11)
8
9. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядовТак как матрица Т невырождена, то формально:
ˆ МНК ( Т ) 1 Т У ,
(12)
f̂ i ˆ 1 1 ( t i ) ... ˆ n n ( t i ), i 1, N
(13)
а оценка тренда:
В случае выполнения условия Гаусса-Маркова для модели (2)
справедливы утверждения относительно свойств оценок . Пустьn=N. В
этом случае (11) принимает вид:
Т ( У ) 0
(14)
Так как невырождена, то (14) принимает вид:
У
(15)
ˆ 1У
(16) 9
10. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядов2. Случай ортогональных векторных функций и n N.
Пусть векторы
1 ( 1 ( t1 ),..., 1 ( t N )) T , 2 ( 2 ( t1 ),..., 2 ( t N )) T ,..., n ( n ( t1 ),..., n ( t N )) T
являются ортогональными, то есть скалярные произведения
___
N
____
( i j ) i ( t k ) j ( t k ) 0 i, j : i 1, n, j 1, n , i j .
(17)
k 1
Тогда
N
(t ) y
ˆ k i 1N
k
i
(t )
i 1
2
k
i
i
, Y , k 1, n ,
____
k
k
2
(18)
где k -Евклидова норма функций.
10
11. 1 Математические модели структурно-детерминированных временных рядов
1 Математические модели структурнодетерминированных временных рядовОпределение
Коэффициенты тренда в форме (18) называют
коэффициентами Фурье представления тренда по системе ортогональных
___
функций (векторов) k , k 1, n .
Если
k
2
N
k2 ( t i ) 1,
(19)
i 1
k называется, как известно,
то система ортогональных функций
ортонормированной, а формула (18) принимает вид
ˆ
k
N
____
(t ) y , k 1, n .
i 1
k
i
i
Прежде чем проводить прогнозирование осуществляют проверку
адекватности модели выборочным данным.
(20)
11
12. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Пусть имеется апостериорный временной
Апостериорная модель временного ряда (3):
ряд
yi f̂ i z i , i 1, N ,
y1 , y 2 ,..., y N .
(21)
а
____
f̂ i ˆ 1 1 ( t i ) ... ˆ n n ( t i ), i 1, N .
(22)
Ставится задача оценки неизвестной величины y m временного ряда
при m N (то есть осуществить прогноз временного ряда в момент времени
t m ). Обозначим оценку ~y m и будем искать ее в виде
~
y m w1 y1 w 2 y 2 ... w N y N W T Y
(23)
где W T ( w1 , w 2 ,..., w N ), Y ( y1 , y 2 ,..., y N ) T .
12
13. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Обозначим апостериорную ошибку прогноза S:
S ym ~
ym .
(24)
Пусть - матрица размерности N*n вида (7) - система из n – линейно
независимых векторов, согласно (3)
S y m ~y m y m W T ( Z) .
(25)
Предполагая, что модель тренда (3) справедлива не только при
t 1 , t 2 ,..., t N , но и при t m , запишем
13
14. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
y m 1 ( t m ) 1 ... n ( t m ) n z m ( m ) z m ,
(26)
где ( m ) ( 1 (t m ),..., n (t m ))
и
S ( ( m ) W T ) z m W T Z . (27)
Априорная ошибка прогноза соответствующая апостериорной (27):
( ( m ) W T ) m W T ,
(28)
где - белый шум (нормально распределенный стационарный в узком
0, i j
, i, j 1,..., N ).
смысле процесс с M ( i ) 0, i 1, N , cov i j 2
,
i
j
____
14
15. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
____
Учитывая свойства m и ( M( i ) 0, i 1, N, i m ), и
выдвигая естественное требование: M( ) 0 , получим
( m) W T 0
(29)
m WT
(30)
Таким образом, ошибка прогноза содержит только случайную
составляющую m W T .
Выражение (29) представляет из себя систему из «n» линейных
уравнений с N неизвестными w 1 , w 2 ,..., w N :
1 ( t m ) 1 ( t1 ) w1 1 ( t 2 ) w 2 .. 1 ( t N ) w N 0
( t ) ( t ) w ( t ) w .. ( t ) w 0
2 m
2 1
1
2 2
2
2 N
N
, (31)
...
n ( t m ) n ( t1 ) w 1 n ( t 2 ) w 2 .. n ( t N ) w N 0
ранг матрицы, которой равен «n» и равен рангу расширенной
матрицы, то есть система совместна.
15
16. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Рассмотрим случай n<N.
В силу теоремы Кронекера –Капелли
существует бесчисленное множество решений этой системы. Учитывая, то
обстоятельство, что априорная ошибка прогноза m W T , точность
прогнозирования будем характеризовать величиной:
D( ) M( 2 ) M[( m W T )( m W T ) T ]
M[ 2m W T T W m T W W T Tm ] 2 (1 W T W)
(32)
Будем искатьW как решение задачи на условный экстремум:
2
2
T
D( ) M ( ) (1 W W ) min
,
(m)
T
W 0
(33)
2
T
W W min
.
(m)
T
W 0
(34)
что эквивалентно
16
17. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Составим функцию Лагранжа:
L(w, ) 2 WT W 2( ( m) WT ) min ,
(35)
где ( 1 ,..., n ) T .
На основании необходимого условия существования экстремума
получим:
2 2 W 2 0
(36)
( m) T T W 0
(37)
P.S. Для получения (37) функцию Лагранжа переписали в виде:
L(w, ) 2 WT W 2 Т ( ( m) T T W)
(38)
17
18. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Задание 1. Проверить, что
Ŵ ( Т ) 1 ( m )T ,
(39)
а оценка прогнозируемого значения y m :
ŷ m Ŵ T Y ( m) ( T ) 1 T .
(40)
Ошибка прогноза:
min 2 2 (1 Ŵ T Ŵ ) 2 (1 ( m ) ( T ) 1 T ( T ) 1 ( m )T
(1
2
(m)
1
( )
T
( m)T
(41)
)
Несмещенная оценка 2 :
1 N
1
(i ) ˆ
ˆ
(
y
)
(Y ˆ , Y ˆ ) ,
i
N n i 1
N n
2
(42)
где (i ) ( 1 ( t i ), 2 ( t i )... n ( t i )) .
В итоге оценка ошибки прогноза
ˆ 2 ˆ 2 (1 ( m ) ( T ) 1 ( m ) T ) .
18(43)
19. 2 Линейное прогнозирование структурно-детерминированных рядов
2 Линейное прогнозирование структурно-детерминированных рядов
Задание 2. Имея 2 или ˆ 2 построить доверительный интервал для
ym .
Расчет
ŷ m
существенно
упрощается,
если
система
векторов
____
1 ( t i ), 2 (t i )... n ( t i ), i 1, N ортогональна.
Задание 3. Показать, что в случае ортогональности системы базисных
функций
N
n
yˆ m k (t m )(
k 1
(t ) y
i 1
n
k
i
(t )
2
k
i 1
i
k2 (t m )
k 1
(t )
2
i 1
(44)
)
n
(1 N
2
i
2
k
)
(45)
i
Задание 4. Привести примеры ортогональных систем базисных функций:
1 ( t i ), 2 ( t i )... n ( t i )
19
20. 3 Анализ остатков модели (тестирование остаточной компоненты)
Для проверки нормальности распределения остатков выдвигаютнулевую гипотезу о нормальном распределении
Н0: t N 0, 2
Н1: t N 0, 2
Для проверки нулевой гипотезы можно воспользоваться критерием 2 Пирсона, Жака-Бера, анализа графиков на нормальной вероятностной бумаге
или
графиков
типа
квантиль-квантиль
и
др.
критериев
проверки
нормальности распределения. Рассмотрим подробнее некоторые из них.
В эконометрических ППП, например в Gretl, Asisstat, реализованы
также критерии проверки нормальности такие как:Тест Дурника-Хансена,
Тест Шапиро-Уилка, Тест Лиллифорса, Андерсона-Дарлинга.
20
21. 3 Анализ остатков модели (тестирование остаточной компоненты)
В эконометрических ППП при оценке АКФ и ЧАКФ выдаются ихграфики
–
коррелограммы
с
наложенными
95%
доверительными
интервалами, если коэффициент автокорреляции выходит за эти границы, то
можно констатировать наличие автокорреляции соответствующего порядка.
Для
проверки
некоррелированности
остатков
во
многих
статистических пакетах приводятся значения портманто-статистик Q* БоксаПирса и/или Q Бокса-Льюнга. Они проверяют нулевую гипотезу
об
отсутствии автокорреляции
21
22. 3 Анализ остатков модели (тестирование остаточной компоненты)
H0 : 1 ... m 0m
H1 : i 0
2
i 1
Значения статистик определяются соответственно:
m
Q* N r i
i 1
2 asympt
2
m k
(46)
или
r k asympt 2
Q N 2 N
m k
i 1 N i
m
2
(47)
соответственно
N– длина временного ряда;
k – количество оцениваемых параметров в модели.
22
23. 3 Анализ остатков модели
Для проверки автокорреляции можно воспользоваться методоммножителей Лагранжа, применительно к проверке автокорреляции остатков,
его называют тестом Бройша-Годфри.
Рассматривается апостериорная модель множественной регрессии:
yt 0 1 хt 1 2 хt 2 k хt k zt ,
(48)
где х1,…,хk – значения регрессоров – это могут быть экзогенные
переменные или лаговые значения эндогенных и экзогенных переменных
или – это регрессия на время. Проверяется предположение, что остатки
могут быть заданы уравнением:
zt 1 zt 1 ... p zt p et ,
(49)
где et - остатки удовлетворяющие свойствам белого шума.
Проверяется гипотеза об отсутствии автокорреляции порядка р.
Н 0 1 ... p 0
Н1 12 ... p2 0
Для проверки нулевой гипотезы МНК оценивается модель вида (49),
где оценки остатков модели обозначим et .
23
24. 3 Анализ остатков модели
1.Строится регрессия либо той же объясняемой переменной Yt ,
либо остатков et
на старые регрессоры и остатки с лагом до р
включительно (то есть в качестве дополнительных объясняющих
переменных используем ( et 1, et 2 ....et p )
2.
Проверяется гипотеза о том, что группа дополнительных
переменных является излишней,
3.
Если в качестве объясняемой переменной используются
остатки, то значение статистики:
U= N * Rˆ 2
(50)
где N - число наблюдений,
R̂ 2 — оценка коэффициента детерминации (из первого этапа). U ( 1,N )
имеет
асимптотическое
(при
увеличении
числа
наблюдений)
распределение 2 с p степенями свободы.
24
25. 4 Верификация прогнозов
Условно показатели оценки точности прогнозов можно отнести к тремвидам: аналитические, сравнительные, качественные.
Среди показателей, которые позволяют сравнивать между собой модели, чаще
всего применяют критерии Акаике (AIC), Шварца (BIC) и Хеннана-Куинна (HQ). Перечисленные критерии называют информационными критериями, как
правило, современные специализированные пакеты прикладных программ
автоматически рассчитывают их вместе с другими характеристиками модели
[3]. Показателями также позволяющими сравнивать модели по прогнозным
качествам являются, например, средняя абсолютная ошибка прогнозирования
(Mean Absolute Error, MAE), медиана абсолютной ошибки прогнозирования
(Median MAE, MdAE), дисперсия ошибки прогноза (Mean Square Error, MSE) и
корень из нее (Root MSE, RMSE). При наличии выбросов (значительно
больших по сравнению с остальными) следует применять MdAE, так как
остальные показатели дают завышенные значения
25
26. 4 Верификация прогнозов
Помимоперечисленных
рассмотрим
показатели,
которые
усовершенствованы по ряду характеристик.
Нормализованная среднеквадратическая ошибка (Normalized RMSE)
призвана избавиться от недостатка, связанного с зависимостью от шкалы
измерений:
N L
NRMSE 1 /(max( y t )) * 1 /(L) * ( y*t y t ) 2 .
t N 1,..., N L
(1)
t N 1
При наличии выбросов следует воспользоваться следующим вариантом
(Integral NRMSE):
N L
N L
t N 1
t N 1
INRMSE (1 / y t ) * 1 /(L) * ( y*t y t ) 2 .
(2)
Средняя абсолютная масштабированная ошибка (Mean Absolute Scaled
Error, MASE):
N L
MASE 1 / L * (
y t y *t
1 N L
t N 1
y t y t 1
L 1 t N 2
).
(3)
26
27. 4 Верификация прогнозов
Медиана абсолютной масштабированной ошибки (Median Absolute Scaled Error, MdASE):MdASE med (
t N 1,..., N L
y t y *t
1 N L
y t y t 1
L 1 t N 2
).
(4)
Ряд показателей точности прогноза основаны на сравнении полученных прогнозов, с «эталонными», полученными по простейшим методам прогнозирования.
Коэффициент несоответствия предложенный Тейлом рассчитывается в нескольких модификациях и основан на сравнениях прогнозов с эталонными значениями:
1) Коэффициент несоответствия (КН1), определяется как отношение средней квадратической ошибки к квадрату фактических значений признака:
y ŷ
N L
KH1
t N 1
2
*
t
t
,
N L
ŷ
t N 1
(5)
2
t
где y *t - прогнозное значение по эталонной модели. Эталонной моделью выступает модель среднего прироста, ŷ*t - прогнозное значение по сравниваемой модели. Если коэффициент принимает
значение 0, то речь идет о полном совпадение прогнозов по двум моделям. Если коэффициент
принимает значение большее 1, то сравниваемая модель по прогнозным качествам уступает эталонной модели. Верхней границы коэффициент не имеет.
27
28. 4 Верификация прогнозов
Коэффициент несоответствия (КН2) определяется как отношение среднейквадратической ошибки прогноза к сумме квадратов отклонений прогнозных значений признака от среднего уровня, рассчитанного по исходному временному ряду за
весь период y t :
y ŷ
N L
KH 2
2
*
t
t N 1
N L
t
( y ŷ )
2
(6)
t
t N 1
Если показатель несоответствия принимает значение превышающее единицу,
то прогноз на уровне среднего значения признака дал бы лучший результат, чем
имеющийся прогноз [5].
3) Коэффициент несоответствия (КН3) определяется как отношение средней
квадратической ошибки прогноза к корню суммы квадратов отклонений фактических значений признака от выровненных по линейному тренду ŷ тренд
:
t
ŷ y
N L
KH 3
t N 1
N L
( ŷ
t N 1
2
*
t
t
тренд
t
yt )
(7)
2
Если показатель больше 1, то прогноз методом экстраполяции тренда дает результат лучший, чем сравниваемый.
28
29. 4 Верификация прогнозов
Одним из подходов сравнения прогнозов по двум моделям, одна изкоторых, необязательно эталонная является вычисление отношение
общепринятых показателей, то есть отношения MAE двух моделей, или
отношения MSE или RMSE.
Существуют также критерии сравнения двух прогнозов, например, можно
критерий Моргана-Грейнджера-Ньюболда, который можно применять, если в
распоряжении имеется достаточно большой объем прогнозных значений (более
нескольких десятков).
Н0: sd =0 (о незначимом различии между прогнозами).
Статистика имеет вид:
1
2
1
MGN sd
(8)
,
L
1
где sd - коэффициент корреляции, определяемый между двумя
показателями m,d. m – сумма ошибок прогнозирования сравниваемых моделей,
d - разность ошибок прогнозирования сравниваемых моделей. L - период
прогноза. Статистика распределена по закону Стьюдента с числом степеней
свободы L-1. Если нулевая гипотеза отвергается, то делаем вывод о значимых
различиях между прогнозами.
2
sd
29
30. Литература к лекции
Чураков Е.П. Математические методы обработки экспериментальных данных
в экономике: Учеб.пособие. – М.: Финансы и статистика, 2004.
Чураков Е.П. Прогнозирование эконометрических временных рядов: Учебное
пособие -М.: Фин. и стат., 2008.
Айвазян, С. А.
Прикладная статистика и основы эконометрики : учеб. для
вузов / С. А. Айвазян, В. С. Мхитарян. - М. : Юнити, 1998. - 1022 с.
Ковалевский, В. П. О подходах к верификации прогнозов математических
моделей социально-экономических процессов [Электронный ресурс] /
Ковалевский В. П. // Университетский комплекс как региональный центр
образования, науки и культуры : материалы Всерос. науч.-метод. конф. (с
междунар. участием), 23-25 янв. 2019 г., Оренбург / М-во науки и высш.
образования Рос. Федерации, Федер. гос. бюджет. образоват. учреждение
высш. образования "Оренбург. гос. ун-т". - Электрон. дан. - Оренбург :
ОГУ,2019. - . - С. 2669-2672.
30