Похожие презентации:
Верифікація моделі. (Тема 6)
1. Тема 3 Верифікація моделі
Лектор: к.е.н., доцент кафедри економетрії тастатистики ДЕМЧИШИН М.Я.
1
2. Зміст
1.Показники якості моделі2. Перевірка значущості та
довірчі інтервали
2
3.
Етапи побудови моделіПостановка
Постановка
задачі
задачі
Формування
Формування
вихідної
вихідної
інформації
інформації
Специфікація
Специфікація
моделі
моделі
Аналіз
Аналіз
залишків
залишків
Оцінка
Оцінка
параметрів
параметрів
моделі
моделі
Прогноз
Прогноз
на
наоснові
основі
моделі
моделі
Верифікація
Верифікація
моделі
моделі
3
4.
1. Показники якості моделіВерифікація моделі—статистична
перевірка на адекватність моделі,
тобто наскільки добре розв‘язано
проблему специфікації моделі,
наскільки добрі оцінки імітаційних та
прогнозних розрахунків.
4
5.
Для перевірки коректності побудовимоделі визначають:
• стандартну похибку рівняння;
• коефіцієнт детермінації;
• коефіцієнт множинної кореляції;
• стандартну похибку параметрів.
5
6.
Стандартна похибка рівняння (точковаоцінка емпіричної дисперсії залишків)характеризує абсолютну величину розкиду
випадкової складової рівняння
Su
2
n
1
2
ui
n i 1
6
7.
Поправка на число ступенів свободидає незміщену оцінку дисперсії
залишків:
ˆ u
2
n
1
2
ui
n m 1 i 1
7
8.
Упоняття
"тіснота
зв'язку"
(щільність) вкладається оцінка впливу
незалежної змінної на залежну змінну.
Під терміном "значимість зв'язку"
(істотність, або значущість) розуміють
оцінку відхилення вибіркових змінних
від своїх значень у генеральній
сукупності спостережень за допомогою
статистичних критеріїв.
8
9.
Коефіцієнт детермінації показує, якоюмірою варіація залежної змінної
(результативного показника) у
визначається варіацією незалежної
змінної (вхідного показника) х.
2
2
u
2
y
S
R 1
S
де
Sy
2
n
1
2
( yi y )
n i 1
9
10.
nІнші формули:
де
R2
2
ˆ
(
y
y
)
i 1
n
2
(
y
y
)
i
i 1
yˆ - розрахункові значення регресанда;
y -загальна середня фактичних
даних результативного показника;
yi
-фактичні
індивідуальні
результативного показника.
значення
10
11.
2( yi y )( yˆ i y )
i 1
2
R n
n
2
2
ˆ
(
y
y
)
(
y
y
)
i
i
n
i 1
i 1
квадрат емпіричного коефіцієнта кореляції між
двома рядами спостережень (теоретичними
yi розрахунковими
значеннями регресанта та його
значеннями
).
yˆ
11
12.
Коефіцієнт кореляції, або індекскореляції, показує, наскільки значним є
вплив змінної хi , на yi
і розраховується так:
R R
2
12
13.
Іноді для спрощення розрахунків тіснотукореляційного зв'язку характеризують
коефіцієнтом кореляції, який
розраховується за формулою:
n
R1 1
( y
i 1
n
( y
i 1
i
yˆ )
2
i
y)
2
13
14.
Якщо зв'язок між результативним івхідним показниками лінійний, то
використовується лінійний коефіцієнт
кореляції, який характеризує не тільки
тісноту зв'язку, а і його напрям:
rxy
xy x y
x x y y
2
2
2
2
14
15. 2. Перевірка значущості та довірчі інтервали.
1516.
Зауваження. У задачах регресійного аналізуважливе значення має припущення про
нормальний розподіл випадкових величин, що
задіяні в даній моделі.
Певні
перетворення
нормально
розподілених величин забезпечують їх розподіл за
законом Стьюдента чи за законом Фішера: на
підставі першого з них визначаються довірчі
інтервали, а другий дає змогу оцінювати
відношення двох випадкових величин.
16
17. Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтер
Стосовно кожногостатистичного результату
висувається так звана нульова
гіпотеза (про рівність нулю
деякої випадкової величини) і
альтернативна до неї гіпотеза
(про її суттєву відмінність від
нуля).
У нульовій гіпотезі
формулюють результат, який
бажано відхилити, а в
альтернативній, яка інакше
називається
експериментальною, — той, що
17
18.
За заданим рівнем значущості множинадопустимих значень розбивається на дві
неперетинні множини: одна містить значення
випадкової величини, ймовірність досягнення
яких перевищує заданий рівень значущості, а
інша — критична область — визначає ті
значення, що досягаються рідко (ймовірність
потрапити до такої області нижча від заданого
рівня), і розташована вона, як правило, на
"хвостах розподілу".
18
19.
При перевірці гіпотез може бутидопущена помилка, наприклад може
бути відхилена нульова гіпотеза, хоча
насправді вона правильна (помилка
першого роду), або ж, навпаки, нульова
гіпотеза може бути прийнята, хоча
вона неправильна (помилка другого
роду).
19
20.
22R
R
00
22
R
R
?
11
застосувати
застосувативідповідний
відповіднийстатистичний
статистичнийкритерій,
критерій,
який
якийдасть
дастьзмогу
змогувстановити,
встановити,
22
чи
суттєво
відрізняється
R
чи суттєво відрізняється R від
віднуля,
нуля,
чи
чиця
цявідмінність
відмінністьпов'язана
пов'язаназзособливостями
особливостями
конкретних
конкретнихданих,
даних,
тобто
тобтозумовлена
зумовленалише
лишепохибками
похибкамивимірювань.
вимірювань.
20
21.
Висувається нульова гіпотеза Н0: R2 = О.
Це означає, що досліджуване рівняння не
пояснює змінювання регресанда під впливом
відповідних регресорів.
У такому разі всі коефіцієнти при незалежних
змінних мають дорівнювати нулю.
При цьому нульову гіпотезу можна подати у
вигляді
Н0 :а1 =а2 =... = аn = 0.
21
22.
Альтернативною до неї є Н1:значення хоча б одного параметра
моделі відмінне від нуля, тобто
хоча б один із факторів впливає
на змінювання залежної змінної.
22
23.
Для перевірки цих гіпотеззастосовують F- критерій Фішера з
n-m-1 ступенями свободи.
R
n m 1
F
2
1 R
m
2
яке порівнюють з табличним
значенням розподілу Фішера при заданому
рівні значущості α.
(Як правило, α = 0,05 або α = 0,01).
23
24.
Якщо<
F
ЯкщоF
Fтабл
<
Fексп
табл
експ
нульовагіпотеза
гіпотезавідхиляється,
відхиляється,
нульова
тобтоіснує
існуєтакий
такийкоефіцієнт
коефіцієнтуурегресійному
регресійномурівнянні,
рівнянні,
тобто
якийсуттєво
суттєвовідрізняється
відрізняєтьсявід
віднуля,
нуля,
який
відповіднийфактор
факторвпливає
впливаєна
надосліджувану
досліджуванузмінну.
змінну.
аавідповідний
24
25.
У випадку парної регресії цейкритерій розраховується за
формулою:
n
F
n
( yˆ y ) ( y
2
i 1
1
:
i 1
i
yˆ )
2
n 2
25
26.
Коефіцієнт кореляції, як вибірковахарактеристика, перевіряється на
значущість за допомогою
t-критерію Стьюдента.
Фактичне значення t статистики
обчислюється за формулою
t експ
R n m 1
2
1 R
26
27.
tексп порівнюється з табличним значеннямt- розподілу з п – т – 1 ступенями свободи,
та при заданому рівні значущості α/2
Якщо
експ
табл
t
t
можна зробити висновок, що коефіцієнт кореляції
достовірний (значущий), а зв'язок між залежною
змінною та всіма незалежними факторами
суттєвий.
27
28.
Можна визначити стандартні похибкиоцінок параметрів моделі з урахуванням
дисперсії залишків:
S aˆ j c jj
2
u
де
обчислюється за формулою:
2
u - дисперсія залишків,
n
2
u
u
i 1
2
i
n m
28
29.
cjj –відповідний діагональний елементматриці похибок С (матриця, обернена до
матриці коефіцієнтів системи нормальних
рівнянь)
n
C A 1 n
xi
i 1
xi
i 1
n
2
xi
i 1
n
1
29
30. Статистичну значущість кожного параметра моделі можна перевірити за допомогою t-критерію. При цьому нульова гіпотеза буде: Н0: aj=0, альтерна
перевірити за допомогою tкритерію.При цьому нульова гіпотеза
буде:
Н0: aj=0, альтернативна H1:
aj≠0 Експериментальне
значення
t-статистики для кожного
параметра моделі обчислюється
за формулою:
tj
aj
Sa j
30
31.
Довірчі інтервали для кожного параметра ajобчислюються на основі його стандартної
похибки та критерію Стьюдента:
a
j
t табл c jj
2
u
; a j t табл c jj
2
u
Табличне значення t табл. , як і раніше, має nm-1 ступенів свободи і рівень значущості α/2
t табл t / 2 ( n m 1)
31
32.
Завдання: Зробити аналіз залежностіобсягу
споживання
y
(у.о.)
домогосподарства
від
наявного
прибутку x (у.о.) за вибіркою обсягом
n=12, результати якої наведено у
таблиці. Визначити вид залежності,
оцінити параметри рівняння регресії,
оцінити силу лінійної залежності між
x та y.
32
33.
№1
2
3
4
5
6
7
8
9
1 1 1
0 1 2
Обсяг
спожив
а-ння 10 10 11 11 12 12 12 12 13 14 14 15
7
9
0
3
0
2
3
8
6
0
5
0
(
у.о.)
y
Наявни
й
прибут
ок
(
x
у.о.)
10 10 10 11 11 11 11 12 13 13 14 14
2
5
8
0
5
7
9
5
2
0
1
4
33
34.
Графік лінійної регресіїy = 3,4226+0,9361*x
150
145
y=3,423+0,936 х
140
135
y
130
125
120
115
110
105
100
105
110
115
120
125
130
135
140
145
150
155
x
34
35.
N=12Intercept
x
Regression Summary for Dependent Variable: y (labor2.sta)
R= ,99160670 R_= ,98328384 Adjusted R_= ,98161222
F(1,10)=588,22 p<,00000 Std.Error of estimate: 1,8775
Beta
Std.Err.
B
Std.Err.
t(10)
p-level
of Beta
of B
3,422610 4,864432 0,70360 0,497738
0,991607 0,040885 0,936080 0,038596 24,25332 0,000000
коефіцієнт кореляції
R=0,9916067.
Значення
критерію Фішера
Значення критерію Стьюдента
Коефіцієнт
детермінації .
R 2 0,98328384
35