1. Корреляционный анализ
1/12
189.50K
Категория: МатематикаМатематика

Корреляционный анализ

1. 1. Корреляционный анализ

Интервальные оценки коэффициента корреляции
-более адекватно отражают реальное положение вещей.
-необходимо знать закон распределения значений
коэффициента корреляции.
r k r r k r
При нормальном распределении
2
1
r
(1
r
)
M (r ) O , M (r ) r
,
2n
n
(1 2 ) 2
1
D(r )
O 3 / 2 .
n
n
1

2. 1. Корреляционный анализ

Интервальная оценка
r u
2
1
r
r u
2
1
r
,
n
n
и – параметр функции Лапласа при заданной
доверительной вероятности
При малом числе п и значениях близких к 1 весьма
грубо отражает реальность.
при = 0: t
r n 2
1 r2
t-распределение Стьюдента с
п –2 степенями свободы
2

3. 1. Корреляционный анализ

Приближение интервальной оценки:
r (1 r 2 )
1 r2
r (1 r 2 )
1 r2
r
r
uq / 2
uq / 2
2n
2n
n
n
Достоинства, недостатки.
3

4. 1. Корреляционный анализ

z-функция Фишера
1 1 r
r = th(z), ->> z ln
2 1 r
Распределение z не зависит от значений и п, при п > 10
быстро сходится к нормальному закону с параметрами
1 1
1
M ( z ) ln
, D( z )
.
2 1 2(n 1)
n 3
4

5. 1. Корреляционный анализ

Доверительный интервал [z1, z2] для математического
ожидания М(z)
uq / 2
1 1 r uq / 2
r
r
z1,2 ln
arcth( z )
2 1 r n 3 2(n 1)
2(
n
1)
n
3
истинное значение коэффициента корреляции с
доверительной вероятностью = 1– q заключено в
пределах
th( z1 ) th( z2 )
Варианты упрощения без смещения.
5

6. 1. Корреляционный анализ

Значимость статистической связи
-сводится к проверке статистической значимости
коэффициента корреляции.
Общий случай: проверяется нулевая гипотеза с какой
либо альтернативной, например
H 0 : R 2 0,
H1 : R 2 0
F-тест Фишера: общий разброс разлагается на
объясненную и не объясненную составляющие
y2 = k2 + e2.
Переход к дисперсиям.
6

7. 1. Корреляционный анализ

F-статистика:
k2
p
F 2
e
m
р = n - 1– число объясняющих переменных (для парной
регрессии 1); m = n - k – число наблюдений без
количества оцениваемых коэффициентов (для парной
регрессии n – 2).
F F ; p ,q - нулевая гипотеза отвергается, R2 значимо
7

8. 1. Корреляционный анализ

Значимость парного выборочного коэффициента
корреляции p = 1, m = n - 2:
r122 y2 (n 2)
k (n 2)
r122 (n 2)
F
2
2
2
e
y (1 r12 )
(1 r122 )
2
р = 1, то F = t2:
F t r12
(n 2)
1 r2
если t t ,q , нулевая гипотеза H0 : r = 0 принимается с
доверительной вероятностью .
8

9. 2. Дисперсионный анализ

-значимость влияния факторов;
-выбор наиболее важных факторов;
-оценка их влияния.
Основная идея:
-разложение общей дисперсии случайной величины на
независимые случайные характеризующие слагаемые,
-сравнение этих дисперсий для оценки существенности
влияния факторов на исследуемую величину.
Виды дисперсионного анализа.
9

10. 2. Дисперсионный анализ

Однофакторный дисперсионный анализ
-на результаты эксперимента действует только один
фактор. Отслеживают процесс в m серий по n элементов
в каждой:
Число элементов n
Число
серий m
1
2

j

n
x
1
x11
x12

x1j

x1n
x1 j
2

i

m
x21

xi1

xm1
x22

xi2

xm2





x2j






x2n

xin

xmn
x2 j

xij

xmj

xmj
10

11. 2. Дисперсионный анализ

Проверим гипотезу о равенстве средних i в серии с
нулевой гипотезой
H 0 : 1 2 ... i ... m
сравнением внутрисерийных и общей дисперсий по Fкритерию.
-расхождение незначительно, то нулевая гипотеза
принимается.
- расхождение значительно, значит значительно действие
исследуемого фактора.
11

12. 2. Дисперсионный анализ

Для этого:
-Найдем сумму квадратов отклонений всех элементов от
общего среднего Q;
-Разложим эту величину на девиаты: сумму квадратов
отклонений между сериями (Q1 - рассеиванием по
факторам ) и сумму квадратов отклонений внутри
серии (Q2 - остаточное рассеивание ):
Q = Q1 + Q2
Q1 /(m 1)
F
Q2 / m(n 1)
Сила проявления влияния факторов: если F < Fq гипотеза об отсутствии достаточно сильного влияния
фактора принимается
12
English     Русский Правила