Похожие презентации:
Мат.стат практика №10
1.
Основы математическойстатистики
Практическое занятие №10
Тема 1. Корреляционное отношение
Тема 2. Непараметрическая корреляция. Коэффициент
корреляции Спирмена
2.
Основы математической статистикиПрактическое занятие №10
В
случае
нелинейной
коэффициент
корреляции
зависимости.
При
зависимости
не
может
нелинейной
между
служить
зависимости
переменными
оценкой
этой
рассчитывается
корреляционное отношение, способное выявить как нелинейные так и
линейные зависимости, хотя и с меньшей информативностью.
Пусть имеется ряд парных наблюдений: (XY)1, (XY)2, (XY)3, ..., (XY)n.
Найдем средние, максимальные и минимальные значения.
Будем рассматривать X как независимую случайную величину.
Интервал изменчивости величины X., то есть Xмакс - Xмин разделим
на k интервалов и сгруппируем парные значения (XY)i по этим
интервалам. В итоге получим k групп парных наблюдений, не
пересекающихся по значениям X.
2
3.
Основы математической статистикиПрактическое занятие №10
Для
каждой группы парных наблюдений, выделенных по
значениям X, рассчитаем средние значения величины Y и получим ряд из k
средних значений.
Корреляционное отношение представляет собой корень
квадратный из отношения межгрупповой изменчивости величины y к её
общей изменчивости во всей выборке.
Общая изменчивость величины у:
k nj
SS y ( y ji Y )
2
n
SS y (Yi Y ) 2
или
i 1
j 1 i 1
где Yi – значения зависимой случайной величины из общего вариационного
ряда парных наблюдений.
Межгрупповая изменчивость:
k
SS y n j ( y j Y )2
Корреляционное отношение:
j 1
y/ x
SS y
SS y
3
4.
Основы математической статистикиПрактическое занятие №10
Корреляционное отношение представляет собой меру концентрации
парных наблюдений около кривой регрессии. Оно может менять свое
значение от 0 до 1.
Значение корреляционного отношения будет зависеть от количества
интервалов, на которые делится общий интервал разброса независимой
переменной. При выборе числа интервалов можно использовать те же правила,
что и при построении гистограммы. Обычно считается, что число интервалов
должно быть не менее 7-8. При очень большом числе интервалов
информативность
корреляционного
отношения
теряется.
Если
число
интервалов будет приближаться к числу наблюдений, то корреляционное
отношение будет приближаться к единице.
4
5.
Основы математической статистикиПрактическое занятие №10
Значимость корреляционного отношения может быть проверена с
помощью критерия Фишера. Нулевая гипотеза при этом формулируется как
H0: y / x 0 .
Критерий Фишера рассчитывается по формуле:
F
( n k ) 2y / x
( k 1)(1 2y / x )
Если рассчитанная величина превысит критическое значение F критерия
для заданного уровня значимости и для k-1 и n-k степеней свободы, то
нулевая гипотеза должна быть отклонена.
5
6.
Основы математической статистикиПрактическое занятие №10
Условием успешного применения коэффициента линейной корреляции
является нормальное распределение совокупностей случайных величин.
В случае неясного или заведомо отличающегося от нормального
распределения, при ограниченном числе данных, а так же при исследовании
величин, измеренных в порядковой шкале, лучше использовать ранговые
коэффициенты корреляции. Наиболее известным среди них является
ранговый коэффициент корреляции Спирмена r(s).
6
7.
Основы математической статистикиПрактическое занятие №10
Пусть x1y1, x2y2, x3y3, ..., xnyn – парные наблюдения двух признаков.
Рассмотрим каждый из признаков отдельно, расположив все его значения в
неубывающий ряд. Присвоим каждому из значений x и y в составе
соответствующего ряда его порядковый номер (ранг). Если значения двух и
более соседних случайных величин в составе упорядоченного ряда совпадают,
то им присваивается «средний ранг». В итоге значения переменных в парных
наблюдениях xiyi можно заменить их рангами:
R(x1)R(y1), R(x2)R(y2), R(x3)R(y3), ..., R(xn)R(yn).
7
8.
Основы математической статистикиПрактическое занятие №10
Для каждой пары рассчитаем квадрат разности рангов и все n
квадратов
разностей
сложим.
Общая
формула
для
расчета
коэффициента корреляции Спирмена будет иметь вид:
n
r ( s) 1
6 [ R( xi ) R( yi )]2
i 1
n3 n
( s)
Нулевая гипотеза формулируется как H0: r 0
( s)
( s)
при альтернативах H1: r 0, r 0. Критерий двусторонний.
Если рассчитанное значение коэффициента корреляции превысит
по абсолютной величине его критическое значение, гипотеза о
равенстве коэффициента корреляции нулю опровергается.
8