Похожие презентации:
Порівняння декількох (трьох і більше) груп даних
1. Порівняння декількох (трьох і більше) груп даних
1.2.
3.
Порівняння незалежних груп даних.
Дисперсійний аналіз (однофакторний і
багатофакторний).
Однофакторний параметричний
дисперсійний аналіз.
Непараметричні методи порівняння груп.
2. Порівняння незалежних груп даних. Дисперсійний аналіз (однофакторний і багатофакторний).
Задача: перевірити, чивідрізняються 3 і більше груп
по певній ознаці (ознакам)
наприклад, чи залежить активність
ферменту протеїнкінази С в
клітинах печінки
від стадії захворювання на гепатит
(1 фактор)
від стадії захворювання і віку
пацієнтів (2 фактори)
від стадії захворювання, віку
пацієнтів і методів терапії (3
фактори)
Фактор – чинник, який
повинен мати вплив на
результат експерименту,
Рівні фактора – значення, які
приймає фактор (напр.,
концентрації речовини, стадії
захворювання тощо)
Дисперсійний аналіз:
Однофакторний (one-way
ANOVA – analysis of variance),
Двофакторний (two-way
ANOVA )
Багатофакторний (MANOVA)
3. 2. Однофакторний параметричний дисперсійний аналіз
Алгоритм:1) перевірити гіпотезу про
Задача: перевірити,
приналежність до нормально
чи відрізняються 3 і
розподіленої сукупності (тест
більше груп по
певній якісній ознаці Шапіро-Уілка),
Умова: нормально2) перевірити гіпотезу про рівність
розподілені групи
дисперсій (тест Левена),
даних (дисперсії –
3) Проведення власне
рівні)
дисперсійного аналізу,
4) Апостеріорне порівняння даних,
попарне (у випадку, коли
дисперсійний аналіз відхилив
Н0)
4. Однофакторний дисперсійний аналіз для рівночисельних груп
1. Маємо груповані дані,для яких рахуємо середні:
№
випробув
ання, і
F1
F2
…
Fp
1
х11
x12
...
x1p
2
х21
x22
...
x2p
Рівні фактора F
…
...
...
...
...
q
хq1
xq2
...
xqp
Групові
середні
xгр1
x гр 2
...
xгр p
Загальне
середнє:
q
p
x xij / N
i 1 j 1
5. 2. Рахуємо суми, число ступенів свободи і дисперсії
S заг ( хij x ) 2Число ступенів свободи:
Для факторної суми:
k факт р 1
Для залишкової суми:
Факторна сума
k зал р(q 1) N p
Суми:
Загальна сума
q
p
i 1 j 1
q
S факт q ( xгр р х ) 2
j 1
Залишкова сума
S зал S заг S факт
дисперсії:
факторна:
Dфакт
Sфакт
залишкова:
Dзал
S зал
kфакт
k зал
6. 3. Власне дисперсійний аналіз
Суть: порівнюємоF-критерій:
факторну і залишкову Фактичне значення
дисперсії – так
Dфакт
Fф
порівнюємо величини
Dзал
розсіяння між групами
Табличне, критичне
(факторна дисперсія,
значення
невипадкова) і всередині
груп (залишкова
Fкрит(α, kфакт, kзал)
дисперсія, випадкова)
При
Fф < Fкрит
– приймаємо Н0
7.
Проведення параметричного однофакторногодисперсійного аналізу в програмі Statistica 7.0:
8.
9.
10.
Вікно результатів, тут:df Effect – kфакт,
df Error – kзал,
MS Effect – Dфакт,
MS Error – Dзал,
SS Error – Sзал,
SS Effect – Sфакт
F – Fф.
11. Коли р < 0.05, варто проводити апостеріорне порівняння даних, щоб встановити силу дії фактора та об’єктивно існуючі відмінності між окремими
Коли р < 0.05, варто проводити апостеріорнепорівняння даних, щоб встановити силу дії
фактора та об’єктивно існуючі відмінності між
окремими групами (дію певних рівнів фактора)
12. Встановлення сили впливу фактора на досліджуваний показник
1 - Метод Плохінського:сила впливу фактора визначається як відсоток міжгрупової
(факторної) варіації у загальній варіації показника:
h
2
S факт
S заг
Статистична похибка показника h2:
sh 2 (1 h )
2
kфакт
k зал
Критерій значущості показника h2:
h2
Порівнюємо з Fкрит(α, kфакт, kзал)
F
sh 2
Гіпотезa: Н0 : h2=0 ,
її приймаємо при Fф < Fкрит
13. 2 – Метод Снедекора
Показник h2:h
Dфакт Dзал
2
Для нерівночисельних комплексів n розраховують:
де n1,n2,…- об’єми вибірок
1
n1 n2 ...
при різних рівнях фактора
n
p 1
(n
N
)
Критерій значущості показника h2:
D факт
Порівнюємо з Fкрит(α, kфакт, kзал)
F
Dфакт Dзал nDзал
Dзал
Гіпотезa: Н0 : h2=0 ,
її приймаємо при Fф < Fкрит
14. Задача: встановити відмінності групових середніх для різних рівнів фактора
15. Апостеріорне порівняння груп даних при різних рівнях фактора (post-hoc comparisons of mean)
Передумова: дисперсійний аналіз виявив вірогідний впливфактора (відхилили Н0, р < 0.05),
Критерій Шеффе:
Виявляє групи з вірогідними відмінностями середніх. Застосовують
для рівно- і нерівночисельних груп.
xi x j
Н0: групові середні рівні,
F
, де
Розрахунок F:
k
1 1
M( )
N ni
n1 n2
i 1
nj
1 k
M
( xij x ) 2
N k i 1 j 1
k – кількість вибірок (рівнів фактора),
ni – об’єм і-тої вибірки,
Fкрит(α, k-1, N-k)
хі - середнє і-тої вибірки,
F< Fкрит – приймаємо Н0
N – загальна чисельність
16.
Тест Шеффе17.
Критерій Тьюкі:Застосовують для рівночисельних вибірок
Н0: групові середні рівні,
Розраховують фактичне значення критерію:
| x1 x2 |
tQ
S зал
q
Порівнюють його зі стандартним значенням:
Qтабл (α, N-k, k-1)
При tQ < Qтабл – приймаємо Н0
18. У випадку, коли дисперсійний аналіз виявив вірогідний вплив фактора, але тести апостеріорного аналізу – ні, варто провести попарне порівн
У випадку, коли дисперсійний аналіз виявиввірогідний вплив фактора, але тести апостеріорного
аналізу – ні, варто провести попарне порівняння груп
t-критерієм з поправкою Бонферроні
Поправка Бонферроні:
Рівень значущості α ділять на
кількість рівнів фактора –
це буде новий рівень
статистичної значущості
Наприклад, при k=6,
α = 0,05/6 =0,008
19. Коли тестами Шапіро-Уілка або Левена було відхилено нульові гіпотези, здійснюють непараметричні методи порівняння груп даних
20.
Підстава обрати непараметричний дисперсійний аналіз21. Тест Краскела-Уолліса (для незалежних груп даних і нерівночисельних груп)
Аналог двовибіркового тесту Манна-Уітні – але длябільше, ніж 2 груп даних
Н0: фактор не змінює показники розподілу даних
n
n
12
Н
N ( N 1) i 1
( Ri ) 2
i 1
ni
3( N 1)
де : N - загальна кількість досліджень; ni – кількість
досліджень на окремих рівнях фактора; Ri – ранги значень
показника, ранжованих в спільний ряд, для кожного рівня
фактора;
При р>3 або n>=5 Нтабл = χ2 (α, р-1)
Коли
Н < Нтабл – Н0 приймають
22.
Спочаткугрупуємо дані
Потім обираємо
модуль
“Непараметричні
статистики”,
порівняння
багатьох груп
даних (залежних
або незалежних)
23.
24.
Результат тесту Краскела-Уолліса:25.
Медіанний тест:Відхиляємо Н0
26. Тест Фрідмана (для залежних, зв’язаних і, отже, рівночисельних груп даних)
Ранговий дисперсійний аналіз; одночасово розраховуєкоефіцієнт конкордації Кендалла – встановлює міру зв’язку
ознак,
Н0: фактор не змінює показники розподілу даних
n
R2
12( Ri ) 2
i 1
3n( p 1)
n * р * (n 1)
де : р – кількість рангів; n – кількість досліджень на
окремих рівнях фактора; Ri – ранги значень показника,
ранжованих окремо для кожного рівня фактора (для
однакових значень – усереднюють ранги);
При р=3 i 2<=n<=9 або р=4 i 2<=n<=4 - χ2 табл = χ2 (α, р-1)
Коли
χ2 < χ2 табл – Н0 приймають
27.
28.
Результат тесту Фрідмана:Приймаємо Н0
29. Коли непараметричний дисперсійний аналіз виявив достовірний вплив фактора (р<0,05)
Коли непараметричний дисперсійний аналізвиявив достовірний вплив фактора (р<0,05)
проводимо апостеріорне порівняння груп:
Для
незалежних
груп:
Для
залежних
груп – попарно
порівнюємо з
допомогою тесту
Уілкоксона
(але з поправкою
Бонферроні)
30.
Встановлення сили впливу фактора на досліджуванийпоказник (непараметрика):
сила впливу фактора визначається як відсоток міжгрупової
(факторної) варіації у загальній варіації показника:
2
де
Сфакт
С заг
R
2
N ( N 1) 2
Сфакт
n
4
( N 1) N ( N 1)
С заг
12