1.97M

1. Описова статистика_основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки

1.

Описова статистика: основи аналізу
емпіричної вибірки та оцінювання
даних. Точкові статистичні оцінки
Танасійчук Ірина Сергіївна
Доцент кафедри сучасних технологій медичної діагностики та лікування
[email protected]

2.

Основні параметри описової статистики
Як правильно описати
отримані дані
Завдання: дослідити
концентрацію білка в
сироватці крові
мешканців двох колоній
108 мешканців
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
99 мешканців
2

3.

Основні параметри описової статистики
108 мешканців
55
60
65
70
75
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
80
85
3

4.

Основні параметри описової статистики
99 мешканців
55
60
65
70
75
80
85
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
90
95
100
4

5.

Основні параметри описової статистики
70 г/л
55
60
65
70
70 г/л
55
60
65
70
75
80
85
90
95
100
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
75
80
85
Іноді середнє
арифметичне
значення дає
неправдиве
уявлення про
сукупність даних
5

6.

Основні параметри описової статистики
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
середнє арифметичне
мода
медіана
55
60
65
70
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
75
80
85
6

7.

Центр статистичного розподілу. Медіана
Медіана
варіанта, яка ділить варіаційний ряд на дві (рівні за
кількістю варіант) частини
n непарне
отримане значення округлити в
більшу сторону
n парне
розрахувати середнє отриманого
та наступного значення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
7

8.

Основні параметри описової статистики
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
дисперсія
стандартне
відхилення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
коефіцієнт
варіації
8

9.

Ширина розподілу. Стандартне відхилення
Іноді стандартне
відхилення дає
неправдиве
уявлення про
сукупність даних
95%
55
60
65
70
75
60
µ=70 г/л
65
70
85
σ=5 г/л
µ=70 г/л
???
55
80
±2 σ
60 – 80
75
80
85
σ=13 г/л
90
95
100
±2 σ
44 – 96
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
9

10.

Ширина розподілу. Інтерквартильний розмах
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
міра розсіювання, що спирається
на сортування (ранжування) даних
інтервал, який містить
половину значень
елементів вибірки
інтерквартильний
розмах
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
різниця між
75-м та 25-м
процентилями
10

11.

Ширина розподілу. Перцентіль
Перцентіль
25%
значення, яке міститься на межі
певного відсотка ранжованої вибірки
1. R = 25/100 x (15+1) =4
75%
Перцентіль дорівнює
значенню із порядковим
номером (рангом) R:
R = P/100 x (N+1),
2. R = 75/100 x (15+1) =12
57
62
P – перцентіль, який необхідно знайти
N – число порядкових номерів
50% всіх значень
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
11

12.

Ширина розподілу. Перцентіль
25%
Перцентіль
значення, яке міститься на межі
певного відсотка ранжованої вибірки
Перцентіль дорівнює
значенню із порядковим
номером (рангом) R:
R = P/100 x (N+1),
P – перцентіль, який необхідно знайти
N – число порядкових номерів
1. R = 25/100 x (20+1) =5,25
2. 5,25 = 5 и 0,25
3. Знайти різницю між значеннями із
рангами 5 и 6 = 59 – 58 = 1
4. Помножити різницю на дробну
частину рангу = 1 х 0,25 = 0,25
5. Додати до значення з порядковим
номером, що дорівнює цілій частині
рангу, число, отримане у кроці 4 =
58 + 0,25 = 58,25
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
12

13.

Ширина розподілу. Перцентіль
25%
Перцентіль
значення, яке міститься на межі
певного відсотка ранжованої вибірки
75%
Ме = 61,5 (58,25;64,75)
50% всіх
значень
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
13

14.

Форма розподілу. Асиметрія
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
Асиметрія (коефіцієнт скісності)
міра відхилення симетричного розподілу стосовно
максимальної ординати (для будь-якого
симетричного розподілу дорівнює нулю)
55
60
65
70
75
As=0
симетричний розподіл
80
85
As<0
As>0
лівостороння асиметрія правостороння асиметрія
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
14

15.

Форма розподілу. Ексцес
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
Ex=0
“ідеальний” розподіл
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
Асиметрія (коефіцієнт скісності)
Ексцес (коефіцієнт гостроверхості)
міра протяжності розподілу
Ex<0
плосковершинний розподіл
Ex>0
гостровершинний розподіл
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
15

16.

Параметричні та непараметричні
характеристики сукупності даних
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
µ = Ме = Мо
Нормальний
розподіл
ДСТУ ISO 5479:2009
Статистичне
опрацювання даних.
Критерії відхилення від
нормального розподілу
(ISO 5479:1997, IDT)
Параметричні характеристики
сукупності та параметричні
критерії для порівняння груп
95 %
55
60
65
As=0
симетричний розподіл
Якщо вибіркові коефіцієнти задовольняють умовам
70
75
80
85
Ex=0
“ідеальний” розподіл
розподіл близький до нормального
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
16

17.

Параметричні та непараметричні
характеристики сукупності даних
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
Розподіл не
підпорядковується
нормальному
закону
55
ФОРМА РОЗПОДІЛУ
НЕпараметричні
характеристики сукупності та
непараметричні критерії для
порівняння груп
60
65
70
75
80
85
90
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
95
100
17

18.

Властивості нормального розподілу
Z-оцінка – змінна, яка
відповідає кількості
стандартних відхилень від
результату вимірювання
до середнього значення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
18

19.

Вибіркові оцінки
генеральних статистичних характеристик
10
Вибірка із
генеральної
сукупності
10
РЕПРЕЗЕНТАТИВНІСТЬ
108 мешканців
99 мешканців
Генеральна сукупність – усі об’єкти, відносно яких ми бажаємо
узагальнити висновки в межах конкретного дослідження
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
19

20.

Вибіркові оцінки
генеральних статистичних характеристик
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
середнє
арифметичне
мода
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
дисперсія
стандартне
відхилення
коефіцієнт
варіації
Асиметрія
Ексцес
медіана
інтерквартильний розмах
Вибірка має повторити властивості всієї досліджуваної множини у вибраній її частині та
найбільш точно і повно характеризувати генеральну сукупність, з якої вона виділена
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
20

21.

Вибіркові оцінки
генеральних статистичних характеристик
Наскільки точними є вибіркові оцінки?
σ=5 г/л
µ=70 г/л
55
108 мешканців
60
65
70
75
80
85
10
Зробимо три незалежні випадкові
вибірки з генеральної сукупності
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
21

22.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
10
60
65
σ=5 г/л
70
75
80
85
µ
Xср
σ
S
108 мешканців
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
22

23.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
Наскільки точними є вибіркові оцінки?
10
Стандартна помилка середнього
У 2 РАЗИ
У 4 РАЗИ
108 мешканців
НІЧОГО НЕ ГОВОРИТЬ ПРО РОЗКИД ДАНИХ
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
23

24.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
Вибіркове середнє не дорівнює генеральному
середньому, але знаходиться десь «поблизу»
ДЕ?
Можна розрахувати інтервал, в
якому із заданою ймовірністю
знаходиться істинне значення
(генеральне середнє)
ДОВІРЧИЙ ІНТЕРВАЛ
ДЛЯ СЕРЕДНЬОГО ЗНАЧЕННЯ
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
24

25.

Вибіркові оцінки
генеральних статистичних характеристик
Хср
S
SE
72
68
67
71
75
69
71
68
69
60
76
65
73
68
84
68
70
70
67
79
86
55
66
70
71
76
75
70
71
72
69
3,94
1,25
72
6,00
1,90
71,2
7,81
2,47
Хср – taSE < µ < Хср + taSE
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
t0,05 (ν=9) = 2,262
72 – 2,262х1,9 < µ < 72 + 2,262х1,9
68 < µ < 76
ВІРНО?
68 < 70 < 76
В нашому прикладі ми знали, чому дорівнює
Хср – вибіркове середнє
SE – стандартна помилка
µ, але на практиці воно є невідомим!!!
µ - генеральне середнє
tα – критичне значення t для рівня значущості α та числа ступенів свободи ν = n-1
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
25

26.

Вибіркові оцінки
генеральних статистичних характеристик
Ми ніколи не знаємо точно, чому дорівнює деяка величина, ми лише можемо знати
діапазон, в якому ця величина знаходиться із заданою ймовірністю
Точкові статистичні
оцінки
Інтервальні
статистичні оцінки
Довірчі
інтервали
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
26

27.

Список використаних джерел інформації і
рекомендованої літератури
1. Данілов В.Я. Статистична обробка даних: навчальний
посібник. – 2019. – 156 с.
2. Бахрушин В.Є. Методи аналізу даних: навчальний
посібник для студентів / В.Є. Бахрушин. – Запоріжжя:
КПУ, 2011. – 268 с.
3. Гланц С. Медико-биологическая статистика. Пер. с
англ. – М.: Практика, 1998. – 459 с.
Описова
статистика:
основи
аналізу
емпіричної
вибірки
та
оцінювання
генеральної
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування [email protected]
сукупності.
27
English     Русский Правила