1.97M
Категория: МатематикаМатематика

Описова статистика: основи аналізу емпіричної вибірки та оцінювання даних. Точкові статистичні оцінки

1.

Описова статистика: основи аналізу
емпіричної вибірки та оцінювання
даних. Точкові статистичні оцінки
Танасійчук Ірина Сергіївна
Доцент кафедри сучасних технологій медичної діагностики та лікування
is.tanasiichuk@gmail.com

2.

Основні параметри описової статистики
Як правильно описати
отримані дані
Завдання: дослідити
концентрацію білка в
сироватці крові
мешканців двох колоній
108 мешканців
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
99 мешканців
2

3.

Основні параметри описової статистики
108 мешканців
55
60
65
70
75
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
80
85
3

4.

Основні параметри описової статистики
99 мешканців
55
60
65
70
75
80
85
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
90
95
100
4

5.

Основні параметри описової статистики
70 г/л
55
60
65
70
70 г/л
55
60
65
70
75
80
85
90
95
100
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
75
80
85
Іноді середнє
арифметичне
значення дає
неправдиве
уявлення про
сукупність даних
5

6.

Основні параметри описової статистики
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
середнє арифметичне
мода
медіана
55
60
65
70
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
75
80
85
6

7.

Центр статистичного розподілу. Медіана
Медіана
варіанта, яка ділить варіаційний ряд на дві (рівні за
кількістю варіант) частини
n непарне
отримане значення округлити в
більшу сторону
n парне
розрахувати середнє отриманого
та наступного значення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
7

8.

Основні параметри описової статистики
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
дисперсія
стандартне
відхилення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
коефіцієнт
варіації
8

9.

Ширина розподілу. Стандартне відхилення
Іноді стандартне
відхилення дає
неправдиве
уявлення про
сукупність даних
95%
55
60
65
70
75
60
µ=70 г/л
65
70
85
σ=5 г/л
µ=70 г/л
???
55
80
±2 σ
60 – 80
75
80
85
σ=13 г/л
90
95
100
±2 σ
44 – 96
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
9

10.

Ширина розподілу. Інтерквартильний розмах
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
міра розсіювання, що спирається
на сортування (ранжування) даних
інтервал, який містить
половину значень
елементів вибірки
інтерквартильний
розмах
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
різниця між
75-м та 25-м
процентилями
10

11.

Ширина розподілу. Перцентіль
Перцентіль
25%
значення, яке міститься на межі
певного відсотка ранжованої вибірки
1. R = 25/100 x (15+1) =4
75%
Перцентіль дорівнює
значенню із порядковим
номером (рангом) R:
R = P/100 x (N+1),
2. R = 75/100 x (15+1) =12
57
62
P – перцентіль, який необхідно знайти
N – число порядкових номерів
50% всіх значень
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
11

12.

Ширина розподілу. Перцентіль
25%
Перцентіль
значення, яке міститься на межі
певного відсотка ранжованої вибірки
Перцентіль дорівнює
значенню із порядковим
номером (рангом) R:
R = P/100 x (N+1),
P – перцентіль, який необхідно знайти
N – число порядкових номерів
1. R = 25/100 x (20+1) =5,25
2. 5,25 = 5 и 0,25
3. Знайти різницю між значеннями із
рангами 5 и 6 = 59 – 58 = 1
4. Помножити різницю на дробну
частину рангу = 1 х 0,25 = 0,25
5. Додати до значення з порядковим
номером, що дорівнює цілій частині
рангу, число, отримане у кроці 4 =
58 + 0,25 = 58,25
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
12

13.

Ширина розподілу. Перцентіль
25%
Перцентіль
значення, яке міститься на межі
певного відсотка ранжованої вибірки
75%
Ме = 61,5 (58,25;64,75)
50% всіх
значень
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
13

14.

Форма розподілу. Асиметрія
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
Асиметрія (коефіцієнт скісності)
міра відхилення симетричного розподілу стосовно
максимальної ординати (для будь-якого
симетричного розподілу дорівнює нулю)
55
60
65
70
75
As=0
симетричний розподіл
80
85
As<0
As>0
лівостороння асиметрія правостороння асиметрія
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
14

15.

Форма розподілу. Ексцес
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
Ex=0
“ідеальний” розподіл
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
Асиметрія (коефіцієнт скісності)
Ексцес (коефіцієнт гостроверхості)
міра протяжності розподілу
Ex<0
плосковершинний розподіл
Ex>0
гостровершинний розподіл
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
15

16.

Параметричні та непараметричні
характеристики сукупності даних
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
µ = Ме = Мо
Нормальний
розподіл
ДСТУ ISO 5479:2009
Статистичне
опрацювання даних.
Критерії відхилення від
нормального розподілу
(ISO 5479:1997, IDT)
Параметричні характеристики
сукупності та параметричні
критерії для порівняння груп
95 %
55
60
65
As=0
симетричний розподіл
Якщо вибіркові коефіцієнти задовольняють умовам
70
75
80
85
Ex=0
“ідеальний” розподіл
розподіл близький до нормального
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
16

17.

Параметричні та непараметричні
характеристики сукупності даних
ЦЕНТР СТАТИСТИЧНОГО
ШИРИНА РОЗПОДІЛУ
РОЗПОДІЛУ
Розподіл не
підпорядковується
нормальному
закону
55
ФОРМА РОЗПОДІЛУ
НЕпараметричні
характеристики сукупності та
непараметричні критерії для
порівняння груп
60
65
70
75
80
85
90
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
95
100
17

18.

Властивості нормального розподілу
Z-оцінка – змінна, яка
відповідає кількості
стандартних відхилень від
результату вимірювання
до середнього значення
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
18

19.

Вибіркові оцінки
генеральних статистичних характеристик
10
Вибірка із
генеральної
сукупності
10
РЕПРЕЗЕНТАТИВНІСТЬ
108 мешканців
99 мешканців
Генеральна сукупність – усі об’єкти, відносно яких ми бажаємо
узагальнити висновки в межах конкретного дослідження
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
19

20.

Вибіркові оцінки
генеральних статистичних характеристик
ЦЕНТР СТАТИСТИЧНОГО
РОЗПОДІЛУ
середнє
арифметичне
мода
ШИРИНА РОЗПОДІЛУ
ФОРМА РОЗПОДІЛУ
міра розсіювання варіант
відносно середньої величини
дисперсія
стандартне
відхилення
коефіцієнт
варіації
Асиметрія
Ексцес
медіана
інтерквартильний розмах
Вибірка має повторити властивості всієї досліджуваної множини у вибраній її частині та
найбільш точно і повно характеризувати генеральну сукупність, з якої вона виділена
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
20

21.

Вибіркові оцінки
генеральних статистичних характеристик
Наскільки точними є вибіркові оцінки?
σ=5 г/л
µ=70 г/л
55
108 мешканців
60
65
70
75
80
85
10
Зробимо три незалежні випадкові
вибірки з генеральної сукупності
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
21

22.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
10
60
65
σ=5 г/л
70
75
80
85
µ
Xср
σ
S
108 мешканців
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
22

23.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
Наскільки точними є вибіркові оцінки?
10
Стандартна помилка середнього
У 2 РАЗИ
У 4 РАЗИ
108 мешканців
НІЧОГО НЕ ГОВОРИТЬ ПРО РОЗКИД ДАНИХ
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
23

24.

Вибіркові оцінки
генеральних статистичних характеристик
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
Вибіркове середнє не дорівнює генеральному
середньому, але знаходиться десь «поблизу»
ДЕ?
Можна розрахувати інтервал, в
якому із заданою ймовірністю
знаходиться істинне значення
(генеральне середнє)
ДОВІРЧИЙ ІНТЕРВАЛ
ДЛЯ СЕРЕДНЬОГО ЗНАЧЕННЯ
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
24

25.

Вибіркові оцінки
генеральних статистичних характеристик
Хср
S
SE
72
68
67
71
75
69
71
68
69
60
76
65
73
68
84
68
70
70
67
79
86
55
66
70
71
76
75
70
71
72
69
3,94
1,25
72
6,00
1,90
71,2
7,81
2,47
Хср – taSE < µ < Хср + taSE
µ=70 г/л
55
60
65
σ=5 г/л
70
75
80
85
t0,05 (ν=9) = 2,262
72 – 2,262х1,9 < µ < 72 + 2,262х1,9
68 < µ < 76
ВІРНО?
68 < 70 < 76
В нашому прикладі ми знали, чому дорівнює
Хср – вибіркове середнє
SE – стандартна помилка
µ, але на практиці воно є невідомим!!!
µ - генеральне середнє
tα – критичне значення t для рівня значущості α та числа ступенів свободи ν = n-1
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
25

26.

Вибіркові оцінки
генеральних статистичних характеристик
Ми ніколи не знаємо точно, чому дорівнює деяка величина, ми лише можемо знати
діапазон, в якому ця величина знаходиться із заданою ймовірністю
Точкові статистичні
оцінки
Інтервальні
статистичні оцінки
Довірчі
інтервали
Описова статистика: основи аналізу емпіричної вибірки та оцінювання генеральної сукупності. Точкові статистичні оцінки.
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
26

27.

Список використаних джерел інформації і
рекомендованої літератури
1. Данілов В.Я. Статистична обробка даних: навчальний
посібник. – 2019. – 156 с.
2. Бахрушин В.Є. Методи аналізу даних: навчальний
посібник для студентів / В.Є. Бахрушин. – Запоріжжя:
КПУ, 2011. – 268 с.
3. Гланц С. Медико-биологическая статистика. Пер. с
англ. – М.: Практика, 1998. – 459 с.
Описова
статистика:
основи
аналізу
емпіричної
вибірки
та
оцінювання
генеральної
Танасійчук І.С., доцент кафедри сучасних технологій медичної діагностики та лікування is.tanasiichuk@gmail.com
сукупності.
27
English     Русский Правила