Статистические оценки параметров распределения
Виды статистических ошибок
Точечные оценки
Интервальные оценки
Доверительный интервал
Пример
Решение
Доверительный интервал для оценки среднего квадратического отклонения σ нормального распределения.
248.00K
Категория: МатематикаМатематика

Статистические оценки параметров распределения. Доверительные интервалы

1. Статистические оценки параметров распределения

Доверительные
интервалы

2.

1. Виды статистических ошибок
2. Интервальные оценки
3. Доверительные интервалы

3. Виды статистических ошибок

Def:
Статистической оценкой неизвестного
параметра теоретического распределения
называют функцию от наблюдаемых
случайных величин.
Для того, чтобы статистические оценки давали
«хорошие» приближения оцениваемых
параметров, они должны удовлетворять
определенным требованиям.

4.

Def:
Несмещенной называют статистическую
оценку Θ*, математическое ожидание которой
равно оцениваемому параметру Θ при любом
объеме выборки, т.е. M(Θ*) = Θ.
Смещенной, если M(Θ*) ≠ Θ.
Def:
Эффективной называют статистическую
оценку, которая (при заданном объеме выборки
n) имеет наименьшую возможную дисперсию.

5.

Def:
Состоятельной называют статистическую
оценку, которая при n→∞ стремится по
вероятности к оцениваемому параметру.
Оценки бывают точечными, которые
определяются одним числом. Все оценки,
рассмотренные выше – точечные.

6. Точечные оценки

Sx
Sx
;
mx
; mS
2(n 1)
n 1
x
M Cv
Cv
2n

7.

При выборке малого объема точечная оценка
может разительно отличаться от
оцениваемого параметра, т.е. приводить к
грубым ошибкам.
По этой причине при небольшом объеме выборки
следует пользоваться интервальными
оценками.

8. Интервальные оценки

Интервальные оценки позволяют установить
точность и надежность оценок.
Пусть найденная по данным выборки
статистическая характеристика Θ* служит
оценкой неизвестного параметра Θ.
Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ,
тем оценка точнее.

9.

Т.о., положительное число δ характеризует
точность оценки.
Однако статистические методы не позволяют
категорически утверждать, что оценка Θ*
удовлетворяет неравенству │Θ – Θ*│< δ;
можно лишь говорить о вероятности γ, с
которой это неравенство осуществляется.

10.

Def:
Надежностью (доверительной вероятностью)
оценки Θ по Θ* называют вероятность γ, с
которой осуществляется неравенство
│Θ – Θ*│< δ. γ = 0,95; 0,99; 0,999.
P
*

11.

Заменив неравенство │Θ – Θ*│< δ
равносильным уме двойным неравенством
- < - <
*
*
*
P
*
*
Вероятность того, что интервал
(Θ* - δ; Θ* + δ) заключает в себе (покрывает)
неизвестный параметр Θ, равна γ.

12. Доверительный интервал

Def:
Доверительным интервалом называется
случайный интервал (Q* - δ; O* + δ), в пределах
которого с вероятностью γ находится
неизвестный оцениваемый параметр.
Доверительные интервалы находят по
различным формулам, в зависимости от
исходных данных.

13.

Доверительный интервал для математического
ожидания нормально распределенного признака
с известным средним квадратическим
отклонением находят по формуле:
t ( X )
t ( X )
p( xв
M ( X ) xв
) 2 (t ),
n
n
(X )
где
среднее
квадратическое
отклонение,
n
t – параметр, величину которого находят по
таблицам Лапласа из соотношения γ=2Φ(t).

14.

Приведенная формула позволяет решать
следующие задачи:
1) По заданным надежности γ и объеме выборки
n находить точность δ и доверительный
интервал.
2) По заданным надежности γ и точности δ
находить объем выборки n.
3) По заданным точности δ и объеме выборки n
находить надежность γ.

15.

В случае большой выборки при n > 30 и
неизвестном среднем квадратическом
отклонении σ(X) доверительный интервал
находят по формуле:
tS
tS

M ( X ) xв
n
n
где S – исправленное выборочное среднее
квадратическое отклонение, то есть оценка
σ(X).

16.

Исследование большой выборки может
оказаться невозможным по различным
признакам. Кроме этого, с уменьшением n
доверительный интервал увеличивается.
При определении доверительного интервала в
случае нормального распределения при
неизвестном σ признака X в генеральной
совокупности применяют случайную величину:

17.

xв M ( X )
T
n
S
Эта величина соответствует закону t –
распределения Стьюдента.
Дифференциальная функция распределения T
обозначается S(tγ; n) и зависит только от
объема выборки n.

18.

Вероятность попадания случайной величины в
соответствующий интервал равна:
t
P(| T | t ) 2 S (t ; n)dt (t ; n).
0

19.

Доверительный интервал для оценки
математического ожидания при неизвестном σ.
S
S
x в t
M ( X ) x в t
,
n
n
где tγ = t(γ; n) – числа, приведенные в
специальных таблицах.

20.

Примечание: при большом объеме выборки
(n ≥ 30) значения tγ таблицы Стьюдента и
t таблицы Лапласа практически равны.
Поэтому выбор формулы, по которой
определяют доверительный интервал,
диктуется исходными данными.

21. Пример

Для определения средней живой массы
трехмесячного теленка определенной породы
были взвешены 100 животных и результаты
сведены в таблицу
Масса, 23-25 25-27 27-29 29-31 31-33 33-35 35-37
кг
Число
телят,
гол
3
10
6
16
15
30
20

22.

Найти:
1) величины, которые следует принять за
среднюю массу и среднее квадратическое
отклонение;
2) ошибку средней и коэффициетнт вариаций;
3) доверительный интервал, в котором с
вероятностью 0,95 заключена средняя масса.

23. Решение

1) В качестве приближенного значения средней
массы принимаем выборочную среднюю, а за
значение признака – середины интервалов
24 3 26 10 28 6 30 16 32 15 34 30 36 20

32кг.
100

24.

Вычисляем выборочную исправленную
дисперсию
1
2
2
2
2
S (3(24 32) 10(26 32) 6(28 32) 16(30 32)
99
2
2
2
15(32 32) 30(34 32) 20(36 32) 11,62.
2

25.

Находим исправленное выборочное среднее
квадратичное отклонение
100
S
11, 62 3, 45кг.
99

26.

2) Ошибка средней равна
3, 45
x
0,345кг
100
Коэффициент вариации
3, 45
V
100 10, 78%
32
показывает, что изменчивость признака
средняя.

27.

3) Поскольку n = 100 > 30 и у нас случай
нормального распределения, то доверительный
интервал находим по формуле
tS
tS

M ( X ) xв
n
n

28.

Из условия 2Φ(tγ) = 0.95 определяем
Φ(tγ) = 0,475, а по таблице приложений
находим tγ = 1,96.
Поэтому
1,96 3, 45
1,96 3, 45
32
x 32
100
100
или 31,32 < x < 32,68 кг – доверительный
интервал для заданной вероятности.

29.

Замечание: если требуется оценить
математическое ожидание с наперед заданной
точностью δ и надежностью γ, то
максимальный объем выборки, который
обеспечит эту точность, находится по
формуле
n t
2
S
2
2
(n
)

30.

Объем выборочной совокупности при повторном
способе отбора находят по формуле:
n
2
2
t S (X )
2
,
(t )
где параметр t определяют из
по таблицам Лапласа;
tS x
n
.
2

31. Доверительный интервал для оценки среднего квадратического отклонения σ нормального распределения.

P S
S S
S (1 ) S (1 )
S
S

32.

S
q
S (1 q) S (1 q)
q находят по приложению №4 руководства
Гмурмана В.С.
English     Русский Правила