1.93M
Категория: МатематикаМатематика

Статистические распределения и выборочное наблюдение

1.

РАНХГС
к.т.н., доцент
Куприянов В.Е.

2.

Лекция по теме № 3
«Статистические
распределения и
выборочное наблюдение»

3.

Учебные вопросы
Лекции по теме № 2
1) Основные статистические
распределения .
2)Выборочное наблюдение в
изучении массовых явлений.

4.

1. Основные статистические
распределения
Нормальное распределение
Среди многих функций плотности вероятности f(x) очень часто
встречается график распределения, изображенный на рисунке.
f(x)
σ
0
x
Аналитически график этой
функции записывается в виде:
Величины
x
X
1
f ( x) =
e
σ 2π
(
x − x )2

2σ 2
(МОЖ) и σ (СКО) являются параметрами распределения.

5.

Характеристики положения
нормального распределения
ü Математическое ожидание;
f(x)
ü Среднее арифметическое
значение;
ü Мода чаще всего
встречающаяся варианта или
xто значение признака, которое
соответствует максимальной
точке теоретической кривой
распределения (модальный –
часто встречающийся
признак);
σ
x
x медиана
f(x)
x
a
x
b
x = xср = x мода = x медиана
ü Медиана значение
признака, приходящегося на
середину ранжированной
(упорядоченной) совокупности
.

6.

Характеристики разброса
нормального распределения
f(x)
σ
σ>σ
σ
σ
x
x −σ
x
x +σ
В качестве границ интервалов
часто берут точки , отстоящие от
математического ожидания на
целое число стандартных
отклонений σ, 2σ, 3σ и т.д.
Значения вероятностей
попадания нормально
распределенной величины
в интервалы с такими
границами приведены в
таблице.
– среднее
D - дисперсия
квадратическое
(стандартное)
отклонение.
n
σ = Dв
Dв =
1
2

(
x
x
)
∑ i
n i
Границы
интервала
Вероятность
x − σ, x + σ
0,68269
x − 2 σ, x + 2 σ
0,95450
x − 3σ, x + 3σ
0,99730

7.

Характеристики ассиметрии
нормального распределения
Асимметрия - отношение
центрального момента
третьего порядка к кубу
среднего квадратического
отклонения:
3
=
AS µ 3 σ
f(x)
x
a
x
b
Характеризует несимметричность
реальной кривой относительно
МОЖ.
Эксцесс - характеристика,
которая определяется
равенством:
)− 3
σ
Характеризует растяжение или
ЭK =

4
4
сжатие реальной кривой по оси
ординат относительно гауссовой
кривой

8.

Другие виды распределений
— Кроме нормального распределения для
статистических исследований используются
следующие:
ü гамма-распределение,
ü бета-распределение,
ü логарифмическое нормальное распределение,
ü экспоненциальное распределение,
ü распределение Вейбулла,
ü распределение Пирсона,
ü распределение Стьюдента,
ü распределение Фишера.

9.

Гамма-распределение
— Используется для описания случайных
величин, ограниченных с одной стороны.
— Гамма-распределение имеет важную роль в теории
массового обслуживания, где рассматриваются
задачи с ожиданием в очереди, обслуживанием
клиентов и т.д.
Например, если поставка некоторой продукции
производится партиями объемом η , а заявки на продукцию
поступают независимо друг от друга с постоянной
интенсивностью λ единиц в неделю, то промежуток
времени, за который будет реализована вся партия
продукции, является случайной величиной, имеющей
гамма-распределение.

10.

Пример задачи на применение
Гамма распределения
Результат решения:
— Пример . Паромная переправа
Время
отправки
менее чем
через, час.
Вероятность
а)
1
0,084
б)
1,5
0,413
в)
2
0,758
Г)
2,5
0,930
Д)
3
0,985
осуществляет доставку контейнеров
на другой берег реки. Паром
отправляется в рейс, как только на
него загрузят 10 контейнеров (η =10).
Контейнеры доставляют на паром
независимо друг от друга с
интенсивностью 6 контейнеров в час
(λ =6). Требуется определить
вероятность того, что время между
последовательными рейсами парома
будет: а) менее 1 часа, б) менее 1,5
часа, в) менее 2 часов.
Вероятность
1,000
0,800
0,600
0,400
0,200
0,000
0,5
1
1,5
2
2,5
3
Время отправки парома, час
3,5

11.

Экспоненциальное распределение
— Наиболее широко используется в качестве статистической
время
работы,
час
1000
вероятность
безотказной
работы
0,92
10000
0,43
12000
0,37
ве роятность базотка зной
ра боты
модели для времени безотказной работы отдельных компонентов
или системы, когда интенсивность отказов считается
постоянной. Экспоненциальное распределение используется для
решения задач из теории надежности.
Пример. Установлено, что среднее время отказа счетчика
составляет 12000 часов. Требуется определить вероятность
безотказной работы счетчика за время x после подключения,
если: а) x=1000 часов, б) x=10000 часов, в) x=12000 часов.
Результат решения:
1,00
0,80
0,60
0,40
0,20
0,00
0
5000
10000
время работы, час
15000

12.

Распределение Пирсона
(функция χ2 - распределение)
— χ2 - распределение широко применяется
для проверки различных статистических
гипотез.
Исследователь выдвигает гипотезу о теоретическом
распределении случайной величины и вычисляет
вероятность ее применимости.
Если эта вероятность мала, то выдвинутая гипотеза
отвергается и исследователь должен выдвинуть
другую гипотезу (либо пополнить статистический
материал или сделать и то, и другое).

13.

Пример задачи на применение
распределение Пирсона
— Пример. Вещевая служба военного округа составляет заявку
на поставку обмундирования для воинских частей. При этом
делается предположение, что рост военнослужащих
подчиняется нормальному закону распределения. Для
проверки данного предположения было проведено
исследование одной из типовых частей.
Рост, см
x
1
Число
P(χ2)=0.74
f
2
162
166
5
166
170
33
170
174
70
174
178
132
178
182
119
182
186
87
186
190
42
190
194
12
По величине P(χ2) судят о существенности
или несущественности расхождения между
эмпирическим и теоретическим
(предполагаемым) распределениями.
При P(χ2)>0,5 - распределения близки,
при 0,2<P(χ2)<0,5 совпадение
удовлетворительное,
при P(χ2) < 0,2 – недостаточное.

14.

Распределение Стьюдента
(t – распределение).
— На практике часто приходится сталкиваться с
малыми выборками, объем которых не превышает 30
единиц и может доходить до 4-5 единиц.
— Разработана теория малой выборки, согласно
которой расхождение между средней малой выборки
и генеральной средней имеет особый закон
распределения, получивший название
распределения Стьюдента.
— Для определения возможных пределов ошибки
пользуются так называемым t-критерием (критерием
Стьюдента).

15.

Пример задачи на применение
распределение Стьюдента
— Пример. При контрольной проверке качества поставляемого в
торговлю маргарина получены данные о содержании консерванта Е205
в 10 пробах. Какова вероятность того, что среднее содержание
консерванта Е205 во всей партии не выйдет за пределы ∆ МВ = ∆ ~x=0,1%
его среднего содержания в представленных пробах?
№ пробы
содержание
консерванта, x, %
1
4,3
2
4,2
3
3,8
4
4,3
Выборочная средняя
~
x
4,1
Нижняя граница
~
x − ∆ ~x
4,0
Верхняя граница
~
x + ∆ ~x
4,2
Стандартное отклонение
5
3,7
6
3,9
7
4,5
8
4,4
Коэффициент доверия
9
4,0
10
3,9
Доверительная
вероятность
Средняя ошибка выборки
σVIB
0,26
µ МВ
0,087
t
1,15
γ
0,72

16.

Логарифмическое, Бета и
Распределение Фишера
— Логарифмическое нормальное распределение
Применяется в областях, где наблюдаемые значения составляют
случайную долю предыдущего значения.
Примерами могут служить распределение сумма личных
доходов, размеров наследства, суммы банковских вкладов.
Бета-распределение
Используется для описания случайных величин, значения
которых ограничены конечным интервалом.
Примерами такой случайной величины может служить доля
дефектных изделий на производственной линии, оценка
продолжительности определенного зтапа работы при
календарном планировании по методу PERT и др.
Распределение Фишера (F – распределение).
Распределение Фишера широко используется в статистике, в
частности, при проверке адекватности уравнения регрессии.

17.

2)Выборочное наблюдение в
изучении массовых явлений.
Понятие выборочного наблюдения.
Выборочное
наблюдение
Такое несплошное наблюдение, при
котором статистическому наблюдению
подвергаются не все единицы
изучаемой совокупности, а лишь
отобранные в определенном порядке.
Цель выборочного наблюдения
состоит в том, чтобы по характеристикам
отобранной части единиц судить о
характеристиках всей совокупности.

18.

Преимущества выборочного
наблюдения
Преимущества выборочного наблюдения
Достижение большей точности результатов
обследования благодаря сокращению ошибок
регистрации
Экономия трудовых и денежных средств и времени в
результате сокращения объема работы
Возможность детального обследования каждой
единицы наблюдения за счет расширения программы
наблюдения.
Сведение к минимуму уничтожения и приведения в
негодность обследуемых единиц совокупности
Уточнение результатов сплошного наблюдения

19.

Научные принципы
выборочного наблюдения
Научные принципы
выборочного наблюдения
Обеспечение случайности
отбора единиц
(при отборе каждой из единиц
изучаемой совокупности
обеспечивается равная
возможность попасть в
выборку)
Обеспечение
достаточного
числа
отобранных
единиц
совокупности

20.

Понятие генеральной и
выборочной совокупности
Генеральная
совокупность
(N)
Выборочная
совокупность
(n)
совокупность, из которой
производится отбор единиц
совокупности.
Совокупность отобранных в
определенном порядке единиц,
по которым собирается
информация

21.

Понятие и виды ошибок
репрезентативности
— Ошибки, свойственные выборочному наблюдению,
называются ошибками репрезентативности.
расхождение между выборочной
Ошибка
характеристикой и характеристикой
репрезентагенеральной совокупности
тивности
Ошибки репрезентативности
Систематические
Случайные
Преднамеренные
Средняя (стандартная)
ошибка выборки
Непреднамеренные
Предельная ошибка
выборки

22.

Средняя (стандартная) ошибка
выборки
такое расхождение между средними
х − х)
выборочной и генеральной (~
совокупностями , которое не превышает± σ
Средняя
ошибка
выборки
Формула для определения величины средней ошибки
выборки для количественного признака
µ

=
σ
2

n
=
σ
~x
n
Формула для определения величины средней ошибки
выборки для альтернативного признака
µ
ω
=
ω
⋅ (1 − ω
n
)

23.

Предельная ошибка выборки
максимально возможное расхождение
выборочной и генеральной средних (Х-х),
т.е. максимум ошибки при заданной
вероятности ее появления
Предельная
ошибка
выборки
Ø О величине предельной ошибки можно судить с определенной
вероятностью, на величину которой указывает коэффициент
доверия t.
t
1,0
1,96
2,0
2,58
3,0
F(t)
0,683
0,950
0,954
0,990
0,997
Формула для определения величины предельной ошибки
выборки
∆ ~x = µ ~x ⋅ t , или ∆ ω = µω ⋅ t

24.

Формулы для определения
необходимой численности выборки
Формула для определения необходимой
численности выборки для средней
n
=
t
2
⋅ σ
∆ ~x
2
x
Формула для определения необходимой
численности выборки для доли
ω ⋅ (1 − ω )
n=
2
∆ω

25.

Спасибо
За Внимание !
English     Русский Правила