1.43M
Категория: МатематикаМатематика

Основные понятия математической статистики

1.

§8. Основные понятия
математической статистики
п.1. Предмет математической
статистики.
Математическая статистика изучает
закономерности, которым подчинены
массовые случайные явления, с помощью
методов ТВ.
Пусть по результатам наблюдений изучается
некоторая СВ.

2.

Основные задачи мат. статистики:
— упорядочить исходные данные
(представить их в виде, удобном для анализа);
— оценить требуемые характеристики
наблюдаемой СВ (функцию распределения,
мат. ожидание, дисперсию и т.д.);
— проверить статистические гипотезы, т.е.
решить вопрос согласования результатов
оценивания с данными.

3.

п.2. Выборочный метод.
Совокупность всех подлежащих исследованию
объектов называется генеральной
совокупностью.
Выборочной совокупностью или случайной
выборкой называют совокупность случайно
отобранных объектов.
Объемом совокупности (выборочной или
генеральной) называют число объектов этой
совокупности.

4.

Пусть в выборке событие x1 наблюдалось n1
раз, событие x2 — n2 раз и т.д., событие xk — nk
раз.
Тогда объем выборки равен
k
n ni .
i 1
Наблюдаемые значения x1 , x2 ,..., xk называют
вариантами.
Числа n1 , n2 ,..., nk называют частотами.
Числа
ni
wi , i 1, k ,
n
называют относительными частотами.

5.

Вариационным рядом называют таблицу вида:
X
n
x1
n1
x2
n2


xk
nk
Статистическим распределением выборки
(статистическим рядом) называют таблицу
вида:
X
w
x1
w1
x2
w2


xk
wk

6.

Пример. В результате тестирования группа
студентов получила следующие оценки
5,3,0,1,4,2,5,4,1,5.
Построить вариационный и статистический
ряд.
Решение. Вариационный ряд.
X
n
0
1
2
3
4
5
1
2
1
1
2
3
Статистический ряд:
n 10.
X 0 1 2 3 4 5
n 0,1 0,2 0,1 0,1 0,2 0,3

7.

Если число вариант велико или наблюдаемая
СВ является непрерывной, то поступают
следующим образом.
Вместо значений в первую строку
вариационного (статистического) ряда
записывают
m log 2 n 1 3,32 lg n 1(формула Стерджеса)
полуинтервалов длиной
xmax xmin
h
.
m
Полученный ряд называют интервальным.

8.

Пример.
189
202
197
211
193
234
204
225
210
185
207
211
227
214
203
215
184
216
190
217
213
220
187
220
232
196
217
233
207
225
208
236
226
195
202
220
193
223
205
201
186
227
213
182
215
203
216
208
232
208
210
220
191
228
195
238
205
204
222
211
198
210
209
202
220
225
197
207
198
189
219
183
196
207
233
221
203
182
217
205
231
213
202
192
214
193
229
216
211
207
227
190
235
226
185
215
204
191
201
199
Записать интервальный вариационный ряд.
Решение. Объем выборки n 100,
кол-во интервалов m 3,32 lg 100 1 8,
длина интервала
238 182
h
7.
8

9.

Интервальный вариационный ряд:
[ xi , xi 1 )
[182,189)
[189,196)
[196,203)
[203,210)
[210,217)
[217,224)
[224,231)
[231,238]
ni
8
12
13
18
18
12
10
9

10.

п.3. Полигон и гистограмма.
Полигоном частот называется ломаная,
соединяющая точки с координатами
( xi , ni ), i 1, k.
Пример. Вариационный ряд
X 0 1 2 3 4 5
n 1 2 1 1 2 3
Полигон частот:
3
2
1
0
1
2
3
4
5

11.

Для изучения непрерывного признака
строится гистограмма.
Гистограммой частот называют ступенчатую
фигуру, состоящую из прямоугольников с
основанием h и высотой n
i
h
.
Замечание.
Площадь каждого прямоугольника:
ni
Si h ni .
h
Площадь всей гистограммы:
k
k
S Si ni n.
i 1
i 1
— объем выборки

12.

Пример.
2,57
1,86
1,71
1,43
1,29
1,14
182
196
189
210
203
224
217
231
238

13.

Гистограммой относительных частот называют
ступенчатую фигуру, состоящую из
прямоугольников с основанием h и высотой
wi
.
h
Замечание.
Площадь каждого прямоугольника:
wi
Si h wi .
h
Площадь всей гистограммы:
k
k
i 1
i 1
S Si wi 1.
Гистограмма относительных частот служит для
оценки вида плотности вероятности.

14.

п.4. Эмпирическая функция
распределения.
Эмпирической функцией распределения
называется функция, определяющая для
каждого значения x относительную частоту
события ( X x)
n
Fn ( x)
x
n
,
где n x — число вариант, меньших x,
n — объем выборки.

15.

Свойства эмпирической функции
распределения
1)
0 Fn ( x) 1.
2) Fn (x) — неубывающая функция.
3) Если x1 — наименьшая варианта, то
x x1 Fn ( x) 0.
Если xk — наименьшая варианта, то
x xk
Fn ( x) 1.

16.

Пример. Вариационный ряд
X 2 6 10
n 12 18 30
Построить эмпирическую функцию
распределения.
Решение. Объем выборки n 12 18 30 60.
Если x 2 , то Fn ( x) 0.
12 1
.
Если 2 x 6 , то Fn ( x)
60 5
Если 6 x 10 , то
12 18 1
Fn ( x)
.
60
2

17.

Если x 10 , то Fn ( x) 1.
Таким образом,
0,
1
,
5
Fn ( x)
1 ,
2
1,
если x 2,
если 2 x 6,
если 6 x 10,
если x 10.

18.

п.5. Статистические оценки.
Пусть имеется некоторая выборка значений
СВ, с теоретической функцией распределения
F (x).
Однако, вид этой функции неизвестен.
Требуется найти (оценить) какой-либо
параметр этого распределения (мат.
ожидание, дисперсию и т.д.).
Пусть — точное значение этого параметра
(неизвестное).
*
Пусть — статистическая оценка параметра .

19.

Пусть последовательно производятся выборки
объема n.
Тогда * можно рассматривать как СВ,
*
*
*
принимающую значения 1 , 2 ,..., k .
Для того, чтобы оценка давала хорошее
приближение оцениваемому параметру она
должна удовлетворять требованиям:
несмещенность;
эффективность;
состоятельность.

20.

Оценка называется несмещенной, если ее
мат. ожидание равно оцениваемому
параметру :
*
M .
*
Оценка называется эффективной, если ее
дисперсия минимальна:
*
D Dmin .
*
Оценка * называется состоятельной, если
при большом объеме выборки ее значение
приближается к истинному:
lim P | | 0.
n
*

21.

п.6. Числовые характеристики
выборки.
Рассмотрим вариационный ряд
X
n
x1
n1
x2
n2


xk
nk
Размахом варьирования называется число
R x max x min .
Выборочным средним называется среднее
арифметическое значение вариант
1 k
x В xi ni .
n i 1

22.

Замечание.
Выборочное среднее является несмещенной
состоятельной оценкой математического
ожидания.
Выборочной дисперсией называется среднее
значение квадратов отклонения вариант от
выборочного среднего
k
1

Несложно получить, что
k
i 1
i
В
) ni .
2
1
1
2
D В xi ni x i ni ,
n i 1
n i 1
k
( x x
n
2
DВ x ( x В ) .
2
2

23.

Замечание.
Выборочное среднее является смещенной
оценкой теоретической дисперсии.
Можно показать, что
n 1
M (DВ )
D.
n
В качестве несмещенной оценки дисперсии
используется исправленная выборочная
дисперсия
n
S
DВ.
n 1
2

24.

Выборочным средним квадратическим
отклонением называется квадратный корень
из выборочной дисперсии
В D В .
Исправленным выборочным средним
квадратическим отклонением называется
величина S (корень из S 2 ).
Замечание.
Выборочное среднее и выборочная
дисперсия обладают теми же свойствами, что
и мат. ожидание и дисперсия дискретной СВ.

25.

Начальным моментом r-го порядка называется
среднее значение r-х степеней вариант
k
1
2
M r xi ni .
n i 1
При этом
k
k
1
1
0
M 0 xi ni n i 1,
n i 1
n i 1
k
1
1
M 1 xi n i xB ,
n i 1
1 k 2
2
M 2 xi n i x .
n i 1

26.

Центральным моментом r-го порядка
называется среднее значение отклонений в
степени r среднего
1 k
mr ( x i x В ) r ni .
n i 1
При этом
k
1
0
m0 ( x i x В ) n i 1,
n i 1
k
k
k
1
1
1
1
m1 ( x i x В ) ni x i ni xB ni 0,
n i 1
n i 1
n i 1
1 k
2
2
m2 ( x i x В ) ni M 2 ( M 1 ) DB .
n i 1

27.

Модой Mo вариационного ряда называется
варианта, имеющая наибольшую частоту.
Модой Me вариационного ряда называется
варианта, которая делит ряд на две части,
равные по числу вариант.
Асимметрией называется величина
As
m3
.
Замечание.
Асимметрия характеризует меру
симметричности эмпирической кривой
распределения относительно среднего
значения.
Для нормального распределения As 0.
3
B

28.

Эксцессом называется величина
Ex
m4
4
B
3.
Замечание.
Эксцесс характеризует степень
островершинности эмпирической кривой
распределения по сравнению с нормальной
кривой.
Для нормального распределения Ex 0.

29.

Пример. Вариационный ряд
X 10-30 30-50 50-70 70-90 90-110 110-130
1
3
10
30
50
6
n
Найти числовые характеристики.
Решение.
Представим интервальный ряд в виде
дискретного (в качестве вариант берем
середины интервалов).
X
n
20
40
60
80
100
120
1
3
10
30
50
6

30.

X
n
20
40
60
80
100
120
1
3
10
30
50
6
Объем выборки n 100.
Выборочное среднее
1
x В
(20 1 40 3 60 10 80 30 100 50 120 6) 88,6.
100
Выборочная дисперсия
1
x
(20 2 1 40 2 3 60 2 10 80 2 30 100 2 50 120 2 6) 8196,
100
2
D В 8196 88,6 346,04.
2
Выборочное среднее квадратическое
отклонение
В 346,04 18,6.

31.

Исправленная выборочная дисперсия
100
S
346,04 349,54.
100 1
2
Исправленное выборочное среднее
квадратическое отклонение
S 349,54 18,7.
Мода
Медиана
Mo 100.
Me 100.

32.

Асимметрия
1
m3
(( 20 88,6)3 1 (40 88,6)3 3 (60 88,6)3 10
100
(80 88,6) 30 (100 88,6) 50 (120 88,6) 6) 6603,89,
3
6603,89
As
1,03.
3
18,6
3
3
Отрицательная асимметрия говорит о том, что
в вариационном ряде преобладают варианты,
меньшие выборочного среднего.

33.

Эксцесс
1
m4
(( 20 88,6) 4 1 (40 88,6) 4 3 (60 88,6) 4 10
100
(80 88,6) 30 (100 88,6) 50 (120 88,6) 6) 524145,
4
4
4
524145
Ex
3 1,38.
4
18,6
Искомая кривая распределения имеет более
острую вершину по сравнению с нормальным
распределением.
English     Русский Правила