Необходимость измерения вариации
Необходимость измерения вариации
Показатели вариации
1. Размах вариации
Размах вариации
2.Среднее линейное отклонение
Среднее линейное отклонение
Среднее линейное отклонение
Свойства дисперсии
Дисперсия альтернативного признака
Среднее значение альтернативного признака
1.09M
Категория: МатематикаМатематика

Показатели вариации

1.

Показатели вариации

2. Необходимость измерения вариации

Средняя величина характеризует
совокупность по изучаемому признаку,
такой характеристики совокупности будет
достаточно, если разброс индивидуальных
значений невелик
Когда ряд характеризуется значительным
рассеиванием индивидуальных значений,
то применение средней величины
ограничено

3. Необходимость измерения вариации

При значительном рассеивании
индивидуальных значений необходимо
рассчитать специальную систему
показателей, характеризующих средний
размер отклонений индивидуальных
значений от средней величины и степень
колеблемости признака в совокупности,
т.е. показателей вариации

4. Показатели вариации

Используются две группы показателей
вариации:
- абсолютные: размах вариации, среднее
линейное отклонение, дисперсия,
среднеквадратическое отклонение
- относительные: коэффициент
осцилляции, линейный коэффициент и
коэффициент вариации

5. 1. Размах вариации

РВ – разность между экстремальными
значениями признака в совокупности. РВ
имеет единицу измерения, совпадающую
с единицей измерения признака у единиц
совокупности

6. Размах вариации

R xmax xmin
Недостаток РВ: он учитывает только
крайние значения и не учитывает
промежуточные значения

7. 2.Среднее линейное отклонение

Недостаток РВ устраняет показатель СЛО.
Он рассчитывается по двум формулам:
а) для несгруппированных данных (по
формуле средней арифметической простой)
б) для сгруппированных данных (по
формуле средней арифметической
взвешенной)

8. Среднее линейное отклонение

а) для несгруппированных данных
б) для сгруппированных данных

9. Среднее линейное отклонение

У СЛО есть единица измерения.
Он обладает серьезным недостатком: в
числителе нет минуса, а сам показатель –
положительное число. Эта проблема
решается третьим и четвертым показателями
вариации – дисперсией и
среднеквадратическим отклонением

10.

3. Дисперсия Это средний квадрат отклонений индивидуальных
значений от средней величины. Она рассчитывается
по простой и взвешенной формулам. Для ее
обозначения используется греческая буква сигма.

11.

Дисперсия
а) для несгруппированных данных
2
(x x )
2
n
б) для сгруппированных данных
2
x x
f
2
f

12.

Расчет дисперсии
для вариационного ряда

13.

Осуществляется при помощи
взвешенной формулы:
(
x
x
)
f
2
2
f

14.

Выработка,
Число
м.
рабочих, f
до 200
3
_
(x – x)2 · f
12249,63
x` 2· f
3
_
x–x
-63,9
x
x·f
x`
x`·f
S
190
570
-3
-9
27
200-220
12
210
2520
-2
-24
15
-43,9
23126,52
48
220-240
50
230
11500
-1
-50
65
-23,9
28560,50
50
240-260
56
250
14000
0
0
121
-3,9
851,76
0
260-280
47
270
12690
1
47
168
16,1
12182,87
47
280-300
23
290
6670
2
46
191
36,1
29973,83
92
300-320
7
310
2170
3
21
198
56,1
22030,47
63
320 и более
2
330
660
4
8
200
76,1
11582,42
32
Итого:
200
140558
359
50780
39

15.

140558
702,79
200
2
702, 79 26,5( м)

16. Свойства дисперсии

17.

1.Если из всех вариант вычесть какую-либо
константу, то дисперсия от этого не изменится:
x A x A f
f
2
2
( x A)
x x
f
2
f
2

18.

2.Если все варианты разделить на константу А,
то дисперсия уменьшится от этого в А² раз:
2
2
x
( )
A
x x
A A f
f

19.

1 x x f
2
2
A
f
A
2
2

20.

3. Дисперсия равна разности среднего квадрата
вариант и квадрата их средней:
x x x
2x x x
n
n
2
2
x 2x x x
n
n
n
2
2
2
2

21.

х
2
x n x
2 x
n
2
n
x 2x x x x
2
2
2
2
2

22.

4. Если рассчитать среднее квадратическое
отклонение от любой константы А, отличной от
средней арифметической, то оно всегда будет
больше дисперсии на квадрат разности между
средней и данной константой А:
x A
2
A
2
2
A
x A
f
2
2
, где
f

23.

Расчет дисперсии
упрощенным способом

24.

Расчет дисперсии упрощенным способом
осуществляется на основе перечисленных
свойств по формуле:
x f х f
2
f
f
2
x C
x
;
h
2
h2
f
f
A
, где

25.

Выработка,
Число
м.
рабочих, f
до 200
3
_
(x – x)2 · f
12249,63
x` 2· f
3
_
x–x
-63,9
x
x·f
x`
x`·f
S
190
570
-3
-9
27
200-220
12
210
2520
-2
-24
15
-43,9
23126,52
48
220-240
50
230
11500
-1
-50
65
-23,9
28560,50
50
240-260
56
250
14000
0
0
121
-3,9
851,76
0
260-280
47
270
12690
1
47
168
16,1
12182,87
47
280-300
23
290
6670
2
46
191
36,1
29973,83
92
300-320
7
310
2170
3
21
198
56,1
22030,47
63
320 и более
2
330
660
4
8
200
76,1
11582,42
32
Итого:
200
140558
359
50780
39

26.

359 39
2
200 200
2
2
20 702,79

27.

Недостаток дисперсии состоит в том,
что она имеет размерность вариант,
возведенную в квадрат (рублей в квадрате,
человек в квадрате)
Чтобы устранить этот недостаток,
используется среднее квадратическое
отклонение

28.

4.Среднее квадратическое отклонение
а) для несгруппированных данных
(
x
x
)
n
2

29.

б) для сгруппированных данных
x x
f
2
f
σ представляет собой среднее квадратическое
отклонение вариант ряда от средней величины

30.

Среднее квадратическое отклонение
имеет единицы измерения , а также может принимать положительные
и отрицательные значения, поскольку получается в результате
извлечения квадратного корня.
С помощью СКО можно утверждать, что i-тое значение признака в
совокупности находится в пределах:
x xi x

31.

Относительные показатели вариации

32.

Относительные показатели вариации
применяются для решения следующих
задач:
- сравнение степени вариации различных
вариационных рядов
- характеристика степени однородности
совокупности

33.

Коэффициент осцилляции
R
Vr 100%,
x
R - размах вариации
х - среднее значение
где

34.

Коэффициент осцилляции отражает
относительную колеблемость крайних
значений признака относительно среднего
значения

35.

Линейный коэффициент вариации
d
Vd 100%,
x
d
где
- среднее линейное отклонение

36.

Коэффициент вариации
V
x
100%
Характеризует долю усредненного значения
отклонений от средней величины. При этом
совокупность считается однородной, если V
не превышает 33%

37.

26,5
V 100
10,44%
x
253,9

38.

Правило трех сигм

39.

В условиях нормального распределения
существует зависимость между величиной
количеством наблюдений:
σ
и
в пределах
x
в пределах
x 2
располагается 94,5 % наблюдений
в пределах
x 3
располагается 99,7 % наблюдений
располагается 68,3 %
наблюдений;

40.

На практике почти не встречаются отклонения,
которые превышают 3σ Отклонение в 3σ может
считаться максимальным
.
При помощи этого правила можно получить
примерную оценку
σ:
xmax xmin
6

41. Дисперсия альтернативного признака

42.

Признаки, которыми обладают одни единицы
совокупности и не обладают другие, называются
альтернативными. Количественно вариация
альтернативного признака проявляется в значении 0
у единиц, которые им не обладают, или в значении
1 у единиц, которые им обладают

43.

где
x
f
0
q
1
p
q- доля единиц, не обладающих признаком
p- доля единиц, обладающих признаком
p+q=1

44. Среднее значение альтернативного признака

x f
x
f
p 1 q 0
p
p q

45.

Дисперсия альтернативного признака :
x x f 0 p q 1 p p
f
p q
2
2
2
p q q p p q pq pq
2
2
Максимальное значение дисперсии альтернативного
признака 0,25

46.

Правило сложения дисперсий

47.

Выделяют дисперсии:
1) общую
2) межгрупповую
3) внутригрупповую

48.

Величина общей дисперсии характеризует
вариацию признака под воздействием всех
факторов, вызывающих эту вариацию:
x j x f j
2
2
fj
где j – номер варианты

49.

Межгрупповая дисперсия (дисперсия групповых
средних или факторная дисперсия) характеризует
систематическую вариацию, т. е. различия в
величине изучаемого признака, возникающие под
влиянием одного фактора, положенного в
основание группировки

50.

xi x ni
ni
2
2
где
xi
x
i
ni
– среднее значение изучаемого признака для i
–й
группы
– общая средняя для всей
совокупности
- номер группы
– количество единиц в i – й группе

51.

j
f j ni
i

52.

Внутригрупповая (средняя из групповых или
остаточная) дисперсия характеризует случайную
вариацию, т. е. ту часть вариации, которая
вызвана действием других неучтённых факторов,
и не зависящую от фактора, положенного в
основании группировки:

53.

2
i
n
,
n
2
i
i
i
где
2
- групповая дисперсия
i
2
i
x
xi fij
2
j
f
ij

54.

Общая дисперсия равна сумме
межгрупповой и внутригрупповой дисперсий:
2
2
2
i

55.

Эмпирический коэффициент детерминации:
2
2
2
Эмпирический коэффициент детерминации
показывает долю общей вариации изучаемого
признака, обусловленную вариацией
группировочного признака (факторного)

56.

Эмпирическое корреляционное отношение :
2
2
Эмпирическое корреляционное отношение характеризует
степень влияния группировочного признака на
результативный показатель. Эмпирическое корреляционное
отношение изменяется в пределах от 0 до 1. Чем ближе η к
единице, тем степень влияния больше
0≤ η≤1

57.

Моменты распределения

58.

Обобщающие характеристики вариационного
ряда могут быть представлены системой
величин, носящих название моментов
распределения

59.

Формула момента k-го порядка:
x A f
,
f
k
Mk
где:
x – варианты
k – показатель степени
f – частоты
А – const

60.

1. При А = 0 получаем систему начальных
моментов. Начальный момент k-го порядка
выражается формулой:
x
f
М
f
k
k
Начальный момент первого порядка равен
x

61.

2. При А = x получаем систему центральных момент
Центральный момент k-го порядка выражается
формулой:
M
*
k
x x
f
k
f
Центральный момент первого порядка равен 0
Центральный момент второго порядка равен σ²

62.

При А =
x0
Mk
где:
получаем систему условных моментов:
x0 –
x x
f
k
0
f
,
некоторый вариант ряда, обычно
близкий к его середине

63.

Нормированный момент представляет собой
отношение центрального момента k-го порядка к
k-ой степени среднего квадратического
отклонения:
rk
M
*
k
k

64.

Нормированный момент
- первого порядка равен 0
- второго порядка равен 1
- третьего и четвертого порядков используется
для характеристики асимметрии и эксцессов

65.

Показатели асимметрии и эксцесса

66.

Симметричным называется такое
распределение, при котором варианты,
равноотстоящие от средней, имеют равные
частоты. Если распределение асимметрично,
частоты вариантов, равноотстоящих от
средней, не равны между собой

67.

Для характеристики асимметрии используется
нормированный момент третьего порядка:
A r3
M
*
3
3
Если А = 0 распределение симметрично
Если А > 1 имеет место правосторонняя асимметрия
Если А < 1 имеет место левосторонняя асимметрия

68.

Под эксцессом понимается степень
островершинности распределения, при этом
в качестве эталона берется нормальное
распределение. Характеристикой эксцесса
является нормированный момент четвертого
порядка

69.

Формула коэффициента эксцесса:
E
*
4
4
M
3

70.

Для нормального распределения Е = 0. Для
более островершинных распределений, чем
нормальное, Е > 0,
для более плосковершинных Е < 0

71.

Выработка, Число
метры
рабочих
х
_
х-х
_
(x-x)²f х΄f
x΄²f
до 200
3
190
-64
12249,63
-9
27
200-220
12
210
-44
23126,52
-24
48
220-240
50
230
-24
28560,5
-50
50
240-260
56
250
-3,9
851,76
0
0
260-280
47
270
16,1
12182,87
47
47
280-300
23
290
36,1
29973,83
46
92
300-320
7
310
56,1
22080,47
21
63
свыше 320
2
330
76,1
11582,42
8
32
140558
39
359
ИТОГО:
English     Русский Правила