ОПИСАТЕЛЬНАЯ СТАТИСТИКА
СРЕДНИЕ ВЕЛИЧИНЫ
ПОКАЗАТЕЛИ РАЗБРОСА
ПОКАЗАТЕЛИ ФОРМЫ РАСПРЕДЕЛЕНИЯ
ГИСТОГРАММА
ПОЛИГОН РАСПРЕДЕЛЕНИЯ
ИНСТРУМЕНТЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ
ПРИМЕР 1
Надстройка “АНАЛИЗ ДАННЫХ” В MS EXCEL
СРАВНИТЕЛЬНЫЙ НАБОР ФУНКЦИЙ В EXCEL и CALC
ЗАДАНИЯ:
ЛИТЕРАТУРА:
СПАСИБО ЗА ВНИМАНИЕ!
5.01M
Категория: МатематикаМатематика

Описательная статистика

1. ОПИСАТЕЛЬНАЯ СТАТИСТИКА

2.

показатели
назначение показателя
пример показателя
среднее (M)
средние величины
показатели разброса
описывают положение
середины распределения
мода (Мо)
медиана (Ме)
амплитуда (интервал)
(Ampl)
дисперсия (D)
описывают степень
разброса (вариабельности,
изменчивости) данных
среднеквадратическое
отклонение (σ)
показатели формы
распределения
отвечают на вопрос о
симметрии и
островершинности
распределения данных
около центра
коэффициент
асимметрии (As)
эксцесс (Es)
гистограмма
полигон распределения

3. СРЕДНИЕ ВЕЛИЧИНЫ

4.

• СРЕДНЕЕ – показывает центральное положение
переменной и рассматривается совместно с
доверительным интервалом.
Чем больше размер выборки, тем более
надежна оценка среднего.
Чем больше разброс (изменчивость) данных,
тем менее надежна оценка среднего.

5.

• МОДА – значение, наиболее часто
встречающееся в выборке.
• МЕДИАНА – значение, которое разбивает выборку
на две равные части.
если выборка – нечетная, то значение медианы
равно варианте равноудаленной от X1 и от Хn
если выборка – четная, то значение медианы
равно среднему арифметическому двух
срединных значений.

6. ПОКАЗАТЕЛИ РАЗБРОСА

7.

• СТАНДАРТНОЕ ОТКЛОНЕНИЕ – мера разброса
(вариабельности, изменчивости) данных
• АМПЛИТУДА (ИНТЕРВАЛ) – мера вариабельности
признака. Вычисляется по формуле: Хmax – Xmin
• ДИСПЕРСИЯ – мера рассеивания (отклонения от
среднего).
чем больше дисперсия, тем выше степень
разброса, и тем сложнее предсказать результат
следующих измерений.
чем меньше дисперсия, тем более плотно
расположены наблюдаемые значения вблизи
среднего, и тем проще предсказать результат
дальнейших измерений.

8. ПОКАЗАТЕЛИ ФОРМЫ РАСПРЕДЕЛЕНИЯ

9.

• КОЭФФИЦИЕНТ АСИММЕТРИИ – мера
несимметричности распределения.
если значение коэффициента асимметрии отчетливо
отличается от 0, то распределение является
асимметричным.
если распределение нормальное, то значение
коэффициента асимметрии равно 0.
ЭКСЦЕСС – показатель «пикообразности»
распределения.
если значение эксцесса значимо отлично от 0, то
функция плотности имеет либо более закругленный,
либо более острый пик плотности нормального
распределения.
если распределение нормальное, то значение эксцесса
равно 0.

10.

As
+
+
Ex
-
-

11.

12.

13. ГИСТОГРАММА

14.

15.

16.

17.

18.

19. ПОЛИГОН РАСПРЕДЕЛЕНИЯ

20.

21.

22.

23.

24. ИНСТРУМЕНТЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ

25.

• НАДСТРОЙКА «АНАЛИЗ ДАНЫХ» (ОПИСАТЕЛЬНАЯ
СТАТИСТИКА) – MS EXCEL
• ФУНКЦИИ (МАСТЕР ФУНКЦИЙ) – MS EXCEL и
OOF.CALK
• МАСТЕР ДИАГРАММ – MS EXCEL и OOF.CALK

26. ПРИМЕР 1

27.

выборка 1
1
1
1
1
1
1
1
1
1
1
выборка 2
1
1
1
1
1
1
1
1
1
491
выборка 3
49
51
49
51
49
51
49
51
49
51

28. Надстройка “АНАЛИЗ ДАННЫХ” В MS EXCEL

29.

30.

31.

32.

33.

34.

35.

36.

37.

Выборка Выборка Выборка
1
2
3
1
1
49
1
1
51
1
1
49
1
1
51
1
1
49
1
1
51
1
1
49
1
1
51
1
1
49
1
491
51
выборка 1
выборка 2
выборка 3
Среднее
1
Среднее
50
Среднее
50
Стандартная
ошибка
0
Стандартная
ошибка
49
Стандартная
ошибка
0.333
Медиана
1
Медиана
1
Медиана
50
Мода
1
Мода
1
Мода
49
Стандартное
отклонение
Дисперсия
выборки
154.95 Стандартное
2
отклонение
Дисперсия
24010
выборки
Стандартное
отклонение
Дисперсия
выборки
Эксцесс
0
0
#ДЕЛ/0 Эксцесс
10
Эксцесс
1.054
1.111
-2.571
Асимметричность #ДЕЛ/0 Асимметричность 3.162
Асимметричность 0
Интервал
0
Интервал
490
Интервал
2
Минимум
1
Минимум
1
Минимум
49
Максимум
1
Максимум
491
Максимум
51
Сумма
10
Сумма
500
Сумма
500
Счет
10
Счет
10
Счет
10

38. СРАВНИТЕЛЬНЫЙ НАБОР ФУНКЦИЙ В EXCEL и CALC

39.

название показателя
функция Excel
функция Calc
СРЗНАЧ
МОДА
МЕДИАНА
AVERAGE
MODE
MEDIAN
минимум выборки (X min)
МИН
MIN
максимум выборки (X max)
МАКС
MAX
X max - X min
X max - X min
ДИСП
VAR
СТАНДОТКЛОН
STDEV
СКОС
ЭКСЦЕСС
СЧЕТ
SKEW
KURT
COUNT
среднее значение (Xср.)
мода (Mo)
медиана (Me)
амплитуда (интервал)
(Ampl)
дисперсия (D)
стандартное отклонение (σ)
асимметрия (As)
эксцесс (Ex)
объем выборки (n)

40.

41.

42.

43.

44.

45.

46.

47.

48. ЗАДАНИЯ:

1. Из имеющихся показателей выберите
наиболее информативный показатель.
2. Опишите словами выборки на основе
полученных значений показателей
описательной статистики.

49. ЛИТЕРАТУРА:

• Б.А.Кобринский, Т.В.Зарубина «Медицинская
информатика». – М., Академия, 2009
• Н.В.Макарова «Информатика. Практикум по
технологии работы на компьютере» (2 т.). – М.,
Финансы и статистика, 2005

50. СПАСИБО ЗА ВНИМАНИЕ!

English     Русский Правила