1.37M
Категория: ИнформатикаИнформатика

Методы компьютерной обработки статистических данных

1.

ГОСУДАРСТВЕННОЕ КАЗЕННОЕ
ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«РОССИЙСКАЯ ТАМОЖЕННАЯ
АКАДЕМИЯ»
Тема 1. Методы компьютерной
обработки статистических данных

2.

Российская
таможенная
академия
ВОПРОСЫ
1. Программные средства для обработки статистических
данных.
2. Классификация статистических данных.
3. Работа с мастером функций электронных таблиц
(МойОфис Таблица; LibreOffice, MS Excel).
2
2

3.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
PolyAnalyst
Подходит для
Средний бизнес, Специалист, НКО, Корпорация
Развёртывание
Персональный компьютер, Сервер предприятия, Облако (SaaS)
Графический интерфейс Веб-браузер, Windows, Linux
Тарификация
По запросу, Единовременная оплата, Ежегодная оплата
Поддержка языков
Русский, Английский, Испанский, Китайский, Корейский
Реестр российского ПО
Включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных (ИАД),
PolyAnalyst
Обработка естественного языка (NLP), Аналитика больших
данных (BDA), Бизнес-аналитика (BI), Data Analysis (DA), Data
Mining (DM), Natural Language Processing (СОЕЯ), Big Data
Analytics (САБОД), Business Intelligence (БА)
Компания-разработчик
Мегапьютер Интеллидженс
Страна
Россия
Головной офис
Москва
Веб-сайт (продукт)
https://www.megaputer.ru/produkti/
Веб-сайт
https://www.megaputer.ru
3

4.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
Loginom
Подходит для
Фрилансер, Средний бизнес, ИП, Специалист, НКО, Корпорация,
Малый бизнес
Развёртывание
Персональный компьютер, Сервер предприятия, Облако (SaaS)
Графический интерфейс Веб-браузер, Windows, Linux
Тарификация
По запросу, Бесплатно, Ежемесячная оплата, Единовременная
оплата
Поддержка языков
Русский, Английский
Реестр российского ПО Включён
Демо версия
Да
Пробная версия (триал) Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных (ИАД),
Loginom
Предсказательная аналитика, Поддержка принятия решений
управления (СППР), Data Analysis (DA), Data Mining (DM),
Бизнес-аналитика (BI) Predictive Analytics (СПA), Executive
Decision Support (СППР)
Компания-разработчик
Loginom company
Страна
Россия
Головной офис
г. Рязань, Рязанская область
Веб-сайт (продукт)
https://loginom.ru/
4
Веб-сайт
https://loginom.ru/company/about

5.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
Dataiku DSS
Подходит для
Средний бизнес, Специалист, НКО, Корпорация
Развёртывание
Сервер предприятия
Графический интерфейс Веб-браузер
Тарификация
По запросу
Поддержка языков
Английский
Реестр российского ПО Не включён
Демо версия
Да
Пробная версия (триал) Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных
Dataiku DSS
(ИАД), Искусственный интеллект (AI), Машинное
обучение (ML), Data Analysis (DA), Data Mining (DM),
Artificial Intelligence (ИИ), Machine Learning (СМО)
Компания-разработчик Dataiku
Страна
США
Головной офис
г. Нью-Йорк
Веб-сайт
https://www.dataiku.com/company/
5

6.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
IBM SPSS Statistics
Подходит для
Развёртывание
Графический интерфейс
Тарификация
Средний бизнес, Специалист, Корпорация
Персональный компьютер
macOS, Windows, Linux
По запросу, Ежемесячная оплата, Единовременная оплата,
Ежегодная оплата
Русский, Английский, Арабский, Вьетнамский, Греческий,
Поддержка языков
Иврит, Испанский, Итальянский, Китайский, Корейский,
Немецкий,
Польский,
Португальский,
Турецкий,
Французский, Японский
Не включён
Реестр российского ПО
Нет
Демо версия
Да
Пробная версия (триал)
Нет
Свободное ПО
Назначение системы IBM Анализ данных (САД), Статистический анализ информации,
Data Analysis (DA), Statistical Information Analysis (SA)
SPSS Statistics
Компания-разработчик
Страна
Головной офис
Веб-сайт
IBM
США
г. Армонк, ш. Нью-Йорк
https://www.ibm.com/ru-ru
6

7.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
In-DAP
Подходит для
Средний бизнес, Специалист, Корпорация
Развёртывание
Сервер предприятия, Облако (SaaS)
Графический интерфейс Веб-браузер
Тарификация
По запросу
Поддержка языков
Русский
Реестр российского ПО
Включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Нет
Назначение системы In- Анализ данных (САД), Предсказательная аналитика, Аналитика
DAP
больших данных (BDA), Интеллектуальный анализ данных
(ИАД), Статистический анализ информации, Визуализация
данных, Аналитическая отчётность (СПАО), Data Analysis (DA),
Predictive Analytics (PA), Big Data Analytics (САБОД), Data
Mining (ИАД), Statistical Information Analysis (ССА), Data
Visualization (СВД), Analytical Reporting (СПАО)
Компания-разработчик
Innostage Центр Разработок
Страна
Россия
Головной офис
г. Иннополис, Республика Татарстан
Веб-сайт
https://inno-dev.ru/
7

8.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
KNIME Analytics Platform
Подходит для
Фрилансер, Средний бизнес, ИП, Специалист, НКО,
Корпорация, Малый бизнес
Развёртывание
Персональный компьютер, Сервер предприятия, Облако (SaaS)
Графический интерфейс macOS, Windows, Linux
Тарификация
Бесплатно, Ежегодная оплата
Поддержка языков
Английский
Реестр российского ПО
Не включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Да
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных
KNIME
Analytics (ИАД), Аналитика больших данных (BDA), Машинное
Platform
обучение (ML), Предсказательная аналитика, Потоковая
аналитика (СПА), Data Analysis (DA), Data Mining (DM), Big
Data Analytics (САБОД), Machine Learning (СМО), Predictive
Analytics (СПА), Stream Analytics (СПА)
Компания-разработчик
KNIME
Страна
Швейцария
Головной офис
г. Цюрих
8
Веб-сайт
https://www.knime.com/about

9.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
NodeXL
Подходит для
Фрилансер, Средний бизнес, ИП, Специалист, НКО,
Малый бизнес
Развёртывание
Персональный компьютер
Графический интерфейс
macOS, Windows
Тарификация
Бесплатно, Ежемесячная оплата, Ежегодная оплата
Поддержка языков
Английский
Реестр российского ПО
Не включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных
NodeXL
(ИАД), Аналитическая отчётность (СПАО), Data Analysis
(DA), Data Mining (DM), Analytical Reporting (AR)
Компания-разработчик
Social Media Research Foundation
Страна
США
Головной офис
Редвуд-Сити, Калифорния
Веб-сайт
https://www.smrfoundation.org/
9

10.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
Polymatica
Подходит для
Средний бизнес, НКО, Корпорация
Развёртывание
Сервер предприятия, Облако (SaaS)
Графический интерфейс
Веб-браузер, Linux
Тарификация
По запросу
Поддержка языков
Русский, Английский
Реестр российского ПО
Включён
Демо версия
Да
Пробная версия
Нет
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных
Polymatica
(ИАД), Бизнес-аналитика (BI), Аналитика больших данных
(BDA), Статистический анализ информации, Data Analysis
(DA), Data Mining (DM), Business Intelligence (BI), Big Data
Analytics (BDA), Statistical Information Analysis (SA)
Компания-разработчик
Полиматика Рус
Страна
Россия
Головной офис
г. Москва
Веб-сайт (продукт)
https://www.polymatica.ru/analytics-software/
Веб-сайт
https://www.polymatica.ru/company/
10

11.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
RapidMiner
Подходит для
Фрилансер, Средний бизнес, ИП, Специалист, НКО,
Корпорация, Малый бизнес
Развёртывание
Персональный компьютер, Сервер предприятия, Облако
(SaaS)
Графический интерфейс macOS, Windows
Тарификация
По запросу, Ежемесячная оплата, Ежегодная оплата
Поддержка языков
Английский
Реестр российского ПО Не включён
Демо версия
Да
Пробная версия
Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Интеллектуальный анализ данных
RapidMiner
(ИАД), Машинное обучение (ML), Искусственный
интеллект (AI), Data Analysis (DA), Data Mining (DM),
Machine Learning (СМО), Artificial Intelligence (ИИ)
Компания-разработчик
RapidMiner
Страна
США
Головной офис
г. Бостон, ш. Массачусетс
Веб-сайт
https://rapidminer.com/us/
11

12.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
SAS Enterprise Miner
Подходит для
Развёртывание
Средний бизнес, НКО, Корпорация
Персональный компьютер, Сервер предприятия, Облако
(SaaS)
Веб-браузер, Windows, Linux
Графический
интерфейс
Тарификация
По запросу
Поддержка языков
Английский
Реестр российского ПО Не включён
Демо версия
Да
Пробная версия
Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Предсказательная аналитика,
SAS Enterprise Miner
Интеллектуальный анализ данных (ИАД), Data Analysis
(DA), Predictive Analytics (PA), Data Mining (ИАД)
Компания-разработчик SAS Institute Inc.
Страна
США
Головной офис
г. Кэри, ш. Северная Каролина
Веб-сайт
https://www.sas.com/
12

13.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
Stata
Подходит для
Средний бизнес, НКО, Корпорация
Развёртывание
Персональный компьютер
Графический интерфейс macOS, Windows, Linux
Тарификация
По запросу
Поддержка языков
Английский
Реестр российского ПО Не включён
Демо версия
Нет
Пробная версия (триал) Нет
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Статистический анализ
Stata
информации, Data Analysis (DA), Statistical Information
Analysis (SA)
Компания-разработчик
StataCorp
Страна
США
Головной офис
Колледж-Стейшен, Техас
Веб-сайт
https://www.stata.com/company/
13

14.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
Anaconda
Подходит для
Фрилансер, Средний бизнес, ИП, Специалист, НКО,
Корпорация, Малый бизнес
Развёртывание
Персональный компьютер, Сервер предприятия
Графический интерфейс macOS, Веб-браузер, Windows, Linux
Тарификация
По запросу, Бесплатно, Ежегодная оплата
Поддержка языков
Английский
Реестр российского ПО
Не включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Да
Назначение
системы Анализ данных (САД), Искусственный интеллект (AI),
Anaconda
Машинное обучение (ML), Статистический анализ информации,
Интеллектуальный анализ данных (ИАД), Data Analysis (DA),
Artificial Intelligence (AI), Machine Learning (СМО), Statistical
Information Analysis (ССА), Data Mining (ИАД)
Компания-разработчик
Anaconda
Страна
США
Головной офис
г. Остин, ш. Техас
Веб-сайт
https://www.anaconda.com/about-us
14

15.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
TIBCO Data Science
Подходит для
Средний бизнес, НКО, Корпорация
Развёртывание
Персональный компьютер, Сервер предприятия
Графический интерфейс Веб-браузер, Windows
Тарификация
По запросу
Поддержка языков
Английский
Реестр российского ПО Не включён
Демо версия
Да
Пробная версия (триал) Да
Свободное ПО
Нет
Назначение
системы Анализ данных (САД), Статистический анализ информации,
TIBCO Data Science
Интеллектуальный анализ данных (ИАД), Машинное обучение
(ML), Искусственный интеллект (AI), Data Analysis (DA),
Statistical Information Analysis (SA), Data Mining (ИАД), Machine
Learning (СМО), Artificial Intelligence (ИИ)
Компания-разработчик TIBCO
Страна
США
Головной офис
г. Пало-Альто, ш. Калифорния
Веб-сайт
https://www.tibco.com/company
15

16.

Российская
таможенная
академия
1. Программные средства для обработки
статистических данных
B3
Подходит для
Развёртывание
Графический интерфейс
Тарификация
Поддержка языков
Реестр российского ПО
Демо версия
Пробная версия (триал)
Свободное ПО
Назначение системы В3
Компания-разработчик
Страна
Веб-сайт
Средний бизнес, Корпорация
Мобильное устройство, Облако (SaaS)
Веб-браузер, iOS, Android
По запросу
Английский
Не включён
Да
Нет
Нет
Анализ данных (САД), Интеллектуальный анализ
данных (ИАД), Машинное обучение (ML),
Искусственный интеллект (AI), Data Analysis (DA),
Data Mining (DM), Machine Learning (СМО),
Artificial Intelligence (ИИ)
B3 Systems
Канада
г. Торонто
16

17.

Российская
таможенная
академия
2. Классификация статистических данных
Анализ данных может проводиться с целью:
• анализа и отображения конкретной собранной
информации
(описательная
(дескриптивная)
статистика);
• описания всего класса явлений по имеющимся
выборочным данным, характеризующим только
часть этого класса (аналитическая статистика).
Под данными (data) в статистике понимают
совокупность сведений, зафиксированных на
определенном носителе в форме, пригодной для их
постоянного хранения, передачи и обработки.
17

18.

Российская
таможенная
академия
2. Классификация статистических данных
Основные критерии классификации наборов статистических данных
по числу
переменных
• одномерные
• двумерные
• многомерные
по наличию или
отсутствию
упорядочения
во времени
по типу шкалы
измерения
каждого
признака
• пространствен
ные
• временные
• пространствен
но-временные
• количественн
ые (числовые)
признаки
• дискретные
• непрерыные
по способу
получения
• первичные
• вторичные
• качественные
(категориальн
ые) признаки
• номинальны
е
• порядковые
18

19.

Российская
таможенная
академия
2. Классификация статистических данных
1. Классификация данных по числу переменных
В одномерных данных у каждого наблюдения регистрируется только
один признак.
В этом случае статистические методы используются для определения
основных характеристик этого признака:
• расчет средних значений и показателей вариации, размаха признака;
• группировка данных и построение вариационных рядов (дискретных
и интервальных);
• графическое представление данных с целью визуализации и анализа;
• исследование различных наблюдений или групп наблюдений,
требующих особого рассмотрения.
19

20.

Российская
таможенная
академия
2. Классификация статистических данных
Пример 1.
Индекс потребительских цен на товары и услуги по РФ (к декабрю
предыдущего года). Данные представлены в табличном формате и в виде
точечно-линейного графика, построенного в программе MS Excel.
Год
2004
2005
2006
2007
2008
Индекс цен, %
111,73
110,92
109,00
111,87
113,28
Год
2009
2010
2011
2012
2013
Индекс цен, %
108,80
108,78
106,10
106,57
106,47
Год
2014
2015
2016
2017
2018
Индекс цен, %
111,35
112,91
105,39
102,51
104,26
Год
2019
2020
2021
2022
2023
Индекс цен, %
103,04
104,91
108,39
111,94
107,42
Индекс потребительских цен на товары и услуги по РФ
Индекс цен, %
114
112
110
108
106
104
102
100
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023
Год
20

21.

Российская
таможенная
академия
2. Классификация статистических данных
Пример 2.
Уровень безработицы (в % к экономически активному населению, в
среднем за год) в России в 2003-2023 гг. Данные представлены в
табличном формате и в виде лепестковой диаграммы, построенной в
программе MS Excel.
Год
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
Уровень
безработицы,
%
Год
7,8
7,1
7,1
6,0
6,3
8,4
7,3
6,5
5,5
5,5
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
Уровень
безработицы,
%
5,2
5,6
5,5
5,2
4,8
4,6
5,8
4,8
3,9
3,2
Уровень безработицы, %
2004
10,0
2023
2005
2022 8,0
2006
2021
2007
6,0
4,0
2020
2008
2,0
2019
2009
0,0
2018
2017
2016
2015
2010
2014
2011
2012
2013
21

22.

Российская
таможенная
академия
2. Классификация статистических данных
В многомерных (двумерных, трехмерных и т.д.) наборах данных у
каждого наблюдения регистрируется несколько признаков.
Статистические методы в этом случае используются для решения
задач:
• определения основных характеристик по каждому одномерному
признаку;
• анализа наличия и степени зависимости между этими признаками;
• исследования вида зависимости одной переменной (результативной)
от остальных (факторных);
• классификации наблюдений с целью получения однородных групп
(кластеров) и выявления аномальных наблюдений;
• построения обобщающих, интеграционных показателей с целью
снижения размерности исходного признакового пространства;
• анализа рядов и прогнозирования (для временных рядов).
22

23.

Российская
таможенная
академия
2. Классификация статистических данных
Пример 3.
Среднемесячные данные мировых цен на нефть и курс доллара США
в РФ в 2023-2024 гг. (двумерные данные). Данные представлены в
табличном формате и в виде точечного графика с построением линейнорегрессионной зависимости между переменными в программе MS Excel.
Месяц, год
май.23
июн.23
июл.23
авг.23
сен.23
окт.23
ноя.23
Цена на нефть,
долл./барель
72,66
74,90
85,56
86,86
95,31
87,41
82,83
Курс доллара,
руб.
79,21
83,32
90,47
95,29
96,62
97,12
90,41
дек.23
янв.24
фев.24
мар.24
апр.24
май.24
июн.24
150
Курс доллара
Цена на нефть,
долл./барель
77,32
79,15
81,72
84,67
89,00
83,00
82,82
Месяц, год
Курс доллара,
руб.
90,82
88,68
91,52
91,74
92,96
90,61
87,76
y = 0,7053x + 31,865
100
50
0
50
55
60
65
70
75
80
Цена нефти, долл/барель
85
90
95
100
23

24.

Российская
таможенная
академия
2. Классификация статистических данных
Пример 4.
Характеристика стран мира по средней продолжительности жизни;
ВВП на душу населения и индекса человеческого развития (трехмерные
данные). Данные представлены в табличной форме и в виде
пузырькового графика (MS Excel).
Ожидаемая продолжительность
жизни, лет (2022 г.)
72,55
77,43
78,59
80,71
84,00
67,74
Страна
Россия
США
Китай
Германия
Япония
Индия
ВВП (ППС) на душу населения,
долл. (2023)
40 813
76 329
21 476
66 616
46 850
9 172
ИЧР (2022)
0,821
0,927
0,788
0,950
0,920
0,644
Характеристика стран мира
ВВП на душу
населения, долл.
100 000
80 000
77,43; 76 329
80,71; 66 616
60 000
40 000
72,55; 40 813
78,59; 21 476
20 000
67,74; 9 172
0
-20 000
66
68
70
72
74
76
78
80
82
Ожидаемая продолжительность жизни, лет
84
Россия
Китай
84; 46 850
Япония
США
Германия
86
Индия
24

25.

Российская
таможенная
академия
2. Классификация статистических данных
Данные представлены
графике (MS Excel).
в
трехмерном
объемно-поверхностном
80000
70000
Россия
60000
США
50000
Китай
40000
Индия
30000
Япония
Германия
20000
Германия
Япония
Индия
Китай
10000
США
0
Ожидаемая
продолжительность
жизни, лет (2022 г.)
Россия
ВВП (ППС) на душу
населения, долл.
(2023)
ИЧР (2022)
25

26.

Российская
таможенная
академия
2. Классификация статистических данных
2. Классификация данных по наличию или отсутствию упорядочения
во времени
Пространственные данные – это значения переменных, относящихся к
однотипным объектам в один и тот же фиксированный момент времени.
Пример 5.
Величина прожиточного минимума (в среднем на душу населения),
установленная в некоторых регионах РФ на 2024 год. Данные представлены в
табличной форме и в виде ленточной (полосовой) диаграммы) (MS Excel).
Регион
Брянская область
Владимирская область
Ивановская область
Калужская область
Московская область
Рязанская область
г. Москва
Ненецкий авт. округ
Калининградская область
Ленинградская область
г. Санкт-Петербург
Республика Крым
Краснодарский край
Волгоградская область
Республика Дагестан
Руб. в месяц
Регион
14217 Чеченская Республика
14989 Республика Татарстан
14526 Чувашская Республика
14835 Нижегородская область
18296 Самарская область
13753 Ямало-Ненецкий авт. округ
22662 Тюменская область
28024 Республика Тыва
15917 Красноярский край
16226 Новосибирская область
16535 Республика Саха (Якутия)
14989 Камчатский край
14835 Приморский край
13290 Донецкая Народная Республика
14062 Запорожская область
Руб. в месяц
14835
13135
13444
14526
14526
21760
15453
15608
17153
15317
23334
27602
18389
14526
14989
26

27.

Российская
таможенная
академия
2. Классификация статистических данных
Камчатский край
Республика Саха (Якутия)
г. Москва
Ямало-Ненецкий авт. округ
Приморский край
Московская область
Красноярский край
г. Санкт-Петербург
Ленинградская область
Калининградская область
Республика Тыва
Тюменская область
Новосибирская область
Запорожская область
Республика Крым
Владимирская область
Чеченская Республика
Краснодарский край
Калужская область
Донецкая Народная Республика
Самарская область
Нижегородская область
Ивановская область
Брянская область
Республика Дагестан
Рязанская область
Чувашская Республика
Волгоградская область
Республика Татарстан
27602
23334
22662
21760
18389
18296
17153
16535
16226
15917
15608
15453
15317
14989
14989
14989
14835
14835
14835
14526
14526
14526
14526
14217
14062
13753
13444
13290
13135
0
5000
10000
15000
20000
25000
30000
Руб. в месяц
27

28.

Российская
таможенная
академия
2. Классификация статистических данных
Временные данные отражают динамику изменения переменных,
характеризующих объект, на некотором промежутке времени.
Моментные временные данные представляют собой изменения
(наблюдения) признака, сделанные в определенный момент времени.
Пример 6.
Государственный долг США на конец года за 2001-2023 гг. (млрд.
долл. США). Данные представлены в виде столбиковой диаграммы (MS
Excel).
Государственный долг США
35000
30000
млрд долл.
25000
20000
15000
10000
5000
0
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023
28

29.

Российская
таможенная
академия
2. Классификация статистических данных
Интервальные временные ряды характеризуют объект наблюдения за
некоторый интервал времени.
Пример 7.
Динамика внешней торговли России за 2012-2022 годы. Данные
представлены в табличной форме и в виде столбиковой диаграммы (MS
Excel).
Год
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
млрд
долл.
844,2
793,6
530,4
468,1
588,7
692,6
674,3
571,9
786,6
847,8
710,2
Внешнеторговый оборот России за 2013-2023 гг.
900
800
700
600
500
400
300
200
100
0
2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023
29

30.

Российская
таможенная
академия
2. Классификация статистических данных
Пространственно-временные данные – это значения переменных,
относящихся к сходным объектам за несколько моментов времени.
Они могут быть также как моментными, так и интервальными.
Пример 8.
Динамика уровня смертности на 1000 чел. населения некоторых
стран за 2020-2022 год. Данные представлены в табличной форме и в
виде столбиковой диаграммы (MS Excel).
Название оси
Уровень смертности на 1000 человек населения
18
16
14
12
10
8
6
4
2
0
2020
2021
2022
Россия
14,6
16,7
12,9
США
10,3
10,4
9,8
Германия
11,9
12,3
12,7
Япония
11,1
11,7
12,9
30

31.

Российская
таможенная
академия
2. Классификация статистических данных
3. Классификация данных по типу шкалы измерения признака
Количественные (числовые) признаки – это показатели,
принимающие числовые значения, которые получаются путем некоторых
измерений или подсчетов.
Интервальная (количественная) шкала показывает, на сколько одно
значение больше другого в принятых единицах.
Частными случаями шкалы интервалов являются шкала отношений
(нулевое начало отсчета) и шкала разностей (произвольное начало отсчета и единый масштаб), а также абсолютная шкала (нулевое начало
отсчета и единый масштаб отсчета).
В случае если данные получены путем измерений и они принимать
абсолютно любые значения из некоторого промежутка или всей числовой
оси, их называют непрерывными. Ели данные образуют конечное или
счетное множество и принимают только некоторые изолированные
значения на числовой оси, между которыми значений быть не может, то
такие признаки называют дискретными.
31

32.

Российская
таможенная
академия
2. Классификация статистических данных
Пример 9.
Рейтинг уровня автомобилизации России по количеству автомобилей
на 1000 чел. На 2022 год. Переменная «количество автомобилей в
регионе» и «численность начисления» - дискретная количественная,
«число автомобилей на 1000 жителей» - непрерывная. (MS Excel).
2 000 000
600,0
500,0
400,0
300,0
200,0
100,0
0,0
1 500 000
1 000 000
500 000
0
Число легковых автомобилей
Автомобилей на 1000 чел.
32

33.

Российская
таможенная
академия
4. Классификация статистических данных
Качественные (категориальные) данные могут принадлежать
только к одной из множеств категорий (классов).
Номинальная (классификационная) шкала – определяется в терминах
категорий, которые нельзя содержательно упорядочить (страна, регион,
город, номер студенческой группы).
Пример 10.
Цвет глаз некой студенческой группы. Данные по номинальной
категорииальной переменной «цвет глаз» представлены в табличной
форме и в сгруппированном виде с помощью круговой диаграммы (MS
ФИО студента
Цвет глаз
Excel).
Благушина Дарья Алексеевна
Боровикова Дарья Николаевна
Ветрук Екатерина Романовна
Галустян Арина Владимировна
Гладких Владимир Олегович
Каландадзе Давид Малхазиевич
Кобзарева Лаура Дмитриевна
Косынкин Никита Евгеньевич
Крафт Софья Александровна
Метелица Татьяна Евгеньевна
Моковеева Анна Валентиновна
Моторыгина Лада Александровна
Мудаева Альвина Семеновна
Мунарбеков Мухамедали Мунарбекович
карие
серые
голубые
зеленые
серые
карие
серые
голубые
голубые
серые
карие
серые
серые
карие
33

34.

Российская
таможенная
академия
2. Классификация статистических данных
Цвет глаз студентов группы
зеленые
7%
голубые
21%
серые
43%
карие
29%
34

35.

Российская
таможенная
академия
2. Классификация статистических данных
Порядковые (ординальные) переменные – данные измеряются в
порядковой шкале.
Пример 11. Результаты сдачи промежуточной аттестации студентами
экономического факультета. Данные представлены в табличной форме и
в виде гистограммы.
ФИО студента
Никитин Арсений Сергеевич
Пышненко Дарья Васильевна
Редькин Никита Всеволодович
Садыхов Теймур Фаридович
Сысоева Валерия Валерьевна
и т.д.
Результат сдачи промежуточной аттестации
полностью на «отлично»
на «хорошо» и «отлично»
есть оценки «удовлетворительно»
есть оценки «неудовлетворительно»
на «хорошо» и «отлично»
Результаты промежуточной аттестации студентов экономического факультета
250
200
150
100
50
0
отлично
хорошо
удовлетворительно
неудовлетворительно
35

36.

Российская
таможенная
академия
2. Классификация статистических данных
4. Классификация данных по способу получения
По способу получения данные делятся на первичные — если
информация собиралась специально для данного анализа и вторичные —
если используется информация из других источников, со-бранная для
других целей.
36

37.

Российская
таможенная
академия
3. Работа с мастером функций
электронных таблиц (МойОфис Таблица;
LibreOffice, MS Excel)
МойОфис Таблица
Подходит для
Развёртывание
Графический интерфейс
Тарификация
Поддержка языков
Малый бизнес, ИП, Средний бизнес, НКО, Корпорация
Персональный компьютер
Windows, iOS, Android, macOS, Linux, Tizen и GNU/Linux
Платно, бесплатно
русский, татарский, башкирский, английский, французский,
испанский, португальский, белорусский, немецкий, казахский,
итальянский, киргизский, армянский, рунди
Реестр российского ПО
Включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Нет
Назначение
системы табличный редактор, предназначенный для работы с большими
МойОфис Таблица
массивами числовых данных и их визуализацией
Компания-разработчик
«Новые Облачные Технологии»
Страна
Россия
Головной офис
г. Торонто
Веб-сайт
myoffice.ru
37

38.

Российская
таможенная
академия
3. Работа с мастером функций
электронных таблиц (МойОфис Таблица;
LibreOffice, MS Excel)
LibreOffice Calc
Подходит для
Малый бизнес, ИП, Средний бизнес, НКО, Корпорация
Развёртывание
Персональный компьютер
Графический интерфейс
Linux, macOS, FreeBSD, Windows
Тарификация
Платно, бесплатно
Поддержка языков
русский, английский и др.
Реестр российского ПО
Включён
Демо версия
Да
Пробная версия (триал)
Да
Свободное ПО
Да
Назначение
системы табличный редактор, предназначенный для работы с
LibreOffice Calc
большими массивами числовых данных и их
визуализацией
Компания-разработчик
The Document Foundation
Страна
Германия
Головной офис
г. Берлин
38
Веб-сайт
www.libreoffice.org/discover/calc/

39.

Российская
таможенная
академия
3. Работа с мастером функций
электронных таблиц (МойОфис Таблица;
LibreOffice, MS Excel)
MicrosoftExcel
Подходит для
Развёртывание
Графический интерфейс
Тарификация
Поддержка языков
Реестр российского ПО
Демо версия
Пробная версия (триал)
Свободное ПО
Назначение системы
MS Excel
Компания-разработчик
Страна
Веб-сайт
Средний, малый бизнес, ИП, НКО, Корпорация
Персональный компьютер
Windows, Macintosh, OS/2
Бесплатно
Русский, английский
Не включён
Да
Да
Да
табличный редактор, предназначенный для
работы с большими массивами числовых данных
и их визуализацией
Microsoft
США
https://www.microsoft.com/ru-ru/microsoft365/excel
39

40.

Российская
таможенная
академия
3. Работа с мастером функций
электронных таблиц (МойОфис Таблица;
LibreOffice, MS Excel)
Установить надстройку Excel «Анализ данных»
Файл → Параметры → Надстройки → Перейти → откроется меню
Надстройки → Доступные настройки → выберите Пакет анализа → ОК.
40

41.

Российская
таможенная
академия
3. Работа с мастером функций
электронных таблиц (МойОфис Таблица;
LibreOffice, MS Excel)
Диалоговое окно «Анализ данных»
41
English     Русский Правила