Похожие презентации:
Введение_бальшие_данные
1.
Технологии обработкиинформации
Лекция Введение в большие данные. Понятие
машинное обучение
доцент кафедры информатики Глотова М.И.
1
2.
DATA-DRIVEN• Data
Driven (дословно — «управляемый
данными») — это подход к управлению,
основанный на данных. Его главный постулат:
решения нужно принимать, опираясь на
анализ цифр, а не интуицию и личный опыт.
https://www.uplab.ru/blog/data-driven/
2
3.
Большие данные• Большие данные (Big Data, англ.) представляют собой новое
качество обычных данных в электронном виде, накопленных в
большом объёме в разнообразных информационных системах,
(корпоративных, государственных), сайтах, блогах;
• Согласно исследованиям IDC, мировой рынок бизнесаналитики и больших данных планомерно растет: в 2015 г.
он достиг $122 млрд., в 2016 г. – уже $130 млрд. К 2020 г.
аналитики прогнозируют рост объема рынка до $203 млрд;
• Количество накопленных данных для российского рынка в
2020 году составит 980 экзабайт.
3
4.
V-модель Большихданных
Variety
Velocity
Volume
Value
Veracity
Validity
4
5. Уровни архитектуры по обращению с большими данными
56. Угрозы и риски использования больших данных
67. Этапы процесса анализа данных по стандарту CRISP-DM
78. Этапы процесса анализа данных по методологии SEMMA
89. Этапы процесса анализа данных по методологии KDD
910. Использование различных методологий в анализе данных
1011. Типы задач анализа данных
Поиск частыхшаблонов/ассоц
иативных
правил
Визуализация
Кластеризация
Предикт
Классификация
11