Похожие презентации:
Информационные хранилища
1.
Дисциплина: «Базы данных»Специальность: №08080165
«Прикладная информатика (в экономике)»
Информационные хранилища
Институт информатики, инноваций и бизнес систем
Кафедра Информационных систем и прикладной
информатики
Старший преподаватель Богданова О.Б.
2.
Хранилища данныхСистемы операционной обработки способны выполнять
тривиальный анализ данных – вычислять максимальные,
минимальные и средние значения атрибутов.
3.
Система поддержки принятиярешений
Под системой поддержки принятия решений понимают
вычислительный комплекс, ориентированный на анализ
данных и обеспечивающий получение информации,
необходимой для разработки решений в сфере управления.
4.
Система поддержки принятиярешений
К числу задач, которые традиционно решают системы
поддержки принятия решений, относятся:
оценка альтернатив решений,
прогнозирование,
классификация,
кластеризация,
выявления ассоциаций
и др.
5.
Система поддержки принятиярешений
Для того, чтобы извлекать полезную информацию из данных,
они должны быть организованы особым, отличным от
принятого в OLTP-системах образом.
6.
Система поддержки принятиярешений
Во-первых, для выполнения аналитических запросов
необходима обработка больших информационных массивов.
Во-вторых, выполнение некоторых аналитических запросов,
например, анализ тенденций и прогнозирование, требует
технологической упорядоченности данных.
В-третьих, данные, используемые для целей анализа, как
правило, отличаются от данных операционных систем.
7.
Хранилища данныхКонцепция хранилищ данных –
это концепция подготовки данных для последующего
анализа.
Она предполагает выполнение следующих положений
8.
Хранилища данных1) Интеграция и согласование данных из различных
источников: традиционных систем операционной
обработки, информационной обработки, информации из
внутренних и внешних по отношению к организации
электронных архивов.
1) Разделение наборов данных, используемых системами
выполнения транзакций и системами поддержки
принятия решений.
9.
Хранилища данныхХранилище данных
«предметно-ориентированный, интегрированный,
неизменяемый и поддерживающий хронологию набор данных,
предназначенный для обеспечений принятия управленческих
решений.»
10.
Хранилища данныхИсходные данные для анализа производятся системами
операционной обработки, поступают из электронных архивов
и от поставщиков информации, например, онлайновых
информационных агентств.
Эти источники слабо связаны между собой , поэтому и данные,
которые они предоставляют, имеют различную структуру и
форматы представления.
11.
Хранилища данныхНеобходимо произвести согласование данных разных
источников, чтобы ими было удобно оперировать при анализе.
Это подразумевает приведение их к единому формату, а
также устранение дублирующихся и некорректных значений.
12.
Хранилища данныхПодготовленные данные загружаются в хранилище.
Пользователи-аналитики осуществляют доступ к нему через
клиентские приложения.
В отличии от систем операционной обработки в СППР,
использующих концепцию ХД, критерии поиска и состав
выдаваемой в виде отчета информации не фиксируются при
ее разработке, пользователи оперируют в основном заранее
не регламентированными запросами (ad-hoc query)
13.
Концепция хранилища данныхOLTP: Есть ли свободные места в купе поезда Москва
— Сочи, отправляющегося 20 августа в 23:15?
OLAP: Каким будет объем продаж железнодорожных
билетов в денежном выражении в следующих трех
месяцах с учетом сезонных колебаний
14.
Концепция хранилища данныхИспользование концепции данных в системе поддержки
принятия решений преследует следующие цели:
1) Своевременное обеспечение аналитиков всей
информацией, необходимой для выработки решений;
2) Создание единой модели данных организации;
3) Создание интегрированного источника данных.
15.
Концепция хранилища данныхОриентация на предметную область.
Хранилище должно разрабатываться с учетом специфики
предметной области, а не приложений, оперирующих
данными.
Структура хранилища должна отражать представления
аналитика об информации, с которой ему приходится
работать.
16.
Концепция хранилища данныхИнтегрированность.
Информация в хранилище загружается из приложений,
созданных разными разработчиками.
Необходимо объединить данные этих приложений, приведя
их к единому синтаксическому и семантическому виду.
17.
Концепция хранилища данныхНеизменяемость данных.
Данные после загрузки в аналитических системах остаются
неизменными.
Внесение каких-либо изменений, кроме добавления записей
не предполагаются.
18.
Концепция хранилища данныхПоддержка хронологии.
Учет хронологии достигается введением ключевых атрибутов
«ДАТА» и/или «ВРЕМЯ» в структуры хранилища данных
19.
Свойства данных в СППР и системах операционнойобработки (OLTP)
Характеристика
OLTP
OLAP
Преобладающие операции
Ввод данных, поиск
Анализ данных
Характер запросов
Много простых
транзакций
Сложные
транзакции
Хранимые данные
Оперативные,
детализированные
Охватывающие
большой период
времени, агрегированные
Вид деятельности
Оперативная, тактическая
Аналитическая,
стратегическая
Тип данных
Структурированные
Разнотипные
20.
OLAPПод OLAP-системой принято понимать СППР, основанную на
концепции хранилища данных и обеспечивающую малое время
выполнения аналитических запросов.
21.
Модели данных, используемые для построенияхранилищ
В настоящее время два чем-то конкурирующих, а в чем-то
взаимодополняющих друг друга подхода к построению
хранилищ данных:
- подход, основанный на использовании многомерной модели
БД (Multidimensional OLAP - MOLAP)
- подход, использующий реляционную модель БД (Relational
OLAP - ROLAP)
22.
Многомерная модель хранилища23.
Реляционная модель хранилища данныхСправочная таблица
Справочная таблица
PARAMETR ID
REGION_ID
Название
Фактологическая таблица
Название субъекта РФ
Подчиненность
Единицы измерения
Тип параметра
Источник данных
Комментарий
PARAMETR ID
Описание
REGION_ID
Комментарий
PERIOD_ID
Значение параметра
Справочная таблица
PERIOD_ID
Описание
Год
Квартал
(Схема звезда)
Месяц
День
24.
Реляционная модель хранилища данных(Схема «Снежинка»)
PARAMETER _ID
REGION_ID
Название
Название субъекта РФ
Единицы измерения
PARAMETER _ID
PARAMTYPE_ID
REGION_ID
DATASOURCE_ID
PERIOD_ID
Комментарий
Значение параметра
Подчиненность
Описание
Комментарий
PERIOD_ID
PARAMTYPE_ID
Описание
Описание типа
параметра
Год
QUARTER_ID
QUARTER_ID
MONTH_ID
PARAMETER _ID
Название квартала
День
Описание источника
данных
Комментарий
Период поступления
данных
MONTH_ID
Название месяца
Комментарий
25.
Киоски данных(Data Marts)
Комбинация многомерного и реляционного
подходов:
Киоски
данных
—
специализированное
тематическое хранилище, обслуживающее одно из
направлений деятельности организации
26.
OLTP-системыЭлектронные архивы
Поставщики
информации
Данные
Источники
информации
Загрузка данных
Приведенные данные к
единому формату
Агрегированные данные
Предобработка данных
Центральное
хранилище
Реляционная параллельная СУБД
Киоски данных
(тематические
хранилища)
МСУБД
МСУБД
МСУБД
МСУБД
Информация
Анализ и
представление
данных
Пользовательские
приложения
Поток задач
анализа
Модели,
прогнозы
27.
Классификация хранилищданных
• Маленькие
•Средние
•Большие
•Сверхбольшие