Похожие презентации:
Критерии OLAP - систем
1.
Курс«Хранилища данных»
Тема:
Критерии OLAP-систем
Барабанщиков Игорь Витальевич
2.
Определение OLAP• OLAP (On-Line Analytical Processing) – технология
оперативной аналитической обработки
данных, использующая методы и средства для
сбора, хранения и анализа многомерных
данных в целях поддержки процессов
принятия решений.
• Основное назначение OLAP-систем – поддержка
аналитической деятельности, произвольных
(ad-hoc) запросов.
• Цель OLAP-систем – проверка возникающих
гипотез.
3.
Истоки OLAP• У истоков OLAP стоял
Эдгар Кодд.
• В 1993 году он изложил
основные концепции
OLAP.
• Э. Кодд сформулировал
12 требований, которым
должны удовлетворять
программы для OLAP.
• В 1995г он добавил к
ним еще 6 правил.
4.
12 правил Кодда1. Многомерность – на концептуальном уровне
OLAP-система должна представлять данные в виде
многомерной модели.
2. Прозрачность – OLAP-система должна
скрывать от пользователя реальную
реализацию многомерной модели, способ
организации, источники, средства обработки и
хранения.
3. Доступность – OLAP-система должна
предоставлять пользователю единую,
согласованную и целостную модель данных,
обеспечивая доступ к данным, независимо от
того, как и где они хранятся.
5.
12 правил Кодда4. Постоянная производительность отчетов –
производительность OLAP-системы не должна
значительно уменьшаться при увеличении
количества измерений, по которым делают
анализ.
5. Клиент-серверная архитектура – OLAP-система
должна работать в среде «клиент-сервер».
Серверный компонент OLAP должен быть
интеллектуальным, он должен строить общую
концептуальную схему на основе консолидации
разных логических и физических схем для
обеспечения эффекта прозрачности.
6.
12 правил Кодда6. Равноправие измерений – OLAP-система
должна поддерживать многомерную модель, в
которой все измерения равноправны.
7. Динамическое управление разреженными
матрицами - OLAP-система должна
обеспечивать оптимальную обработку
разреженных матриц.
Скорость доступа должна сохраняться вне
зависимости от расположения ячеек данных и
быть постоянной величиной для моделей,
имеющих разное число измерений и разную
степень разреженности данных.
7.
12 правил Кодда8. Поддержка многопользовательского режима - OLAPсистема должна предоставлять возможность работать
нескольким пользователям совместно с одной
аналитической моделью или создавать для них
разные модели из единых данных.
9. Неограниченные перекрестные операции - при
выполнении любых операций среза, вращения,
консолидации или детализации OLAP-система должна
обеспечивать сохранение функциональных отношений,
описанных с помощью определенного формального
языка между ячейками гиперкуба.
Система должна сама выполнять преобразование
установленных отношений, не требуя от
пользователя их переопределения.
8.
12 правил Кодда10. Интуитивная манипуляция данными - OLAP-система
должна предоставлять способ выполнения операций
среза, вращения, консолидации и детализации над
гиперкубом без необходимости пользователю
совершать много операций с интерфейсом.
11. Гибкие возможности получения отчетов - OLAPсистема должна поддерживать различные способы
визуализации данных.
12. Неограниченная размерность и число уровней
агрегации – система должна предоставить не менее 15
измерений. Количество уровней агрегации для любого
измерения не должно ограничиваться.
9.
Дополнительные правила Кодда13. Пакетное извлечение против интерпретации OLAP-система должна в равной степени
эффективно обеспечивать доступ как к
собственным, так и к внешним данным.
14. Поддержка всех моделей OLAP-анализа OLAP-система должна поддерживать все 4
модели анализа данных, определенные Коддом:
категориальную, толковательную,
умозрительную, стереотипную.
15. Обработка ненормализованных данных OLAP-система должна быть интегрирована с
ненормализованными источниками данных.
10.
Дополнительные правила Кодда16. Сохранение результатов OLAP - хранение их
отдельно от исходных данных. Изменение данных в
OLAP-системе не должно затрагивать исходные
системы.
17. Исключение отсутствующих значений – OLAPсистема, предоставляя данные пользователю, должна
отбрасывать все отсутствующие значения.
Отсутствующие значения должны отличаться от
нулевых значений.
18. Обработка отсутствующих значений - OLAPсистема должна игнорировать все отсутствующие
значения без учета их источника.
11.
Тест FASMI• Создан Найджелом Пендсом в 1995 году.
• Дает определение OLAP в виде 5 критериев (Fast,
Analysis, Shared, Multidimensional, Information).
• FASMI означает: быстрый анализ разделяемой
многомерной информации.
• Тест FASMI был разработан в качестве
альтернативы 18 правилам Кодда.
• Он проще для понимания, чем правила Кодда
и чаще применяется на практике для оценки
OLAP-систем.
12.
Критерии FASMI: Fast• Быстрый отражает требование к скорости реакции
системы – система должна обеспечивать выдачу
большинства ответов пользователям в сжатые сроки.
• По Пендсу, интервал с момента инициации запроса до
получения результата должен измеряться секундами.
• Самые простые запросы обрабатываются в течение
одной секунды и очень немногие – более 20-ти.
• Важность этого требования возрастает при
использовании таких систем в качестве инструмента
оперативного представления данных для аналитика,
так как длительное время ожидания может пагубно
влиять на цепочку рассуждений аналитика.
13.
Критерии FASMI: Analysis• Analysis (анализ) предполагает
приспособленность системы к использованию
в релевантной для задачи и пользователя
бизнес-логике с сохранением доступной
«обычному» пользователю легкости
оперирования данными без использования
низкоуровневого специального
инструментария.
• Система может справляться с любым
логическим и статистическим анализом,
характерным для данного приложения, и
обеспечивает его сохранение в виде,
доступном для конечного пользователя.
14.
Критерии FASMI: Shared• Совместное использование описывает
очевидное требование к возможности
одновременного многопользовательского
доступа к информации с интегрированной
системой разграничения прав доступа
вплоть до уровня конкретной ячейки
данных.
• Система осуществляет все требования
защиты конфиденциальности (возможно до
уровня ячейки) и, если множественный доступ
для записи необходим, обеспечивает
блокировку модификаций на
соответствующем уровне.
15.
Критерии FASMI: Multidimensional• Многомерность является ключевым
требованием концепции.
• Предполагается, что система должна
обеспечивать полную поддержку
многомерного иерархического представления
как «наиболее логичного пути анализа бизнеса
и организаций».
• Многомерность указывает на модель
концептуального представления данных,
то есть на то, как пользователь должен
представлять организацию данных при
формулировании запросов, а не на то, в каких
структурах хранятся данные физически.
16.
Критерии FASMI: Information• Информация — это все соответствующие
целям пользователя данные.
• При этом наличие «лишних» данных
негативно сказывается на требовании к
скорости реакции системы.
• Требуемая информация должна быть
получена там, где она необходима.
17.
Итоги• Для проверки OLAP-систем можно
использовать:
- правила Кодда (12+6)
- тест FASMI
• Для проверки OLAP-систем легче
использовать тест FASMI
• На практике обычно используют тест
FASMI