Критерии OLAP - систем

1.

Курс
«Хранилища данных»
Тема:
Критерии OLAP-систем
Барабанщиков Игорь Витальевич

2.

Определение OLAP
• OLAP (On-Line Analytical Processing) – технология
оперативной аналитической обработки
данных, использующая методы и средства для
сбора, хранения и анализа многомерных
данных в целях поддержки процессов
принятия решений.
• Основное назначение OLAP-систем – поддержка
аналитической деятельности, произвольных
(ad-hoc) запросов.
• Цель OLAP-систем – проверка возникающих
гипотез.

3.

Истоки OLAP
• У истоков OLAP стоял
Эдгар Кодд.
• В 1993 году он изложил
основные концепции
OLAP.
• Э. Кодд сформулировал
12 требований, которым
должны удовлетворять
программы для OLAP.
• В 1995г он добавил к
ним еще 6 правил.

4.

12 правил Кодда
1. Многомерность – на концептуальном уровне
OLAP-система должна представлять данные в виде
многомерной модели.
2. Прозрачность – OLAP-система должна
скрывать от пользователя реальную
реализацию многомерной модели, способ
организации, источники, средства обработки и
хранения.
3. Доступность – OLAP-система должна
предоставлять пользователю единую,
согласованную и целостную модель данных,
обеспечивая доступ к данным, независимо от
того, как и где они хранятся.

5.

12 правил Кодда
4. Постоянная производительность отчетов –
производительность OLAP-системы не должна
значительно уменьшаться при увеличении
количества измерений, по которым делают
анализ.
5. Клиент-серверная архитектура – OLAP-система
должна работать в среде «клиент-сервер».
Серверный компонент OLAP должен быть
интеллектуальным, он должен строить общую
концептуальную схему на основе консолидации
разных логических и физических схем для
обеспечения эффекта прозрачности.

6.

12 правил Кодда
6. Равноправие измерений – OLAP-система
должна поддерживать многомерную модель, в
которой все измерения равноправны.
7. Динамическое управление разреженными
матрицами - OLAP-система должна
обеспечивать оптимальную обработку
разреженных матриц.
Скорость доступа должна сохраняться вне
зависимости от расположения ячеек данных и
быть постоянной величиной для моделей,
имеющих разное число измерений и разную
степень разреженности данных.

7.

12 правил Кодда
8. Поддержка многопользовательского режима - OLAPсистема должна предоставлять возможность работать
нескольким пользователям совместно с одной
аналитической моделью или создавать для них
разные модели из единых данных.
9. Неограниченные перекрестные операции - при
выполнении любых операций среза, вращения,
консолидации или детализации OLAP-система должна
обеспечивать сохранение функциональных отношений,
описанных с помощью определенного формального
языка между ячейками гиперкуба.
Система должна сама выполнять преобразование
установленных отношений, не требуя от
пользователя их переопределения.

8.

12 правил Кодда
10. Интуитивная манипуляция данными - OLAP-система
должна предоставлять способ выполнения операций
среза, вращения, консолидации и детализации над
гиперкубом без необходимости пользователю
совершать много операций с интерфейсом.
11. Гибкие возможности получения отчетов - OLAPсистема должна поддерживать различные способы
визуализации данных.
12. Неограниченная размерность и число уровней
агрегации – система должна предоставить не менее 15
измерений. Количество уровней агрегации для любого
измерения не должно ограничиваться.

9.

Дополнительные правила Кодда
13. Пакетное извлечение против интерпретации OLAP-система должна в равной степени
эффективно обеспечивать доступ как к
собственным, так и к внешним данным.
14. Поддержка всех моделей OLAP-анализа OLAP-система должна поддерживать все 4
модели анализа данных, определенные Коддом:
категориальную, толковательную,
умозрительную, стереотипную.
15. Обработка ненормализованных данных OLAP-система должна быть интегрирована с
ненормализованными источниками данных.

10.

Дополнительные правила Кодда
16. Сохранение результатов OLAP - хранение их
отдельно от исходных данных. Изменение данных в
OLAP-системе не должно затрагивать исходные
системы.
17. Исключение отсутствующих значений – OLAPсистема, предоставляя данные пользователю, должна
отбрасывать все отсутствующие значения.
Отсутствующие значения должны отличаться от
нулевых значений.
18. Обработка отсутствующих значений - OLAPсистема должна игнорировать все отсутствующие
значения без учета их источника.

11.

Тест FASMI
• Создан Найджелом Пендсом в 1995 году.
• Дает определение OLAP в виде 5 критериев (Fast,
Analysis, Shared, Multidimensional, Information).
• FASMI означает: быстрый анализ разделяемой
многомерной информации.
• Тест FASMI был разработан в качестве
альтернативы 18 правилам Кодда.
• Он проще для понимания, чем правила Кодда
и чаще применяется на практике для оценки
OLAP-систем.

12.

Критерии FASMI: Fast
• Быстрый отражает требование к скорости реакции
системы – система должна обеспечивать выдачу
большинства ответов пользователям в сжатые сроки.
• По Пендсу, интервал с момента инициации запроса до
получения результата должен измеряться секундами.
• Самые простые запросы обрабатываются в течение
одной секунды и очень немногие – более 20-ти.
• Важность этого требования возрастает при
использовании таких систем в качестве инструмента
оперативного представления данных для аналитика,
так как длительное время ожидания может пагубно
влиять на цепочку рассуждений аналитика.

13.

Критерии FASMI: Analysis
• Analysis (анализ) предполагает
приспособленность системы к использованию
в релевантной для задачи и пользователя
бизнес-логике с сохранением доступной
«обычному» пользователю легкости
оперирования данными без использования
низкоуровневого специального
инструментария.
• Система может справляться с любым
логическим и статистическим анализом,
характерным для данного приложения, и
обеспечивает его сохранение в виде,
доступном для конечного пользователя.

14.

Критерии FASMI: Shared
• Совместное использование описывает
очевидное требование к возможности
одновременного многопользовательского
доступа к информации с интегрированной
системой разграничения прав доступа
вплоть до уровня конкретной ячейки
данных.
• Система осуществляет все требования
защиты конфиденциальности (возможно до
уровня ячейки) и, если множественный доступ
для записи необходим, обеспечивает
блокировку модификаций на
соответствующем уровне.

15.

Критерии FASMI: Multidimensional
• Многомерность является ключевым
требованием концепции.
• Предполагается, что система должна
обеспечивать полную поддержку
многомерного иерархического представления
как «наиболее логичного пути анализа бизнеса
и организаций».
• Многомерность указывает на модель
концептуального представления данных,
то есть на то, как пользователь должен
представлять организацию данных при
формулировании запросов, а не на то, в каких
структурах хранятся данные физически.

16.

Критерии FASMI: Information
• Информация — это все соответствующие
целям пользователя данные.
• При этом наличие «лишних» данных
негативно сказывается на требовании к
скорости реакции системы.
• Требуемая информация должна быть
получена там, где она необходима.

17.

Итоги
• Для проверки OLAP-систем можно
использовать:
- правила Кодда (12+6)
- тест FASMI
• Для проверки OLAP-систем легче
использовать тест FASMI
• На практике обычно используют тест
FASMI
English     Русский Правила