Агрегат (хранилище данных)
-
Определение и использование агрегатов
- Агрегаты — это сводки, которые ускоряют обработку запросов к большим наборам данных.
- Они сокращают количество строк, необходимых для ответа на запрос.
-
Простейшая форма и изменение детализации
- Агрегат — это простая сводная таблица, получаемая с помощью SQL-запроса Group by.
- Агрегация может изменять степень детализации измерений, создавая новые таблицы измерений и фактов.
-
Дизайн и представление
- Агрегированные данные — это предварительно вычисленные обобщенные данные, хранящиеся в новых таблицах.
- Агрегация может быть выполнена путем устранения размерности или сопоставления фактов с обобщенным измерением.
- Агрегированные таблицы измерений должны соответствовать базовым таблицам измерений.
-
Влияние на производительность
- Агрегаты могут значительно ускорить выполнение запросов, в некоторых случаях в сто или тысячу раз.
- Агрегаты являются ключевым элементом для повышения производительности больших хранилищ данных.
-
Сложность и агрегатная навигация
- Наличие агрегированных данных увеличивает сложность многомерной модели.
- Агрегатная навигация помогает определить, можно ли ответить на запрос, используя меньшую агрегатную таблицу.
-
Технологии агрегатной навигации
- Агрегатная навигация может быть реализована в OLAP-движках, материализованных представлениях и ROLAP.
- Рекомендуется использовать первые три технологии, так как преимущества последнего ограничены одним интерфейсом BI.
-
Проблемы и рекомендации
- При использовании агрегированных данных следует учитывать размер наборов данных и необходимость их обработки.
- Вопрос о том, упростит ли структуру модели отказ от агрегатов на первой итерации, остается открытым.