Оглавление
Медленно меняющееся измерение
-
Определение и типы SCD
- SCD (Slowly Changing Dimensions) — это метод хранения исторических данных в хранилищах данных.
- Существуют различные типы SCD, включая типы 1, 2, 3, 4, 5, 6 и гибридные подходы.
-
Типы SCD
- Тип 1: используется для хранения исторических данных без изменений.
- Тип 2: используется для хранения исторических данных с изменениями, но без добавления новых атрибутов.
- Тип 3: используется для хранения ограниченной истории изменений, ограниченной количеством столбцов.
- Тип 4: использует «таблицы истории» для хранения текущих и исторических данных.
- Тип 5: основан на мини-измерении и перезаписи атрибутов типа 1.
- Тип 6: сочетает в себе подходы типов 1, 2 и 3, обеспечивая ссылочную целостность и гибкость запросов.
- Тип 7: использует как суррогатный, так и естественный ключ для гибкости привязок к измерениям.
-
Сравнение типов SCD
- Тип 1 обеспечивает целостность данных, но не поддерживает запросы «по состоянию на момент времени».
- Тип 2 обеспечивает ссылочную целостность, но может требовать обновления данных при изменениях.
- Тип 3 ограничивает хронологию изменений, но может быть дорогим при частых изменениях.
- Тип 4 обеспечивает ссылочную целостность и производительность, но требует дополнительных таблиц.
- Тип 5 позволяет получать текущие значения атрибутов мини-измерения без привязки к таблице фактов.
- Тип 6 сочетает в себе преимущества типов 1, 2 и 3, но может вызывать проблемы с изменениями.
- Тип 7 обеспечивает гибкость привязок к измерениям, но не поддерживает ссылочную целостность.
-
Гибридные подходы
- Различные типы SCD могут применяться к разным столбцам одной таблицы.
-
Рекомендации
- Существуют предостережения относительно использования SCD, включая проблемы с ссылочной целостностью и корректностью запросов.
-
Источники
- Ссылки на патенты и публикации Ральфа Кимбалла и Брюса Оттманна.