UA-11904844-8

Сравнение логической и физической структур

Уже упоминалось, что аналитический набор данных предприятия содержит одну строку для каждого объекта с десятками, сотнями или тысячами показателей. Если вы знакомы со «старыми» плоскими файлами, то примерно об этом и идет речь. Логическая и физическая структура EADS отличаются друг от друга (см. рис. 5.8).

Было бы логично представить EADS о клиенте в виде таблицы, содержащей данные о продажах, демографические данные и информацию, связанную с мероприятиями прямого маркетинга, однако данные о потребителе могут храниться иначе. Физическое представление EADS может включать одну таблицу, содержащую данные о продажах, одну таблицу с демографическими данными и одну таблицу с метриками, относящимися к мероприятиям прямого маркетинга.

Пользователям не следует об этом беспокоиться. Как только будут определены подходящие метрики, люди, управляющие базой данных, смогут выбрать наилучший способ их хранения. Затем на основе физических таблиц можно добавить нужные пользователям представления.

 eads

Рис. 5.8. Сравнение логического и физического представления EADS

Обновление

Обновление аналитического набора данных предприятия — главная причина существования физически отдельных таблиц. Различные типы данных, например данные опросов, о продажах и демографические, могут требовать обновления с разной частотой: данные о продажах — ежедневного обновления; демографические — ежеквартально; данные опросов могут вообще никогда не обновляться. При проведении нового опроса данные загружаются в систему, и их уже не касаются.

Таким образом, легче поместить различные типы данных в разные физические таблицы, чтобы они могли обновляться независимо друг от друга. Это сэкономит системные ресурсы, поскольку в таблице не будет дополнительных метрик, когда в обновлении нуждаются лишь немногие. Кроме того, отдельные таблицы или представления облегчают аналитикам процесс извлечения конкретных типов данных, которые им требуются. Наконец, многие базы данных имеют ограничения на количество столбцов в одной таблице, поэтому для большого EADS может потребоваться несколько таблиц.

Обратите внимание: вне зависимости от того, как физически хранится EADS, по мере необходимости используются представления для сбора различных фрагментов. Одно представление может содержать только показатели продаж и данные опросов, другое — только данные опросов и демографические показатели, а третье — все три типа данных. Со временем, если появится новый источник данных, например данные социальных медиа или веб-данные, основанные на этих данных метрики добавляют в аналитический набор данных предприятия. Можно определить и подходящий способ хранения новых данных, и обновленный набор представлений для их использования.