Структура базы данных
Сведения, выгруженные из сервиса-источника, сохраняются в базу данных, которая создается отдельно для каждого проекта. Для каждого сервиса, из которого выгружаются данные, специально разрабатывается структура БД, которая призвана максимально облегчить работу конечного пользователя с данными. Все структуры проектируются на основе «звезды» или производной от нее «снежинки», подробней о которой можно почитать здесь:
Если вы используете для работы с данными Power BI, то рекомендуем посмотреть так же вот это видео:
Основная идея такой структуры сводится к тому, что есть два типа таблиц:
- таблицы измерений – в которых содержатся параметры, описывающие объект или событие;
- таблицы фактов – в которых содержатся показатели и ссылки на таблицы измерений.
В связи с тем, что в нашем примере мы работает с выгрузкой данных из Яндекс.Директ, то схема для него выглядит следующим образом:
Зеленым цветом на схеме выделены таблицы измерений, которые используются только данной выгрузкой, синим – общие таблицы измерений, используемые различными выгрузками, желтым – таблицы фактов и фиолетовым – вспомогательные таблицы.
Более детальное описание таблиц можно найти в документации, размещенной в сервисе в настройках источника, в которой описаны все таблицы, их поля и сведения, которые в них загружаются:
Сведения о данных, загруженных в базу находятся на странице “Хранилище”:
Для каждой таблицы отображается количество строк в таблице, её объем, а также информация о представлении. Они необходимы для того, чтобы скрыть системные поля и дать понятные названия. Более подробно о причине использования представлений можно прочитать по ссылке:
Обращаем внимание, что при изменении структуры таблиц (например, при добавлении сервисом функционала) представления в базе не корректируются: это связано с тем, что именно представления, как правило, используются в моделях данных. Дата изменения структуры представления отображается в колонке “Обновлено” (не следует путать с датой обновления данных). При необходимости представление можно пересоздать до актуальной структуры (“Выбрать” – “Пересоздать”).
Здесь же можно найти настройки для подключения к базе данных:
На триальном аккаунте вам будет доступно подключение под Пользователем, после оплаты работы добавится доступ Владельца. Кроме того, в сервисе предусмотрен функционал для обработки данных непосредственно в интерфейсе личного кабинета, раздел “Инструменты”. Этот раздел включает в себя:
- два инструмента для получения табличных данных из БД – заранее сформированные с помощью Cube.js кубы данных и классический редактор SQL-запросов;
- редактор для создания визуализаций на основании полученных данных Vega-lite;
- функционал сохранения визуализаций на дашборде;
- шаблонные дашборды, которые можно разворачивать для аналогичных источников.
Таким образом, пользователи сервиса могут внутри его интерфейса работать с данными и строить визуализации, не используя внешние инструменты.
Для более серьезной работы с данными лучше воспользоваться специализированным ПО. Примеры настройки подключения к хранилищу из различного ПО можно найти в этом разделе.