Что такое датасет?
Датасет или набор данных — механизм хранения информации, который предоставляет быстрый доступ к большим объемам данных. Датасеты создаются из таблиц базы данных или SQL-запросов. Выберите таблицу из базы данных слева или создайте датасет из SQL-запроса в Лаборатории SQL. При необходимости сохраните запрос как датасет.
Типы датасетов
В Cloud BI два типа датасетов:
В реестре доступна фильтрация по типу датасета.
Физический датасет
Физический датасет — таблица или представление в базе данных (БД). Так как физический датасет отражает реальную таблицу, то Cloud BI автоматически извлекает соответствующую информацию из БД. Примеры информации — схема БД и типы столбцов. Эта информация сохраняется в БД метаданных. Если базовая таблица БД поменялась, то нажмите кнопку Синхронизировать столбцы из источника для обновления внутренней модели данных.
Возможности физического датасета
Физический датасет позволяет:
Виртуальный датасет
Виртуальный датасет — функционал Cloud BI, позволяющий преобразовать SQL-запрос произвольной формы к БД в объект датасета в Cloud BI. Возможности аналогичны физическим датасетам.
Реестр датасетов
Датасеты создаются в отдельном реестре.

Создание датасета
1. Нажмите кнопку Датасет в реестре.

2. В открывшемся окне выберете:
- базу данных (БД),
- схему,
- таблицу БД.
3. Нажмите кнопку ADD DATASET AND CREATE CHART.

Дальнейшие шаги аналогичны созданию графика.
Редактирование данных вкладок датасета
1. Найдите в реестре необходимый датасет и нажмите кнопку Редактировать в столбце Действия.
2. В открывшейся форме нажмите на кнопку внесения изменений, отредактируйте данные параметров вкладок и нажмите кнопку Сохранить:
Изменение настроек влияют на все графики, использующие этот датасет, в том числе графики других пользователей.
Для внесения изменений формы нажмите на замок.
Источник
При необходимости внесите изменения в следующие параметры:
- Переключатель Физический (таблица или представление).
- Переключатель Виртуальный (SQL).
- БД,
- схема,
- имя датасета,
- запрос SQL.

Меры
При необходимости отредактируйте существующие показатели и добавьте новые по кнопке Добавить запись. При добавлении и редактирование записи доступно:
- Написание выражения SQL.
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение.
- Удаление записи.

Столбцы
При необходимости добавьте данные или внесите изменения в параметры:
- Содержит дату/время.
- Дата и время по умолчанию. Если столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый.
- Является измерением.
Доступно удаление столбцов.

Вычисляемые столбцы
При необходимости добавьте данные/внесите изменения в следующие параметры:
- Содержит дату/время.
- Дата и время по умолчанию. Если это столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый.
- Является измерением.
При добавлении и редактирование записи доступно:
- Написание выражения SQL.
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение.
- Удаление записи.

Операции с бинарными полями
Если датасет содержит поле с бинарным значением (true/false), то подсчитать сумму невозможно, появляется ошибка.

Как исправить ошибку?
При редактировании добавьте в датасет вычисляемый столбец с числовым типом. Создайте логику нового поля при помощи выражения SQL.

Настройки
При необходимости добавьте данные или внесите изменения в две группы параметров:
Группа параметров | Параметр | Заполнение параметра |
Базовая настройка | Описание | Вводится описание. |
| URL базы данных | URL по умолчанию, на который перенаправляются при доступе из страницы с реестром датасетов. |
Фильтры автозаполнения | При необходимости включите фильтр на определенный интервал или диапазон времени и извлеките значение предиката. Автозаполняемые фильтры используются для улучшения быстродействия запроса. Используйте этот параметр, чтобы применить предложение WHERE запрос для уникальных значений из таблицы. Активируется ограничение сканирования при помощи фильтров относительного времени к секционированному или индексированному полю. Доступно редактирование SQL-запроса в модальном окне. |
Дополнительные параметры | Поддерживаются метаданные форматов: - `{ "certification": { "certified_by": "Data Platform Team"
- "details": "This table is the source of truth." }
- "warning_markdown": "This is a warning." }`
При необходимости укажите владельцев датасета. |
Продвинутая настройка | Время жизни кэша | Количество секунд до истечения срока действия кэша. |
| Смещение времени | Отрицательное или положительное количество часов для смещения столбца времени. Функционал используется для приведения часового пояса UTC к местному времени. |
Параметры шаблона | Набор параметров, доступных в запросе через шаблонизацию Jinja. |
При необходимости перейдите из реестра и внесите изменения в датасет.

Фильтрация в реестре датасетов
При необходимости отфильтруйте реестр по следующим параметрам:
- владелец,
- база данных,
- схема,
- тип,
- утверждено. Функционал полезен, когда, к примеру, необходимо посмотреть, что аналитик создал, а руководитель утвердил график
Дополнительно доступен поиск в реестре.

Множественный выбор в реестре датасетов
Доступен при нажатии кнопки Множественный выбор. Возможен экспорт данных.

Удаление датасетов
При необходимости удалите датасет одним из двух способов:
- При выделении записи в реестре и нажатии кнопки Удалить.
- При множественном выборе и нажатии кнопки Удалить.
При удалении в открывшейся форме выйдет сообщение, что датасет привязан к графикам. Введите Удалить и нажмите кнопку Удалить. В результате датасет удаляется из реестра.
Удаление датасета приводит к неработоспособности привязанных графиков.

Экспорт датасета
При необходимости экспортируйте датасет двумя способами:
- При выделении записи в реестре и нажатии кнопки Экспорт в столбце Действия.
- При множественном выборе и нажатии кнопки Экспорт.

Датасеты экспортируются в архиве в формате yaml.
Импорт датасета
1. Нажмите кнопку Импортировать датасеты.
2. В открывшейся форме загрузите необходимый файл и нажмите кнопку Импорт. В результате датасет загружается в реестр.

При необходимости импортируйте датасеты при множественном выборе.
Пример датасета

В начало 🡱
К следующему разделу 🡲
К предыдущему разделу 🡰