I. Создание и настройка датасетов
Что такое датасет?
Датасет или набор данных — механизм хранения информации, который предоставляет быстрый доступ к большим объемам данных. Датасеты создаются из таблиц базы данных или SQL-запросов. Выберите таблицу из базы данных слева или создайте датасет из SQL-запроса в Лаборатории SQL. При необходимости сохраните запрос как датасет.
Типы датасетов
В Cloud BI два типа датасетов:
- физический
- виртуальный
Физический
Физический датасет
Физический набор данных в Superset представляет собой таблицу или представление в вашей базе данных. Поскольку физический набор данных отражает реальную физическую таблицу, Superset может автоматически извлекать соответствующую информацию из базы данных (например, схему и типы столбцов). Эта информация сохраняется в базе данных метаданных Superset. Если произойдет изменение базовой таблицы базы данных, вы можете нажать «Синхронизировать столбцы из источника», чтобы заставить Superset обновить свою внутреннюю модель данных.
Виртуальные наборы данных позволяют вам преобразовать SQL-запрос произвольной формы к вашей базе данных в объект набора данных в Superset. Виртуальные наборы данных наследуют большую часть тех же сверхспособностей, что и физические наборы данных:
- типы столбцов (выводятся из результатов выполнения запроса)
- умение определять метрики
- возможность определять вычисляемые столбцы
- возможность сертифицировать метрики или вычисляемые столбцы
- установка таймаута кэша
Реестр датасетов
Датасеты создаются в отдельном реестре.
Создание датасета
1. Нажмите кнопку Датасет в реестре.
2. В открывшемся окне выберете:
- базу данных (БД)
- схему
- таблицу БД
3. Нажмите кнопку ADD DATASET AND CREATE CHART.
4. Дальнейшие шаги аналогичны созданию графика.
Редактирование данных вкладок датасета
1. Найдите в реестре необходимый датасет и нажмите кнопку Редактировать в столбце Действия.
2. В открывшейся форме нажмите на кнопку внесения изменений, отредактируйте данные параметров вкладок и нажмите кнопку Сохранить:
Источник
При необходимости внесите изменения в следующие параметры:
- Переключатель Физический (таблица или представление).
- БД
- Схема
- Таблица
- Переключатель Виртуальный (SQL).
- БД
- Схема
- Имя датасета
- Запрос SQL
Меры
При необходимости отредактируйте существующие показатели и добавьте новые по кнопке Добавить запись. При добавлении и редактирование записи доступно:
- Написание выражения SQL
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение
- Удаление записи
Столбцы
При необходимости добавьте данные/внесите изменения в следующие параметры:
- Содержит дату/время
- Дата и время по умолчанию. Если это столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый
- Является измерением
Доступно удаление столбцов.
Вычисляемые столбцы
При необходимости добавьте данные/внесите изменения в следующие параметры:
- Содержит дату/время.
- Дата и время по умолчанию. Если это столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый.
- Является измерением.
При добавлении и редактирование записи доступно:
- Написание выражения SQL.
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение.
- Удаление записи.
Операции с бинарными полями
Если датасет содержит поле с бинарным значением (true/false), то подсчитать сумму невозможно, появляется ошибка.
Как исправить ошибку?
Когда редактируете датасет, добавьте вычисляемый столбец с числовым типом. Создайте логику нового поля при помощи выражения SQL.
Настройки
При необходимости добавьте данные или внесите изменения в следующие группы параметров:
Группа параметров | Поле | Заполнение поля |
Базовая настройка | Описание | Вводится описание. |
URL базы данных | URL по умолчанию, на который перенаправляются при доступе из страницы с реестром датасетов. | |
Фильтры автозаполнения | При необходимости включите фильтр на определенный интервал или диапазон времени и извлеките значение предиката. | |
Дополнительные параметры | Поддерживаются метаданные следующих форматов:
При необходимости укажите владельцев датасета. | |
Продвинутая настройка | Время жизни кэша | Количество секунд до истечения срока действия кэша. |
Смещение времени | Отрицательное или положительное количество часов для смещения столбца времени. Функционал используется для приведения часового пояса UTC к местному времени. | |
Параметры шаблона | Набор параметров, доступных в запросе через шаблонизацию Jinja. |
При необходимости перейдите из реестра и внесите изменения в датасет.
Фильтрация в реестре датасетов
При необходимости отфильтруйте реестр по следующим параметрам:
- Владелец
- База данных
- Схема
- Тип
- Сертифицировано ли
Дополнительно доступен поиск в реестре.
Множественный выбор в реестре датасетов
Доступен при нажатии кнопки Множественный выбор. Также возможен экспорт данных.
Удаление датасетов
При необходимости удалите датасет одним из двух способов:
- При выделении записи в реестре и нажатии кнопки Удалить.
- При множественном выборе и нажатии кнопки Удалить.
При удалении в открывшейся форме выйдет сообщение, что датасет привязан к графикам. Введите Удалить и нажмите кнопку Удалить. В результате датасет удаляется из реестра.
Экспорт датасета
При необходимости экспортируйте датасет двумя способами:
- При выделении записи в реестре и нажатии кнопки Экспорт в столбце Действия.
- При множественном выборе и нажатии кнопки Экспорт.
Импорт датасета
1. Нажмите кнопку Импортировать датасеты.
2. В открывшейся форме загрузите необходимый файл и нажмите кнопку Импорт. В результате датасет загружается в реестр.
При необходимости импортируйте датасеты при множественном выборе.