I. Создание и настройка датасетов
Что такое датасет?
Датасет или набор данных — механизм хранения информации, который предоставляет быстрый доступ к большим объемам данных. Датасеты создаются из таблиц базы данных или SQL-запросов. Выберите таблицу из базы данных слева или создайте датасет из SQL-запроса в Лаборатории SQL. При необходимости сохраните запрос как датасет.
Реестр датасетов
Датасеты создаются в отдельном реестре.
Создание датасета
1. Нажмите кнопку Датасет в реестре.
2. В открывшемся окне выберете:
- базу данных (БД)
- схему
- таблицу БД
3. Нажмите кнопку ADD DATASET AND CREATE CHART.
4. Дальнейшие шаги аналогичны созданию графика.
Редактирование датасета
1. Найдите в реестре необходимый датасет и нажмите кнопку Редактировать в столбце Действия.
2. В открывшейся форме нажмите на кнопку внесения изменений, отредактируйте данные параметров вкладок и нажмите кнопку Сохранить:
Источник
При необходимости внесите изменения в следующие параметры:
- Переключатель Физический (таблица или представление).
- БД
- Схема
- Таблица
- Переключатель Виртуальный (SQL).
- БД
- Схема
- Имя датасета
- Запрос SQL
Меры
При необходимости отредактируйте существующие показатели и добавьте новые по кнопке Добавить запись. При добавлении и редактирование записи доступно:
- Написание выражения SQL
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение
- Удаление записи
Столбцы
При необходимости добавьте данные/внесите изменения в следующие параметры:
- Содержит дату/время
- Дата и время по умолчанию. Если это столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый
- Является измерением
Доступно удаление столбцов.
Вычисляемые столбцы
При необходимости добавьте данные/внесите изменения в следующие параметры:
- Содержит дату/время.
- Дата и время по умолчанию. Если это столбец с типом данных Дата и время, то укажите, как Cloud BI должен анализировать формат даты и времени в соответствии с ISO 8601.
- Фильтруемый.
- Является измерением.
При добавлении и редактирование записи доступно:
- Написание выражения SQL.
- Ввод описания, форматы даты и времени, кем утверждено, детали утверждения, предупреждение.
- Удаление записи.
Настройки
При необходимости добавьте данные или внесите изменения в следующие группы параметров:
Группа параметров | Поле | Заполнение поля |
Базовая настройка | Описание | Вводится описание. |
URL базы данных | URL по умолчанию, на который перенаправляются при доступе из страницы с реестром датасетов. | |
Фильтры автозаполнения | При необходимости включите фильтр на определенный интервал или диапазон времени и извлеките значение предиката. | |
Дополнительные параметры | Поддерживаются метаданные следующих форматов:
При необходимости укажите владельцев датасета. | |
- Базовая настройка.
- Описание.
- URL базы данных. URL по умолчанию, на который выполняется перенаправление при доступе из страницы с реестром датасетов.
- Фильтры автозаполнения. При необходимости включите фильтр на определенный интервал/диапазон времени и извлеките значение предиката.
Автозаполняемые фильтры используются для повышения производительности запроса, извлекающего значения. Используйте этот параметр, чтобы применить предложение WHERE к запросу, выбирающему отдельные значения из таблицы. Целью является ограничение сканирования путем применения фильтра относительного времени к секционированному или индексированному полю, связанному со временем.
Доступно редактирование SQL-запроса.
- Дополнительные параметры. Дополнительные метаданные таблицы. Поддерживаются метаданные следующих форматов:
- `{ "certification": { "certified_by": "Data Platform Team".
- "details": "This table is the source of truth." }.
- "warning_markdown": "This is a warning." }`.
Доступно указание владельцев датасета.
- Продвинутая настройка.
- Время жизни кэша. Количество секунд до истечения срока действия кэша.
- Смещение времени. Отрицательное или положительное количество часов для смещения столбца времени. Функционал используется для приведения часового пояса UTC к местному времени.
- Параметры шаблона. Набор параметров, доступных в запросе с использованием шаблонизации Jinja.
При необходимости перейдите из реестра и внесите изменения в датасет.
Фильтрация в реестре датасетов
При необходимости отфильтруйте реестр по следующим параметрам:
- Владелец.
- База данных.
- Схема.
- Тип.
- Сертифицировано ли.
Дополнительно доступен поиск в реестре.
Множественный выбор в реестре датасетов
Доступен при нажатии кнопки Множественный выбор. Также возможен экспорт данных.
Удаление датасетов
При необходимости удалите датасет одним из двух способов:
- При выделении записи в реестре и нажатии кнопки Удалить.
- При множественном выборе и нажатии кнопки Удалить.
При удалении в открывшейся форме выйдет сообщение, что датасет привязан к графикам. Введите Удалить и нажмите кнопку Удалить. В результате датасет удаляется из реестра.
Экспорт датасета
При необходимости экспортируйте датасет двумя способами:
- При выделении записи в реестре и нажатии кнопки Экспорт в столбце Действия.
- При множественном выборе и нажатии кнопки Экспорт.
Импорт датасета
1. Нажмите кнопку Импортировать датасеты.
2. В открывшейся форме загрузите необходимый файл и нажмите кнопку Импорт. В результате датасет загружается в реестр.
При необходимости импортируйте датасеты при множественном выборе.
Операции с бинарными полями
Если датасет содержит поле с бинарным значением (true/false), то подсчитать сумму невозможно, появляется ошибка.
Как исправить ошибку?
Когда редактируете датасет, добавьте вычисляемый столбец с числовым типом. Создайте логику нового поля при помощи выражения SQL.