Исходный код вики 02. Данные и таблицы
Версия 3.1 от Ирина Сафонова на 29.03.2023, 15:39
Последние авторы
author | version | line-number | content |
---|---|---|---|
1 | (% style="color:#4169E1" %) | ||
2 | == Можно ли получить доступ к нескольким таблицам одновременно? == | ||
3 | |||
4 | **Ответ:** не совсем. Только не в режиме поиска данных или интерфейсе визуализации. Инструмент Лаборатории SQL позволяет получить доступ только к одной таблице или к представлению. | ||
5 | |||
6 | При работе с таблицами решение — материализация таблицы с помощью регулярного запланированного процесса пакетной обработки данных. Таблица при этом должна содержать все необходимые для анализа данных поля. | ||
7 | |||
8 | Представление (View) — это простой логический уровень, абстрагирующий несколько SQL-запросов виртуальной таблицей. Это позволяет объединять несколько таблиц в одну единую и преобразовывать данные с использованием произвольных SQL-запросов. Ограничением является производительность базы данных, поскольку сервис эффективно запускает запрос поверх запроса к представлению. Хорошая практика является — ограничение соединения основной большой таблицы только к одной или к нескольким небольшим таблицам. В этом случае рекомендуется избегать оператора GROUP BY (где это возможно), поскольку BI будет выполнять свою собственную реализацию запроса GROUP BY, а выполнение работы дважды может снизить производительность. | ||
9 | |||
10 | При использовании таблицы или представления (view) важный фактором является то, достаточно ли быстро работает БД, из которой забираются данные. Быстрая работа БД необходима для обслуживания БД | ||
11 | |||
12 | в интерактивном режиме с целью обеспечения хорошего взаимодействия между СУБД и BI. Лучше всего использовать СУБД с "горячим" доступом в качестве организации горячего слоя для BI (например, [[Clickhouse>>https://wiki.dfcloud.ru/bin/view/%D0%A1%D0%B5%D1%80%D0%B2%D0%B8%D1%81%20Cloud%20BI/2.%20%D0%98%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%86%D0%B8%D1%8F/02.%20%D0%A0%D1%83%D0%BA%D0%BE%D0%B2%D0%BE%D0%B4%D1%81%D1%82%D0%B2%D0%BE%20%D0%B0%D0%B4%D0%BC%D0%B8%D0%BD%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D0%BE%D1%80%D0%B0/A.%20%D0%A1%D0%BE%D0%B5%D0%B4%D0%B8%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5%20%D1%81%20%D0%B1%D0%B0%D0%B7%D0%B0%D0%BC%D0%B8%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85/ClickHouse/]]). | ||
13 | |||
14 | Однако если использовать Лабораторию SQL, то такого ограничения нет. Лаборатория SQL позволяет написать SQL-запроса для объединения нескольких таблиц, если учетная запись БД, через которую подключается Cloud BI, имеет доступ к таблицам. | ||
15 | |||
16 | (% style="color:#4169E1" %) | ||
17 | == Насколько большими могут быть данные? == | ||
18 | |||
19 | **Ответ:** очень большого размера. Cloud BI работает как тонкий клиент над БД или средством обработки данных. | ||
20 | Основной критерий скорости работы и объема обрабатываемых данных — скорость работы БД, используемой в качестве хранилища данных и являющейся слоем данных для Cloud BI. | ||
21 | Многие распределенные СУБД могут выполнять запросы, работающие с терабайтами данных в интерактивном режиме. |