Обзор¶
Общее представление¶
Класс DBHose предоставляет универсальный интерфейс для переноса данных между различными источниками в Apache Airflow DAGs.
Обмен данными осуществляется в режиме стрим.
При обмене данными между родственными СУБД (Postgres, Greenplum, Arenadata либо обмен между серверами Clickhouse) данные передаются в родных бинарных форматах.
При обмене между разными СУБД (Postgres и Clickhouse) на этапе передачи происходит преобразование бинарных форматов из одного в другой в потоке.
Для использования нестандартных источников (API сервисы, датафреймы pandas/polars, и т.д.) предусмотрены специальные режимы передачи данных, так же использующие стрим.
Предупреждение
Проект находится в стадии бета-тестирования и может содержать ошибки. Используйте с осторожностью в production-средах.
Поддерживаемые СУБД¶
На данный момент работа с СУБД поддерживается только между следующими базами данных:
ClickHouse
Greenplum
PostgreSQL
Особенности¶
⚠️Статус проекта: бета-версия
⚡️Производительность: оптимизировано для больших объемов данных