加载数据到 Databend
以下主题讲解如何将数据加载到 Databend:
准备加载文件
Databend 使您能够从存储在不同位置的各种格式的文件中加载数据。 加载前,请确保您的文件符合这些要求:
支持的文件存储位置
Databend 可以从存储在本地文件系统中的文件加载数据, 支持的对象存储解决方案和远程服务器。
支持的文件格式
数据文件可以多种格式并按需要压缩。 Databend 支持从这些格式的文件加载数据:
- CSV
- TSV
- NDJSON
- Parquet
- XML
支持的压缩格式包括:
- GZIP
- BZ2
- BROTLI
- ZSTD
- DEFLATE
- RAW_DEFLATE
- XZ
数据加载方法
Databend 推荐使用 COPY INTO 命令从 Stage、Bucket 或远程服务器中的文件加载数据;使用 Streaming Load API 从本地文件加载数据。
使用 COPY INTO 命令
COPY INTO 命令可以从 Stage、Bucket 或远程服务器中的文件加载数据。 您可以通过 COPY INTO 命令的选项来告诉 Databend 如何加载您的数据。 COPY INTO 命令提供许多选项可以让您指定如何加载您的数据。
关于COPY INTO 命令及其选项的详细解释,见 COPY INTO。
使用 Streaming Load API
Streaming Load API 可以从您的本地数据文件读取数据并加载到 Databend。 更多关于 Streaming Load API 的信息,请参阅 Streaming Load API。
数据加载注意事项
实践教程
以下是一些帮助您学习数据加载的教程:
- 教程 - 从内部 Stage 加载:在此教程中,您将创建一个内部 Stage 并上传一个样本文件,然后用COPY INTO 命令将文件中的数据加载到 Databend。
- 教程:从亚马逊 S3 Bucket 加载:在此教程中, 您将会上传一个样本文件到您的亚马逊 S3 Bucket,然后用COPY INTO 命令将文件中的数据加载到 Databend。
- 教程:从本地文件加载:在此教程中, 您将使用 Streaming Load API 从本地样本文件加载数据到 Databend。
- 教程:从远程文件加载:在此教程中, 您将使用COPY INTO 命令将远程样本文件中的数据加载到 Databend。