⌘+k ctrl+k
1.4 (LTS)
搜索快捷键 cmd + k | ctrl + k
处理大型数据库

本页面提供了处理超大规模 DuckDB 数据库文件的相关信息。虽然大多数 DuckDB 数据库的体积远低于 1 TB,但在我们的2024 年用户调查中,仍有 1% 的受访者使用了 2 TB 或以上的 DuckDB 文件(相当于约 10 TB 的 CSV 文件)。

DuckDB 的原生数据库格式支持超大规模数据库文件,且没有任何实际限制;不过,在处理超大规模数据库文件时,仍有一些事项需要注意。

  1. 对象存储系统对文件大小的限制比块存储系统要低。例如,AWS S3 将单个文件大小限制为 5 TB

  2. DuckDB 数据库的检查点(Checkpointing)操作可能会很慢。例如,在 TPC-H SF1000 数据库的表中增加几行数据后,执行检查点操作大约需要 5 秒。

  3. 在使用块存储时,文件系统对处理大文件的性能有显著影响。在 Linux 上,DuckDB 在 XFS 文件系统下处理大文件时性能表现最佳。

对于存储海量数据,建议考虑使用 DuckLake 湖仓格式

© 2025 DuckDB 基金会,阿姆斯特丹,荷兰
行为准则 商标使用指南