发布于 : Oct 23, 2024
Oct 2024
评估
在可用的开放表格格式中,能够支持数据湖仓一体(lakehouses)架构——例如 Apache Iceberg、Delta和 Hudi——尚未出现明显的赢家。相反,我们看到了一些工具正在促进这些格式之间的互操作性。例如, Delta UniForm 通过允许 Hudi 和 Iceberg 客户端读取 Delta 表,实现了单向互操作性。另一个新进入这个领域的是Apache XTable™,这是一个 Apache 孵化器项目,旨在实现 Hudi、Delta 和 Iceberg 之间的全向互操作性。与 UniForm 类似,XTable 在不创建底层数据副本的情况下,能够在这些格式之间转换元数据。XTable 对于那些在多个表格格式之间进行实验的团队可能会很有用。然而,考虑到这些格式之间功能的差异,长期依赖全向互操作性可能会导致团队只能使用功能的“最小公倍数”。