原文:Apache Hudi 0.7.0版本重磅发布

重点特性 . Clustering . . 版本中支持了对Hudi表数据进行Clustering 对数据按照数据特征进行聚簇,以便优化文件大小和数据布局 ,Clustering提供了更灵活地方式增加文件大小,有了Clustering特性,便可更快速地摄取数据,然后聚簇为更大的文件,实验数据表明查询性能可以提升 倍,文件数可以减少 倍 另外Clustering对于查询侧优化也很明显,在查询时通常会 ...

2021-01-31 22:14 0 752 推荐指数:

查看详情

Apache Hudi 0.8.0版本重磅发布

1. 重点特性 1.1 Flink集成 自从Hudi 0.7.0版本支持Flink写入后,Hudi社区又进一步完善了Flink和Hudi的集成。包括重新设计性能更好、扩展性更好、基于Flink状态索引的写入Pipeline;支持Flink写入MOR表;Flink批量读取COW和MOR表;流式 ...

Wed Apr 14 03:01:00 CST 2021 0 413
Apache Hudi 0.6.0版本重磅发布

1. 下载信息 源码:Apache Hudi 0.6.0 Source Release (asc, sha512) 二进制Jar包:nexus 2. 迁移指南 如果您从0.5.3以前的版本迁移至0.6.0,请仔细核对每个版本的迁移指南; 0.6.0版本从基于list ...

Wed Aug 26 17:09:00 CST 2020 0 785
Apache Hudi 0.5.1版本重磅发布

历经大约3个月时间,Apache Hudi 社区终于发布了0.5.1版本,这是Apache Hudi发布的第二个Apache版本,该版本中一些关键点如下 版本升级 将Spark版本从2.1.0升级到2.4.4 将Avro版本从1.7.7升级到1.8.2 ...

Sat Feb 01 08:51:00 CST 2020 0 203
Apache Hudi 0.9.0版本重磅发布!更强大的流式数据湖平台

1. 重点特性 1.1 Spark SQL支持 0.9.0 添加了对使用 Spark SQL 的 DDL/DML 的支持,朝着使所有角色(非工程师、分析师等)更容易访问和操作 Hudi 迈出了一大步。 用户现在可以使用 CREATE TABLE....USING HUDI 和 CREATE ...

Mon Sep 06 06:31:00 CST 2021 0 343
特性速览| Apache Hudi 0.5.3版本正式发布

1. 下载连接 源代码下载:Apache Hudi 0.5.3 Source Release (asc, sha512) 0.5.3版本相关jar包地址:https://repository.apache.org/#nexus-search;quick~hudi 2. 迁移指南 ...

Fri Jun 19 17:41:00 CST 2020 0 756
Flutter 1.17版本重磅发布

Flutter 1.17 是2020年的第一个稳定版本,此版本包括iOS平台Metal支持(性能更快),新的Material组件,新的Network跟踪工具等等! 对所有人来说,今年是充满挑战的一年。我们的目标是按季度节奏发布稳定的发行;但是,此版本花费了更长的时间,因为我们一直在为新 ...

Fri May 08 05:36:00 CST 2020 0 2817
Apache Hudi重磅特性解读之全局索引

1. 摘要 Hudi表允许多种类型操作,包括非常常用的upsert,当然为支持upsert,Hudi依赖索引机制来定位记录在哪些文件中。 当前,Hudi支持分区和非分区的数据集。分区数据集是将一组文件(数据)放在称为分区的桶中的数据集。一个Hudi数据集可能由N个分区和M个文件组成,这种组织 ...

Tue Jul 07 02:42:00 CST 2020 0 1467
重磅!解锁Apache Flink读写Apache Hudi新姿势

感谢阿里云 Blink 团队Danny Chan的投稿及完善Flink与Hudi集成工作。 1. 背景 Apache Hudi 是目前最流行的数据湖解决方案之一,Data Lake Analytics 集成了 Hudi 服务高效的数据 MERGE(UPDATE/DELETE)场景 ...

Sat Apr 10 20:18:00 CST 2021 0 2231
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM