原文:阿里云DataWorks实践:数据集成+数据开发

简介 什么是DataWorks: DataWorks 数据工场,原大数据开发套件 是阿里云重要的PaaS Platform as a Service 平台产品,为您提供数据集成 数据开发 数据地图 数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。 DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute 开源大数据引擎E Ma ...

2021-02-26 15:18 1 1834 推荐指数:

查看详情

阿里数据之——DataWorks学习

什么是DataWorks?   一个大数据开发治理平台,集数据集成数据开发数据地图,数据质量,数据服务等于一体,一站式开发管理的界面。   DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink ...

Wed Mar 30 01:53:00 CST 2022 0 718
治理企业“数据悬河”,阿里DataWorks全链路数据治理新品发布

​简介: 10月19日,在2021年云栖大会上,阿里重磅发布DataWorks全链路数据治理产品体系,基于数据仓库,数据湖、湖仓一体等多种大数据架构,DataWorks帮助企业治理内部不断上涨的“数据悬河”,释放企业的数据生产力。 ​ 阿里巴巴集团副总裁 阿里智能计算平台事业部高级 ...

Sat Nov 06 00:34:00 CST 2021 0 110
阿里数仓Dataworks数据导出到文件step by step

背景 假设你在阿里Dataworks的空间space下有一个表table_A,想要把它的数据导出到文件以供后续使用,但是数据量又很多,从浏览器复制不太现实。阿里提供了Java和Python版本的SDK,用来完成这个操作。 为了帮助业务取数,我之前搜了很多文档包括官方文档,但都没有完整讲清楚 ...

Tue Jun 15 19:03:00 CST 2021 0 552
知乎的 Flink 数据集成平台建设实践

简介: 本文由知乎技术平台负责人孙晓光分享,主要介绍知乎 Flink 数据集成平台建设实践。内容如下: 1. 业务场景 ; 2. 历史设计 ; 3. 全面转向 Flink 后的设计 ; 4. 未来 Flink 应用场景的规划。 本文由知乎技术平台负责人孙晓光分享,主要介绍知 ...

Fri Apr 23 17:59:00 CST 2021 0 231
实战 | 将Apache Hudi数据集写入阿里OSS

1. 引入 上对象存储的廉价让不少公司将其作为主要的存储方案,而Hudi作为数据湖解决方案,支持对象存储也是必不可少。之前AWS EMR已经内置集成Hudi,也意味着可以在S3上无缝使用Hudi。当然国内用户可能更多使用阿里OSS作为上存储方案,那么如果用户想基于OSS构建数据湖 ...

Sat Apr 25 22:58:00 CST 2020 0 1023
DataWorks数据工场)

一、DataWorks数据工场) DataWorks系列视频 https://help.aliyun.com/video_list/107549.html?spm=a2c4g.11174359.3.3.292e240fTm93TJ ...

Sun Jul 07 06:33:00 CST 2019 0 920
阿里开发之OSS数据迁移

最近由于项目需求,需要将一个aliyun账号下的oss数据导入到两一个aliyun账号下的oss,经过一番坎坷,最终搞定。 1.查看oss数据迁移官方文档,我是在本地windows电脑上进行操作的,先下载了官方给出的数据迁移工具,但是,给出这个工具的老哥不太用心呀!下载下来按照文档操作,出现乱码 ...

Sat Mar 04 00:16:00 CST 2017 2 3131
 
粤ICP备18138465号  © 2018-2026 CODEPRJ.COM