原文:DataHub使用小结(一)——概述

一 概念 .什么是DataHub DataHub是流式数据 Streaming Data 的处理平台,提供对流式数据的发布 Publish ,订阅 Subscribe 和分发功能 在订阅 发布功能中,订阅者订阅自己感兴趣的数据,发布者发布到中间channel,发布 订阅彼此不知道对方的存在 可以轻松构建基于流式数据的分析和应用。 主要可以进行流处理应用以及流数据归档 归档到maxcomputer ...

2018-09-06 17:11 0 7877 推荐指数:

查看详情

DataWorks使用小结(一)——概述

一、概述   DataWorks数据工场,是MaxComputer的可视化开发平台,一站式开发、管理界面   1.功能概述     1.强大调度:支持分钟到月的调度     2.多种任务:支持ODPS、SHELL等多种任务     3.可视化开发:B/S架构的可视化开发界面,简单易上手 ...

Sun Aug 26 20:00:00 CST 2018 0 13950
DataHub

DataHub 为数据分析提供了类似github的托管功能,并且让大家在线运行Ipython notebook,共享数据分析代码,从零开始学习数据分析的方法。DataHub 集数据收集管理,数据版本 http://datahub.top/ 数据分析基础:http://datahub ...

Wed Jul 15 20:02:00 CST 2015 0 3697
DataHub开源元数据管理工具搭建及使用

一、DataHub安装   1、安装docker和docker-compose     yum -y install docker     curl -L "https://github.com/docker/compose/releases/download/1.29.2 ...

Tue Feb 15 19:55:00 CST 2022 0 4121
LinkedIn-DataHub专题: 初识DataHub

本文仅从普及角度让大家对元数据中心系统及其DataHub有个初步了解。DataHub部署、实战、更深入的技术剖析会单独给出 介绍 DataHub是由LinkedIn的数据团队开源的一款提供元数据搜索与发现的工具,在数据资产越来越重视的当下,探索数据治理解决方案,以满足不断增长的大数据 ...

Wed Feb 24 04:42:00 CST 2021 0 387
elasticsearch使用小结(ES使用小结

本文章总结自己在使用es过程中遇到的一些场景与解决办法。 1.查询结果排序   使用es进程query时,默认是按照_score排序的,当score同分时,同分结果顺序就不确定了(可能是按更新时间排序),如果要进行二次排序,就要用到sort功能了,话不多说,上代 ...

Fri Sep 29 18:15:00 CST 2017 0 4353
Wireshark的简单使用小结

Wireshark(前称Ethereal)是一个网络封包分析软件。网络封包分析软件的功能是截取网络封包,并尽可能显示出最为详细的网络封包资料。在过去,网络封包分析软件是非常昂贵,或是专门属于营利用的软件,Wireshark的出现改变了这一切。在GNU GPL通用许可证的保障范围底下,使用 ...

Mon Feb 27 01:33:00 CST 2012 2 4437
GD库使用小结---1

  因为一开始,“大家”都说一般任务中,用php操作图片不常见,像我们这种基本业务型的,就更用不到了,所以先别看,偶就没有看。现在有机会了自然要来玩一把。   以前学过C#的GDI+,交了课程设计后 ...

Sun Apr 19 08:40:00 CST 2015 2 2406
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM