HBase定義 HBase 是一個高可靠、高性能、面向列、可伸縮的分布式存儲系統,利用Hbase技術可在廉價PC Server上搭建 大規模結構化存儲集群。 HBase 是 ...
Hive背景介紹 Hive最初是Facebook為了滿足對海量社交網絡數據的管理和機器學習的需求而產生和發展的。互聯網現在進入了大數據時代,大數據是現在互聯網的趨勢,而hadoop就是大數據時代里的核心技術,但是hadoop的mapreduce操作專業性太強,所以facebook在這些基礎上開發了hive框架,畢竟世界上會sql的人比會java的人多的多,hive可以說是學習hadoop相關技術 ...
2018-05-12 16:03 0 13614 推薦指數:
HBase定義 HBase 是一個高可靠、高性能、面向列、可伸縮的分布式存儲系統,利用Hbase技術可在廉價PC Server上搭建 大規模結構化存儲集群。 HBase 是 ...
Canal簡介 Canal是阿里開源的一款基於Mysql數據庫binlog的增量訂閱和消費組件,通過它可以訂閱數據庫的binlog日志,然后進行一些數據消費,如數據鏡像、數據異構、數據索引、緩 ...
Flume概念 Flume是一個分布式、可靠、和高可用的海量日志聚合的系統,支持在系統中定制各類數據發送方,用於收集數據;同時,Flume提供對數據進行簡單處理,並寫到各種數據接受方(可定制)的能 ...
為了幫助賣家提高運營水平,賣家管理后台會展示一些訪客、訂單等趨勢和指標數據,如PV,UV,轉化率,GMV等; 這些指標的計算依靠前端埋點和訂單詳情等數據,其特點是數據量大,並有一定的實時性要求。 Druid本質是一個分布式時序數據庫,其設計恰好滿足這個場景: Historical數據 ...
什么是容器? 一句話概括容器:容器就是將軟件打包成標准化單元,以用於開發、交付和部署。 容器鏡像是輕量的、可執行的獨立軟件包 ,包含軟件運行所需的所有內容:代碼、運行時環境、系統工具、系統庫和設置。 容器化軟件適用於基於Linux和Windows的應用,在任何環境中都能夠始終如一 ...
ThreadLocalMap的角度入手深入學習ThreadLocal的原理。 1. 基本數據結構 ...
Flink的應用場景 Flink項目的理念就是:Flink是為分布式,高性能,隨時可用以及准確的流處理應用程序打造的開源流處理框架。自2019年開源以來,迅速成為大數據實時計算領域炙手可熱的技術框架。 我們來看看Flink支持的眾多應用場景: 實時數據計算 我們知道,數據計算場景需要 ...
實時計算最好的時代 在過去的十年里,面向數據時代的實時計算技術接踵而至。從我們最初認識的 Storm,再到 Spark 的異軍突起,迅速占領了整個實時計算領域。直到 2019 年 1 月底,阿里巴巴 ...