原文:大數據開源apache項目匯總

Pinot 是一個實時分布式的 OLAP 數據存儲和分析系統。使用它實現低延遲可伸縮的實時分析。Pinot 從離線數據源 包括Hadoop和各類文件 和在線數據源 如Kafka 中攫取數據進行分析 ignite是分布式內存網格的一種實現,其基於java平台,具有可持久化,分布式事務,分布式計算等特點,此外還支持豐富的鍵值存儲以及SQL語法 基於h 引擎 ,可以看成是一個分布式內存數據 IoTDB ...

2021-10-19 11:45 0 848 推薦指數:

查看詳情

大數據開源組件匯總

本文除了一些常用的大數據工具,還總結匯總了其他大數據工具,幾乎是最全的大數據工具的總結。 如果你想入門大數據,可以對他們進行簡單的了解。 如果你想學習自己熟悉意外的大數據工具,可以看這篇文章。 如果你想選擇一個適合自己公司的大數據工具,也可以參考這篇 ...

Mon Apr 09 07:44:00 CST 2018 0 4640
大數據開源框架技術匯總

大數據框架:現階段用的最多的就hadoop、spark、flinnk。三者都是apache軟件基金會的頂級開源項目。Hadoop: Apache Hadoop 軟件庫是一個允許在計算機集群上通過分布式運算使用簡單編程模式處理大型的數據集合Spark: Apache Spark 是一個 ...

Mon Jun 29 05:33:00 CST 2020 0 881
推薦幾個大數據相關的開源項目

kafka監控平台:https://github.com/smartloli/EFAK flink作業管理平台:https://github.com/zhp8341/flink-streaming-platform-web 數據可視化:https://github.com ...

Wed Dec 08 01:36:00 CST 2021 0 888
2021~2022Apache大數據相關項目盤點

一、晉升為Apache TLP(Top-Level Project)的大數據相關項目 1.1、Apache® DataSketches™ (20210203) 1.2、Apache® Gobblin™ (20210216) ** 1.3、Apache ...

Sun Mar 06 23:40:00 CST 2022 0 2061
大數據基礎---大數據調優匯總

前言 不進行優化的代碼就是耍流氓。 總體來說大數據優化主要分為三點,一是充分利用CPU,二是節省內存,三是減少網絡傳輸。 一、Hive/MapReduce調優 1.1 本地模式 Hive默認采用集群模式進行計算,如果對於小數據量,可以設置為單台機器進行計算,這樣可以大大縮減 ...

Thu Jul 16 07:17:00 CST 2020 0 1339
GitHub 干貨 | 各大數據競賽 Top 解決方案開源匯總

AI 科技評論編者按:現在,越來越多的企業、高校以及學術組織機構通過舉辦各種類型的數據競賽來「物色」數據科學領域的優秀人才,並借此激勵他們為某一數據領域或應用場景找到具有突破性意義的方案,也為之后的數據研究者留下有價值的經驗。 Smilexuhc 在 GitHub 社區對各大數據競賽名列前茅 ...

Tue May 14 19:22:00 CST 2019 0 1303
一共81個,開源大數據處理工具匯總

[思路網注] 本文一共分為上下兩部分。我們將針對大數據開源工具不同的用處來進行分類,並且附上了官網和部分下載鏈接,希望能給做大數據的朋友做個參考。 本文一共分為上下兩部分。我們將針對大數據開源工具不同的用處來進行分類,並且附上了官網和部分下載鏈接,希望能給做大數據的朋友做個參考。下面 ...

Tue May 19 17:00:00 CST 2015 0 1954
一共81個,開源大數據處理工具匯總(上)(轉)

出處:http://blog.csdn.net/luobailian/article/details/50412187 作者:大數據女神-諾藍(微信公號:dashujunvshen)。本文是36大數據專稿,轉載必須標明來源36大數據。 本文一共分為上下兩部分。我們將針對大數據開源工具不同的用處 ...

Thu Jul 13 17:27:00 CST 2017 0 5109
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM