原文:大規模Hadoop集群實踐:騰訊分布式數據倉庫(TDW)

TDW 是騰訊最大的離線數據處理平台。本文主要從需求 挑戰 方案和未來計划等方面,介紹了TDW在建設單個大規模集群中采取的 JobTracker 分散化和 NameNode 高可用兩個優化方案。 TDW Tencent distributed Data Warehouse,騰訊分布式數據倉庫 基於開源軟件Hadoop和 Hive 進行構建,打破了傳統數據倉庫不能線性擴展 可控性差的局限,並且根據 ...

2014-08-21 14:58 0 3155 推薦指數:

查看詳情

大規模分布式系統運維實踐

2013年,雲梯1實現空間優化與跨機房集群擴展,雲梯2單集群規模從1500台升級到5000台,同時跨集群擴展的5K項目順利取得階段性成果,阿里成為第一個獨立研發擁有這類大規模通用計算平台的公司。當時,雲梯1、雲梯2,再加上已上線的生產集群,阿里整體集群規模已超過萬台。迄今為止,全球范圍內 ...

Wed Jan 11 18:44:00 CST 2017 0 2093
大規模分布式系統性能測試實踐

一、雲時代的應用性能測試挑戰 二、華為雲性能測試實踐方案如何更加系統的開展性能測試活動 1. 被測對象分析(某社交類APP) 從系統架構分析可能出現的瓶頸點,作為重點測試場景 Feed流會頻繁操作后台的Redis等服務,每次操作會產生100+次網絡操作,200+次 ...

Fri Jan 04 03:42:00 CST 2019 0 1392
分布式系統 (大規模分布式系統原理解析和架構實踐

http://blog.csdn.net/u010738184/article/details/49472795 分布式系統的基礎理論: 分布式系統:多台機器通過網絡連接在一起,作為一個整體為上層提供服務。 一、基礎理論知識:數據分布、復制、一致性、容錯。 1、異常 (1)服務器宕機 ...

Wed Nov 29 22:07:00 CST 2017 0 1929
數據倉庫專題(3)-分布式數據倉庫事實表設計思考

一、前言   最近在設計數據倉庫數據邏輯模型,考慮到海量數據存儲在分布式數據倉庫中的技術架構模式,需要針對傳統的面相關系型數據倉庫數據存儲模型進行技術改造。設計出一套真正適合分布式數據倉庫數據存儲模型。 二、事實表設計基礎 事實表記錄發生在現實世界中的操作型事件,其所產生 ...

Wed Apr 15 02:26:00 CST 2015 3 4117
分布式大規模服務調用架構

問題探索 一個完備的分布式架構應該具備和功能? 討論范圍 1.分布式微服務架構畫像 2.分布式微服務市場需求與前景 3.分布式微服務在企業項目中的地位 4.分布式微服務生態圈 5.技術架構嚴謹的本質 6.分布式微服務治理技術原理 7.分布式微服務服務異步與同步的原理 8.分布式 ...

Wed Jul 15 16:31:00 CST 2020 0 531
.NET分布式大規模計算利器-Orleans(一)

寫在前面 Orleans是基於Actor模型思想的.NET領域的框架,它提供了一種直接而簡單的方法來構建分布式大規模計算應用程序,而無需學習和應用復雜的並發或其他擴展模式。我在2015年下半年開始應用Orleans,當時公司的交易系統采用的架構就是基於Orleans框架的,其展現出 ...

Mon Sep 23 17:55:00 CST 2019 26 2757
Adam:大規模分布式機器學習框架

引子 轉載請注明:http://blog.csdn.net/stdcoutzyx/article/details/46676515 又是好久沒寫博客,記得有一次看Ng大神的訪談 ...

Tue Jul 25 00:02:00 CST 2017 0 1885
ClickHouse數據庫培訓實戰 (PB級大數據分析平台、大規模分布式集群架構)

一、ClickHouse數據庫培訓實戰課程 (PB級大數據分析平台、大規模分布式集群架構)視頻教程 為滿足想學習和掌握ClickHouse大數據分析專用的數據庫,風哥特別設計的一套比較系統的ClickHouse數據庫培訓課程;本套ClickHouse數據庫培訓實戰課程 課程共計10小時,內容涉 ...

Thu Dec 17 04:14:00 CST 2020 0 490
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM