分布式存储(姚文辉)
1.大数据对分布式存储的需求 存储容量(>100PB) 高吞吐量(1PB sort < 2小时 350GB/每秒的吞吐量) 高可靠性(8个9) 服务高可靠性(99.95 ...
1.大数据对分布式存储的需求 存储容量(>100PB) 高吞吐量(1PB sort < 2小时 350GB/每秒的吞吐量) 高可靠性(8个9) 服务高可靠性(99.95 ...
1.设计基础目标 (1) 错误是常态,需要使用数据冗余 (2)流式数据访问。数据批量读而不是随机速写,不支持OLTP,hadoop擅长数据分析而不是事物处理。 (3)文件采用一次 ...