花費 25 ms
[大牛翻譯系列]Hadoop(17)MapReduce 文件處理:小文件

5.1 小文件 大數據這個概念似乎意味着處理GB級乃至更大的文件。實際上大數據可以是大量的小文件。比如說,日志文件通常增長到MB級時就會存檔。這一節中將介紹在HDFS中有效地處理小文件的技術。 ...

Thu Mar 20 14:47:00 CST 2014 0 3911
[大牛翻譯系列]Hadoop(7)MapReduce:抽樣(Sampling)

4.3 抽樣(Sampling) 用基於MapReduce的程序來處理TB級的數據集,要花費的時間可能是數以小時計。僅僅是優化代碼是很難達到良好的效果。 在開發和調試代碼的時候,沒有必要處理整個數 ...

Sun Mar 09 16:09:00 CST 2014 0 3091

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM