HDFS 寫數據流程

本文轉載自查看原文 2020-07-30 18:01 612 hadoop

一、HDFS 寫數據流程

客戶端想 NameNode 發出請求（包含 Blocksize 和副本數）；
NameNode 經過計算，反饋給客戶端相同副本數的 DataNode，切給出的 DataNode 有優先存儲順序要求；（數據與 DataNode 對應時，一般移動計算，不移動數據）
客戶端得到信息后開始寫數據，當第一個 DataNode 接受 Block 時，會將該數據傳給第二個 DataNode ，第二個 DataNode 接受到數據時，也會將該數據傳遞給第三個 DataNode；在最后一個 DataNode 接受數據完畢時，則該 Block 全部傳輸完畢；
DataNode 在接受數據完畢后，每一個 DataNode 都會將完畢信息傳遞給 NameNode；
NameNode 將所有 DataNode 反饋的信息（所有數據以傳輸完畢），反饋給客戶端；
客戶端接受到 NamaNode 反饋的信息后（第一個 Block 傳輸完畢），開始發送請求傳輸第二個 Block；
傳輸完畢后，在關閉請求之前，NameNode 將該文件所有 Block 存放在 DataNode 上的 ID 保存在文件中；

低延遲的數據訪問；（一般數據較大，不容易實現在秒級別檢索數據）
不適合小文件的存儲；（無論文件大小，都有對應的元數據存放在 NameNode 上，如果小文件較多，則對應的元數據較多，對應的元數據所占用的內存信息較大，給NameNode 壓力較大）

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 HDFS 讀/寫數據流程 HDFS讀寫數據流程 HDFS寫文件的流程 Hadoop_08_客戶端向HDFS讀寫（上傳）數據流程什么是數據流程圖（DFD）？ LoRaWAN協議(七)--完整數據流程數據流圖、數據流程圖、程序流程圖的區別與聯系數據流圖和數據流程圖 Java中對接釘釘API獲取數據流程對Socket CAN的理解（3）——【Socket CAN發送數據流程】