tensorflow dataloader 相關內容

本文轉載自查看原文 2019-11-10 17:39 498 機器學習/ TensorFlow

Tensorflow dataloader 相關調研；數據讀取是訓練的開始，是非常關鍵的一步；下面是調研時搜集到的一些相關鏈接：

閱讀摘要：

Tensorflow 讀取數據的機制：
- 直接從硬盤上讀文件：tf 直接從硬盤上讀取數據，並將內存放入內存中，並完成之后的運算；此過程出現大量IO操作，造成了大量的浪費；訓練時間較長；
- 在內存中開辟讀寫隊列，來讀取數據：首先將文件讀到內存中，計算任務再從內存中讀取數據，彼此之間不會發生阻塞，提高了資源的利用率，也一定程度上加快了網絡的訓練的速度；
- 基於文件隊列和內存隊列結合的形式讀取數據：對於磁盤上的數據，文件名存放在文件名隊列中，內存隊列從文件名隊列中進行數據的讀取，計算設備之間從內存中讀取運算所需的數據。通過文件隊列，可以完成對epoch的更好的管理；
TFRecord 數據格式：
- tensorflow支持的一種數據格式，內部使用了google自家的Protocol Buffer 二進制數據編碼方案，方便我們模型訓練，驗證，測試數據集的輸入；通過protocal buffer能對現有的數據集進行一定程度上的聚合，減少磁盤IO；所以一定程度上能夠加速，tensorflow數據處理階段的過程；(這么一看，針對文件系統或者存儲系統的研究生生涯學習一定程度上加深了我對磁盤，文件以及系統的理解，還是很不錯的)

資源摘錄自網絡，保持更新，更多內容請關注：cnblogs.com/xuyaowen;

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 CVS 相關內容標簽的相關內容 Django模板語言相關內容 syslog相關內容介紹 UWB硬件設計相關內容 HTTP協議相關內容游戲測試相關內容 mysql關於timestamp字段相關內容 Header和Cookie相關內容 Memcached相關內容總結