深度學習中表示數據集的常用方法之設計矩陣

本文轉載自查看原文 2018-09-05 16:30 1523

表示數據集的常用方法

表示數據集的常用方法是設計矩陣（design matrix）。

設計矩陣的每一行包含一個不同的樣本。每一列對應於不同的特征。

例如，Iris數據集包含150個樣本，每個樣本有4個特征。這意味着我們可以將數據集表為設計矩陣。

當然，每個樣本都可以表示成向量，並且這些向量的維度相同，才能將一個數據集表示成設計矩陣。在許多情況下，存在着不同類型的異構數據，由於其向量的維度不同，無法表示為設計矩陣的形式。此時，不會將數據集表示成m行的矩陣，而是表示為M個元素的結合：

這種方式意味着和可以有不同的大小。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 深度學習-數據集增強-方法機器學習深度學習常用數據集深度學習常用數據集 API（包括 Fashion MNIST） 25個深度學習開源數據集深度學習數據集匯總深度學習數據集+模型說明 [深度學習]-Dataset數據集加載深度學習（一）之MNIST數據集分類 [深度學習] 各種下載深度學習數據集方法（In python）【資源帖】深度學習視覺領域常用數據集匯總