經典的數據集匯總


名稱 訓練集 測試集 說明  
MNIST手寫體數據集 60000張 10000張 10個類別,每張圖片28*28 單標簽、多分類
IMDB電影評論數據集

25000條評論

50%正

50%負

25000條評論

50%正

50%負

  二分類
 路透社數據集 8982個樣本 2246個樣本 

46個不同的新聞主題,訓練集中每個主題都有至少10個樣本

每個樣本都是一個整數列表 

單標簽、多分類

 波士頓房價數據集 404條  102條  506條樣本,每個樣本有13個特征,特征的取值范圍可能不一樣  回歸

 貓狗圖像數據集

2013年kaggle比賽

 自定義 自定義 

 12500張貓

 12500張狗

CNN

ImageNet數據集     

140萬張標記圖像,

1000個不同種類,包含許多動物類別,其中包含不同種類的貓和狗

CNN
 Glove詞嵌入  400000個單詞的100維嵌入向量  LSTM、RNN
 耶拿天氣數據集      每10分鍾記錄14個不同的量(比如氣溫、氣壓、濕度、風向等)

LSTM

溫度預測

 CelebA名人人臉數據集     超過20萬張名人肖像  VAE
 CIFAR10數據集     50000張32*32的RGB圖像,有10個類別,每個類別5000張圖像 GAN


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM