名稱 | 訓練集 | 測試集 | 說明 | |
MNIST手寫體數據集 | 60000張 | 10000張 | 10個類別,每張圖片28*28 | 單標簽、多分類 |
IMDB電影評論數據集 | 25000條評論 50%正 50%負 |
25000條評論 50%正 50%負 |
二分類 | |
路透社數據集 | 8982個樣本 | 2246個樣本 | 46個不同的新聞主題,訓練集中每個主題都有至少10個樣本 每個樣本都是一個整數列表 |
單標簽、多分類 |
波士頓房價數據集 | 404條 | 102條 | 506條樣本,每個樣本有13個特征,特征的取值范圍可能不一樣 | 回歸 |
貓狗圖像數據集 2013年kaggle比賽 |
自定義 | 自定義 | 12500張貓 12500張狗 |
CNN |
ImageNet數據集 | 140萬張標記圖像, 1000個不同種類,包含許多動物類別,其中包含不同種類的貓和狗 |
CNN | ||
Glove詞嵌入 400000個單詞的100維嵌入向量 | LSTM、RNN | |||
耶拿天氣數據集 | 每10分鍾記錄14個不同的量(比如氣溫、氣壓、濕度、風向等) | LSTM 溫度預測 |
||
CelebA名人人臉數據集 | 超過20萬張名人肖像 | VAE | ||
CIFAR10數據集 | 50000張32*32的RGB圖像,有10個類別,每個類別5000張圖像 | GAN |