在機器學習中,我們常常會遇到不均衡的數據集。比如癌症數據集中,癌症樣本的數量可能遠少於非癌症樣本的數量;在銀行的信用數據集中, 按期還款的客戶數量可能遠大於違約客戶的樣本數量。 比如非常有名的德國信用數據集,正負樣本的分類就不是很均衡 ...
點擊轉到數據集網站 點擊進入主頁 ...
2020-07-18 14:39 0 907 推薦指數:
在機器學習中,我們常常會遇到不均衡的數據集。比如癌症數據集中,癌症樣本的數量可能遠少於非癌症樣本的數量;在銀行的信用數據集中, 按期還款的客戶數量可能遠大於違約客戶的樣本數量。 比如非常有名的德國信用數據集,正負樣本的分類就不是很均衡 ...
數據集網站收集(持續更新) 1.Kaggle: https://www.kaggle.com/ 可以按關鍵字搜索數據集 自帶討論區 有熱心群眾分享自己的Kernel,可供參考(熱心群眾們自己對數據的分析代碼) 2.天池: https://tianchi.aliyun.com ...
深度學習視覺領域常用數據集匯總:https://www.jianshu.com/p/9990284bc4d5?from=singlemessage 機器學習最常用的50大免費數據集: https://mp.weixin.qq.com/s/-a3EiPSXcbFpMwvOfcFEYQ (原文鏈接 ...
http://dataju.cn/Dataju/web/home 聚數力 ...
https://github.com/awesomedata/awesome-public-datasets ...
阿爾及利亞森林火災數據集 0.導入包 import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import ...
最近因為比賽在找一些數據集,但是有些網站的下載真的很麻煩,不僅要填詳細的個人信息,還要求有學校雇員參與,不勝其煩。所以在網上找到了這樣的一個網站,下載方便,可以用它來搜一些替代性的數據集,並且難能可貴的是訪問非常快:https://academictorrents.com/ ...
數據集網站集合。這個網站中列出來很多數據集網站,非常全,其中的很多網站數據描述詳細,而且數據可以直接下載, ...