在机器学习中,我们常常会遇到不均衡的数据集。比如癌症数据集中,癌症样本的数量可能远少于非癌症样本的数量;在银行的信用数据集中, 按期还款的客户数量可能远大于违约客户的样本数量。 比如非常有名的德国信用数据集,正负样本的分类就不是很均衡 ...
点击转到数据集网站 点击进入主页 ...
2020-07-18 14:39 0 907 推荐指数:
在机器学习中,我们常常会遇到不均衡的数据集。比如癌症数据集中,癌症样本的数量可能远少于非癌症样本的数量;在银行的信用数据集中, 按期还款的客户数量可能远大于违约客户的样本数量。 比如非常有名的德国信用数据集,正负样本的分类就不是很均衡 ...
数据集网站收集(持续更新) 1.Kaggle: https://www.kaggle.com/ 可以按关键字搜索数据集 自带讨论区 有热心群众分享自己的Kernel,可供参考(热心群众们自己对数据的分析代码) 2.天池: https://tianchi.aliyun.com ...
深度学习视觉领域常用数据集汇总:https://www.jianshu.com/p/9990284bc4d5?from=singlemessage 机器学习最常用的50大免费数据集: https://mp.weixin.qq.com/s/-a3EiPSXcbFpMwvOfcFEYQ (原文链接 ...
http://dataju.cn/Dataju/web/home 聚数力 ...
https://github.com/awesomedata/awesome-public-datasets ...
阿尔及利亚森林火灾数据集 0.导入包 import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import ...
最近因为比赛在找一些数据集,但是有些网站的下载真的很麻烦,不仅要填详细的个人信息,还要求有学校雇员参与,不胜其烦。所以在网上找到了这样的一个网站,下载方便,可以用它来搜一些替代性的数据集,并且难能可贵的是访问非常快:https://academictorrents.com/ ...
数据集网站集合。这个网站中列出来很多数据集网站,非常全,其中的很多网站数据描述详细,而且数据可以直接下载, ...