先看数据: 特征如下: Time Number of seconds ela ...
from:https: zhuanlan.zhihu.com p 本项目需解决的问题 本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 建模思路 项目背景 数据集包含由欧洲持卡人于 年 月使用信用卡进行交的数据。此数据集显示两天内发生的交易,其中 , 笔交易中有 笔被盗刷。数据集非常不平衡,积极的类 被盗刷 占所有交易的 . 。 它只包含 ...
2018-05-25 12:11 0 10233 推荐指数:
先看数据: 特征如下: Time Number of seconds ela ...
地址:https://www.kaggle.com/mlg-ulb/creditcardfraud 数据概述 数据集包含2013年9月欧洲持卡人通过信用卡进行的交易。该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。数据集高度不平衡,阳性类别(欺诈)占所有交易 ...
...
kaggle数据地址:https://www.kaggle.com/sakshigoyal7/credit-card-customers 导入数据 简单的数据查看 拿到百度翻译了一下 简单看一下缺失情况 我们按照数据类型分一下 ...
一、任务基础 数据集包含由欧洲人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔被盗刷。数据集非常不平衡,正例(被盗刷)占所有交易的0.172%。,这是因为由于保密问题,我们无法提供有关数据的原始功能和更多背景信息。特征V1,V2 ...
导入类库 作图函数 数据获取与解析 数据为结构化数据,不需要抽特征转化, 但特征Time和Amount的数据规格和其他特征不一样, 需要对其做特征做特征缩放 ...
多。 以下是下采样: 过采样:SMOTE算法、ADASYN算法 SMOTE: ...
六、混淆矩阵: 混淆矩阵是由一个坐标系组成的,有x轴以及y轴,在x轴里面有0和1,在y轴里面有0和1。x轴表达的是预测的值,y轴表达的是真实的值。可以对比真实值与预测值之间的差异,可以计算当前模型衡量的指标值。 这里精度的表示:(136+138)/(136+13+9+138)。之前有提到 ...