一、任务基础 数据集包含由欧洲人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔被盗刷。数据集非常不平衡,正例(被盗刷)占所有交易的0.172%。,这是因为由于保密问题,我们无法提供有关数据的原始功能和更多背景信息。特征V1,V2 ...
导入类库 作图函数 数据获取与解析 数据为结构化数据,不需要抽特征转化, 但特征Time和Amount的数据规格和其他特征不一样, 需要对其做特征做特征缩放 特征工程 特征转换 将时间从单位每秒化为单位每小时 divmod , 结果: , 元组, 为商, 为余数 特征选择 特征缩放 Amount变量和Time变量的取值范围与其他变量相差较大, 所以要对其进行特征缩放 特征重要性排序 对特征的重要性 ...
2018-10-18 14:38 0 1144 推荐指数:
一、任务基础 数据集包含由欧洲人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔被盗刷。数据集非常不平衡,正例(被盗刷)占所有交易的0.172%。,这是因为由于保密问题,我们无法提供有关数据的原始功能和更多背景信息。特征V1,V2 ...
六、混淆矩阵: 混淆矩阵是由一个坐标系组成的,有x轴以及y轴,在x轴里面有0和1,在y轴里面有0和1。x轴表达的是预测的值,y轴表达的是真实的值。可以对比真实值与预测值之间的差异,可以计算当前模型衡 ...
一,课题研究与背景介绍: 1,课题研究: 利用信用卡历史数据进行机器建模,构建反欺诈模型,预测新的信用卡被盗刷的可能性。 2,背景介绍: 数据集包含由欧洲人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔被盗刷。数据集非常不平衡 ...
...
python数据分析个人学习读书笔记-目录索引 第6章--逻辑回归项目实战 ——信用卡欺诈检测 本章从实战的角度出发,以真实数据集为背景,一步步讲解如何使用Python工具包进行实际数据分析与建模工作。 6.1数据分析与预处理 假设有一份信用卡交易记录,遗憾的是数据经过了脱敏 ...
本文是对100天搞定机器学习|Day33-34 随机森林的补充 前文对随机森林的概念、工作原理、使用方法做了简单介绍,并提供了分类和回归的实例。 本期我们重点讲一下: 1、集成学习、Bagging和随机森林概念及相互关系 2、随机森林参数解释及设置建议 3、随机森林模型调参实战 4、随机森林模型 ...
项目名称:金融反欺诈(信用卡盗刷) 项目概述:本项目通过利用信用卡的历史交易数据进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 项目背景:数据包含了由欧洲持卡人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284807笔交易中有492笔 ...
地址:https://www.kaggle.com/mlg-ulb/creditcardfraud 数据概述 数据集包含2013年9月欧洲持卡人通过信用卡进行的交易。该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。数据集高度不平衡,阳性类别(欺诈)占所有交易 ...