原文:评分卡系列(三):分类学习器的评估

作者:JSong 时间: . . 评分卡可以用来预测客户的好坏。当一个评分卡已经构建完成,并且有一组个人分数和其对应的好坏状态的数据时,我们想知道所构建的评分卡是否可靠 可靠程度如何 而这取决于如何去定义这个 好 字。一般有三种角度可以来评估: 评分卡分类划分的准确程度,如错误率 准确率 召回率 F 评分卡的判别能力,评估评分卡将好人和坏人分离开的程度,如KS统计量 ROC曲线 GINI系数 评分 ...

2018-01-14 20:30 0 5620 推荐指数:

查看详情

IMDB情感分类学习

需要学习链接: 使用pandas做预处理,https://blog.csdn.net/mpk_no1/article/details/71698725 https://www.jianshu.com/p/8d3f929c9444 1.想法: 1.首先是要读取数据集,建立字典,将word转为 ...

Tue Mar 03 08:26:00 CST 2020 0 634
文本分类学习 (五) 机器学习SVM的前奏-特征提取(方检验续集)

前言: 上一篇比较详细的介绍了方检验和方分布。这篇我们就实际操刀,找到一些训练集,正所谓纸上得来终觉浅,绝知此事要躬行。然而我在躬行的时候,发现了方检验对于文本分类来说应该把公式再变形一般,那样就完美了。 目录: 文本分类学习(一)开篇 文本分类学习(二)文本表示 ...

Mon Apr 23 18:51:00 CST 2018 3 5606
文本分类学习 (八)SVM 入门之线性分类器

SVM 和线性分类器是分不开的。因为SVM的核心:高维空间中,在线性可分(如果线性不可分那么就使用核函数转换为更高维从而变的线性可分)的数据集中寻找一个最优的超平面将数据集分隔开来。 所以要理解SVM首先要明白的就是线性可分和线性分类器。 可以先解释这张图,通过这张图就可以了解线性 ...

Thu May 31 22:00:00 CST 2018 0 1461
文本分类学习(二)文本表示

接着上一篇。在正式的尝试使用文本分类算法分类文本的时候,我们得先准备两件事情: 一,准备适量的训练文本;二,选择合适的方法将这些训练文本进行表示(也就是将文本换一种方式表示) 大家都知道文本其实就是很多词组成的文章啊。所以很自然的就想到用一系列词来表示文本。比如我这篇文章,将其分词之后 ...

Sun Apr 01 00:58:00 CST 2018 1 1014
文本分类学习(六) AdaBoost和SVM

直接从特征提取,跳到了BoostSVM,是因为自己一直在写程序,分析垃圾文本,和思考文本分类用于识别垃圾文本的短处。自己学习文本分类就是为了识别垃圾文本。 中间的博客待自己研究透彻后再补上吧。 因为获取垃圾文本的时候,发现垃圾文本不是简单的垃圾文本,它们具有多个特性: 1. 种类繁多 ...

Wed May 09 00:18:00 CST 2018 0 1934
评分系列(二):特征工程

导入数据,这里我将逾期15天以上的都当作正类 1、评分简介 在进行下一步操作之前,我们先来解 ...

Mon Jan 15 03:37:00 CST 2018 4 11810
机器学习之多分类学习

一、问题描述 现实中常遇到多分类学习任务,有些二分类学习方法可直接推广到多分类,但在更多情况下,我们是基于一些基本策略,利用二分类学习来解决多分类问题。 假设有N个类别C1,C2,......,CN,多分类学习的基本思路是“拆解法”,即将多分类任务拆分为若干个二分类任务 ...

Sun Jul 14 19:29:00 CST 2019 0 393
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM