【文章推荐】评分卡系列（三）：分类学习器的评估

原文：评分卡系列（三）：分类学习器的评估

作者：JSong 时间： . . 评分卡可以用来预测客户的好坏。当一个评分卡已经构建完成，并且有一组个人分数和其对应的好坏状态的数据时，我们想知道所构建的评分卡是否可靠可靠程度如何而这取决于如何去定义这个好字。一般有三种角度可以来评估：评分卡分类划分的准确程度，如错误率准确率召回率 F 评分卡的判别能力，评估评分卡将好人和坏人分离开的程度，如KS统计量 ROC曲线 GINI系数评分 ...

2018-01-14 20:30 0 5620 推荐指数：

查看详情

文本分类学习 （四）特征选择之卡方检验

序，选择排名靠前的特征来表示文本。目录：文本分类学习（一）开篇文本分类学习（二 ...

IMDB情感分类学习

需要学习链接：使用pandas做预处理，https://blog.csdn.net/mpk_no1/article/details/71698725 https://www.jianshu.com/p/8d3f929c9444 1.想法： 1.首先是要读取数据集，建立字典，将word转为 ...

文本分类学习 （五）机器学习SVM的前奏-特征提取（卡方检验续集）

前言：上一篇比较详细的介绍了卡方检验和卡方分布。这篇我们就实际操刀，找到一些训练集，正所谓纸上得来终觉浅，绝知此事要躬行。然而我在躬行的时候，发现了卡方检验对于文本分类来说应该把公式再变形一般，那样就完美了。目录：文本分类学习（一）开篇文本分类学习（二）文本表示 ...

文本分类学习 （八）SVM 入门之线性分类器

SVM 和线性分类器是分不开的。因为SVM的核心：高维空间中，在线性可分（如果线性不可分那么就使用核函数转换为更高维从而变的线性可分）的数据集中寻找一个最优的超平面将数据集分隔开来。所以要理解SVM首先要明白的就是线性可分和线性分类器。可以先解释这张图，通过这张图就可以了解线性 ...

文本分类学习（二）文本表示

接着上一篇。在正式的尝试使用文本分类算法分类文本的时候，我们得先准备两件事情: 一，准备适量的训练文本；二，选择合适的方法将这些训练文本进行表示（也就是将文本换一种方式表示）大家都知道文本其实就是很多词组成的文章啊。所以很自然的就想到用一系列词来表示文本。比如我这篇文章，将其分词之后 ...

文本分类学习（六） AdaBoost和SVM

直接从特征提取，跳到了BoostSVM，是因为自己一直在写程序，分析垃圾文本，和思考文本分类用于识别垃圾文本的短处。自己学习文本分类就是为了识别垃圾文本。中间的博客待自己研究透彻后再补上吧。因为获取垃圾文本的时候，发现垃圾文本不是简单的垃圾文本，它们具有多个特性： 1. 种类繁多 ...

评分卡系列（二）：特征工程

导入数据，这里我将逾期15天以上的都当作正类 1、评分卡简介在进行下一步操作之前，我们先来解 ...

机器学习之多分类学习

一、问题描述现实中常遇到多分类学习任务，有些二分类学习方法可直接推广到多分类，但在更多情况下，我们是基于一些基本策略，利用二分类学习器来解决多分类问题。假设有N个类别C1，C2,......，CN，多分类学习的基本思路是“拆解法”，即将多分类任务拆分为若干个二分类任务 ...

原文：评分卡系列（三）：分类学习器的评估

相关推荐

相关标签