kappa系数

本文转载自查看原文 2019-09-04 16:28 1419 python/ 机器学习/ sklearn机器学习/ sklearn/ kappa

python金融风控评分卡模型和数据分析微专业课（博主亲自录制视频）：http://dwz.date/b9vv

python脚本

"""
项目合作QQ:231469242
这个系数的取值范围是[-1,1]，实际应用中，一般是[0,1]
这个系数的值越高，则代表模型实现的分类准确度越高
"""

def kappa(matrix):
    n = np.sum(matrix)
    sum_po = 0
    sum_pe = 0
    for i in range(len(matrix[0])):
        sum_po += matrix[i][i]
        row = np.sum(matrix[i, :])
        col = np.sum(matrix[:, i])
        sum_pe += row * col
    po = sum_po / n
    pe = sum_pe / (n * n)
    # print(po, pe)
    return (po - pe) / (1 - pe)
#其中，matrix是一个方阵，若共有i个类别，则matrix.shape = (i,i). 
#用下面的代码进行测试:

import numpy as np
matrix = [
    [239,21,16],
    [16,73,4],
    [6,9,280]]

matrix = np.array(matrix)
print(kappa(matrix))

参考链接： https://blog.csdn.net/wang7807564/article/details/80252362

引言

分类是机器学习中监督学习的一种重要应用，基于统计的机器学习方法可以使用SVM进行二分类，可以使用决策书，梯度提升树等进行多分类。
对于二分类模型，我们通常可以使用ROC曲线来评估模型的预测效果。这里，我们介绍一下在多分类中衡量模型评估准确度的一种方法–kappa系数评估方法。

Kappa系数

首先，我们介绍一下kappa系数：
kappa系数是用在统计学中评估一致性的一种方法，我们可以用他来进行多分类模型准确度的评估，这个系数的取值范围是[-1,1]，实际应用中，一般是[0,1]，与ROC曲线中一般不会出现下凸形曲线的原理类似。
这个系数的值越高，则代表模型实现的分类准确度越高。kappa系数的计算方法可以这样来表示：

python机器学习生物信息学系列课（博主录制）：http://dwz.date/b9vw

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 FLeiss Kappa系数和Kappa系数的Python实现分类结果评价指标——Kappa系数 kappa系数在大数据评测中的应用 10. 混淆矩阵、总体分类精度、Kappa系数【一致性检验指标】Kappa(cappa)系数 Kappa(cappa)系数只需要看这一篇就够了，算法到python实现 Lambda架构 vs Kappa架构 Lambda架构 VS Kappa架构二：大数据架构回顾-Kappa架构一致性检验的几种方式--ICC、kappa、weighted kappa、Kendall