原文:模型區分度衡量指標-KS值

.KS值 學習器將正例和反例分開的能力,確定最好的 截斷點 KS曲線和ROC曲線都用到了TPR,FPR。KS曲線是把TPR和FPR都作為縱坐標,而樣本數作為橫坐標。但是AUC只評價了模型的整體訓練效果,並沒有指出如何划分類別讓預估的效果達到最好。不同之處在於,ks取的是TPR和FPR差值的最大值。偽陽性率 FPR :判定為正例卻不是真正例的比率真陽性率 TPR :判定為正例也是真正例的比率偽陰性 ...

2019-09-25 10:04 0 2515 推薦指數:

查看詳情

索引的區分度

首先 索引長度和區分度是相互矛盾的, 索引長度太短,那么區分度就很低,吧索引長度加長,區分度就高,但是索引也是要占內存的,所以我們需要找到一個平衡點; 那么這個平衡點怎么來定? 比如用戶表有個字段 username ,要給他加索引,問題是索引長度多少合適? 其實我們知道 百家姓里面 ...

Sun Aug 09 20:00:00 CST 2020 0 918
【轉】風控中的特征評價指標(三)——KS

轉自:https://zhuanlan.zhihu.com/p/79934510 風控業務背景 在風控中,我們常用KS指標來評估模型區分度(discrimination)。這也是風控模型同學最為追求的指標之一。那么,有多少人真正理解KS背后的內涵?本文將從區分度的概念、KS的計算方法、業務 ...

Tue Jan 05 01:22:00 CST 2021 0 738
使用python獲得N個區分度較高的RGB顏色

獲得任意N個區分度最高的RGB顏色是一個經典的問題,之前在做一些可視化的東西時需要解決這個問題。首先去網上找了一些方法,未果,於是想自己來搞,心里的想法是,先給出一個距離函數用來度量兩個RGB顏色區分度,然后再通過隨機和貪心的方式依次獲得N個顏色。如果要這樣搞的話,距離函數的定義 ...

Wed Jun 05 16:48:00 CST 2019 0 1153
mysql 索引長度和區分度

首先 索引長度和區分度是相互矛盾的, 索引長度太短,那么區分度就很低,吧索引長度加長,區分度就高,但是索引也是要占內存的,所以我們需要找到一個平衡點; 那么這個平衡點怎么來定? 比如用戶表有個字段 username ,要給他加索引,問題是索引長度多少合適? 其實我們知道 ...

Mon Jun 22 17:02:00 CST 2020 0 766
MySQL 索引長度和區分度

首先 索引長度和區分度是相互矛盾的, 索引長度太短,那么區分度就很低,吧索引長度加長,區分度就高,但是索引也是要占內存的,所以我們需要找到一個平衡點; 那么這個平衡點怎么來定? 比如用戶表有個字段 username ,要給他加索引,問題是索引長度多少合適? 其實我們知道 百家姓里面 ...

Mon Feb 13 00:46:00 CST 2017 0 7716
聚類算法的衡量指標

聚類算法的衡量指標 混淆矩陣 均一性 一個簇中只包含一個類別的樣本,則滿足均一性;其實也可以認為就是正確率(每個聚簇中正確分類的樣本數占該聚簇總樣本數的比例和): 完整性 同類別樣本被歸類到相同簇中,則滿足完整性;每個聚簇中正確分類的樣本數占該類 ...

Fri Aug 09 02:41:00 CST 2019 0 1314
代碼質量衡量指標

目錄 1 代碼質量衡量指標 參考資料 1 代碼質量衡量指標 SQALE(Software Quality Assessment based on Lifecycle Expectations)方法整合了ISO-25010標准與代碼規范,其目標是:以客觀、准確 ...

Wed Jul 28 23:48:00 CST 2021 0 183
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM