混淆矩陣


https://blog.csdn.net/vesper305/article/details/44927047

Confusion Matrix

在機器學習領域,混淆矩陣(confusion matrix),又稱為可能性表格或是錯誤矩陣。它是一種特定的矩陣用來呈現算法性能的可視化效果,通常是監督學習(非監督學習,通常用匹配矩陣:matching matrix)。其每一列代表預測值,每一行代表的是實際的類別。這個名字來源於它可以非常容易的表明多個類別是否有混淆(也就是一個class被預測成另一個class)。

 

Example

假設有一個用來對貓(cats)、狗(dogs)、兔子(rabbits)進行分類的系統,混淆矩陣就是為了進一步分析性能而對該算法測試結果做出的總結。假設總共有 27 只動物:8只貓, 6條狗, 13只兔子。結果的混淆矩陣如下圖:


在這個混淆矩陣中,實際有 8只貓,但是系統將其中3只預測成了狗;對於 6條狗,其中有 1條被預測成了兔子,2條被預測成了貓。從混淆矩陣中我們可以看出系統對於區分貓和狗存在一些問題,但是區分兔子和其他動物的效果還是不錯的。所有正確的預測結果都在對角線上,所以從混淆矩陣中可以很方便直觀的看出哪里有錯誤,因為他們呈現在對角線外面。

下圖的來源:【小萌五分鍾】機器學習 | 混淆矩陣 Confusion Matrix_嗶哩嗶哩_bilibili

 

 看右下角的矩陣:主對角線上薄荷綠的兩塊說明是預測對了,所以是以True開頭的,非主對角線上橙色的兩塊說明是預測錯誤的,所以是以False開頭的。另外,第一行都是預測成“是(漢堡)”了,所以第一行的第二個單詞都是Positive,第二行都是預測成“不是(漢堡)”了,所以第一行的第二個單詞都是Negative.

上圖是對於二分類而言的混淆矩陣,那對於多分類呢?

3個類別的話就是3*3的矩陣。

 

 如果是N分類呢?

 

 我們總是希薄荷綠位置的數值盡可能的大,其余的地方的數值盡可能的小,這樣才說明預測的正確性高。才能說明模型的效果是更好的。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM