問題描述:
沒有隱藏層的softmax網絡,g就是softmax激活函數
決策邊界是線性的(圖片來自吳恩達的深度學習視頻)
首先說明兩點問題:
1,決策邊界上softmax對任兩類的輸出概率是相等的,即對於邊界上任一點X,softmax輸出的概率向量上的對應分量相等。由softmax計算定義可知,zi=wi*X+bi=zj=wj*X+bj. 這里wi和wj是權重矩陣第i,j行。
2,邊界是線性的等價於 對邊界上任意兩點X1,X2,他們的線性組合X0=t*X1+s*X2仍然在決策邊界上,這里t+s=1.
下面開始證明沒有隱藏層的softmax網絡的決策邊界是線性的:
從softmax的決策邊界上任取兩點X1,X2, 由上面的敘述1可知,w1*X+b1=w2*X+b2,即(w1-w2)*X=b2-b1.
再任取一點X0=t*X1+s*X2,s+t=1,則softmax對X0的計算得z1=w1*X0+b1,z2=w2*X0+b2, 下面證明z1=z2.
z1-z2=w1*X0+b1-(w2*X0+b2)=t*(w1-w2)*X1+s*(w1-w2)*X2-(b1-b2)=t*(b2-b1)+s*(b2-b1)-(b1-b2)=0.
所以,z1=z2,即X0也在決策邊界上。
注:上面這種證明方法也可以用於證明其他分類器(比如線性回歸和邏輯回歸分類器)的決策邊界是線性的,這是一種一般性方法。