二分類問題


二分類問題示例:

首先我們從一個問題開始說起,這里有一個二分類問題的例子,假如你有一張圖片作為輸入,比如這只貓,如果識別這張圖片為貓,則輸出標簽1作為結果;如果識別出不是貓,那么輸出標簽0作為結果(這也就是著名的cat和non cat問題)。現在我們可以用字母y來表示輸出的結果標簽,如下圖所示:


我們來看看一張圖片在計算機中是如何表示的,為了保存一張圖片,需要保存三個 矩陣(矩陣的概念,一定要清楚,不清楚的需要去看看線性代數了,補充下),它們分別對應圖片中的紅、綠、藍三種顏色通道,如果你的圖片大小為64x64像素,那么你就有三個規模為64x64的矩陣,分別對應圖片中紅、綠、藍三種像素的強度值。為了便於表示,這里我畫了三個很小的矩陣,注意它們的規模為5x4 而不是64x64,如下圖所示:

 

 

為了把這些像素值放到一個 特征向量(這個是重點,特征向量!這個是后面很多神經網絡的核心思維!)中,我們需要把這些像素值提取出來,然后放入一個特征向量x。為了把這些像素值轉換為特征向量 x,我們需要像下面這樣定義一個特征向量 x 來表示這張圖片,我們把所有的像素都取出來,例如255、231等等,直到取完所有的紅色像素,接着最后是255、134、…、255、134等等,直到得到一個特征向量,把圖片中所有的紅、綠、藍像素值都列出來。( 可以想象成把所有畫素值並成一列或者一排,這里最好理解成一列,因為后續的思路是按列來看的),如果圖片的大小為64x64像素,那么向量 x 的總維度,將是64乘以64乘以3,這是三個像素矩陣中像素的總量。
 
在這個例子中維度為12,288。現在我們用n_x=12,288,來表示輸入特征向量的維度,有時候為了簡潔,我會直接用小寫的n來表示輸入特征向量x的維度。所以在二分類問題中,我們的目標就是習得一個分類器,它以圖片的特征向量作為輸入,然后預測輸出結果y為1還是0,也就是預測圖片中是否有貓:

 

 

接下來我們說明一些在余下課程中,需要用到的一些符號。

符號定義 :

x:表示一個n_x維數據,為輸入數據,維度為(n_x,1);

y:表示輸出結果,取值為(0,1)(取值問題,一定要注意,這個是后期輸出值的把控重點!)

(x^(i),y^(i))(代表x的(i)上標,y的(i)上標):表示第i組數據,可能是訓練數據,也可能是測試數據,此處默認為訓練數據;

X=[x^(1),x^(2),...,x^(m)]:表示所有的訓練數據集的輸入值,放在一個 n_x×m的矩陣中,其中m表示樣本數目;

Y=[y^(1),y^(2),...,y^(m)]:對應表示所有訓練數據集的輸出值,維度為1×m。

此處方便理解,特意截圖出來,希望能了解!

 

 

用一對(x,y)來表示一個單獨的樣本,x代表n_x維的特征向量,y 表示標簽(輸出結果)只能為0或1。 而訓練集將由m個訓練樣本組成,其中(x^(1),y^(1))表示第一個樣本的輸入和輸出,(x^(2),y^(2))表示第二個樣本的輸入和輸出,直到最后一個樣本(x^(m),y^(m)),然后所有的這些一起表示整個訓練集。有時候為了強調這是訓練樣本的個數,會寫作M_train,當涉及到測試集的時候,我們會使用M_test來表示測試集的樣本數,所以這是測試集的樣本數:

 

 

最后為了能把訓練集表示得更緊湊一點,我們會定義一個矩陣用大寫X的表示,它由輸入向量x^(1)、x^(2)等組成,如下圖放在矩陣的列中,所以現在我們把x^(1)作為第一列放在矩陣中,x^(2)作為第二列,x^(m)放到第m列,然后我們就得到了訓練集矩陣X。所以這個矩陣有m列,m是訓練集的樣本數量,然后這個矩陣的高度記為n_x,注意有時候可能因為其他某些原因,矩陣X會由訓練樣本按照行堆疊起來而不是列,如下圖所示:x^(1)的轉置直到x^(m)的轉置,但是在實現神經網絡的時候,使用左邊的這種形式,會讓整個實現的過程變得更加簡單

 

 

現在來簡單溫習一下:X是一個規模為n_x乘以m的矩陣,當你用Python實現的時候,你會看到X.shape,這是一條Python命令,用於顯示矩陣的規模,即X.shape等於(n_x,m),X是一個規模為n_x乘以m的矩陣。所以綜上所述,這就是如何將訓練樣本(輸入向量X的集合)表示為一個矩陣。

那么輸出標簽y呢?同樣的道理,為了能更加容易地實現一個神經網絡,將標簽y放在列中將會使得后續計算非常方便,所以我們定義大寫的Y等於y^(1),y^(2),...,y^(m),所以在這里是一個規模為1乘以m的矩陣,同樣地使用Python將表示為Y.shape等於(1,m),表示這是一個規模為1乘以m的矩陣。

 

 

鏈接:https://www.jianshu.com/p/91a683e38172


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM