二分類問題

本文轉載自查看原文 2019-12-26 11:05 5808 深度學習

二分類問題示例：

首先我們從一個問題開始說起，這里有一個二分類問題的例子，假如你有一張圖片作為輸入，比如這只貓，如果識別這張圖片為貓，則輸出標簽1作為結果；如果識別出不是貓，那么輸出標簽0作為結果（這也就是著名的cat和non cat問題）。現在我們可以用字母y來表示輸出的結果標簽，如下圖所示：

我們來看看一張圖片在計算機中是如何表示的，為了保存一張圖片，需要保存三個 矩陣（矩陣的概念，一定要清楚，不清楚的需要去看看線性代數了，補充下），它們分別對應圖片中的紅、綠、藍三種顏色通道，如果你的圖片大小為64x64像素，那么你就有三個規模為64x64的矩陣，分別對應圖片中紅、綠、藍三種像素的強度值。為了便於表示，這里我畫了三個很小的矩陣，注意它們的規模為5x4 而不是64x64，如下圖所示：

為了把這些像素值放到一個 特征向量（這個是重點，特征向量！這個是后面很多神經網絡的核心思維！）中，我們需要把這些像素值提取出來，然后放入一個特征向量x。為了把這些像素值轉換為特征向量 x，我們需要像下面這樣定義一個特征向量 x 來表示這張圖片，我們把所有的像素都取出來，例如255、231等等，直到取完所有的紅色像素，接着最后是255、134、…、255、134等等，直到得到一個特征向量，把圖片中所有的紅、綠、藍像素值都列出來。（ 可以想象成把所有畫素值並成一列或者一排，這里最好理解成一列，因為后續的思路是按列來看的），如果圖片的大小為64x64像素，那么向量 x 的總維度，將是64乘以64乘以3，這是三個像素矩陣中像素的總量。

在這個例子中維度為12,288。現在我們用n_x=12,288，來表示輸入特征向量的維度，有時候為了簡潔，我會直接用小寫的n來表示輸入特征向量x的維度。所以在二分類問題中，我們的目標就是習得一個分類器，它以圖片的特征向量作為輸入，然后預測輸出結果y為1還是0，也就是預測圖片中是否有貓：

接下來我們說明一些在余下課程中，需要用到的一些符號。

符號定義：

x：表示一個n_x維數據，為輸入數據，維度為(n_x,1)；

y：表示輸出結果，取值為(0,1)（取值問題，一定要注意，這個是后期輸出值的把控重點！）；

(x^(i),y^(i))（代表x的（i）上標，y的（i）上標）：表示第i組數據，可能是訓練數據，也可能是測試數據，此處默認為訓練數據；

X=[x^(1),x^(2),...,x^(m)]：表示所有的訓練數據集的輸入值，放在一個 n_x×m的矩陣中，其中m表示樣本數目;

Y=[y^(1),y^(2),...,y^(m)]：對應表示所有訓練數據集的輸出值，維度為1×m。

此處方便理解，特意截圖出來，希望能了解！

用一對(x,y)來表示一個單獨的樣本，x代表n_x維的特征向量，y 表示標簽(輸出結果)只能為0或1。而訓練集將由m個訓練樣本組成，其中(x^(1),y^(1))表示第一個樣本的輸入和輸出，(x^(2),y^(2))表示第二個樣本的輸入和輸出，直到最后一個樣本(x^(m),y^(m))，然后所有的這些一起表示整個訓練集。有時候為了強調這是訓練樣本的個數，會寫作M_train，當涉及到測試集的時候，我們會使用M_test來表示測試集的樣本數，所以這是測試集的樣本數：

最后為了能把訓練集表示得更緊湊一點，我們會定義一個矩陣用大寫X的表示，它由輸入向量x^(1)、x^(2)等組成，如下圖放在矩陣的列中，所以現在我們把x^(1)作為第一列放在矩陣中，x^(2)作為第二列，x^(m)放到第m列，然后我們就得到了訓練集矩陣X。所以這個矩陣有m列，m是訓練集的樣本數量，然后這個矩陣的高度記為n_x，注意有時候可能因為其他某些原因，矩陣X會由訓練樣本按照行堆疊起來而不是列，如下圖所示：x^(1)的轉置直到x^(m)的轉置，但是在實現神經網絡的時候，使用左邊的這種形式，會讓整個實現的過程變得更加簡單

現在來簡單溫習一下:X是一個規模為n_x乘以m的矩陣，當你用Python實現的時候，你會看到X.shape，這是一條Python命令，用於顯示矩陣的規模，即X.shape等於(n_x,m)，X是一個規模為n_x乘以m的矩陣。所以綜上所述，這就是如何將訓練樣本（輸入向量X的集合）表示為一個矩陣。

那么輸出標簽y呢？同樣的道理，為了能更加容易地實現一個神經網絡，將標簽y放在列中將會使得后續計算非常方便，所以我們定義大寫的Y等於y^(1),y^(2),...,y^(m)，所以在這里是一個規模為1乘以m的矩陣，同樣地使用Python將表示為Y.shape等於(1,m)，表示這是一個規模為1乘以m的矩陣。

鏈接：https://www.jianshu.com/p/91a683e38172

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 二分類 25、二分類、多分類與多標簽問題的區別邏輯回歸的MATLAB實現(二分類問題) 深度學習之電影二分類的情感問題二分類問題 - 【老魚學tensorflow2】二分類問題泛化誤差上界的詳細證明 2.邏輯回歸關於二分類問題的理解 K-means實現二分類問題二分類問題的評價指標：ROC，AUC Kaggle實戰之二分類問題