二分類問題示例:
首先我們從一個問題開始說起,這里有一個二分類問題的例子,假如你有一張圖片作為輸入,比如這只貓,如果識別這張圖片為貓,則輸出標簽1作為結果;如果識別出不是貓,那么輸出標簽0作為結果(這也就是著名的cat和non cat問題)。現在我們可以用字母y來表示輸出的結果標簽,如下圖所示:
接下來我們說明一些在余下課程中,需要用到的一些符號。
符號定義 :
x:表示一個n_x維數據,為輸入數據,維度為(n_x,1);
y:表示輸出結果,取值為(0,1)(取值問題,一定要注意,這個是后期輸出值的把控重點!);
(x^(i),y^(i))(代表x的(i)上標,y的(i)上標):表示第i組數據,可能是訓練數據,也可能是測試數據,此處默認為訓練數據;
X=[x^(1),x^(2),...,x^(m)]:表示所有的訓練數據集的輸入值,放在一個 n_x×m的矩陣中,其中m表示樣本數目;
Y=[y^(1),y^(2),...,y^(m)]:對應表示所有訓練數據集的輸出值,維度為1×m。
此處方便理解,特意截圖出來,希望能了解!
現在來簡單溫習一下:X是一個規模為n_x乘以m的矩陣,當你用Python實現的時候,你會看到X.shape,這是一條Python命令,用於顯示矩陣的規模,即X.shape等於(n_x,m),X是一個規模為n_x乘以m的矩陣。所以綜上所述,這就是如何將訓練樣本(輸入向量X的集合)表示為一個矩陣。
那么輸出標簽y呢?同樣的道理,為了能更加容易地實現一個神經網絡,將標簽y放在列中將會使得后續計算非常方便,所以我們定義大寫的Y等於y^(1),y^(2),...,y^(m),所以在這里是一個規模為1乘以m的矩陣,同樣地使用Python將表示為Y.shape等於(1,m),表示這是一個規模為1乘以m的矩陣。
