神經網絡預測mnist時候如果不歸一化,則准確率僅僅10%下文作者svm也遇到了。

本文轉載自查看原文 2017-11-22 19:39 3253 機器學習

轉自：http://blog.csdn.net/jeryjeryjery/article/details/72649320

這兩天用Python來實現手寫數字識別，剛開始用原始數據進行訓練，結果預測結果都是同一個類別，全部是對應數字1。正確率也只有10%左右，下面是代碼及運行結果截圖：
這里寫圖片描述

預測結果都是數字1。

數據歸一化是指將特征值從一個大范圍映射到[0,1]或者[-1,1]，如果原始值都是正數，則建議選擇映射到[0,1]；如果原始值有正數又有負數，則建議映射到[-1,1]；具體情況需要具體分析。映射到[0,1]的實現是:

n e w_v a l u e = v a l u e - m i n _ v a l u e m a x _ v a l

這樣就能實現從原來的范圍映射到[0,1]之間。
libsvm中提供了數據歸一化工具，就是svm-scale這個工具。如果你的數據文件已經滿足了svm的格式要求，即

下面以數據源train.txt為例，將其歸一化到[0,1]，並存入到train-to-one.txt中，語句截圖如下：
這里寫圖片描述

因為手寫數字圖片是由一系列的像素點組成的，像素值從0到255，所以可以讓每一個像素值除以255，從而實現映射。可以調用svm-scale來實現，也可以直接編寫java代碼來實現，然后再以歸一化之后的數據進行訓練模型並預測，其代碼和截圖如下：
歸一化數據

可以看出，准確率和速率明顯提高了，不會出現僅僅只有一類的問題。但是其中的原理，本人現在還不知道，等我理解了再解釋吧！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 神經網絡為什么要歸一化 SVM訓練結果參數說明訓練參數說明歸一化加快速度和提升准確率歸一化還原深度學習-使用cuda加速卷積神經網絡-手寫數字識別准確率99.7% 神經網絡訓練准確率一直在0.63左右徘徊問題解決方案實現手寫數字識別(數據集50000張圖片)比較3種算法神經網絡、灰度平均值、SVM各自的准確率—Jason niu 關於神經網絡（matlab）歸一化的整理神經網絡的參數初始化和批量歸一化 pytorch（十九）：MNIST打印准確率和損失使用神經網絡預測航班起飛准點率對神經網絡輸入是否做歸一化