R語言實現擬合神經網絡預測和結果可視化

本文轉載自查看原文 2019-09-15 14:35 723

原文鏈接：http://tecdat.cn/?p=6691

神經網絡一直是迷人的機器學習模型之一，不僅因為花哨的反向傳播算法，而且還因為它們的復雜性（考慮到許多隱藏層的深度學習）和受大腦啟發的結構。

神經網絡並不總是流行，部分原因是它們在某些情況下仍然存在計算成本高昂，部分原因是與支持向量機（SVM）等簡單方法相比，它們似乎沒有產生更好的結果。然而，神經網絡再一次引起了人們的注意並變得流行起來。

在這篇文章中，我們將擬合神經網絡，並將線性模型作為比較。

數據集

波士頓數據集是波士頓郊區房屋價值數據的集合。我們的目標是使用所有其他可用的連續變量來預測自住房屋（medv）的中值。

首先，我們需要檢查是否缺少數據點，否則我們需要修復數據集。

apply（data，2，function（x）sum（is.na（x）））

然后我們擬合線性回歸模型並在測試集上進行測試。

index < -  sample（1：nrow（data），round（0.75 * nrow（data）））
   MSE.lm < -  sum（（pr.lm  -  test $ medv）^ 2）/ nrow（test）

該sample(x,size)函數簡單地從向量輸出指定大小的隨機選擇樣本的向量x。

准備適應神經網絡

在擬合神經網絡之前，需要做一些准備工作。神經網絡不容易訓練和調整。

作為第一步，我們將解決數據預處理問題。
因此，我們在繼續之前分割數據：

maxs < -  apply（data，2，max） 
 scaled < -  as.data.frame（scale（data，center = mins，scale = maxs  -  mins））
train_ < -  scaled [index，]
test_ < -  scaled [-index，]

請注意，scale返回需要強制轉換為data.frame的矩陣。

參數

據我所知，雖然有幾個或多或少可接受的經驗法則，但沒有固定的規則可以使用多少層和神經元。通常，如果有必要，一個隱藏層足以滿足大量應用程序的需要。就神經元的數量而言，它應該在輸入層大小和輸出層大小之間，通常是輸入大小的2/3

該hidden參數接受一個包含每個隱藏層的神經元數量的向量，而該參數linear.output用於指定我們是否要進行回歸linear.output=TRUE或分類linear.output=FALSE

Neuralnet包提供了繪制模型的好工具：

plot（nn）

這是模型的圖形表示，每個連接都有權重：

黑色線條顯示每個層與每個連接上的權重之間的連接，而藍線顯示每個步驟中添加的偏差項。偏差可以被認為是線性模型的截距。

使用神經網絡預測medv

現在我們可以嘗試預測測試集的值並計算MSE。

pr.nn < -  compute（nn，test _ [，1：13]）

然后我們比較兩個MSE

顯然，在預測medv時，網絡比線性模型做得更好。再一次，要小心，因為這個結果取決於上面執行的列車測試分割。下面，在視覺圖之后，我們將進行快速交叉驗證，以便對結果更有信心。
下面繪制了網絡性能和測試集上的線性模型的第一種可視方法

輸出圖

通過目視檢查圖，我們可以看到神經網絡的預測（通常）在線周圍更加集中（與線的完美對齊將表明MSE為0，因此是理想的完美預測），而不是由線性模型。

下面繪制了一個可能更有用的視覺比較：

交叉驗證

交叉驗證是構建預測模型的另一個非常重要的步驟。雖然有不同類型的交叉驗證方法

然后通過計算平均誤差，我們可以掌握模型的運作方式。

我們將使用神經網絡的for循環和線性模型cv.glm()的boot包中的函數來實現快速交叉驗證。
據我所知，R中沒有內置函數在這種神經網絡上進行交叉驗證，如果你知道這樣的函數，請在評論中告訴我。以下是線性模型的10倍交叉驗證MSE：

 
lm.fit < - glm（medv~。，data = data）

請注意，我正在以這種方式分割數據：90％的訓練集和10％的測試集以隨機方式進行10次。我也正在使用plyr庫初始化進度條，因為我想要密切關注過程的狀態，因為神經網絡的擬合可能需要一段時間。

過了一會兒，過程完成，我們計算平均MSE並將結果繪制成箱線圖

 
cv.error
10.32697995
17.640652805 6.310575067 15.769518577 5.730130820 10.520947119 6.121160840
6.389967211 8.004786424 17.369282494 9.412778105

上面的代碼輸出以下boxplot：

神經網絡的平均MSE（10.33）低於線性模型的MSE，盡管交叉驗證的MSE似乎存在一定程度的變化。這可能取決於數據的分割或網絡中權重的隨機初始化。

關於模型可解釋性的最后說明

神經網絡很像黑盒子：解釋它們的結果要比解釋簡單模型（如線性模型）的結果要困難得多。因此，根據您需要的應用程序類型，您可能也想考慮這個因素。此外，正如您在上面所看到的，需要格外小心以適應神經網絡，小的變化可能導致不同的結果。

如果您有任何疑問，請在下面發表評論。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 神經網絡一（用tensorflow搭建簡單的神經網絡並可視化）拓端tecdat|R語言實現CNN（卷積神經網絡）模型進行回歸數據分析 BERT大火卻不懂Transformer？讀這一篇就夠了原版可視化機器學習可視化神經網絡可視化深度學習 R語言神經網絡算法 Deep Learning基礎--26種神經網絡激活函數可視化『cs231n』卷積神經網絡的可視化與進一步理解拓端tecdat：R語言用加性多元線性回歸、隨機森林、彈性網絡模型預測鮑魚年齡和可視化 R語言可視化之箱圖 R語言AMORE包實現BP神經網絡——German數據集拓端tecdat|R語言復雜網絡分析：聚類（社區檢測）和可視化