原文地址:http://blog.csdn.net/luxiaoxun/article/details/7649945
分類:
版權聲明:本文為博主原創文章,未經博主允許不得轉載。
BP(Back Propagation)網絡是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。BP網絡能學習和存貯大量的輸入輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它的學習規則是使用最速下降法(梯度法),通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡模型拓撲結構包括輸入層(input layer)、隱層(hide layer)和輸出層(output layer)。
以下是我收集的一些關於神經網絡的文章:
神經網絡介紹——利用反向傳播算法的模式學習
http://www.ibm.com/developerworks/cn/Linux/other/l-neural/index.html
人工智能 Java 坦克機器人系列: 神經網絡,上部
http://www.ibm.com/developerworks/cn/java/j-lo-robocode3/index.html
人工智能 Java 坦克機器人系列: 神經網絡,下部
http://www.ibm.com/developerworks/cn/java/j-lo-robocode4/
使用 Python 構造神經網絡--Hopfield 網絡可以重構失真的圖案並消除噪聲
http://www.ibm.com/developerworks/cn/linux/l-neurnet/
提供一個Matlab的BP神經網絡的基礎資料
http://www.cnblogs.com/galaxyprince/archive/2010/12/20/1911157.html
http://www.codeproject.com/KB/recipes/aforge_neuro.aspx
作者已經給出好幾種形式的應用例子
以下C++代碼實現了BP網絡,通過8個3位二進制樣本對應一個期望輸出,訓練BP網絡,最后訓練好的網絡可以將輸入的三位二進制數對應輸出一位十進制數。
- //將三位二進制數轉為一位十進制數
- #include<iostream>
- #include<cmath>
- using namespace std;
- #define innode 3 //輸入結點數
- #define hidenode 10//隱含結點數
- #define outnode 1 //輸出結點數
- #define trainsample 8//BP訓練樣本數
- class BpNet
- {
- public:
- void train(double p[trainsample][innode ],double t[trainsample][outnode]);//Bp訓練
- double p[trainsample][innode]; //輸入的樣本
- double t[trainsample][outnode]; //樣本要輸出的
- double *recognize(double *p);//Bp識別
- void writetrain(); //寫訓練完的權值
- void readtrain(); //讀訓練好的權值,這使的不用每次去訓練了,只要把訓練最好的權值存下來就OK
- BpNet();
- virtual ~BpNet();
- public:
- void init();
- double w[innode][hidenode];//隱含結點權值
- double w1[hidenode][outnode];//輸出結點權值
- double b1[hidenode];//隱含結點閥值
- double b2[outnode];//輸出結點閥值
- double rate_w; //權值學習率(輸入層-隱含層)
- double rate_w1;//權值學習率 (隱含層-輸出層)
- double rate_b1;//隱含層閥值學習率
- double rate_b2;//輸出層閥值學習率
- double e;//誤差計算
- double error;//允許的最大誤差
- double result[outnode];// Bp輸出
- };
- BpNet::BpNet()
- {
- error=1.0;
- e=0.0;
- rate_w=0.9; //權值學習率(輸入層--隱含層)
- rate_w1=0.9; //權值學習率 (隱含層--輸出層)
- rate_b1=0.9; //隱含層閥值學習率
- rate_b2=0.9; //輸出層閥值學習率
- }
- BpNet::~BpNet()
- {
- }
- void winit(double w[],int n) //權值初始化
- {
- for(int i=0;i<n;i++)
- w[i]=(2.0*(double)rand()/RAND_MAX)-1;
- }
- void BpNet::init()
- {
- winit((double*)w,innode*hidenode);
- winit((double*)w1,hidenode*outnode);
- winit(b1,hidenode);
- winit(b2,outnode);
- }
- void BpNet::train(double p[trainsample][innode],double t[trainsample][outnode])
- {
- double pp[hidenode];//隱含結點的校正誤差
- double qq[outnode];//希望輸出值與實際輸出值的偏差
- double yd[outnode];//希望輸出值
- double x[innode]; //輸入向量
- double x1[hidenode];//隱含結點狀態值
- double x2[outnode];//輸出結點狀態值
- double o1[hidenode];//隱含層激活值
- double o2[hidenode];//輸出層激活值
- for(int isamp=0;isamp<trainsample;isamp++)//循環訓練一次樣品
- {
- for(int i=0;i<innode;i++)
- x[i]=p[isamp][i]; //輸入的樣本
- for(int i=0;i<outnode;i++)
- yd[i]=t[isamp][i]; //期望輸出的樣本
- //構造每個樣品的輸入和輸出標准
- for(int j=0;j<hidenode;j++)
- {
- o1[j]=0.0;
- for(int i=0;i<innode;i++)
- o1[j]=o1[j]+w[i][j]*x[i];//隱含層各單元輸入激活值
- x1[j]=1.0/(1+exp(-o1[j]-b1[j]));//隱含層各單元的輸出
- // if(o1[j]+b1[j]>0) x1[j]=1;
- //else x1[j]=0;
- }
- for(int k=0;k<outnode;k++)
- {
- o2[k]=0.0;
- for(int j=0;j<hidenode;j++)
- o2[k]=o2[k]+w1[j][k]*x1[j]; //輸出層各單元輸入激活值
- x2[k]=1.0/(1.0+exp(-o2[k]-b2[k])); //輸出層各單元輸出
- // if(o2[k]+b2[k]>0) x2[k]=1;
- // else x2[k]=0;
- }
- for(int k=0;k<outnode;k++)
- {
- qq[k]=(yd[k]-x2[k])*x2[k]*(1-x2[k]); //希望輸出與實際輸出的偏差
- for(int j=0;j<hidenode;j++)
- w1[j][k]+=rate_w1*qq[k]*x1[j]; //下一次的隱含層和輸出層之間的新連接權
- }
- for(int j=0;j<hidenode;j++)
- {
- pp[j]=0.0;
- for(int k=0;k<outnode;k++)
- pp[j]=pp[j]+qq[k]*w1[j][k];
- pp[j]=pp[j]*x1[j]*(1-x1[j]); //隱含層的校正誤差
- for(int i=0;i<innode;i++)
- w[i][j]+=rate_w*pp[j]*x[i]; //下一次的輸入層和隱含層之間的新連接權
- }
- for(int k=0;k<outnode;k++)
- {
- e+=fabs(yd[k]-x2[k])*fabs(yd[k]-x2[k]); //計算均方差
- }
- error=e/2.0;
- for(int k=0;k<outnode;k++)
- b2[k]=b2[k]+rate_b2*qq[k]; //下一次的隱含層和輸出層之間的新閾值
- for(int j=0;j<hidenode;j++)
- b1[j]=b1[j]+rate_b1*pp[j]; //下一次的輸入層和隱含層之間的新閾值
- }
- }
- double *BpNet::recognize(double *p)
- {
- double x[innode]; //輸入向量
- double x1[hidenode]; //隱含結點狀態值
- double x2[outnode]; //輸出結點狀態值
- double o1[hidenode]; //隱含層激活值
- double o2[hidenode]; //輸出層激活值
- for(int i=0;i<innode;i++)
- x[i]=p[i];
- for(int j=0;j<hidenode;j++)
- {
- o1[j]=0.0;
- for(int i=0;i<innode;i++)
- o1[j]=o1[j]+w[i][j]*x[i]; //隱含層各單元激活值
- x1[j]=1.0/(1.0+exp(-o1[j]-b1[j])); //隱含層各單元輸出
- //if(o1[j]+b1[j]>0) x1[j]=1;
- // else x1[j]=0;
- }
- for(int k=0;k<outnode;k++)
- {
- o2[k]=0.0;
- for(int j=0;j<hidenode;j++)
- o2[k]=o2[k]+w1[j][k]*x1[j];//輸出層各單元激活值
- x2[k]=1.0/(1.0+exp(-o2[k]-b2[k]));//輸出層各單元輸出
- //if(o2[k]+b2[k]>0) x2[k]=1;
- //else x2[k]=0;
- }
- for(int k=0;k<outnode;k++)
- {
- result[k]=x2[k];
- }
- return result;
- }
- void BpNet::writetrain()
- {
- FILE *stream0;
- FILE *stream1;
- FILE *stream2;
- FILE *stream3;
- int i,j;
- //隱含結點權值寫入
- if(( stream0 = fopen("w.txt", "w+" ))==NULL)
- {
- cout<<"創建文件失敗!";
- exit(1);
- }
- for(i=0;i<innode;i++)
- {
- for(j=0;j<hidenode;j++)
- {
- fprintf(stream0, "%f\n", w[i][j]);
- }
- }
- fclose(stream0);
- //輸出結點權值寫入
- if(( stream1 = fopen("w1.txt", "w+" ))==NULL)
- {
- cout<<"創建文件失敗!";
- exit(1);
- }
- for(i=0;i<hidenode;i++)
- {
- for(j=0;j<outnode;j++)
- {
- fprintf(stream1, "%f\n",w1[i][j]);
- }
- }
- fclose(stream1);
- //隱含結點閥值寫入
- if(( stream2 = fopen("b1.txt", "w+" ))==NULL)
- {
- cout<<"創建文件失敗!";
- exit(1);
- }
- for(i=0;i<hidenode;i++)
- fprintf(stream2, "%f\n",b1[i]);
- fclose(stream2);
- //輸出結點閥值寫入
- if(( stream3 = fopen("b2.txt", "w+" ))==NULL)
- {
- cout<<"創建文件失敗!";
- exit(1);
- }
- for(i=0;i<outnode;i++)
- fprintf(stream3, "%f\n",b2[i]);
- fclose(stream3);
- }
- void BpNet::readtrain()
- {
- FILE *stream0;
- FILE *stream1;
- FILE *stream2;
- FILE *stream3;
- int i,j;
- //隱含結點權值讀出
- if(( stream0 = fopen("w.txt", "r" ))==NULL)
- {
- cout<<"打開文件失敗!";
- exit(1);
- }
- float wx[innode][hidenode];
- for(i=0;i<innode;i++)
- {
- for(j=0;j<hidenode;j++)
- {
- fscanf(stream0, "%f", &wx[i][j]);
- w[i][j]=wx[i][j];
- }
- }
- fclose(stream0);
- //輸出結點權值讀出
- if(( stream1 = fopen("w1.txt", "r" ))==NULL)
- {
- cout<<"打開文件失敗!";
- exit(1);
- }
- float wx1[hidenode][outnode];
- for(i=0;i<hidenode;i++)
- {
- for(j=0;j<outnode;j++)
- {
- fscanf(stream1, "%f", &wx1[i][j]);
- w1[i][j]=wx1[i][j];
- }
- }
- fclose(stream1);
- //隱含結點閥值讀出
- if(( stream2 = fopen("b1.txt", "r" ))==NULL)
- {
- cout<<"打開文件失敗!";
- exit(1);
- }
- float xb1[hidenode];
- for(i=0;i<hidenode;i++)
- {
- fscanf(stream2, "%f",&xb1[i]);
- b1[i]=xb1[i];
- }
- fclose(stream2);
- //輸出結點閥值讀出
- if(( stream3 = fopen("b2.txt", "r" ))==NULL)
- {
- cout<<"打開文件失敗!";
- exit(1);
- }
- float xb2[outnode];
- for(i=0;i<outnode;i++)
- {
- fscanf(stream3, "%f",&xb2[i]);
- b2[i]=xb2[i];
- }
- fclose(stream3);
- }
- //輸入樣本
- double X[trainsample][innode]= {
- {0,0,0},{0,0,1},{0,1,0},{0,1,1},{1,0,0},{1,0,1},{1,1,0},{1,1,1}
- };
- //期望輸出樣本
- double Y[trainsample][outnode]={
- {0},{0.1429},{0.2857},{0.4286},{0.5714},{0.7143},{0.8571},{1.0000}
- };
- int main()
- {
- BpNet bp;
- bp.init();
- int times=0;
- while(bp.error>0.0001)
- {
- bp.e=0.0;
- times++;
- bp.train(X,Y);
- cout<<"Times="<<times<<" error="<<bp.error<<endl;
- }
- cout<<"trainning complete..."<<endl;
- double m[innode]={1,1,1};
- double *r=bp.recognize(m);
- for(int i=0;i<outnode;++i)
- cout<<bp.result[i]<<" ";
- double cha[trainsample][outnode];
- double mi=100;
- double index;
- for(int i=0;i<trainsample;i++)
- {
- for(int j=0;j<outnode;j++)
- {
- //找差值最小的那個樣本
- cha[i][j]=(double)(fabs(Y[i][j]-bp.result[j]));
- if(cha[i][j]<mi)
- {
- mi=cha[i][j];
- index=i;
- }
- }
- }
- for(int i=0;i<innode;++i)
- cout<<m[i];
- cout<<" is "<<index<<endl;
- cout<<endl;
- return 0;
- }
