BP算法的改进(可打印修改)

格式：pdf
大小：55.20 KB
文档页数：1

下载文档原格式

BP算法的缺点与改进

BP算法的缺点与改进
BP算法的缺点与改进
目前，BP网络得到了越来越广泛的应用，但是BP算法在应用中也同时暴露出一定的缺陷: l)训练次数多，学习效率低，收敛速度慢;
2)易形成局部极小;’
3)隐层神经元的数目难以确定;
4)训练时有学习新样本而忘记旧样本的趋势。

针对这些缺陷，国内外研究者提出了许多有效的改进方法，如:
l)改进学习率参数的调节方法，如使学习率粉的大小随误差梯度变化;
2)改进神经网络的结构，如增加隐层神经元的数目;
3)改变激励函数，如把sigmoid函数改成分段函数;
4)权值修正方法，如增加动量项。

(1)BP神经网络的建立
神经网络工具箱含有许多专用函数用来建立神经网络，其中函数newff()来创建一个BP神经网络。

此函数的调用格式为:
net=newff(PR，【5152…S司，{TITZ…TN}，BTF，BLF，PF)
net=newff:用于在对话框中创建BP神经网络;
PR:R*2维矩阵(共有R组输入)，每行由每组输入的最大值和最小值组
si:第i层神经元数;
Ti:第i层的激励函数，“tansig”为默认时函数;
BTF:BP神经网络的训练函数，“traiulm”为默认时函数;
BLF:BP神经网络中权值和阂值的算法，“leamgdm”为默认函数;
PF:BP神经网络的性能函数，“mse”为默认函数。

一种改进型BP算法

梯度，还要考虑ｔ一１时刻的负梯度。即按照ｔ时刻和ｔ－１时刻负梯度的加权和对联接权重进行修正。通过引入动量项可以有效减小学习过程中的振荡趋势，同时避免权重值陷入局部
最小。
三、结论
本文通过引入双极性ｓ型函数和动量项改进了传统ＢＰ算法，提出了一种基于双极性ｓ型函数和动量项的改进型ＢＰ学习算法。该算法有效减小了训练过程中的振荡趋势，加快了收敛过程，同时避免权重值陷入局部最小。 ∞
３０３－３１４．
［２］雷鸣，伊申明，杨叔子．神经网络自适应学习研究 Ⅱ 】＿系统工
程与电子术，１９９４，（３）：２９ — ３６．
【３］汪澜，刘万军，马国利．一种改进的ＢＰ人工神经网络模型叫．辽宁工程技术大学学报，２００４，（ｓ１）：２６－３２．
ｆ２１马晓亭，陈臣．云计算环境下数字图书馆信息资源安全威胁与
提升云计算软件供应商的独立性是非常有利的。供应商可以
通过增加新功能＃节约部署投资和减少实际部署时间来加速
［４】陈伟，马如雄，郝艳红．基于ＭＡＴＬＡＢ的ＢＰ人工神经网络设
误差小于０．Ｏ１时的改进型Ｂ速
度提高的倍数
计卟电脑学习，２００５，（０２）：６６ — ７２．

改进的BP神经网络算法

改进的BP神经网络算法以下是一个简单的改进的BP神经网络算法的C语言源码，注释已经添加在代码中，代码的运行结果是将一个简单的线性函数拟合为输入值的平方的2倍。

```c#include <stdio.h>#include <stdlib.h>#include <math.h>#define INPUT_LAYER_SIZE 1 // 输入层节点个数#define HIDDEN_LAYER_SIZE 10 // 隐藏层节点个数#define OUTPUT_LAYER_SIZE 1 // 输出层节点个数#define LEARNING_RATE 0.1 // 学习率double sigmoid(double x)return 1 / (1 + exp(-x));double sigmoid_derivative(double x)return x * (1 - x);//训练函数void train(double input[INPUT_LAYER_SIZE], doubleexpected_output[OUTPUT_LAYER_SIZE], doublew_ih[INPUT_LAYER_SIZE][HIDDEN_LAYER_SIZE], doublew_ho[HIDDEN_LAYER_SIZE][OUTPUT_LAYER_SIZE], double *b_h, double *b_o)//前向传播double hidden_layer_activations[HIDDEN_LAYER_SIZE];double output_layer_activations[OUTPUT_LAYER_SIZE];for (int i = 0; i < HIDDEN_LAYER_SIZE; i++)double activation = 0;for (int j = 0; j < INPUT_LAYER_SIZE; j++)activation += input[j] * w_ih[j][i];}activation += *b_h;hidden_layer_activations[i] = sigmoid(activation);}for (int i = 0; i < OUTPUT_LAYER_SIZE; i++)double activation = 0;for (int j = 0; j < HIDDEN_LAYER_SIZE; j++)activation += hidden_layer_activations[j] * w_ho[j][i];}activation += *b_o;output_layer_activations[i] = sigmoid(activation);}//反向传播double output_layer_errors[OUTPUT_LAYER_SIZE];double hidden_layer_errors[HIDDEN_LAYER_SIZE];for (int i = 0; i < OUTPUT_LAYER_SIZE; i++)output_layer_errors[i] = (expected_output[i] - output_layer_activations[i]) *sigmoid_derivative(output_layer_activations[i]);}for (int i = 0; i < HIDDEN_LAYER_SIZE; i++)double error = 0;for (int j = 0; j < OUTPUT_LAYER_SIZE; j++)error += output_layer_errors[j] * w_ho[i][j];}hidden_layer_errors[i] = error *sigmoid_derivative(hidden_layer_activations[i]);}//更新权值和偏置for (int i = 0; i < HIDDEN_LAYER_SIZE; i++)for (int j = 0; j < OUTPUT_LAYER_SIZE; j++)w_ho[i][j] += LEARNING_RATE * output_layer_errors[j] * hidden_layer_activations[i];}}for (int i = 0; i < INPUT_LAYER_SIZE; i++)for (int j = 0; j < HIDDEN_LAYER_SIZE; j++)w_ih[i][j] += LEARNING_RATE * hidden_layer_errors[j] * input[i];}}*b_o += LEARNING_RATE * output_layer_errors[0];*b_h += LEARNING_RATE * hidden_layer_errors[0];//测试函数double test(double input[INPUT_LAYER_SIZE], doublew_ih[INPUT_LAYER_SIZE][HIDDEN_LAYER_SIZE], doublew_ho[HIDDEN_LAYER_SIZE][OUTPUT_LAYER_SIZE], double b_h, double b_o)double hidden_layer_activations[HIDDEN_LAYER_SIZE];double output_layer_activations[OUTPUT_LAYER_SIZE];for (int i = 0; i < HIDDEN_LAYER_SIZE; i++)double activation = 0;for (int j = 0; j < INPUT_LAYER_SIZE; j++)activation += input[j] * w_ih[j][i];}activation += b_h;hidden_layer_activations[i] = sigmoid(activation);}for (int i = 0; i < OUTPUT_LAYER_SIZE; i++)double activation = 0;for (int j = 0; j < HIDDEN_LAYER_SIZE; j++)activation += hidden_layer_activations[j] * w_ho[j][i]; }activation += b_o;output_layer_activations[i] = sigmoid(activation);}return output_layer_activations[0];int mai//初始化权值和偏置double w_ih[INPUT_LAYER_SIZE][HIDDEN_LAYER_SIZE];double w_ho[HIDDEN_LAYER_SIZE][OUTPUT_LAYER_SIZE];double b_h = 0;double b_o = 0;for (int i = 0; i < INPUT_LAYER_SIZE; i++)for (int j = 0; j < HIDDEN_LAYER_SIZE; j++)w_ih[i][j] = ((double) rand( / RAND_MAX) * 2 - 1; // [-1, 1]之间的随机数}}for (int i = 0; i < HIDDEN_LAYER_SIZE; i++)for (int j = 0; j < OUTPUT_LAYER_SIZE; j++)w_ho[i][j] = ((double) rand( / RAND_MAX) * 2 - 1; // [-1, 1]之间的随机数}}//训练模型for (int epoch = 0; epoch < MAX_EPOCHS; epoch++)double input = ((double) rand( / RAND_MAX) * 10; // [0, 10]之间的随机数double expected_output = 2 * pow(input, 2); // y = 2x^2train(&input, &expected_output, w_ih, w_ho, &b_h, &b_o);}//测试模型double input = 5;double output = test(&input, w_ih, w_ho, b_h, b_o);printf("Input: %.2f, Output: %.2f\n", input, output);return 0;```这个代码实现了一个包含一个输入层、一个隐藏层、一个输出层的BP神经网络，使用了sigmoid激活函数和均方差误差函数。

标准BP算法及改进的BP算法

自适应学习速率应用
P = -1:0.1:1 T = [-0.96 -0.577 -0.0729 0.377 0.641 0.66 [0.461 0.1336 -0.201 -0.434 -0.5 -0.393 -0.1647 0.0988 0.3072 0.396 0.3449 0.1816 -0.0312 0.2183 -0.3201 ]; [R,Q] = size(P); [S2,Q] = size(T); S1 = 5; [W1,B1] = rands(S1,R); [W2,B2] = rands(S2,S1);
10
2
Performance is 0.0199998, Goal is 0.02
10 Training-Blue Goal-Black
1
10
0
10
-1
10
-2
0
100
200
300 400 664 Epochs
500
600
采用动量法时的训练误差记录
1.3 自适应学习率调整法
在BP算法中，网络权值的调整取决于学习 BP算法中，网络权值的调整取决于学习速率和梯度。在标准BP 速率和梯度。在标准BP 算法中，学习速率是不变的。而在自适应学习率调整法中，通常学习速率的调整准则是：检查权值的修正是否真正降低了误差函数，如果确实如此，则说明所选的学习率小了，可对其增加一个量；若不是则说明产生了过调，那么就应减小学习速率的值。
标准BP算法及改进的标准BP算法及改进的BP 算法及改进的BP 算法应用
1.1 标准的BP算法标准的BP算法
BP标准的BP算法是基于梯度下降法，通过 BP标准的BP算法是基于梯度下降法，通过计算目标函数对网络权值和阈值的梯度进行修正。 X(k + 1 ) = X(k) - µ∆F( X(K) ) X(K)为由网络所有权值和阈值所形成的向 X(K)为由网络所有权值和阈值所形成的向量； µ为学习速率； ∆F( X(K) )为目标函数的梯度； )为目标函数的梯度；

一种改进BP人工神经网络收敛性的算法

一种改进BP 人工神经网络收敛性的算法赵刚引言BP （Back Propagation 即误差反向传输）人工神经网络[1]，因其结构简洁，能够以任意精度逼近任意函数[2]，是目前应用最广泛的一种网络，应用于信号处理，模式识别，结果预测，自适应控制等领域。

但BP 算法的核心是最速梯度下降法，主要优点是计算量小，主要缺点是收敛速度慢[3]。

加快BP 网络的收敛速度一直是热门的研究课题，Rumelhart 提出在权值调整中加入动量项，即将上次的权值调整量ΔW （n －1）乘以动量系数α加上本次计算得到的权值调整量ΔW 乘以学习率η作为本次的权值调整量，即αη⋅-∆+⋅∆=∆)1()(n W W n W (1)该方法能够少量加快BP 网络的收敛速度，但参数η和α的选取比较困难，很容易引起网络振荡。

Harry A.C.Eaton 和Tracy.L.Olivier 提出了学习率的经验公式：22221.../5.1n N N N +++=η (2)他们把训练样本分成n 个模式，每个模式分别是N 1，N 2，…,N n 个样本。

但试验结果一般。

Darken Chrisitian 和Moody John [3]提出动态学习率法，并给出学习率的计算公式：)/1/()0(r n +=ηη (3)式中η（0）是初始学习率，n 为学习次数，r 是一个大于1的常数，用于调节学习率改变速度，该方法的缺点在于用另外一个不确定的常数r 代替了η，实际使用中r 不易找到合适值。

还有另外的很多学者提出了各种改进算法，如Cater （1987），Chan and Fallside （1987），Jacobs （1988），Silva and Almeida （1990）[4] 但这些算法都以改变学习率和动量项为基础，改进效果均不太明显。

本文提出的改进算法和参考文献中的算法有较大差异，体现在以下方面：（1）本文的算法不使用标准BP 算法中的学习率参数。

BP网络算法的问题及改进

经验选取的。
４．对于新加入的样本，要影响到已经学完的样本。
５．描述每个输入特征样本的数目要求必须相同。
（二）改进ＢＰ算法
１．改进算法描述为了克服传统ＢＰ算法收敛速度慢且容易陷入
局部极小的问题，我们对标准ＢＰ算法进行了改进。改进主要有两点：
（１）自适应学习率学习速率 & 的选择很重要， & 大则收敛快，但
果当前的误差梯度修正方向正确，就增大学习率，加入动量项；否则减
小学习率，甩掉动量项，从而使学习速度加快，效率有较大提高。
３．改进算法流程图改进ＢＰ算法的流程图如图１所示。
图３改进学习率ＢＰ算法误差曲线图Ｆｉｇｕｒｅ４－３Ｉｍｐｒｏｖｅｄｌｅａｒｎｒａｔｅａｒｉｔｈｍｅｔｉｃｅｒｒｏｒｃｕｒｖｅ
当△Ｅ＜０； &＝&
（５－５）
当△Ｅ＜０； &＝０
（５－６）
其中△Ｅ＝Ｅ（ｔ）－Ｅ（ｔ－１）
（５－７）
２．改进之处与ＢＰ算法相比，本算法有两点改进：
（１）降低权值修改频率，使权值沿总体误差最小的方向调整，使总
误差收敛的速度加快。
（２）根据情况确定学习速率，即让学习速率 ! 和动量项 & 可变，如
类，在实际应用中也取得了较好的效果，但它仍存在着以下问题：
１．学习算法的收敛速度很慢。
２．局部极小：从数学角度看，ＢＰ网络的学习过程使用的是最速下
降梯度法，所以不可避免的会遇到优化过程中最常见的局部极小问

BP算法的改进

式分类问题，教师信号通常为１或０，所以
Ｈ一：０．５
对于模式Ｐ，输出层的接近程度Ａ定义为
Ａｐ备
Ａ随着网络计算输出与期望输出的接近而减小，所以ｇ会按照如下的规则进行调整：，
ｇ｛ｆ一一Ａｇ
第ｌ卷年６期２３第２１０１月
辽宁师专学报
ＪｕｎｌｆＬｉｏｉｇＴｅｃｅｓＣｏｌｇｏｒａａｎｎａｈｒｌｅｏｅ
Ｖ０．１．２】３Ｎ０
Ｊｎ．２０１１ｕ
【术研究】学
的输入信号太高或太低以致于所有隐含层的神经元产生了非常接近传递函数边界值的输出，当然，这种情
况下网络没能取得它的期望值．本文在对ＢＰ算法进行总体分析的基础上，采用一系列修改传递函数的方式对其进行改进，基本克服了ＢＰ算法上容易陷入局部极小值以及收敛速度较慢等缺点，取得了较好的收敛效果．
ＢＰ算法的改进
张俭
（口职业技术学院，辽宁营口１５０）营１００
摘要：针对多层神经网络中由于隐含层神经元饱和而｝起的局部极小值问题，提出一种改进的Ｂ算ｌＰ法．每一种训练模式在隐含层的神经元都采用各自的传递函数，该改进算法的思想是当网络输出没有取得期望的结果时，修改传递函数以防止隐含层神经元饱和，这种改进的算法既不用改变网络的拓扑结构，也不会消耗更多的计算时间．关键词：神经网络；ＢＰ算法；局部极小；饱和；增益参数中图分类号：Ｔ１３Ｐ８文献标识码：Ａ文章编号：

一种用于预测的BP算法的改进

一种用于预测的BP 算法的改进旷昀[摘要] 数据挖掘技术能从海量数据中找出有价值的信息，神经网络中的BP 算法虽然有较广泛的应用，但存在容易陷入局部极小点及网络的瘫痪等问题。

而Cauchy 训练的最大长处是，它有可能使网络逃离局部极小点。

用通过结合Cauchy 训练来改进BP 算法，在收敛速度，局部极小点、网络瘫痪等问题上有所改善。

[关键词] 数据挖掘；BP 算法；Cauchy 训练[作者简介] 旷昀，女，柳州运输职业技术学院信息工程系讲师。

广西柳州，545007一、数据挖掘数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术，目的是帮助决策者寻找数据间潜在的关联，发现被忽略的要素[1]。

数据挖掘技术涉及数据库、人工智能、机器学习和统计分析等多种技术。

数据挖掘技术能从大型数据库或数据仓库中自动分析数据，进行归纳性推理，从中发掘出潜在的模式；或者产生联想，建立新的业务模型，帮助决策者调整策略，做出正确的决策。

数据挖掘技术中的常用算法有：人工神经网络、遗传算法、决策树、公式发现、统计分析方法等。

这些方法各有千秋，总的来说，应该根据不同的问题环境和应用层面来选择合适的方法，并且灵活应用来解决数据挖掘中遇到的难题，BP 算法是一种适用于预测的神经网络算法。

二、BP 算法BP 算法是一种数据挖掘的方法。

BP 网络的神经元同一般的人工神经网络一样，但BP 算法要求使用的激活函数必须是处处可导的。

一般多数设计者都使用S 形函数。

实际上，也可以用其他函数作为BP 神经网络的激活函数，只要该函数是处处可导的。

BP 网络是非循环多级网络，但是实验表明，增加隐藏层的层数和隐藏层的神经元的个数不一定能够提高网络的精度和表达能力，在大多数情况下，BP 网络一般都选用二级网络[2]。

（一）BP 算法的训练过程人工神经网络的训练过程是根据样本集对神经元之间的联接权进行调整的过BP 网络也不例外，而且BP 网络执行的是有导师训练。

BP学习算法的改进

3.2.3.BP学习算法的改进 3.2.3.BP学习算法的改进
主讲：方聪
3.2.3.BP学习算法的改进 3.2.3.BP学习算法的改进
1、BP学习算法中存在的问题
①训练次数多，学习效率低，收敛速度慢训练次数多，学习效率低， ②容易形成局部极小点 ③隐层神经元数目难以确定 ④训练时有学习新样本忘记旧样本的趋势
• 学习步长η 对收敛速度的影响
∂E (n) ∆w jp (n) ∝ ∂w jp (n) ∂E (n) P ∆w jp (n) = −η = ηδ p (n)v J (n) j ∂w jp (n) w jp (n + 1) = w jp (n) + ∆w jp (n)
η 由式中可知学习步长η 的选取很重要，值大收敛快，但过大又不稳定。
• 存在平坦区域的原因分析
激励函数
f ( x) =
1 , a > 0; −∞ < x < ∞ 1 + exp( − ax ) e
p − au p p − au p
p p 输出的导数： ' 输出的导数：y kp = v p ' = f ' (u p ( n )) =
(1 + e
)
2
=
1+ e
p − au p
y kp ( n )(1 − y kp ( n )) e kp ( n )
= y kp ( n )(1 − y kp ( n ))( d p ( n ) − y kp ( n ))
存在平坦区域的原因分析： – 第一种可能是 ykp 充分接近 d p – 第二种可能是 y kp 充分接近0 – 第三种可能是 ykp 充分接近1
二、弹性BP算法

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

BP算法的改进
附加动量法
附加动量法使网络在修正其权值时，不仅考虑误差在梯度上的作用，而且考虑在误差曲面
上变化趋势的影响。

在没有附加动量的作用下，网络可能陷入浅的局部极小值，利用附加
动量的作用有可能滑过这些极小值。

该方法是在反向传播法的基础上在每一个权值（或阈值）的变化上加上一项正比于前次权
值（或阈值）变化量的值，并根据反向传播法来产生新的权值（或阈值）变化。

带有附加动量因子的权值和阈值调节公式为：
其中k为训练次数，mc为动量因子，一般取0.95左右。

附加动量法的实质是将最后一次权值（或阈值）变化的影响，通过一个动量因子来传递。

当动量因子取值为零时，权值（或阈值）的变化仅是根据梯度下降法产生；当动量因子取
值为1时，新的权值（或阈值）变化则是设置为最后一次权值（或阈值）的变化，而依梯
度法产生的变化部分则被忽略掉了。

以此方式，当增加了动量项后，促使权值的调节向着
误差曲面底部的平均方向变化，当网络权值进入误差曲面底部的平坦区时， i将变得很小，于是,从而防止了的出现，有助于使网络从误差曲面的局部极小值中跳出。

根据附加动量法的设计原则，当修正的权值在误差中导致太大的增长结果时，新的权值应
被取消而不被采用，并使动量作用停止下来，以使网络不进入较大误差曲面；当新的误差
变化率对其旧值超过一个事先设定的最大误差变化率时，也得取消所计算的权值变化。

其
最大误差变化率可以是任何大于或等于1的值。

典型的取值取1.04。

所以，在进行附加动
量法的训练程序设计时，必须加进条件判断以正确使用其权值修正公式。

训练程序设计中采用动量法的判断条件为：
E（k）为第k步误差平方和。

V = net.iw{1,1}%输入层到中间层权值
theta1 = net.b{1}%中间层各神经元阈值
W = net.lw{2,1}%中间层到输出层权值
theta2 = net.b{2}%输出层各神经元阈值。

标准BP算法及改进的BP算法

页数:19
标准BP算法及改进的BP算法标准BP算法及改进的BP算法应用(1)

页数:2
BP算法的改进

页数:1
BP算法的缺点与改进

页数:1
BP算法的改进

页数:3
BP算法的改进(可打印修改)

页数:1
bp算法的改进

页数:41
BP神经网络的几种改进方法参考PPT

页数:11
标准BP算法及改进的BP算法应用

页数:19
BP算法及其优缺点

页数:41