基于粒子群优化算法的神经网络在
- 格式:pdf
- 大小:88.13 KB
- 文档页数:5
基于粒子群优化的BP神经网络【摘要】人工神经网络的优化学习是其研究中的一个重要课题。
将粒子群优化算法用于BP神经网络的学习,将粒子优化算法的全局搜索和BP神经网的局部搜索相结合,并设计一网络实例加以训练,达到了比较满意的效果。
【关键词】粒子群优化算法BP神经网络BP算法BP网络(Back Propagation Network)是用途最为广泛的一类神经网络,具有很强的信息处理能力。
但是,由于BP算法的基本思想是最小二乘法,采用的是梯度搜索技术,难免存在收敛速度慢、局部极小等问题。
粒子群优化算法(Particle Swarm Optimaziton,简称PSO )是由Kennedy J和Eberhart R C于1995年提出的一种优化算法,源于对鸟群和鱼群群体运动行为的研究。
由于其容易理解,易于实现,不要求目标函数和约束条件是可微的,并能以较大概率求得全局最优解,目前已在许多优化问题中得到成功应用。
由于它具有并行计算的特点,而且可以提高计算速度。
因此,可以用粒子群优化算法来优化BP网络。
一、BP神经网络及其算法BP网络是一种具有三层或三层以上的单向传播的多层前馈网络,其拓扑结构如图1。
图1 拓扑结构图BP算法的执行步骤如下:(1)对各层权系数置一个较小Wij的非零随机数。
(2)输入一个样本X=(X1,X2,…,x n),以及对应期望输出) Y=(y1,y2,…,yn)。
(3)计算各层的输出。
对于第k 层第i个神经元的输出有:Uki=∑WijXk-1i,Xki=f(Uki)(一般为sigmoid 函数,即f(x)=1/(1-epx(-x))。
(4)求各层的学习误差dki。
对于输出层,有,k=m,dmi=Xmi(1-Xmi)(Xmi-Ymi)。
对于其他各层,有dxi=Xki(1-Xki)∑Wijdk+1i。
(5)修正权系数Wij。
Wij (t+1)=Wij-η•dki•Xk-1j。
基于粒子群优化算法的神经网络在农药定量构效关系建模中的应用张丽平 俞欢军3 陈德钊 胡上序(浙江大学化工系,杭州310027)摘 要 神经网络模型能有效模拟非线性输入输出关系,但其常规训练算法为BP 或其它梯度算法,导致训练时间较长且易陷入局部极小点。
本实验探讨用粒子群优化算法训练神经网络,并应用到苯乙酰胺类农药的定量构效关系建模中,对未知化合物的活性进行预测来指导新药的设计和合成。
仿真结果表明,粒子群优化算法训练的神经网络不仅收敛速度明显加快,而且其预报精度也得到了较大的提高。
关键词 粒子群优化算法,神经网络,定量构效关系 2004201204收稿;2004207225接受本文系国家自然科学基金资助项目(N o.20276063)1 引 言药物定量构效关系(QS AR )是研究药物生理活性和药物分子结构参数间的量变规律并建立相应的数学模型,进而研究药物的作用机理,从而用于预测未知化合物的生物活性,探讨药物的作用机理,指导新药的设计和合成,在药物和农药的研究与设计中已经显示出广阔的应用前景1。
以往QS AR 的建模方法大多基于统计原理,局限于线性模型,只进行简单的非线性处理,由此所建立的模型很难契合实际构效关系,并且其处理过程都比较繁琐2。
神经网络通过学习将构效关系知识隐式分布在网络之中,适用于高度非线性体系。
在药物QS AR 中采用神经网络(NN )始于20世纪80年代末3,此后得到迅速的发展,目前已发展为除多重线性回归和多元数据分析之外的第3种方法4。
通常多层前传网络采用BP 算法,通过误差反传,按梯度下降的方向调整权值。
其缺点是可能陷入局部极小点,且对高维输入收敛速度非常缓慢。
粒子群优化算法(particle swarm optimization ,PS O )是K ennedy 等5源于对鸟群、鱼群和人类社会行为的研究而发展的一种新的进化型寻优技术。
PS O 已成为进化寻优算法研究的热点,其最主要特点是简单、收敛速度快,且所需领域知识少。
本实验拟将该方法初始化前传神经网络为苯乙酰胺类农药建立良好适用的QS AR 模型。
2 苯乙酰胺类农药的Q SAR 问题苯乙酰胺类化合物是除草农药,其除草活性与其分子结构密切相关。
所有的N 2(12甲基212苯乙基)苯乙酰胺都可用相应的羧酸酰胺通过霍夫曼反应生成。
N 2(12甲基212苯乙基)苯乙酰胺的基本结构式为:其中X 为Me 、F 、Cl 、OMe 、CF 3和Br 等,Y 为Me 、Cl 、F 和Br 等,由不同的X 和Y 取代基可构成不同的化合物。
常用以下7个理化参数描述化合物的分子组成和结构:log P 、log 2P (疏水性参数及其平方项)、σ(电性效应参数)、E s (T aft 立体参数)、MR (摩尔折射度),1χ、2χ(分子连接性指数)。
于是这类化合物的QS AR 就转化为上述理化参数与除草活性间的关系。
为研究这种关系,选用具有代表性的50个化合物,他们的活性值取自文献1,见表1。
第32卷2004年12月分析化学(FE NXI H UAX UE ) 研究报告Chinese Journal of Analytical Chemistry 第12期1590~1594表1 苯乙酰胺类化合物分子结构参数与除草活性值T able1 S tructural parameters and anti2scipusjuncoides activity of N2phenylacetamides序号N o.自变量Independent variableslog PσMR E s1χ2χlog2P因变量Dependent variable活性Activity1 1.12-0.349.240.007.31 5.59 1.254 5.8520.70-0.11 4.510.78 6.93 5.170.490 5.683 1.270.069.620.277.42 5.70 1.613 5.7240.54-0.4411.460.697.43 5.480.292 6.075 1.12-0.249.240.007.31 5.65 1.254 5.896 1.270.209.620.277.41 5.77 1.613 6.007 1.270.069.620.277.42 5.70 1.662 5.5880.850.29 4.89 1.057.03 5.280.722 5.449 1.420.4610.000.547.52 5.81 2.016 5.65100.69-0.0411.840.967.53 5.590.476 5.4611 1.270.169.620.277.41 5.76 1.613 5.5712 1.420.6010.000.547.51 5.88 2.016 5.65130.690.1011.840.967.52 5.630.476 5.4214 1.270.069.620.277.41 5.76 1.613 5.1815 1.420.4610.000.547.51 5.88 2.016 5.4116 1.12-0.249.240.007.31 5.65 1.254 5.79170.70-0.01 4.510.78 6.92 5.230.490 5.9218 1.270.169.620.277.41 5.75 1.613 6.10190.54-0.3411.460.697.42 5.530.292 5.7920 1.12-0.149.240.007.30 5.71 1.254 5.8221 1.270.309.620.277.40 5.83 1.613 6.2222 1.440.368.61-1.167.39 5.66 2.074 5.7323 1.420.1612.470.087.80 6.27 2.016 4.64240.94-0.3116.060.038.00 5.800.884 4.32 250.700.17 4.510.78 6.92 5.200.490 6.47 260.850.57 4.89 1.057.02 5.310.722 6.5727 1.270.209.620.277.41 5.76 1.613 6.49280.850.43 4.89 1.057.02 5.340.7227.0429 1.420.6010.000.547.51 5.87 2.016 6.71300.690.1011.840.967.52 5.650.476 6.5331 1.270.309.620.277.40 5.83 1.613 6.3832 1.420.7410.000.547.51 5.94 2.016 6.9533 1.570.6212.850.357.90 6.32 2.465 6.47340.56-0.349.240.007.31 5.640.314 5.82 350.70-0.11 4.510.78 6.92 5.220.490 6.0136 1.270.069.620.277.41 5.75 1.613 6.22370.54-0.4411.460.697.42 5.530.292 5.82 380.56-0.249.240.007.30 5.700.314 5.8939 1.270.209.620.277.40 5.82 1.613 5.92400.70-0.11 4.510.78 6.92 5.190.490 6.25 410.850.29 4.89 1.057.02 5.310.7227.05 420.12-0.21 6.73 1.477.03 5.080.014 6.44 430.70-0.01 4.510.78 6.91 5.260.490 6.50 440.850.43 4.89 1.057.02 5.370.722 6.3945 1.270.069.620.277.41 5.76 1.613 6.68460.850.29 4.89 1.057.02 5.340.722 6.6347 1.420.4610.000.547.51 5.87 2.016 6.9148 1.270.169.620.277.40 5.82 1.613 6.8449 1.000.297.740.867.41 5.79 1.000 6.6050 1.570.6012.850.357.90 6.39 2.465 6.49 1951第12期张丽平等:基于粒子群优化算法的神经网络在农药定量构效关系建模中的应用 3 前传神经网络3.1 网络结构网络有7个输入端和1个输出端,分别与7个理化参数和1个活性值相对应。
根据经验规则,网络中权重总数应等于或小于样本容量,所得数学模型才比较稳定6。
由此,在本实验中隐层结点为5比较合适,网络结构为72521,共46个权值。
3.2 样本使用由于各变量表示样本的各种性质,往往使用不同的度量单位,其观测值也可能相差十分悬殊。
这样绝对值大的变量其影响可能盖过绝对值小的变量,使后者应有的作用得不到反映。
为了确保各变量在分析中的地位相同,故对输入端的7个变量实施极差标准化。
为避免偶然性,采用交叉验证法,将50个样品构成10个组合,每组均有45个样品作训练用,另外5个样品作预报用,因此每个样品有9次作训练用,1次作预报用。
3.3 过拟合控制为了避免训练网络时出现过拟合,实验使用测试集监控训练的过程,即由训练所得数学模型计算预报误差,如果测试集的训练误差曲线显著上升,并且预报误差和训练误差为可接受的大小,则训练终止。
实验表明,该方法可以有效地降低过拟合程度。
3.4 初始化前传神经网络的PSO 算法与其他进化寻优算法相类似,PS O 算法也将通过个体间的协作与竞争,实现多维空间中最优解的搜索。
PS O 方法首先生成初始种群,即在可行解空间中随机初始化一群粒子,每个粒子都为寻优问题的一个可行解,并用某个函数计算出相应的适应值以确定是否达到寻优目标。
每个粒子将在解空间中运动,并由一个矢量决定其运动方向和位移。
通常粒子将追随当前的最优粒子而动,并经逐代搜索最后得到最优解。
在每一代中,粒子将跟踪两个极值,一为粒子本身迄今找到的最优解,代表该粒子自身对寻优方向的认知水平;另一为全种群迄今找到的最优解,代表社会认知水平。
设第i 个粒子位置为x i =(x i 1,x i 2,……x in )T ,其位移为v i =(v i 1,v i 2,……v in )T 。
它的个体最优值点为p i =(p i 1,p i 2,……p in )T ,种群的全局最优值点为p g =(p g 1,p g 2,……p gn )T 。