数学建模与计算
- 格式:doc
- 大小:817.50 KB
- 文档页数:26
数学建模计算方法蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法)数据拟合、参数估计、插值等数据处理算法(比赛中通常会碰到大量的数据必须要处理,而处理数据的关键就在于这些算法,通常使用Matlab 作为工具)线性规划、整数规划、多元规划、二次规划等规划类问题(建模比赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo 软件实现) 图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,必须要认真准备)动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法〔制定〕中比较常用的方法,很多场合可以用到比赛中)4建模计算法三层次结构:最高层:这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果,因此也称为目标层。
中间层:这一层次中包涵了为实现目标所涉及的中间环节,它可以由假设干个层次组成,包括所必须合计的准则、子准则,因此也称为准则层。
最底层:这一层次包括了为实现目标可供选择的各种措施、决策方案等,因此也称为措施层或方案层。
递阶层次结构中的层次数与问题的复杂程度及必须要分析的详尽程度有关,一般地层次数不受限制。
每一层次中各元素所支配的元素一般不要超过 9 个。
这是因为支配的元素过多会给两两比较推断带来困难。
层次分析法的应用:在应用层次分析法研究问题时,碰到的主要困难有两个:(i)如何依据实际状况抽象出较为贴切的层次结构;(ii)如何将某些定性的量作比较接近实际定量化处理。
层次分析法对人们的思维过程进行了加工整理,提出了一套系统分析问题的方法,为科学管理和决策提供了较有说服力的依据。
但层次分析法也有其局限性,主要表现在:(i)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维过程中的严重非一致性,却无法排除决策者个人可能存在的严重片面性。
Mathematica高级数学建模与计算教程第一章:Mathematica概述Mathematica是一种强大的数学建模和计算工具,它能够帮助用户解决各种复杂的数学问题。
本章将介绍Mathematica的基本概念、界面和功能,以及如何开始使用Mathematica。
1.1 Mathematica的基本概念Mathematica是由Wolfram Research公司开发的一款数学软件,它集成了数学计算、数据分析、可视化等多种功能,广泛应用于科学研究、工程和金融等领域。
Mathematica的核心是一种高级程序语言,用户可以用它进行数学建模和计算,并通过交互式界面进行操作。
1.2 Mathematica的界面和功能Mathematica的主界面分为菜单栏、工具栏和工作区等部分。
菜单栏提供了各种功能的快捷操作,工具栏则包含了常用的工具和命令按钮。
在工作区中,用户可以编写和执行Mathematica代码,并查看结果。
1.3 快速开始在Mathematica中,用户可以使用各种内置的函数和命令来进行数学建模和计算。
例如,可以使用内置函数Plot来绘制函数图像,使用函数Solve来求解方程,使用函数Integrate来进行积分等等。
用户可以通过简单的代码来描述数学问题,并得到计算结果。
第二章:数学建模基础数学建模是将实际问题转化为数学问题,并使用数学方法进行求解的过程。
本章将介绍数学建模的基本原理和方法,并结合具体例子演示如何使用Mathematica进行数学建模。
2.1 数学建模的基本原理数学建模的过程可以分为问题定义、数学模型的建立、模型求解和结果分析等几个步骤。
问题定义阶段需要明确问题的背景、目标和约束条件;数学模型的建立阶段需要选择合适的数学模型来描述问题;模型求解阶段需要使用合适的方法和工具进行求解;结果分析阶段需要对求解结果进行验证和解释。
2.2 使用Mathematica进行数学建模Mathematica提供了丰富的函数和命令来支持数学建模的各个步骤。
数学建模计算代码数学建模是通过运用数学知识和方法来解决实际问题的过程。
计算代码则是指利用计算机编程语言来编写程序,实现数学建模的计算过程。
本文将结合数学建模和计算代码的概念,讨论如何使用计算代码进行数学建模,并提供一些常用的数学建模计算代码示例。
一、数学建模与计算代码的关系数学建模通常分为数学模型的建立、数学模型的求解和模型结果的验证三个步骤。
其中,数学模型的求解是数学建模中的核心环节,而计算代码则是实现模型求解的工具。
计算代码通常通过编写和执行算法来实现模型的计算过程。
通过将数学模型用计算代码编写成计算机程序,可以更加方便地进行模型计算和求解。
计算代码可以通过数值计算、符号计算、优化算法等方法来实现数学模型的求解。
在计算代码编写的过程中,需要根据具体的数学模型和求解方法选择合适的编程语言和算法,以便实现高效、准确的数学模型求解。
二、数学建模计算代码示例1.数值积分数值积分是数学建模中常用的求解方法之一,它通过将积分转化为求和或近似替代问题来进行求解。
以下是使用Python编写的数值积分计算代码示例:```pythonimport numpy as npdef numerical_integration(f, a, b, n):数值积分函数,利用梯形法则进行数值积分计算:param f: 被积函数:param a: 积分下限:param b: 积分上限:param n: 划分区间数:return: 数值积分结果"""h=(b-a)/n#计算区间宽度x = np.linspace(a, b, n + 1) # 生成等距节点y=f(x)#计算节点函数值integration_result = (h / 2) * (np.sum(y) - y[0] - y[-1]) # 梯形法则计算积分return integration_resultdef f(x):"""被积函数:param x: 自变量:return: 函数值return x ** 2a=0b=1n=1000result = numerical_integration(f, a, b, n)print("数值积分结果为:", result)```2.线性回归线性回归是拟合一个线性函数来描述变量之间关系的统计方法。
数学建模计算方法数学建模是指运用数学的方法和技巧解决实际问题的过程。
它是数学与其他学科的交叉融合,旨在通过建立数学模型,从而给出该问题的数学描述以及计算方法。
数学建模的计算方法是解决数学模型的关键步骤,下面将详细介绍数学建模的三种常用的计算方法:数值方法、优化方法和模拟方法。
首先,数值方法是通过数值计算来求解数学模型的一种方法。
它的基本思想是将问题转化为数值计算问题,利用离散的数值计算方法得到问题的近似解。
数值方法常用于求解无法用解析方法获得精确解的复杂数学模型。
其中的核心方法包括数值微积分、数值代数、数值逼近等。
数值方法的优点是能够较快地得到近似解,但是由于是近似解,所以其误差会存在一定的范围。
其次,优化方法是一种通过寻找最优解来求解数学模型的方法。
优化方法的目标是在模型的约束条件下,寻找使目标函数达到最大或最小值的决策变量。
它的基本思想是将问题转化为一个最优化问题,利用优化理论和算法来求解。
优化方法常用于求解资源配置、作业调度、生产运营等实际问题。
常见的优化方法有线性规划、整数规划、动态规划等。
优化方法的优点是能够找到最优解,但是对于复杂的问题,求解过程可能较为耗时。
最后,模拟方法是一种通过模拟现实系统的行为来求解数学模型的方法。
模拟方法的基本思想是将问题看作一个系统,通过建立与之对应的数学模型,模拟和观察该系统在不同条件下的行为,从而获得问题的解。
模拟方法常用于求解自然科学、社会科学等领域的问题,如气象预测、交通流模拟等。
常见的模拟方法有蒙特卡洛方法、离散事件仿真等。
模拟方法的优点是能够模拟现实系统的行为,但是对于复杂系统的模拟,需要考虑到各种因素的相互影响,因此模拟精度可能受到一定的限制。
总之,数学建模的计算方法包括数值方法、优化方法和模拟方法。
不同的计算方法适用于不同类型的问题,选择合适的计算方法可以有效地求解数学模型,并得到实际问题的解答。
在实际应用中,常常会结合不同的计算方法,综合运用,以获得更准确、更全面的结果。
数学建模与科学计算数学建模与科学计算是一门应用数学学科,旨在通过建立数学模型,运用数值计算方法来解决现实世界中的问题。
它在物理学、生物学、工程学、经济学等领域中都有广泛的应用。
本文将介绍数学建模与科学计算的基本概念、方法以及在实际问题中的应用。
一、数学建模的基本概念数学建模是将实际问题抽象成数学模型的过程。
它通常包括以下几个步骤:1. 问题描述:明确问题的背景、目标和限制条件。
2. 建立模型:选择合适的数学工具和方法建立模型,例如方程、矩阵、图论等。
3. 求解模型:通过数学计算方法求解模型,并得到结果。
4. 模型验证:将模型的结果与实际情况进行比较,验证模型的准确性和可靠性。
二、科学计算的基本方法科学计算是指通过计算机进行数值计算、数据分析和模拟实验等方法来解决科学问题。
它通常包括以下几个步骤:1. 数据收集:从实际问题中收集和整理相关的数据,包括实验数据、观测数据等。
2. 数据分析:对收集到的数据进行统计分析、数据挖掘等方法,提取有用的信息。
3. 建立模型:根据问题的特点,选择合适的数学模型,将问题转化为数学形式。
4. 数值计算:通过计算机对模型进行求解,使用数值计算方法求得近似解。
5. 结果分析:对计算结果进行分析和解释,得出科学结论。
三、数学建模与科学计算的应用数学建模与科学计算在各个领域中都有广泛的应用。
以下是一些典型的应用例子:1. 物理学:数学建模与科学计算可以用来研究天体运动、流体力学、材料科学等问题。
2. 生物学:可以利用数学建模与科学计算来研究生物进化、生物流体力学、神经网络等问题。
3. 工程学:可以用来优化工程设计、模拟工程系统的运行、预测自然灾害等。
4. 经济学:可以用来研究市场行为、预测经济趋势、优化投资组合等问题。
5. 计算机科学:可以利用数学建模与科学计算来研究算法复杂性、人工智能等问题。
四、总结数学建模与科学计算在解决实际问题中发挥着重要的作用。
它不仅能够帮助我们深入理解问题的本质,还能够指导实际决策和优化设计。
民航飞行中的数学模型与计算一、数学模型概述1.数学模型的定义与分类2.数学模型在民航飞行中的应用价值3.建立数学模型的基本步骤二、民航飞行基本概念1.飞行速度与飞行时间2.飞行高度与飞行距离3.飞机性能指标(如推力、阻力、燃油消耗等)三、民航飞行中的数学模型1.飞行轨迹模型–直线飞行模型–曲线飞行模型(如圆周飞行、螺旋飞行等)2.飞行性能模型–动力学模型(牛顿运动定律、空气动力学方程等)–燃油消耗模型(如Wright公式、燃油流量公式等)3.飞行环境模型–大气模型(如国际标准大气模型、局部大气模型等)–气象模型(如风速、风向、降水等)4.飞行安全模型–避障模型(如圆柱避障、多边形避障等)–飞行间隔模型(垂直间隔、水平间隔等)四、计算方法与技巧1.数学建模方法–假设与简化–参数估计与优化–模型验证与修正2.数值计算方法–欧拉法、龙格-库塔法等数值积分方法–蒙特卡洛模拟、有限元分析等数值模拟方法3.计算机编程与软件应用–编程语言(如MATLAB、Python、C++等)–专业软件(如Mathematica、ANSYS、FLUENT等)五、民航飞行中的实际应用1.航线规划与航班调度–最佳航线规划算法(如遗传算法、蚁群算法等)–航班调度优化模型(如时间窗口、飞机利用率等)2.飞行管理与导航–飞行管理计算机(FMC)及其算法–卫星导航系统(如GPS、GLONASS等)3.飞行仿真与训练–飞行仿真器(如Flight Simulator、X-Plane等)–飞行训练大纲与教学方法六、发展趋势与展望1.人工智能与机器学习在民航飞行中的应用2.大数据与云计算在民航飞行领域的应用3.绿色航空与可持续发展知识点:__________习题及方法:一、数学模型概述习题习题1:定义一个数学模型,并说明其应用于民航飞行中的价值。
答案:定义:数学模型是用来描述现实世界中的某个特定系统的数学关系和规律的抽象表示。
在民航飞行中,数学模型可以用来预测飞机的飞行性能、优化航线规划、提高飞行安全性等。
数学专业的数学建模与计算机应用数学建模和计算机应用是当今数学专业的重要组成部分。
它们不仅是数学知识的应用和发展,而且也是解决实际问题的有力工具。
本文将介绍数学建模和计算机应用在数学专业中的重要性,以及它们对于现代社会的影响。
一、数学建模数学建模是通过技术手段将现实问题转化为数学问题,并利用数学方法来解决这些问题的过程。
它要求数学专业的学生具备扎实的数学基础知识,并具备将数学知识应用于实际问题的能力。
数学建模的过程包括对问题的分析、建立模型、求解模型和对结果的解释。
数学建模在数学专业中的重要性不言而喻。
通过数学建模,学生不仅可以将抽象的数学概念应用于实际问题,而且可以培养学生的创新意识和动手能力。
同时,数学建模也为数学专业的学生提供了一个实践和锻炼的平台,使他们能够更好地理解和掌握数学知识。
二、计算机应用计算机应用是指利用计算机技术和软件工具来解决实际问题的过程。
在数学专业中,计算机应用主要包括数值计算、数据处理和图像处理等方面。
通过计算机的强大计算和处理能力,数学专业的学生可以更加高效地求解数学问题,并且能够处理大量的数据和图像信息。
计算机应用在数学专业中的重要性不可忽视。
它不仅提高了学生的工作效率,而且也拓展了数学的研究领域。
借助计算机工具,数学专业的学生可以更加深入地研究和探索数学的各个领域,并且可以对数学模型进行仿真和实验。
三、数学建模与计算机应用的结合数学建模和计算机应用是相互关联和相互促进的。
数学建模需要计算机应用来进行数学模型的求解和仿真,而计算机应用也需要数学建模来提供数学基础和方法支持。
二者的结合使学生能够更加全面地理解和应用数学知识,同时也提高了问题的解决效率和准确性。
借助数学建模和计算机应用的结合,数学专业的学生可以解决更加复杂和实际的问题,并且可以开展更加深入和广泛的研究。
他们可以利用数学建模和计算机应用来研究和分析各种现象,探索数学的新理论和应用,为现代社会的发展做出更大的贡献。
2K-H行星齿轮传动优化设计数学建模与解算引言行星齿轮传动是一种常见的机械传动方式,广泛应用于各种设备和机械系统中。
优化设计行星齿轮传动,可以提高传动效率、减小体积和重量,从而实现更高的性能和更低的成本。
数学建模与解算是优化设计的重要步骤,通过数学模型,可以准确地描述齿轮传动系统的工作原理和性能参数,通过数值计算和优化算法,可以找到最优的设计参数和工作状态。
本文针对2K-H行星齿轮传动进行优化设计数学建模与解算的研究,通过数学分析和计算,找到最佳的参数组合和工作状态,为行星齿轮传动的优化设计提供理论和技术支持。
1. 2K-H行星齿轮传动的结构和工作原理2K-H行星齿轮传动是一种常见的行星齿轮传动结构,由太阳轮、行星轮、行星架、内齿轮和外齿轮等部件组成。
太阳轮和内齿轮由电机或其他动力装置驱动,行星轮由行星架支撑,并围绕太阳轮和内齿轮旋转,外齿轮则与行星轮啮合并输出动力。
通过这种结构,2K-H行星齿轮传动可以实现多种不同的传动比和输出方向,是一种灵活、高效的传动方式。
优化设计齿轮传动需要准确地描述和计算传动系统的性能参数,其中包括传动比、效率、载荷能力、寿命和噪音等。
对于2K-H行星齿轮传动而言,传动比是一个重要的参数,通过调整太阳轮、行星轮和内齿轮的尺寸和数量,可以实现不同的传动比。
效率是另一个关键参数,它直接影响传动系统的能量损失和发热,通过优化齿轮几何形状和啮合参数,可以提高传动效率。
载荷能力、寿命和噪音也是需要考虑的性能参数,它们与齿轮材料、加工工艺和润滑方式等因素有关。
基于建立的数学模型,可以进行2K-H行星齿轮传动的优化设计。
需要确定优化的目标和约束条件,例如最大化传动比、最大化效率或最小化体积和重量。
然后,可以采用数学优化算法,如遗传算法、粒子群算法和模拟退火算法,搜索最优的设计参数组合和工作状态。
数学优化算法包括了全局搜索和局部搜索两个方面,能够得到全局最优解或局部最优解,根据实际情况选择合适的算法和计算策略。
数学建模与计算1 多元线性回归1.1 回归系数的计算假设变量y 与p 个变量x 1, x 2, … , x p 之间存在以下线性关系:y = b 0 + b 1x 1 + b 2x 2 + … + b p x p (+ ε) (1.1)这些变量的n 组观测值如表1.1所示。
将这些数值代入(1.1)得y 1 = b 0 + b 1x 11 + b 2x 12 + … + b p x 1p y 2 = b 0 + b 1x 21 + b 2x 22 + … + b p x 2p ……y n = b 0 + b 1x n 1 + b 2x n 2 + … + b p x np (1.2)这是一个关于b 0, b 1, …,b p (待估参数)的线性方程组。
一般来说方程个数n 远大于变量个数p , 是一个不相容的线性方程组。
但是可以求出b 0, b 1, …,b p 的一组数值代入(1.2)式右边,使得等号两边的数值尽可能接近。
最常用的便是最小二乘法,即Min Q (b 0, b 1, …,b p ) =∑=----ni ip p i i x b x b b y 12110)...(令Y = ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n y y y 21, X =⎪⎪⎪⎪⎪⎭⎫⎝⎛np n n p p x x x x x x x x x 212222*********, β =⎪⎪⎪⎪⎪⎭⎫⎝⎛p b b b 10, 得Min Q (β) = (Y - X β)T (Y - X β) = Y T Y - 2Y T X β + βT X T X β这是一个关于β的凸二次函数。
令ββ∂∂)(Q = -2 X T Y + 2 X T X β = 0, 得到X T X β = X T Y .此式称为正规方程组或法方程组。
如果X T X 可逆,则βˆ= (X T X )-1X T Y . (1.3) 其中βˆ= (0ˆb ,1ˆb ,…, pb ˆ)T 。
定义1. n 元实值函数f (x ) = f (x 1, x 2, … , x n )的n 个偏导数构成的向量称为梯度函数,记为∇f (x )或xx f ∂∂)(, 即 x x f ∂∂)( = Tnx x f x x f x x f ))(,,)(,)((21∂∂∂∂∂∂ . 结论1.1. 设c 和x 是n 维数向量,那么xx c T ∂∂)(= c .结论1.2. 设A 是n ⨯ n 对称矩阵,x 是n 维向量,那么xAx x T ∂∂)(= 2Ax 。
结论1.3. X T X 可逆的必要充分条件是X 的列线性无关。
1.2 回归方程的检验定义总平方和SS tot = ∑-=ni i y y 12)(,回归平方和SS reg = ∑-=n i i y y12)ˆ(, 残差平方和SS err = ∑-=ni i i yy 12)ˆ(, 其中y =∑=n i i y 1/ n , i yˆ = 0ˆb +1ˆb x i 1 + … +p b ˆx ip 。
另外 R 2=totreg SS SS ,调节的R 2 = 1 - (1 - R 2)11---p n n .通常,R 2或调节的R 2大于0.95时可认为回归方程成立。
1.3 可以用线性回归方法求解的非线性模型(1) 二次函数y = c 0 + c 1x + c 2x 2.将x 2看作一个新的变量,这是一个具有2个自变量的线性模型。
设x 的观测值为x 1, x 2, … , x n , y 的观测值为y 1, y 2, … , y n , 则公式(1.3)中的X = ⎪⎪⎪⎪⎪⎭⎫⎝⎛2222211111n n x xx x x x , Y = ⎪⎪⎪⎪⎪⎭⎫⎝⎛n y y y 21, β = ⎪⎪⎪⎭⎫ ⎝⎛210c c c(2) C-D 函数Y = AL αK β其中L 是劳动力的投入,K 是资金投入,Y 是产出,A 称为技术系数。
A , α, β是待估参数。
两边取对数得ln Y = ln A + αln L + βln K(3) 施工区交通事故模型[2]ln f = α0 + α1ln L + α2D1 + α3Q 1+ α4U 其中f 是施工区交通事故频率,L 是施工区长度,D 是施工期,Q 是交通流量, U 是道路类型。
(4) 单隧道地表沉降槽的高斯曲线模型S = S max 2ax e其中S 是x 处的沉降深度,S max 和a 是待估参数。
两边取对数得ln S = ln S max + ax 2.1.4 不可以用线性回归方法求解的非线性模型(1) 逻辑增长曲线预测模型btt ae ky -+=1其中y t 是第t 期某经济指标的数值,k , a , b 是待估参数。
(2) 双隧道地表沉降槽的高斯曲线模型[3]S = s 121x a e+ s 222)(u x a e-其中S 是x 处的沉降深度,u 是两隧道中心的距离,s 1, a 1, s 2, a 2是待估参数。
以上两个模型的参数可用非线性最小二乘法求取。
假设变量y 自变量x (∈R p )之间存在以下关系:y = f (x ; β)(+ ε)其中β ∈ R m 是待估参数。
给定因变量与自变量的若干组观测值(y i , x i ),非线性最小二乘的数学模型如下:∑-=ii i x f y Q 2)),((min ββ这是一个无约束极值问题,由于形式特殊,可用Levenberg-Marquardt(LM)方法求解,见[4]p262-266.习题(1) 证明结论1.1, 1.2和1.3。
(2) 编一个计算程序计算(X T X)-1。
参考文献[1] 盛骤,谢式千,潘承毅. 概率论与数理统计,高等教育出版社,1997.[2] Qiang Meng, Jinxian Weng, Xiaobo Qu. A probabilistic quantitative risk assessment model for the long-term work zone crashes, Accident Analysis and Prevention, 2010, (42) 1866-1877.[3] 马灵. 基于数据挖掘的隧道施工地表沉降规律研究,华中科技大学博士学位论文,2013.[4] Jorge Nocedal, Stephen J Wright. Numerical Optimization数值最优化,科学出版社,2006.2 神经网络2.1 BP神经网络回归分析是寻求因变量y与自变量x (∈R p)之间函数关系的一种统计分析方法。
这种方法需要给定两者之间函数关系的形式y = f(x; β), 利用因变量与自变量的若干组观测值(y i, x i)确定参数β(∈R m),一般用最小二乘法。
y = f(x; β)是x的线性函数时称为线性最小二乘问题,是x的非线性函数时称为非线性最小二乘问题。
对于许多实际问题,因变量与自变量之间的关系很复杂,难以确定它们之间函数关系的形式。
(人工)神经网络不要求明显地给出因变量与自变量之间函数关系的表达式。
神经网络是由一些单元(神经元)按一定方式连接而成的网络,其形式多种多样,最常用的是分层前向神经网络,其第一层是输入层,最后一层是输出层,中间一般有1或2层,称为隐层。
输入层和输出层单元的个数由需要解决的问题本身决定,隐层单元的个数由实验确定,使得网络的输出尽可能与目标值接近。
图2.1是一个具有三个输入两个输出一个隐层的神经网络,其中的圆圈表示单元,与圆圈相连的箭线表示其输入或输出。
图2.1 神经网络的例子神经网络的每个单元对应一个数字,称为输出。
输入层单元的输入相当于自变量的观测值。
隐层和输出层每个单元的输入是前一层各单元输出的加权和,称为净输入。
将净输入代入一个称为激励函数或传递函数的一元函数,得到的数值便是该单元的输出。
为了防止各单元的净输入不至于过大或过小,有时需加上一个数值,称为调整量。
神经网络的主要工作是不断调整权值,称为训练,使得其输出尽可能接近理想输出(相当于回归分析中因变量的观测值)。
调整权值的方法很多,最有名的是分层神经网络中使用的误差反向传播(Back Propagation, BP )算法。
在分层神经网络中,隐层和输出层每个单元的输出递归地确定。
设神经网络有p 个输入,q 个输出,分L 层。
激励函数为g (∙)。
用w ij l 表示第l - 1层单元i 指向第l 层单元j 的连接权。
在给定p 个输入y 11, y 21, … , y p 1和所有连接权的前提下,其他单元的输出由左到右由上到下依次计算。
第l 层单元j 的净输入h j l =∑-il ij l i w y 1 第l 层单元j 的输出y j l = g (h j l ), l = 2, … , L .对隐层和输出层每个单元由左到右进行的以上运算称为前向传播。
以图2.1网络部分单元为例说明前向传播计算方法。
隐层第1个单元的净输入h 12 = y 11w 112 + y 21w 212 + y 31w 312.该单元的输出y 12 = g(h 12).输出层第1个单元的净输入h 13 = y 12 w 113+ y 22w 213 + y 32w 313 + y 42w 413.该单元的输出y 13 = g(h 13).计算涉及的数据见图2.2。
2图2.2 前向传播(部分)示意图一般来说,图2.1隐层各单元的净输入和输出为∑==31212i ij i jw y h , )(22j j h g y =, j = 1, 2, 3, 4. (2.1)图2.1输出层各单元的净输入和输出为∑==41323i ij i jw y h ,)(33j j h g y =,j = 1, 2. (2.2) 激励函数有许多,例如([1]p124)(1) 线性函数g (x ) = cx .(2) 符号函数g (x ) = sgn(x ) = ⎩⎨⎧<-≥.0,1,0,1x x(3) Sigmoid 函数g (x ) =xe -+11.(4) 双曲函数g (x ) = xxe e --+-11.神经网络每层用到的激励函数可能不一样([2]p132),根据实验效果确定。
设神经网络最后一层单元j 的目标值为d j L ,为了使得各单元的输出y j L 尽可能接近d j L ,极小化误差平方和:∑==-=q j L j L j wy d E 12)(21min ∑=-qj L j L j h g d 12))((21 (2.3)以获取连接权w ij l 的数值。
E 的表达式称为成本函数或业绩函数,w 是所有连接权构成的向量。
由于h j L =∑-kLkj L k w y 1,按照复合函数求导法,E 对第L - 1层单元i 与第L 层单元j 的连接权w ij L 的偏导数Lijw E∂∂= j h E ∂∂L ij L j w h ∂∂= -(d j L - y j L ) g ’(h j L ) y iL -1. (2.4) 其中L jh E ∂∂=-(d j L - y j L ) g ’(h j L )。