第二章 变分原理
- 格式:doc
- 大小:1.91 MB
- 文档页数:34
变分原理与变分法变分原理是数学物理中的一种基本原理,用于描述自然界中的物理现象。
它是物理学中的最小作用量原理的数学表述。
变分原理与变分法密切相关,是变分法的基础。
变分原理是由欧拉-拉格朗日提出的,并以他们的名字命名。
它表明,自然界的真实运动是使作用量取极值的路径。
作用量是在一个过程中所有可能路径上对拉格朗日量(描述系统运动的函数)进行积分得到的。
换句话说,作用量是描述系统整体运动的一个量度。
在物理学中,拉格朗日函数常常由系统的动能和势能构成。
通过对动能和势能的定义,我们可以得到描述系统运动的拉格朗日方程。
拉格朗日方程是变分原理的数学表达式,它通过求解一组微分方程来描述系统的运动。
变分法是一种数学方法,用于求解泛函问题。
泛函是一个函数的函数,通常是由一个区间上的函数组成的。
在变分法中,我们通过将泛函写成一族函数的积分形式,并求解使得泛函取极值的函数。
这就涉及到求取泛函的变分(即导数)。
变分法的基本思想是将泛函中的函数进行微小的变化,然后求取这个变化对泛函的影响。
这个变化就是变分,通常用符号δ表示。
然后通过对泛函进行导数运算,得到变分后的泛函表达式。
最后,将变分的泛函表达式置于极值条件下,即求取变分后的泛函为零的解,就可以求得泛函的最优解。
在物理学中,变分法常常用于求解极值问题,如最小作用量问题、哈密顿原理以及量子力学中的路径积分等。
它为我们提供了一种强大的工具,用于描述和预测自然界中的物理现象。
总结起来,变分原理是描述自然界中物理现象的最小作用量原理的数学表述,而变分法是求解泛函问题的一种数学方法。
它们相互依存,变分原理提供了变分法的理论基础,而变分法为我们提供了一种强大的工具,用于求解各种物理问题。
变分原理与变分法的理论和应用涉及数学、物理、工程等多个领域,对于理解和研究复杂的物理现象具有重要的意义。
变分原理与变分法一、变分原理的基本概念变分原理是针对泛函的一种表述方式。
所谓泛函是指一类函数的函数,这类函数可以是数学上的对象,也可以是物理上的对象。
变分原理是以泛函的极值问题为基础,通过对泛函进行变分计算,求取泛函的极值。
在变分原理中,被考虑的对象是泛函数而不是函数。
二、变分原理的基本原理三、变分法的基本步骤变分法是通过对泛函的变分计算来解决极值问题。
它的基本步骤如下:1.建立泛函:根据具体的问题,建立一个泛函表达式,其中包含了待求函数及其导数。
2.变分计算:对建立的泛函进行变分计算,即对泛函中的待求函数及其导数进行变动,求出泛函的变分表达式。
3.边界条件:根据具体问题的边界条件,对变分表达式进行求解,得到泛函的变分解。
4.极值问题:根据泛函的变分解,通过进一步的计算确定泛函的极值。
四、变分原理和变分法的应用1.物理学中的应用:变分原理和变分法在物理学中有广泛的应用。
例如,拉格朗日方程和哈密顿方程可以通过变分原理推导出来。
此外,在量子力学和场论中,变分法也被用于求解相应的泛函积分方程。
2.工程学中的应用:在工程学中,变分原理和变分法常用于求解最优化问题。
例如,在结构力学中,通过变分法可以求解出构件的最优形状和尺寸。
在控制理论中,变分法可以用于求解最优控制问题。
3.数学学科中的应用:变分原理和变分法在数学学科中也有重要的应用。
例如,在函数极值问题中,变分法可以用于求解一类非线性偏微分方程的临界点。
总之,变分原理与变分法是一种强有力的数学工具,具有广泛的应用领域。
通过应用变分原理和变分法,可以更好地解决求极值问题,进而推导出物理方程、最优设计和数学方程等相关问题的解。
因此,深入理解变分原理和变分法对于数学、物理、工程等学科的研究和应用具有重要的意义。
第二章变分法变分法(Variational calculus )是研究泛函极值的数学方法,早在十七世纪末,几何学、力学等领域相继提出了一些泛函极值问题(最速降线问题、最小旋转曲面问题等),导致了变分法的形成和发展。
本章我们介绍变分法及其在最优控制中的应用。
第一节 泛函及其极值我们首先给出泛函的定义定义1.1 设Ω为一函数的集合,若对于每一个函数Ω∈)(t x ,都有一个实数J 与之对应,则称J 是定义在Ω上的泛函,记作))((t x J 。
Ω称为J 的容许函数集合,Ω∈)(t x 称为宗量。
例 1 对于xy 平面上过定点),(11y x A 和),(22y x B 的每一条光滑曲线)(x y ,绕x 轴旋转得一旋转体,旋转体的侧面积是曲线)(x y 的泛函⎰+=21))(1()(2))((2x x dx x yx y x y J π, 容许函数集合可表示为})(,)(],,[)()({2211211y x y y x y x x C x y x y ==∈=Ω.第一章中介绍的三个性能指标1)终端型性能指标也称麦耶(Mayer )型性能指标)),(()(11t t x x J Φ=,2)积分型性能指标还称拉格郎日(Lagrange )型性能指标⎰=1))(),(,()(0t t dt t xt x t f x J , 3)混合型性能指标也叫包尔查(Bolza )型性能指标⎰+Φ=1))(),(,()),(()(011t t dt t xt x t f t t x x J , 它们都是泛函,并且它们之间可以相互转化。
引进新的函数)(0t x ,它是如下微分方程初值问题的解.0)()),(),(,()(0000==t x t x t x t f t x则拉格郎日(Lagrange )型性能指标就化为⎰=≡Φ1))(),(,()()),((01011t t dt t xt x t f t x t t x , 变成麦耶(Mayer )型性能指标。
§9 变分原理9.1 弹性变形体的功能原理学习要点:本节讨论弹性体的功能原理。
能量原理为弹性力学开拓了新的求解思路,使得基本方程由数学上求解困难的偏微分方程边值问题转化为代数方程组。
而功能关系是能量原理的基础。
首先建立静力可能的应力和几何可能的位移概念;静力可能的应力和几何可能的位移可以是同一弹性体中的两种不同的受力状态和变形状....................态,二者彼此独立而且无任何关系。
................建立弹性体的功能关系。
功能关系可以描述为:对于弹性体,外力在任意一组几何可能的位移上所做的功,等于任意一组静力可能的应力在与上述几何可能的位移对应的应变分量上所做的功。
9.1.1 静力可能的应力:假设弹性变形体的体积为V,包围此体积的表面积为S。
表面积为S 可以分为两部分所组成:一部分是表面积的位移给定,称为Su;另外一部分是表面积的面力给定,称为Sσ。
+Sσ显然S=Su假设有一组应力分量σij在弹性体内部满足平衡微分方程在面力已知的边界Sσ,满足面力边界条件这一组应力分量称为静力可能的应力。
静力可能的应力未必是真实的应力,................因为真实的应力还....................必须满足应力表达的变形协调方程...............,但是真实的应力分量必然是静力可能的应力。
.........为了区别于真实的应力分量,我们用表示静力可能的应力分量。
9.1.2 几何可能的位移:假设有一组位移分量u i和与其对应的应变分量εij,它们在弹性体内部满足几何方程在位移已知的边界S u上,满足位移边界条件这一组位移称为几何可能的位移。
几何可能的位移未必是真实的位移,因为真实的位移还必须在弹性体内部满足位移表示的平衡微分方程..........;在面力已知的边界..................。
但是,真实的位移必然是...S.σ.上,必须满足以位移表示的面力边界条件几何可能的。
第二章 弹性力学基本理论及变分原理弹性力学是固体力学的一个分支。
它研究弹性体在外力或其他因素(如温度变化)作用下产生的应力、应变和位移,并为各种结构或其构件的强度、刚度和稳定性等的计算提供必要的理论基础和计算方法。
本章将介绍弹性力学的基本方程及有关的变分原理。
§2.1小位移变形弹性力学的基本方程和变分原理在结构数值分析中,经常用到弹性力学中的定解问题及与之等效的变分原理。
现将它们连同相应的矩阵形式的张量表达式综合引述于后,详细推导可参阅有关的书籍。
§2.1.1弹性力学的基本方程的矩阵形式弹性体在载荷作用下,体内任意一点的应力状态可由6个应力分量表示,它们的矩阵表示称为应力列阵或应力向量111213141516222324252633343536444546555666x x y y z z xy xy yz yz zx zx D D D D D D D D D D D D D D D D D D D D D σεσεσετγτγτγ⎧⎫⎡⎤⎧⎫⎪⎪⎢⎥⎪⎪⎪⎪⎢⎥⎪⎪⎪⎪⎢⎥⎪⎪⎪⎪⎪⎪=⎢⎥⎨⎬⎨⎬⎢⎥⎪⎪⎪⎪⎢⎥⎪⎪⎪⎪⎢⎥⎪⎪⎪⎪⎢⎥⎪⎪⎪⎪⎩⎭⎣⎦⎩⎭ (2.1.1) 弹性体在载荷作用下,将产生位移和变形,弹性体内任意一点位移可用3个位移分量表示,它们的矩阵形式为[]T u u v u v w w ⎧⎫⎪⎪==⎨⎬⎪⎪⎩⎭(2.1.2)弹性体内任意一点的应变,可由6个应变分量表示,应变的矩阵形式为x y Tz xy z xy yz zx xy yz zx εεεσεεεγγγγγγ⎧⎫⎪⎪⎪⎪⎪⎪⎪⎪⎡⎤==⎨⎬⎣⎦⎪⎪⎪⎪⎪⎪⎪⎪⎩⎭(2.1.3)对于三维问题,弹性力学的基本方程可写成如下形式 1 平衡方程0xy x zx x f x y z τστ∂∂∂+++=∂∂∂ 0xy y zy y f xyzτστ∂∂∂+++=∂∂∂0yz zx zz f x y zττσ∂∂∂+++=∂∂∂ x f 、y f 和z f 为单位体积的体积力在x 、y 、z 方向的分量。
变分原理及其应用变分原理是变分法的理论基础,它起源于十八世纪,由欧拉首次提出,并由拉格朗日、哈密顿等学者进一步完善和推广。
变分原理为求解极值问题提供了一种统一的方法,广泛应用于物理学、力学、电磁学、光学、量子力学等领域。
变分问题是寻找一个函数使得一些函数能量泛函取得极值,通常是最小值。
而变分原理则提供了一个求极值问题的一般性框架,其核心思想是找到一个引理或原理,使得能量泛函的极值条件变得容易得到。
对于一个实数域上的函数,可以定义一个泛函,称为能量泛函,它通常用一个定积分表示:\[ J[y(x)]=\int_{a}^{b}F(x,y(x),y'(x))dx \]其中,\[F(x,y(x),y'(x))\]是在积分区间[a,b]上的连续函数,而\[y'(x)\]是\[y(x)\]的导数。
变分原理的基本思想是,如果\[J[y]\]在\[y(x)\]处取得极值,那么\[y(x)\]应该满足一些特殊的微分方程,这个微分方程称为欧拉-拉格朗日方程。
应用领域:1.牛顿力学:变分原理被应用于质点、刚体和连续介质的力学问题。
通过将物体运动的能量泛函进行最小化,可以得到物体运动的欧拉-拉格朗日方程,从而推导出牛顿第二定律。
2.动力学:变分原理被应用于研究力学系统的动力学性质,如自由自由度系统和约束系统。
通过最小化系统的哈密顿量泛函,可以推导出系统的哈密顿方程,得到系统的运动方程。
3.场论:变分原理可用于描述场的运动和作用,并得到相应的场方程。
例如,通过最小化电磁波的作用量泛函,可以得到麦克斯韦方程组。
4.最优控制:变分原理可用于寻找动力系统的最优控制策略。
通过最小化控制系统的哈密顿量泛函,可以得到系统的最优控制方程。
5.经济学:变分原理被应用于经济学中的边际分析。
通过最小化经济系统的效用泛函,可以得到最优生产和消费策略。
总之,变分原理是一种强大的数学工具,可以应用于各种不同领域的问题求解。
通过最小化能量泛函,可以得到物体、场或系统的运动方程和约束条件,从而解决实际问题。
第二章 变分原理变分原理是力学分析中重要数学工具之一,能量法、有限元法、加权残值法等力学方法都是以变分原理为数学工具的。
变分法的早期思想是Johann Bernoulli 在1696年以公开信的方式提出最速降线命题,并在1697年进行了解决。
关于变分法的一般理论是Euler 于1774年、Lagrange 于1762年共同奠基的,我们称之为Euler-Lagrange 变分原理。
1872年Betti 提出了功的互等定理。
1876年意大利学者Castigor 提出了最小功原理。
德国学者Hellinger 于1914年发表了有关不完全广义变分原理,后来美国学者Reissner 发表了与Hellinger 相类似的工作,此工作被称之为Hellinger-Reissner 变分原理。
我国学者钱令希于1950年发表“余能原理”论文。
我国学者胡海昌于1954年发表了有关广义变分原理的论文,日本学者鹫津久一郎(Washizu)于1955年发表了与有胡海昌相类似的工作,此工作被称之为胡-鹫变分原理。
1956年Biot 建立了热弹性力学变分原理。
1964年钱伟长提出用Lagranger 乘子构造广义 分原理的方法。
1964年Gurtin 提出了线弹性动力学变分原理。
1967年意大利学者Tonti 提出了四类变量的广义变分原理,在这类变分原理中,位移、应变、应力及Beltrami 应力函数都是变分变量。
§ 2.1 历史上著名的变分法命题历史上有三个著名的变分法命题,即最速降线问题、短程线线问题和等周问题。
这三个命题的提出和解决推动了变分法的发展。
1、最速降线命题1695年,Bernoulli 以公开信方式提出了最速降线命题。
如图2-1所示,设有不在同一垂线上的A 、B 两点,在此两点间连一曲线,有一重物沿此曲线下滑,忽略各种阻力的理想情况,什么曲线能使重物沿曲线AB 光滑下滑的时间最短。
设A 点与坐标原点O 重合,B 点的坐标为(x 1,y 1),滑体质量为m ,从O 点下滑至P 点时的速度为v ,根据能量恒原理,有:221mv mgy =(2-1)用s 表示弧长,则沿弧切向方向的速度为: 图2-1 最速降线图gy dt ds v 2==(2-2)曲线弧长为:dx dx dy dydx ds 2221⎪⎭⎫ ⎝⎛+=+=(2-3)于是,时间为:()dx gyyvds dt 212'+==(2-4)下降时间为:()⎰⎰+==12'021x Tdx gyydt T (2-5)经过求解,最速降线为圆滚线,其参数方程为:()()θθθcos 12sin 2-=-=C y C x (2-6)2、短程线命题设()0,,=z y x ϕ是如图2-2所示的曲面,在此曲面上有A 、B 两点,试问如何连接可使此曲面上A 、B 两点间的距离最短。
设A 点的坐标为()111,,z y x A 、B 点的坐标为()222,,z y x B ,在曲面上A 、B 两点的曲线长度为:dx dx dz dx dy L x x ⎰⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛+=21221 (2-7)其中,()()x z z x y y ==,是满足曲面()0,,=z y x ϕ的约束条件。
3、等周命题等周命题为在长度一定的闭合曲线中,什么曲线围成的面积最大。
图2-2 短程线 设所给曲线的参数方程为()()s y y s x x ==,,因这条曲线是封闭的,在这条曲线的始端和末端,有()()()()1010,s y s y s x s x ==。
该曲线周长为:ds ds dy ds dx L s s ⎰⎪⎭⎫⎝⎛+⎪⎭⎫ ⎝⎛=122 (2-8) 由于该曲线封,根据格林公式:()⎰⎰⎰+-=⎪⎭⎫ ⎝⎛+ΩYdy Xdxdxdy dx dX dx dY (2-9)该曲线所围成的面积为:()()⎰⎰⎰⎰⎰⎰⎪⎭⎫⎝⎛-=-=+=ΩΩ1021211121s s ds dsdx y ds dyx ydx xdydxdydxdy (2-10) 于是等周问题可以归纳为在满足()()()()1010,s y s y s x s x ==和式(2-8)条件下,从所有可能函数中选择一对函数使面积最大。
§ 2.2 泛函的概念在函数论中,自变量x 对应着另一变量y ,则变量y 称为自变量x 的函数()y x 。
假如自变函数()y x 对应着另一个函数[]()y x ∏,则[]()y x ∏称为泛函。
函数是变量与变量之间的关系,泛函是变量与函数之间的关系。
泛函是函数的函数,是函数的广义函数。
通过微分学和变分学对比,可理解变分特性。
2.2.1 微分和变分函数()y x 的自变量x 的增量x ∆是x ∆=x -1x ,当x 是独立变量时,x 的微分等于x 的增量,即dx x =∆;泛函[]()y x ∏的自变函数c 的增量在它很小时称为变分,用()y x δ或简单地用y δ表示。
变分y δ等于()y x 与跟它相接近、并通过边界的另一个函数1()y x 之差,即()y x δ=()y x -1()y x 。
特别指出的是,变分()y x δ不是常值,而是通过边界条件的函数。
两个自变函数相接近的意义可有不同的理解,最简单的理解是在任意x 值上()y x 和1()y x 之差很小,即:()y x -1()y x ε≤ (2-11)这种接近称零阶接近度,如图2-3所示。
很明显,这时之差''1()()y x y x -不一定是微量。
如果满足零阶接近,同时满足自变函数的斜率也很接近,即:1''1()()()()y x y x y x y x ⎧-≤⎪⎨-≤⎪⎩εε(2-12)这种接近称一阶接近度,如图2-4所示。
图 2-3 零阶接近度 图2-4 一阶接近度依次类推,k 阶接近度要求零阶至k 阶导数之差都很小。
1111122211()()()()()()...()()k k k y y x y x y y x y x y y x y x y y x y x ⎧=-≤⎪=-≤⎪⎪=-≤⎨⎪⎪⎪=-≤⎩δεδεδεδε (2-14) 接近度越高,两条曲线亦越接近。
2.2.2 函数的微分和泛函的变分函数的微分有两个定义。
一个是通常的定义,即函数的增量定义为:()()y y x x y x ∆=+∆- (2-15) 可展开为x ∆的线性项和非线性项之和,即()(,)y A x x x x x β∆=∆+∆∆ (2-16) 其中线性项()A x 和x ∆无关,(,)x x β∆与x ∆有关,是高次项,当0x ∆→时(,)x x β∆0→,此时可称()y x 是可微,相应有:'()lim()x y dy A x x y dxdyy A x dxx∆→∆==∆=∆==∆ (2-17)也可以说,对于可微函数,函数的微分是函数增量的主部分,即线性项。
函数的第二定义是设ε是为一小参数,将()y x x ε+∆对ε求导数,即'()()()()()y x x x x y x x y x x x x x εεεεεεε∂+∆∂+∆+∆==+∆∆∂∂+∆∂ (2-18)当ε趋近于零时'()()y x x y x x εεε→∂+∆|=∆∂ (2-19)这就说明,()y x x ε+∆在ε=0处对ε的导数等于()y x 在x 处的微分。
ε称为拉格朗日乘子,此法称为拉格朗日乘子法。
泛函的变分也有类似的两个定义。
第一个定义:自变函数()y x 的变分()y x δ所引起的泛函的增量,即: [][]()()()y x y x y x δ∆∏=∏+-∏ (2-20)类似地,其可展开为线性项和非线性项 [][]m a x (),()(),()L y x y x y x y x y δβδδ∆∏=+ (2-21) 其中L 是对()y x δ的线性泛函项,而β是非线性泛函项,是()y x δ的同阶或高阶微量,当()y x δ0→时m ax 0y δ→,同时β也趋近于零,这时泛函的增量等于()y x δ的线性部分[](),()L y x y x δ,叫做泛函的变分,用δ∏来表示。
[][][]0()()()(),()y y x y x y x L y x y xδδδδ→∏=∆∏|=∏+-∏= (2-22) 所以泛函的变分是泛函增量的主部,而且这个主部对于函数变分()y x δ来说是线性的。
第二个定义:泛函变分是[]()()y x y x ∏+εδ对ε在0=ε处的示导值。
泛函的增量用微小参数ε表示为:[][][][]m a x()()()(),()(),()y x y x y x L y x y x y x y x yεδεδβεδεδ∆∏=∏+-∏=+ (2-23)因为泛函导数是[]()()y x y x εδ∏+对ε的导数在ε=0时的值,于是有[][][][]m a xm a x()()(),()(),()()(),()()y x y x Ly x y x y x y x y x y x y x yx εδεδβεδδεεβεδεδε∂∂∏+=+∂∂∂+∂ (2-24)因为线性项[](),()L y x y x εδ对()y x δ是线性的,故 [][](),()(),()L y x y x L y x y x εδεδ= (2-25) 并且当ε0→时[](),()0y x y x βεδ→,m ax 0y δ→,得[][]()()(),()y x y x Ly x y x εδδε∂∏+=∂ (2-26)由此得拉格朗日的泛函变分定义为 [][]0()()(),()y x y x Ly x y xεδεδδε→∂∏=∏+|=∂ (2-27)2.2.2 变分运算规则自变函数的变分()y x δ是x 的函数,于是可以用x 求导数[]''11()()()()()()dy x d dy x dy x y x y x y x dxdxdxdx δδ⎡⎤=-=-=⎢⎥⎣⎦(2-28) 即[]()()d dy x y x dx dx δδ⎡⎤=⎢⎥⎣⎦(2-29) 因此,变分δ和导数d d x的运算可换,变分的导数等于导数的变分。
同理有:[][]""()()()()n ny x y x y x y x δδδδ== (2-30) 其它运算规则如下:()()()()()()221112121221122122112211 ()2 ()3 (/)()/45 ()()6 n n n nx x x x n y y dx dx-∏+∏=∏+∏∏∏=∏∏+∏∏∏∏=∏∏-∏∏∏∏=∏∏=∏=∏⎰⎰δδδδδδδδδδδδδδδ (2-31)2.2.3 极大极小——极值问题与函数的极大、极小问题相类似,泛函也有极大、极小问题。