最小二乘法
- 格式:doc
- 大小:190.00 KB
- 文档页数:9
最小2乘法公式
最小二乘法是一种数学方法,可以用来解决线性回归问题。
线性回归问题是指在给定一堆数据的情况下,寻找一个函数,使得这个函数能够最好地拟合这堆数据。
最小二乘法的目标是使得这个函数的预测值与实际值之间的误差平方和最小。
最小二乘法最早由法国数学家勒让德在19世纪提出,被广泛应用于科学、工程和金融等领域。
通常,最小二乘法的公式可以用矩阵与向量的乘积来表示。
在这个公式中,我们需要用到一些符号:Y:实际值的向量(n行1列)
X:预测值的矩阵(n行p列)
b:回归系数的向量(p行1列)
e:误差的向量(n行1列)
其中,n表示数据的数量,p表示回归系数的数量。
最小二乘法的公式是:
b = (X^TX)^(-1)X^TY
在这个公式中,^T表示转置,^(-1)表示矩阵求逆。
这个公式的核心是矩阵求逆。
如果矩阵没有逆矩阵,我们就无法使用最小二乘法来解决线性回归问题。
此外,如果数据量很大,矩阵
的求逆操作也会变得非常耗时。
因此,在实际应用中,我们需要采用一些基于最小二乘法的变种算法来加速计算。
总体而言,最小二乘法是一个非常有用的数学工具,可以帮助我们解决许多实际问题。
当然,在使用最小二乘法的时候,我们需要注意数据的质量和数量,以及算法的适用范围和参数调整等问题,才能取得最好的效果。
最小二乘法的推导最小二乘法是统计学中一种常用的数据拟合方法,它是将待拟合函数的拟合优度衡量为误差平方和最小化的问题,属于最优化策略。
它可以用来拟合非线性模型,使得得到的模型拟合更加精确。
一、最小二乘法概念最小二乘法是一种数据拟合方法,它是将待拟合函数的拟合优度衡量为误差平方和最小化的问题,属于最优化策略。
最小二乘法的主要思想是,对给定的一组观测值,在满足某种条件下,这组观测值可以用一个或几个理论模型来描述,从而使拟合模型尽可能逼近实际观测值,达到拟合精度最高的目的。
二、最小二乘法推导考虑一个最小二乘问题,我们希望拟合一组数据,它们的点坐标可以用一个关于d个未知参数(p1,p2,p3,…,pd)的多项式表示,即:F(x,p1,p2,p3,…,pd)将多项式中的参数(p1,p2,p3,…,pd)的值求出,就可以对已知数据进行拟合。
最小二乘法表示形式:要使拟合模型参数值与所拟合数据做到最拟合,就要将拟合模型和实际数据的差值最小化,也就是求出多项式中的参数的值,使得误差平方和最小根据最小二乘法的优化性质,我们可以写出最小二乘优化问题的形式将误差平方和最小化的条件写出来就为:S=(f(x1,p1,…,pd)-y1)^2+(f(x2,p1,…,pd)-y2)^2+…+(f(xn,p1,…,pd)-yn)^2最小二乘问题表示为:min{S(p1,p2,…,pd)}其中p1,p2,…,pd是未知参数,我们要求这些参数值使得S 最小。
为了求得最小二乘拟合参数和进行形式转换,我们对S求偏导:S/pi=2*(f(xi,p1,…,pd)-yi)*f(xi,p1,…,pd)/pi 当S/pi=0时,即有(f(xi,p1,…,pd)-yi)*f(xi,p1,…,pd)/pi=0 于是,我们将最小二乘拟合参数pi的表达式改写为:pi=(A-1)*B其中A=∑(f(xi,p1,…,pd)/pi)^2,B=∑(f(xi,p1,…,pd)-yi)*f(xi,p1,…,pd)/pi根据最小二乘法,我们就可以求得最小二乘拟合参数pi的值了。
最小二乘法知识最小二乘法是一种最优化方法,经常用于拟合数据和解决回归问题。
它的目标是通过调整模型参数,使得模型的预测值与观测值之间的差异最小。
最小二乘法的核心思想是最小化误差的平方和。
对于给定的数据集,假设有一个线性模型y = β₀ + β₁x₁ + β₂x₂ + ... +βₙxₙ,其中β₀, β₁, β₂, ... , βₙ 是需要求解的未知参数,x₁, x₂, ... , xₙ 是自变量,y 是因变量。
那么对于每个样本点 (xᵢ, yᵢ),可以计算其预测值ŷᵢ = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ,然后计算预测值与实际值之间的差异 eᵢ = yᵢ - ŷᵢ。
最小二乘法的目标是使得误差的平方和最小化,即最小化目标函数 E = ∑(yᵢ - ŷᵢ)²。
对于简单的线性回归问题,即只有一个自变量的情况下,最小二乘法可以通过解析方法求解参数的闭合解。
我们可以通过求偏导数,令目标函数对参数的偏导数等于零,求解出参数的最优解。
然而,对于复杂的非线性回归问题,解析方法通常不可行。
在实际应用中,最小二乘法通常使用迭代方法进行求解。
一种常用的迭代方法是梯度下降法。
梯度下降法通过反复进行参数更新的方式逐步降低目标函数的值,直到收敛到最优解。
具体而言,梯度下降法首先随机初始化参数的值,然后计算目标函数对于每个参数的偏导数,根据偏导数的方向更新参数的值。
迭代更新的过程可以通过下式表示:βₙ = βₙ - α(∂E/∂βₙ)其中,α 是学习率参数,控制每次更新参数的步长。
学习率需要适当选择,过小会导致收敛过慢,过大会导致震荡甚至不收敛。
最小二乘法除了可以用于线性回归问题,还可以用于其他类型的回归问题,比如多项式回归。
在多项式回归中,我们可以通过增加高次项来拟合非线性关系。
同样地,最小二乘法可以通过调整多项式的系数来使得拟合曲线与实际数据更加接近。
除了回归问题,最小二乘法还可以应用于其他领域,比如数据压缩、信号处理和统计建模等。
必修三中的最小二乘法必修三中的最小二乘法这种使用均方误差作为损失,并求得损失最小值的方法就叫做最小二乘法线性模型相信很多人遇到最小二乘法是在高中数学必修三里,那么让店铺来为大家介绍一下什么最小二乘法以及二乘法的运用和案例。
什么是最小二乘法最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
最小二乘法还可用于曲线拟合。
其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
最小二乘法原理最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
最小二乘法还可用于曲线拟合。
其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
示例:数据点(红色)、使用最小二乘法求得的最佳解(蓝色)、误差(绿色)。
某次实验得到了四个数据点:...(右图中红色的点)。
我们希望找出一条和这四个点最匹配的直线,即找出在某种“最佳情况”下能够大致符合如下超定线性方程组的和:最小二乘法采用的手段是尽量使得等号两边的方差最小,也就是找出这个函数的最小值:最小值可以通过对分别求和的偏导数,然后使它们等于零得到。
如此就得到了一个只有两个未知数的方程组,很容易就可以解出:也就是说直线是最佳的。
人们对由某一变量或多个变量……构成的相关变量感兴趣。
如弹簧的形变与所用的力相关,一个企业的盈利与其营业额,投资收益和原始资本有关。
为了得到这些变量同之间的关系,便用不相关变量去构建,使用如下函数模型,个独立变量或个系数去拟合。
通常人们将一个可能的、对不相关变量t的构成都无困难的函数类型称作函数模型(如抛物线函数或指数函数)。
参数b是为了使所选择的函数模型同观测值y相匹配。
最小二乘法的原理及其应用1. 最小二乘法的原理最小二乘法是一种常用的数学优化方法,其原理是通过最小化残差平方和来寻找数据的最佳拟合线或曲线。
当数据存在随机误差时,最小二乘法可以有效地估计模型参数。
最小二乘法的基本原理可以概括为以下几个步骤:1.首先,假设模型的形式,如线性模型:y=mx+b。
2.然后,定义一个衡量模型拟合程度的误差函数,通常采用残差的平方和:$E(m, b) = \\sum_{i=1}^{n} (y_i - (mx_i + b))^2$。
3.接下来,根据最小二乘法的原理,我们需要通过对误差函数求偏导数,得出使误差函数最小化的模型参数。
4.最后,通过优化算法,如梯度下降法等,迭代地调整模型参数,使误差函数达到最小值,从而获得最佳拟合模型。
最小二乘法的原理非常简单和直观,因此被广泛应用于各个领域,如统计学、经济学、工程学等。
2. 最小二乘法的应用最小二乘法在实际问题中有着广泛的应用,下面将介绍其中的几个应用场景。
2.1 线性回归线性回归是最小二乘法最常见的应用之一。
在线性回归中,最小二乘法用于估计自变量与因变量之间的线性关系。
通过最小化残差平方和,我们可以找到一条最佳拟合直线,从而对未知的因变量进行预测。
线性回归广泛应用于经济学、社会学等领域,帮助研究者探索变量之间的相互关系。
2.2 曲线拟合最小二乘法还可以用于曲线拟合。
当我们需要拟合一个非线性模型时,可以通过最小二乘法来估计参数。
通过选择适当的模型形式和误差函数,可以得到最佳拟合曲线,从而准确地描述数据的变化趋势。
曲线拟合在信号处理、图像处理等领域具有重要的应用。
2.3 数据降维数据降维是指将高维度的数据转化为低维度表示,以便于可视化和分析。
最小二乘法可以用于主成分分析(PCA)等降维方法中。
通过寻找投影方向,使得在低维度空间中的数据点到其投影点的平均距离最小化,可以实现数据的有效降维。
2.4 系统辨识在控制工程中,最小二乘法经常被用于系统辨识。
最小二乘法(least sqauremethod)专栏文章汇总文章结构如下:1:最小二乘法的原理与要解决的问题2 :最小二乘法的矩阵法解法3:最小二乘法的几何解释4:最小二乘法的局限性和适用场景5:案例python实现6:参考文献1:最小二乘法的原理与要解决的问题最小二乘法是由勒让德在19世纪发现的,形式如下式:标函数 = \sum(观测值-理论值)^2\\观测值就是我们的多组样本,理论值就是我们的假设拟合函数。
目标函数也就是在机器学习中常说的损失函数,我们的目标是得到使目标函数最小化时候的拟合函数的模型。
举一个最简单的线性回归的简单例子,比如我们有 m 个只有一个特征的样本: (x_i, y_i)(i=1, 2, 3...,m)样本采用一般的 h_{\theta}(x) 为 n 次的多项式拟合,h_{\theta}(x)=\theta_0+\theta_1x+\theta_2x^2+...\theta_nx^n,\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 为参数最小二乘法就是要找到一组\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 使得\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^2 (残差平方和) 最小,即,求 min\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^22 :最小二乘法的矩阵法解法最小二乘法的代数法解法就是对 \theta_i 求偏导数,令偏导数为0,再解方程组,得到 \theta_i 。
矩阵法比代数法要简洁,下面主要讲解下矩阵法解法,这里用多元线性回归例子来描:假设函数h_{\theta}(x_1,x_2,...x_n)=\theta_0+\theta_1x_1+...+\t heta_nx_n 的矩阵表达方式为:h_{\theta}(\mathbf{x})=\mathbf{X}\theta\\其中,假设函数 h_{\theta}(\mathbf{x})=\mathbf{X}\theta 为 m\times1 的向量, \theta 为 n\times1 的向量,里面有 n 个代数法的模型参数。
最小二乘法的原理和应用最小二乘法是一种常见的数学统计方法,常用于数据分析、回归分析和预测模型的建立。
听起来有些抽象,但如果您掌握了最小二乘法,您将能够更好地理解许多现代技术的工作原理。
一、最小二乘法的原理所谓“最小二乘法”,是指根据离散点的数据,以一条最佳直线来逼近这些点,这条直线被称为“回归线”,这个过程也叫做“回归分析”。
当然,如果数据呈非线性关系,类似的曲线模型也可以使用最小二乘法来拟合。
那么,最小二乘法到底是如何工作的呢?它的基本思路是,根据实际数据的偏差,通过数学方法,找到一条最佳的回归线,这条线距离所有数据点的距离之和最小。
也就是说,最小二乘法的目标是尽可能地减少偏差,使回归线的拟合效果越来越好。
那么,如何计算这个距离之和呢?具体来说,我们可以使用误差平方和这个指标。
误差平方和是指所有数据点与回归线之间的距离平方和,也就是所有偏差的平方之和。
这可以通过计算最小二乘法函数来实现。
二、最小二乘法的应用最小二乘法是一种非常广泛应用的数学方法,尤其是在数据分析、回归分析和预测建模方面。
无论是商业分析,还是学术研究,都可以使用最小二乘法来处理真实的数据,并获得更准确的结果。
其中,最常见的应用之一就是从数据中预测未来趋势。
我们可以使用最小二乘法模型来分析可预测的变化趋势、发现趋势异常,甚至拟合出完善的预测模型,为未来的计划和决策提供直观的信息支持。
在市场营销和销售方面尤为突出。
此外,最小二乘法还可以用于估计相应变量的效应。
例如,在经济学上,我们可以使用最小二乘法来分析支出、收入和利率之间的关系,进而预测未来的经济走势。
另外,最小二乘法还可以给强大的机器学习算法提供支持。
例如,在图像识别和自然语言处理领域,我们可以使用最小二乘法来训练神经网络,或优化线性回归模型,进而实现更准确、更稳定的机器学习算法。
总之,最小二乘法是一种非常重要的数学方法,适用于许多领域,其原理和应用仅仅是数学的一小部分。
如果您能掌握它的高级应用,比如说自动建模和自动预测等,您将能够在数据分析和决策中站得更高,走得更远。
最小二乘法的基本公式最小二乘法,这玩意儿听起来是不是有点高大上?但别怕,其实它并没有那么复杂,就像咱们学骑自行车,一开始觉得难,掌握窍门后就变得轻松自如啦!先来说说最小二乘法到底是啥。
简单来讲,它就是一种找数据最佳拟合直线或者曲线的方法。
比如说,你记录了一堆气温和日期的数据,想找出它们之间的规律,这时候最小二乘法就派上用场了。
那它的基本公式是啥呢?咱们来瞧瞧。
假设咱们有一堆数据点(x₁, y₁), (x₂, y₂),..., (xₙ, yₙ),然后要找一条直线 y = ax + b 来拟合这些点。
那最小二乘法就是要让每个点到这条直线的垂直距离的平方和最小。
这个垂直距离,咱们叫它残差。
具体的公式就是:Q = Σ(yi - (axi + b))²,这里的Σ是求和符号,就是把所有的残差平方加起来。
然后通过求 Q 对 a 和 b 的偏导数,令它们等于 0 ,就能解出 a 和 b 的值,从而得到最佳拟合直线的方程。
我给您讲个我亲身经历的事儿吧。
有一次我带着学生们去做一个关于植物生长和光照时间关系的实验。
我们每天记录植物的高度和对应的光照时长,最后想用最小二乘法来找出它们之间的关系。
一开始,学生们都被这些数据弄得晕头转向的。
有的说:“老师,这也太乱了,怎么找规律啊?”我就告诉他们,别着急,咱们有最小二乘法这个法宝呢!然后我一步一步地给他们讲解公式的原理和计算方法。
有个叫小明的同学特别认真,眼睛紧紧盯着黑板,手里的笔不停地记着。
可算到中间的时候,他突然举手说:“老师,我这一步算错了,得重新来。
”我鼓励他说:“没关系,重新算,多算几遍就熟练啦。
”最后,经过大家的努力,我们终于算出了最佳拟合直线的方程。
当我们把这个方程画在图上,看到那些数据点都很接近这条直线的时候,孩子们都兴奋得欢呼起来。
从那以后,学生们对最小二乘法的理解可深刻多了。
他们知道了,数学不仅仅是书本上的公式,还能真真切切地帮助我们解决生活中的问题。
最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
最小二乘法还可用于曲线拟合。
其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
考虑超定方程组(超定指未知数小于方程个数):其中m代表有m个等式,n代表有n 个未知数,m>n ;将其进行向量化后为:,,显然该方程组一般而言没有解,所以为了选取最合适的让该等式"尽量成立",引入残差平方和函数S(在统计学中,残差平方和函数可以看成n倍的均方误差MSE)当时,取最小值,记作:通过对进行微分求最值,可以得到:如果矩阵非奇异则有唯一解[2]:在我们研究两个变量(x,y)之间的相互关系时,通常可以得到一系列成对的数据(x1,y1.x2,y2... xm,ym);将这些数据描绘在x -y 直角坐标系中,若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。
(式1-1)其中:a0、a1 是任意实数为建立这直线方程就要确定a0和a1,应用《最小二乘法原理》,将实测值Yi与利用计算值Yj(Yj=a0+a1Xi)(式1-1)的离差(Yi-Yj)的平方和最小为“优化判据”。
令:φ=(式1-2)把(式1-1)代入(式1-2)中得:φ=(式1-3)当最小时,可用函数φ对a0、a1求偏导数,令这两个偏导数等于零。
∑2(a0 + a1*Xi - Yi)=0(式1-4)∑2Xi(a0 +a1*Xi - Yi)=0(式1-5)亦即:na0 + (∑Xi ) a1 = ∑Yi (式1-6)(∑Xi ) a0 + (∑Xi^2 ) a1 = ∑(Xi*Yi) (式1-7)得到的两个关于a0、a1为未知数的两个方程组,解这两个方程组得出:a0 = (∑Yi) / n - a1(∑Xi) / n (式1-8)a1 = [n∑(Xi Yi) - (∑Xi ∑Yi)] / (n∑Xi^2 -∑Xi∑Xi)(式1-9) 这时把a0、a1代入(式1-1)中,此时的(式1-1)就是我们回归的一元线性方程即:数学模型。
使用最小二乘法的条件
最小二乘法是一种常用的预测和估计方法,也被称为最小平方法、最优二乘估计或简称最小二乘估计。
在有关统计建模和机器学习领域中,最小二乘法用于拟合数据,估计模型参数,拟合最佳函数曲线。
最小二乘法受到优化问题的思想指导,其基本原理是有误差,或者说有给定数据。
要在给定数据的情况下找出能最好拟合数据的函数关系,使得拟合曲线与给定数据之间的差别最小,这就是最小二乘法。
最小二乘法有几种使用条件:
一是存在可被测量的随机误差,即给定的m个数据点之间存在某种形式的随机误差,其对对应的点有随机的扰动;
二是用于拟合的模型的所有参数都是需要估算的,是未知参数;
三是满足第一范式条件,即:差异函数完全一致且扰动项(如误差)的期望值未知;
四是满足最大不相关条件,即:扰动项不相关,同时具有常数平方和分布。
五是满足独立性,即:每个观测点都是独立的,不存在任何联系。
通过最小二乘法拟合数据,可以更好地估计参数,从而获得更准确、有效的预测结果。
最小二乘法摘要:最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
最小二乘法还可用于曲线拟合。
其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
1 简介1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。
经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。
随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。
时年24岁的高斯也计算了谷神星的轨道。
奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。
高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中,而法国科学家勒让德于1806年独立发现“最小二乘法”,但因不为时人所知而默默无闻。
两人曾为谁最早创立最小二乘法原理发生争执。
1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,见高斯-马尔可夫定理。
2 原理在我们研究两个变量(x, y)之间的相互关系时,通常可以得到一系列成对的数据(x1, y1、x2, y2... xm , ym);将这些数据描绘在x -y直角坐标系中(如图1), 若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。
Y计= a0 + a1 X (式1-1)其中:a0、a1 是任意实数为建立这直线方程就要确定a0和a1,应用《最小二乘法原理》,将实测值Yi 与利用(式1-1)计算值(Y计=a0+a1X)的离差(Yi-Y计)的平方和〔∑(Yi - Y计)2〕最小为“优化判据”。
令: φ = ∑(Yi - Y计)2 (式1-2)把(式1-1)代入(式1-2)中得:φ = ∑(Yi - a0 - a1 Xi)2 (式1-3)当∑(Yi-Y计)平方最小时,可用函数φ对a0、a1求偏导数,令这两个偏导数等于零。
(式1-4) (式1-5) 亦即:m a0 + (∑Xi ) a1 = ∑Yi (式1-6)(∑Xi ) a0 + (∑Xi2 ) a1 = ∑(Xi, Yi) (式1-7)得到的两个关于a0、 a1为未知数的两个方程组,解这两个方程组得出: a0 = (∑Yi) / m - a1(∑Xi) / m (式1-8)a1 = [n ∑Xi Yi - (∑Xi ∑Yi)] / [n ∑Xi2 - (∑Xi)2 )] (式1-9) 这时把a0、a1代入(式1-1)中, 此时的(式1-1)就是我们回归的元线性方程即:数学模型。
在回归过程中,回归的关联式是不可能全部通过每个回归数据点(x1, y1、 x2, y2...xm,ym),为了判断关联式的好坏,可借助相关系数“R ”,统计量“F ”,剩余标准偏差“S ”进行判断;“R ”越趋近于 1 越好;“F ”的绝对值越大越好;“S ”越趋近于 0 越好。
R = [∑XiYi - m (∑Xi / m)(∑Yi / m)]/ SQR{[∑Xi2 - m (∑Xi / m)2][∑Yi2 - m (∑Yi / m)2]} (式1-10) *在(式1-1)中,m 为样本容量,即实验次数;Xi 、Yi 分别任意一组实验X 、Y 的数值。
3 缺陷最小二乘是一种最基本的辨识方法,但它具有两方面的缺陷:一是当模型噪声是有色噪声时,最小二乘估计不是无偏、一致估计;二是随着数据的增长,将出现所谓的“数据饱和”现象。
针对这两个问题,出现了相应的辨识算法,如遗忘因子法、限定记忆法、偏差补偿法、增广最小二乘、广义最小二乘、辅助变量法、二步法及多级最小二乘法等。
第一节 最小二乘法的基本原理和多项式拟合 一 最小二乘法的基本原理从整体上考虑近似函数)(x p 同所给数据点),(i i y x (i=0,1,…,m)误差i i i y x p r -=)((i=0,1,…,m) 的大小,常用的方法有以下三种:一是误差ii i y x p r -=)((i=0,1,…,m)绝对值的最大值imi r ≤≤0max ,即误差 向量Tm r r r r ),,(10 =的∞—范数;二是误差绝对值的和∑=mi ir 0,即误差向量r 的1—范数;三是误差平方和∑=mi ir02的算术平方根,即误差向量r 的2—范数;前两种方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,因此在曲线拟合中常采用误差平方和∑=mi ir02来 度量误差i r (i=0,1,…,m)的整体大小。
数据拟合的具体作法是:对给定数据 ),(i i y x (i=0,1,…,m),在取定的函数类Φ中,求Φ∈)(x p ,使误差i i i y x p r -=)((i=0,1,…,m)的平方和最小,即∑=mi ir2=[]∑==-mi i iy xp 02min)(从几何意义上讲,就是寻求与给定点),(i i y x (i=0,1,…,m)的距离平方和为最小的曲线 )(x p y =(图6-1)。
函数)(x p 称为拟合 函数或最小二乘解,求拟合函数)(x p 的方法称为曲线拟合的最小二乘法。
在曲线拟合中,函数类Φ可有不同的选取方法.6—1二 多项式拟合假设给定数据点),(i i y x (i=0,1,…,m),Φ为所有次数不超过)(m n n ≤的多项式构成的函数类,现求一Φ∈=∑=nk kkn x ax p 0)(,使得[]min )(022=⎪⎭⎫ ⎝⎛-=-=∑∑∑===mi mi nk i ki k i i ny x ay x pI (1)当拟合函数为多项式时,称为多项式拟合,满足式(1)的)(x p n 称为最小二乘拟合多项式。
特别地,当n=1时,称为线性拟合或直线拟合。
显然∑∑==-=mi nk i k i ky x aI 02)(为n a a a ,,10的多元函数,因此上述问题即为求),,(10n a a a I I =的极值 问题。
由多元函数求极值的必要条件,得nj x y x a a I mi ji nk i ki k j,,1,0,0)(20==-=∂∂∑∑== (2)即nj y xa xnk mi i j ik mi k j i,,1,0,)(0==∑∑∑===+ (3)(3)是关于n a a a ,,10的线性方程组,用矩阵表示为⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+∑∑∑∑∑∑∑∑∑∑∑=====+==+====m i i n i m i i i m i i n mi n i mi n imi n i mi n i mi im i i mi nimi iy x y x y a a a x xx x xx x xm 00010020101020001(4)式(3)或式(4)称为正规方程组或法方程组。
可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。
从式(4)中解出k a (k=0,1,…,n),从而可得多项式∑==nk kkn xax p 0)( (5)可以证明,式(5)中的)(x p n 满足式(1),即)(x p n 为所求的拟合多项式。
我们把[]∑=-mi i i ny x p2)(称为最小二乘拟合多项式)(x p n 的平方误差,记作[]∑=-=mi i i ny x pr222)(由式(2)可得∑∑∑===-=mi nk mi i ki k iy x a y r222)( (6)多项式拟合的一般方法可归纳为以下几步:(1) 由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n ;(2) 列表计算∑==mi j in j x)2,,1,0( 和∑==mi ij in j y x)2,,1,0( ;(3) 写出正规方程组,求出n a a a ,,10;(4) 写出拟合多项式∑==nk kkn xax p 0)(。
在实际应用中,m n <或m n ≤;当m n =时所得的拟合多项式就是拉格朗日或牛顿插值多项式。
例1 测得铜导线在温度i T (℃)时的电阻)(Ωi R 如表6-1,求电阻R 与温度 T数为Ta a R 10+=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡445.200295.56583.93253.2453.245710a a解方程组得921.0,572.7010==a a故得R 与T 的拟合直线为TR 921.0572.70+=利用上述关系式,可以预测不同温度时铜导线的电阻值。
例如,由R=0得T=-242.5,即预测温度 T=-242.5℃时,铜导线无电阻。
6-2例2 例2 已知实验数据如下表试用最小二乘法求它的二次拟合多项式。
解 设拟合曲线方程为2210x a x a a y ++=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡102514732253173017381301738152381529210a a a解得2676.06053.3,4597.13210=-==a a a故拟合多项式为22676.06053.34597.13xy +-=*三 最小二乘拟合多项式的存在唯一性定理1 设节点n x x x ,,,10 互异,则法方程组(4)的解存在唯一。
证 由克莱姆法则,只需证明方程组(4)的系数矩阵非奇异即可。
用反证法,设方程组(4)的系数矩阵奇异,则其所对应的齐次方程组⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+∑∑∑∑∑∑∑∑∑∑∑=====+==+====m i i n i m i i i m i i n mi n i mi n imi n i mi n i mi im i i mi nimi iy x y x y a a a x xx x xx x xm 000100201001020001(7)有非零解。
式(7)可写为nj a xnk k mi k j i,,1,0,0)(0==∑∑==+ (8)将式(8)中第j 个方程乘以ja(j=0,1,…,n),然后将新得到的n+1个方程左右两端分别 相加,得∑∑∑===+=⎥⎦⎤⎢⎣⎡nj n k k m i k j i j a x a 00000)(因为[]∑∑∑∑∑∑∑∑∑∑=======+===+===⎥⎦⎤⎢⎣⎡mi mi mi i nnk kik nj ji j nj nk kj ij knj n k k m i k j i j x px a x a x a aa x a 00200000)())(()(其中∑==nk kkn x ax p 0)(所以)(=i n x p (i=0,1,…,m))(x p n 是次数不超过n的多项式,它有m+1>n 个相异零点,由代数基本定理,必须有010===n a a a ,与齐次方程组有非零解的假设矛盾。