最小二乘法线性拟合
- 格式:doc
- 大小:272.00 KB
- 文档页数:10
—26 n 基本概念与数据处理4.最小二乘法线性拟合(非常好)我们知道,用作图法求出直线的斜率a 和截据b ,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分 散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据 处理方法,求出的a 和b 误差较大。
用最小二乘法拟合直线处理数据时 ,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a 和截据b 是唯一的。
最小二乘法就是将一组符合 Y=a+bX 关系的测量数据,用计算的方法求出最佳的a和b 。
显然,关键是如何求出最佳的a 和b 。
(1)求回归直线设直线方程的表达式为: y 二 a bx(2-6-1)要根据测量数据求出最佳的 a 和b o 对满足线性关系的一组等精度测量数据 (X i ,y i ), 假定自变量X i 的误差可以忽略,则在同一 X i 下,测量点y i 和直线上的点 a+bx i 的偏差d i 如下:d i = y i - a - bx-id^ — y 2~ a - bx 2d n = yn ~a ~ bx n显然最好测量点都在直线上(即 d i =d 2=,, =d n =0),求出的a 和b 是最理想的,但测量点不可能都在直线上, 这样只有考虑d i 、d 2、”、 d n 为最小,也就是考虑d i +d 2+,, +d n 为最小,但因d i 、d 2、,,、d n 有正有负,加起来可能相互抵消,因此不可取;而|d i | + |d 2|+ ,,+ |d n |又不好解方程,因而不可行。
现在米取一种等效方法:当d^+d/ + ,,+d n 2222对a 和b 为最小时,d i 、d 2、,,、 d n 也为最小。
取(d i +d 2 +,, +d n )为最小值,求 a和b 的方法叫最小二乘法。
nD 八 d i 2i JD 对a 和b 分别求一阶偏导数为:n-na -b ' X i ]i T nnD 八 d i 2 = i ±(2-6-2)-=D-=b:D-a n 一2「y ii 3 n一2[、X i y i i 』n基本概念与数据处理—27 - -b' X j2]i d—28 - n 基本概念与数据处理2 ' x -x将a 、b 值带入线性方程y = a bx ,即得到回归直线方程。
在Excel中进行最小二乘法线性拟合的步骤如下:
1.在Excel中输入或打开要进行最小二乘法拟合的数据。
2.按住“shift”键的同时,用鼠标左键单击以选择数据。
3.单击菜单栏上的“插入”》“图表”》“散点图”图标。
4.弹出下拉列表,单击“散点图”》“仅带数据标记的散点图”图标。
5.此时,在窗口中间弹出散点图窗口。
6.鼠标左键单击其上的散点,单击鼠标右键,弹出列表式对话框,
再单击“添加趋势线(R)”。
7.弹出“设置趋势线格式”对话框。
8.勾选“设置截距(S)”、“显示公式(E)和“显示R平均值(R)”前的
方框,此时,在原散点图中增加了一条趋势线及其公式、R平均值。
以上步骤仅供参考,具体操作可能会因Excel版本的不同而略有差异。
如果需要更详细的信息,建议查看Excel的帮助文档或相关教程。
最小二乘法线性与非线性拟合最小二乘法实现数据拟合最小二乘法原理函数插值是差值函数p(x)与被插函数f(x)在节点处函数值相同,即p( )=f( ) (i=0,1,2,3……,n),而曲线拟合函数不要求严格地通过所有数据点( ),也就是说拟合函数在处的偏差=不都严格地等于零。
但是,为了使近似曲线能尽量反应所给数据点的变化趋势,要求| |按某种度量标准最小。
即=为最小。
这种要求误差平方和最小的拟合称为曲线拟合的最小二乘法。
(一)线性最小二乘拟合根据线性最小二乘拟合理论,我们得知关于系数矩阵A的解法为A=R\Y。
例题假设测出了一组,由下面的表格给出,且已知函数原型为y(x)=c1+c2*e^(-3*x)+c3*cos(-2*x)*exp(-4*x)+c4*x^2试用已知数据求出待定系数的值。
在Matlab中输入以下程序x=[0,0.2,0.4,0.7,0.9,0.92,0.99,1.2,1.4,1.48,1.5]';y=[2.88;2.2576;1.9683;1.9258;2.0862;2.109;2.1979;2.5409;2.9627;3.155;3.2052];A=[ones(size(x)) exp(-3*x),cos(-2*x).*exp(-4*x) x.^2];c=A\y;c'运行结果为ans =1.22002.3397 -0.6797 0.8700下面画出由拟合得到的曲线及已知的数据散点图x1=[0:0.01:1.5]';A1=[ones(size(x1)) exp(-3*x1),cos(-2*x1).*exp(-4*x1) x1.^2];y1=A1*c;plot(x1,y1,x,y,'o')事实上,上面给出的数据就是由已知曲线y(x)= 0.8700-0.6797*e^(-3*x)+ 2.3397*cos(-2*x)*exp(-4*x)+ 1.2200*x^2产生的,由上图可见拟合效果较好。
最小二乘法求出直线拟合公式最小二乘法是一种常用的线性回归方法,用于求出最佳的拟合直线公式。
其基本思想是通过最小化观测数据与拟合直线之间的误差来确定最佳的直线参数。
假设我们有一组观测数据(xi, yi),其中xi表示自变量的取值,yi表示因变量的取值。
我们的目标是找到一条直线y = mx + c,使得观测数据点到这条直线之间的误差最小。
首先,我们定义观测数据点到拟合直线的误差为:ei = yi - (mx + c)。
我们的目标是最小化所有观测数据点的误差之和:min Σ(ei^2) = min Σ(yi - (mx + c))^2为了求解上述最小化问题,我们需要对误差函数关于参数m和c进行求导,并令导数等于零。
这样可以得到参数的最优解。
对于参数m的求解,我们有以下等式:d/dm Σ(ei^2) = d/dm Σ(yi - (mx + c))^2 = 0通过对上述等式进行求导和化简,我们得到以下方程:m * Σ(xi^2) + c * Σ(xi) = Σ(xi * yi)类似地,对于参数c的求解,我们有以下等式:d/dc Σ(ei^2) = d/dc Σ(yi - (mx + c))^2 = 0通过对上述等式进行求导和化简,我们得到以下方程:m * Σ(xi) + c * n = Σ(yi)其中,n表示观测数据点的数量。
最终,我们可以通过解上述方程组,求得最佳的直线参数m和c,从而得到直线的拟合公式。
拓展:最小二乘法不仅可以应用在线性回归问题中,还可以拓展到非线性回归问题。
例如,如果观测数据点遵循多项式分布,则可以使用多项式回归来拟合数据。
此时,最小二乘法的基本原理是相同的,只是拟合的模型变为多项式函数。
此外,最小二乘法还可以应用于其他问题,例如数据平滑、参数估计等。
它是一种常用的统计学方法,可以在各种实际问题中得到广泛的应用。
最小二乘法多项式拟合对于给定的数据点N i y x i i ≤≤1),,(,可用下面的n 阶多项式进行拟合,即∑==+++=nk k k x a x a x a a x f 02210)(为了使拟合出的近似曲线能尽量反映所给数据的变化趋势,要求在所有数据点上的残差|)(|||i i i y x f -=δ都较小。
为达到上述目标,可以令上述偏差的平方和最小,即min ])([)(2121=-=∑∑==iiNi iN i y x f δ称这种方法为最小二乘原则,利用这一原则确定拟合多项式)(x f 的方法即为最小二乘法多项式拟合。
确定上述多项式的过程也就是确定)(x f 中的系数n k a k ≤≤0,的过程,根据最小二乘原则,则偏差平方和应该是这些系数的函数,即min ])([)(),,,(212110=-==∑∑==i i Ni i N i n y x f a a a S δ为使上式取值最小,则其关于n k a k ≤≤0,的一阶导数应该为零,即有∑∑∑∑=====⇒=-⇒=-=∂∂Ni i N i i i i N i i i N i y x f y x f y x f a S11110)(0])([0])([2 ∑∑∑∑=====⇒=-⇒=-=∂∂N i i i N i i i i i N i i i i N i i y x x f x y x f x y x f x a S11111)(0])([0])([2∑∑∑∑=====⇒=-⇒=-=∂∂N i i k i N i i ki i i N i k i i i N i k i k y x x f x y x f x y x f kx a S 1111)(0])([0])([2∑∑∑∑=====⇒=-⇒=-=∂∂N i i n i N i i ni i i N i n i i i N i n i n y x x f x y x f x y x f nx a S 1111)(0])([0])([2 将上面各等式写成方程组的形式可有∑∑∑∑∑∑=======++++⇒=Ni i N i n in N i iN i i Ni iN i iy x a x a x a N a yx f 1112211011)(∑∑∑∑∑∑==+=====++++⇒=Ni i i Ni n in Ni iNi ii Ni iiNi iiy x xa x a x a x a yx x f x 111132121011)(∑∑∑∑∑∑==+=+=+===++++⇒=Ni i k i Ni k n in Ni k iNi k ik iNi i k i Ni i k iy x xa xa xa x a y x x f x11122111011)(∑∑∑∑∑∑===+=+===++++⇒=Ni i n i Ni n in Ni n iNi n in iNi i n i Ni i n iy x xa xa xa x a y x x f x112122111011)(写成矩阵形式有⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⋅⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑======+=+==+==+===+=====N i i n i Ni ik i N i i i N i i n k N i ni Ni k n iNi n iNi ni N i k n i N i k iNi k iN i kiN i n i Ni k iNi i N i i Ni niNi k iNi iy x y x y x y a a a a x xxx x xxx x xxx x x x N 111110121111112111111121111上述方程组可以通过克莱姆法则来计算,从而解出各系数n k a k ≤≤0,得到拟合方程。
⽤Matlab进⾏最⼩⼆乘法线性拟合求传感器⾮线性误差灵敏度%后⾯的为注释,红⾊部分代码需要根据实际情况更改%最⼩⼆乘法线性拟合y=ax+bx=[0.5,1,1.5,2,2.5,3,3.5,4,4.5,5];%⾃变量y=[191,321,442,565,686,819,930,1032,1153,1252];%因变量xmean=mean(x);ymean=mean(y);sumx2=(x-xmean)*(x-xmean)';sumxy=(y-ymean)*(x-xmean)';a=sumxy/sumx2;%解出直线斜率a(即传感器灵敏度)b=ymean-a*xmean;%解出直线截距bz=((a*(x(1,10))+b-(y(1,10)))/(y(1,10)));%“10”是⾃变量的个数,z为⾮线性误差(即线性度)abz%作图,先把原始数据点⽤蓝⾊"⼗"字描出来figureplot(x,y,'+');hold on% ⽤红⾊绘制拟合出的直线px=linspace(0,6,50);%(linspace语法(从横坐标负轴起点0画到横坐标正轴终点6,50等分精度))py=a*px+b;plot(px,py,'r');运⾏结果:a =236.9818b =87.4000另⼀种简单⼀点的⽅法:%最⼩⼆乘法线性拟合y=ax+bx=[0.5,1,1.5,2,2.5,3,3.5,4,4.5,5];%⾃变量y=[191,321,442,565,686,819,930,1032,1153,1252];%因变量p=polyfit(x,y,1); p运⾏结果:p =236.9818 87.4000。
最小二乘法求拟合直线公式
直线拟合求最佳经验公式的一种数据处理方法是最小二乘法(又称作
一元线性回归),它可克服用作图法求直线公式时图线的绘制引入的误差,结果更精确,在科学实验中得到了广泛的应用。
1.最小二乘法的理论基础:
若两物理量x、y满足线性关系,并由实验等精度地测得一组实验数据,且假定实验误差主要出现在上,设拟合直线公式为,当所测各值与拟
合直线上各估计值之间偏差的平方和最小,即时,所得拟合公式即为最佳
经验公式。
2.用最小二乘法求最佳经验公式:
设由实验数据求得最佳经验公式为y=a+bx,根据最小二乘法原理有:即:
化为:
其解为:
将得出的、代入即可得最佳经验公式。
的不确定度与很多因素有关,如实验数据的多少、实验数据之间的关
系与直线关系的符合程度(即以下介绍的相关系数)、实验数据的分散度
等等,在此不作介绍。
最小二乘拟合在物理实验中经常要观测两个有函数关系的物理量。
根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。
这类问题通常有两种情况:一种是两个观测量x 与y 之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x 与y 之间的函数形式还不知道,需要找出它们之间的经验公式。
后一种情况常假设x 与y 之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,从而可采用类似于前一种情况的处理方法。
一、最小二乘法原理在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作x ,而把所有的误差只认为是y 的误差。
设x 和y 的函数关系由理论公式y =f (x ;c 1,c 2,……c m ) (0-0-1)给出,其中c 1,c 2,……c m 是m 个要通过实验确定的参数。
对于每组观测数据(x i ,y i )i =1,2,……,N 。
都对应于xy 平面上一个点。
若不存在测量误差,则这些数据点都准确落在理论曲线上。
只要选取m 组测量值代入式(0-0-1),便得到方程组y i =f (x ;c 1,c 2,……c m ) (0-0-2)式中i =1,2,……,m.求m 个方程的联立解即得m 个参数的数值。
显然N<m 时,参数不能确定。
在N>m 的情况下,式(0-0-2)成为矛盾方程组,不能直接用解方程的方法求得m 个参数值,只能用曲线拟合的方法来处理。
设测量中不存在着系统误差,或者说已经修正,则y 的观测值y i 围绕着期望值 <f (x ;c 1,c 2,……c m )> 摆动,其分布为正态分布,则y i 的概率密度为()()[]⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--=22212,......,,;exp 21i mi i i i c c c x f y y p σσπ,式中i σ是分布的标准误差。
线性最小二乘法拟合
线性最小二乘法(Linear Least Squares,LLS)是一种用来对观测数据建立数学模型的最常见的统计学方法,它可以有效地从数据中恢复出一组最优参数值。
它可以用来拟合各种类型的多项式曲线,甚至可以应用到混合型曲线,并且具有良好的拟合效果。
一、线性最小二乘法的定义
线性最小二乘法是一种数学方法,记为$argmin \ \sum_{i=1}^{n} (Y_i - f(X_i))^2$,表明最小二乘法通过最小化残差(残差是指观测值与实际值的差异)的平方和,来估计参数模型的参数。
二、线性最小二乘法的原理
线性最小二乘法即最小误差平方和法,即参数估计问题关于误差平方和有最小值时参数向量,该参数向量即构成最小二乘解。
另外,在假定数据舍入误差符合高斯分布的情况下,最小二乘法可以被认为是可行统计方法的最优的一种。
三、线性最小二乘法的应用
(1)拟合函数式在数学及工程中,最小二乘法非常常见,主要用于拟合函数式,特别是二元一次函数式,如曲线或抛物线;
(2)计算未知参数线性最小二乘法可以用来解决只有已知数据,而求解未知参数的最小二乘问题,它除了可以拟合多项式表达式,还可以拟合非线性方程;
(3)建立数据模型经过数据分析处理,可以使用最小二乘法的方法建立数据模型,来求解某些复杂的问题。
四、线性最小二乘法的优缺点
(1)优点:算法简单,收敛速度快,适用于线性拟合;
(2)缺点:模型不一定适用所有数据,受输入噪声影响,不适用高次函数拟合。
线性最小二乘法是广泛用于统计学和工程领域的有效方法,它不仅可以提供良好的拟合效果,而且可以有效地恢复出参数模型的最优参数值,可以满足许多不同的场景的需求,也被广泛认可和使用。
最小二乘法拟合原理最小二乘法(Least Squares Method)是一种常用的线性回归分析方法,用于拟合数据点到一个理论模型的直线或曲线的原理。
它的目标是通过最小化实际数据点与拟合曲线之间的垂直距离(也称为残差)的平方和来找到最佳的拟合曲线。
假设我们有一个包含n个数据点的数据集,其中每个数据点的坐标可以表示为(xi,yi)。
我们希望找到一个模型y=f(x,θ),其中x是自变量,θ是模型的参数,使得对于每个数据点,模型预测的y值与实际的观测值之间的差异最小化。
yi = yi_true + ei以线性回归为例,模型可以表示为y=θ0+θ1x,其中θ0和θ1是要估计的参数。
我们的目标是找到最佳的θ0和θ1,使得所有数据点的残差平方和最小。
残差可以定义为:ei = yi - (θ0 + θ1xi)为了最小化残差平方和,我们需要对残差平方和进行求导,并令导数等于零。
这样一来,我们就能得到使得残差平方和最小的参数估计值。
对于线性回归而言,最小二乘法的公式可以写为:θ1 = (sum(xi - x_mean)(yi - y_mean))/(sum(xi - x_mean)^2)θ0 = y_mea n - θ1x_mean其中,x_mean和y_mean分别是自变量和因变量的均值。
需要注意的是,最小二乘法只是一种估计参数的方法,它没有办法告诉我们模型是否真实有效。
为了评估拟合效果,我们还需要使用一些指标,如决定系数(coefficient of determination),来评估拟合曲线与数据之间的拟合程度。
总结起来,最小二乘法是一种通过最小化实际数据点与拟合曲线之间的垂直距离的平方和来找到最佳的拟合曲线的方法。
它的原理建立在数据具有随机误差,且服从独立同分布的正态分布的假设上。
通过最小二乘法,我们可以估计出模型的参数,以及评估拟合程度,从而对数据进行分析、预测与优化。
最小二乘法线性拟合最小二乘法线性拟合是一种常用的拟合方式,用于回归分析。
该方法采用最小二乘法,即使给定一组观测数据,通过计算出虚拟曲线,让拟合曲线和真实曲线之间距离最小化。
一、最小二乘法线性拟合的定义最小二乘法线性拟合是指利用一定量的实验数据,将拟合的数据的每个成分所需的函数拟合情况相同,而且有较低的累积偏差,以最好地模拟真实的实验数据的方法。
二、最小二乘法线性拟合的优点1、可以反映出实验数据的趋势:利用最小二乘法线性拟合,可以较准确地反映实验数据的趋势,可以用较低的累积偏差来得到较好的拟合效果。
2、可以有效地分析实验结果:通过最小二乘法线性拟合,可以有效地分析实验数据,从而获得完整的实验结果。
3、有利于有效的参数估计:利用最小二乘法线性拟合能够有效的参数估计,从而得出较好的参数拟合结论。
三、最小二乘法线性拟合的应用1、在科学研究中:最小二乘法线性拟合是科学研究中普遍采用的方法,如利用最小二乘法线性拟合,可以准确地模拟实验数据对实验结果的影响程度,从而获得较准确的分析结论。
2、在工程实践中:最小二乘法线性拟合也可用于工程实践的计算和设计,使得实验数据和拟合数据可以较为准确地实现关联,有助于加速计算结果的获得,从而提高系统的运行效率。
四、最小二乘法线性拟合的缺点1、拟合出的曲线有明显的噪点:采用最小二乘法线性拟合得出的拟合曲线,有可能会出现明显的噪点,影响拟合效果,而使拟合曲线与实际曲线不一致。
2、受矩阵性质的影响:最小二乘法线性拟合还受矩阵的性质的影响,要求迭代过程中的影响矩阵要满足半正定的性质,以方便求解得出解决方案。
3、无法估计系统噪声:最小二乘法线性拟合无法估计实验数据中的系统噪声,可能存在隐藏的噪声缺陷,从而影响拟合效果。
最小二乘拟合法公式最小二乘拟合法是一种常用的数据分析方法,用于寻找观测数据中的数学模型。
它通过最小化观测值与模型预测值之间的残差平方和,来确定最优的拟合参数。
最小二乘拟合法公式如下:设有n组观测数据,其中第i组观测数据的自变量为xi,因变量为yi。
我们希望找到一个线性模型y = a + bx,使得这个模型与观测数据的残差平方和最小化。
其中a和b为待确定的拟合参数。
我们需要计算观测数据的平均值,分别记为x̄和ȳ。
然后,我们计算x和y的离差平方和,分别记为SSxx和SSyy。
接下来,计算x和y的协方差,记为SSxy。
通过最小二乘拟合法,我们可以得到拟合参数的估计值b和a。
b的估计值为:b = SSxy / SSxxa的估计值为:a = ȳ -b * x̄我们得到了用于拟合数据的线性模型y = a + bx。
通过这个模型,我们可以预测自变量对应的因变量的值。
最小二乘拟合法广泛应用于各个领域,特别是在统计学和经济学中。
它可以用于分析数据的趋势、预测未来的趋势,以及评估变量之间的关系。
通过最小二乘拟合法,我们可以得到拟合参数的估计值,从而得到一个最优的拟合模型。
然而,最小二乘拟合法也有一些限制。
首先,它假设观测数据之间的关系是线性的,但实际情况可能并非如此。
其次,最小二乘拟合法对异常值非常敏感,一个异常值可能会对拟合结果产生较大的影响。
此外,最小二乘拟合法无法提供参数的显著性检验和模型的拟合优度检验。
在应用最小二乘拟合法时,我们需要仔细考虑数据的特点和拟合模型的合理性。
如果数据之间的关系不是线性的,我们可以尝试其他的拟合方法,如多项式拟合或非线性拟合。
此外,在进行最小二乘拟合时,我们还需要对拟合结果进行评估,以确定拟合模型的拟合优度和预测能力。
最小二乘拟合法是一种常用的数据分析方法,可以用于寻找观测数据中的数学模型。
通过最小化观测值与模型预测值之间的残差平方和,最小二乘拟合法可以确定最优的拟合参数,从而得到一个最优的拟合模型。
---------------------------------------------------------------最新资料推荐------------------------------------------------------最小二乘法线性与非线性拟合最小二乘法线性与非线性拟合最小二乘法实现数据拟合最小二乘法原理函数插值是差值函数 p(x)与被插函数 f(x)在节点处函数值相同,即 p( )=f( ) (i=0,1,2,3,n),而曲线拟合函数不要求严格地通过所有数据点( ),也就是说拟合函数在处的偏差= 不都严格地等于零。
但是,为了使近似曲线能尽量反应所给数据点的变化趋势,要求| |按某种度量标准最小。
即ab 中输入以下程序x=[0,0.2,0.4,0.7,0.9,0.92,0.99,1.2,1.4,1.48,1.5]’;y=[2.88;2.2576;1.9683;1.9258;2.0862;2.109;2.1979;2.5409;2.9627;3.155;3.2052]; A=[ones(size(x)) exp(-3*x),cos(-2*x).*exp(-4*x) x.]; c=A\y; c’ 运行结果为ans = 1.2200 2.3397 -0.6797 0.8700 下面画出由拟合得到的曲线及已知的数据散点图x1=[0:0.01:1.5]’; A1=[ones(size(x1)) exp(-3*x1),cos(-2*x1).*exp(-4*x1) x1.]; x 0 0.2 0.4 0.7 0.9 0.92 0.99 1 .2 1 .4 1 .48 1 .5 y 2.88 2.2576 1 .9683 1 .9258 2.0862 2.1 09 2.1 979 2.5409 2.9627矩阵,表示因变量矩阵,是输出的系数矩阵,即多项式的系数。
多项式在自变量 x 处的函数值 y 可用以下命令计算:y=polyval(A,x) 例题对下面一组数据作二次多项式拟合,即1 / 6要求出二次多项式中的,使最小。
4.最小二乘法线性拟合(非常好)我们知道,用作图法求出直线的斜率a 和截据b ,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据处理方法,求出的a 和b 误差较大。
用最小二乘法拟合直线处理数据时,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a 和截据b 是唯一的。
最小二乘法就是将一组符合Y=a+bX 关系的测量数据,用计算的方法求出最佳的a 和b 。
显然,关键是如何求出最佳的a 和b 。
(1) 求回归直线设直线方程的表达式为:bx a y += (2-6-1)要根据测量数据求出最佳的a 和b 。
对满足线性关系的一组等精度测量数据(x i ,y i ),假定自变量x i 的误差可以忽略,则在同一x i 下,测量点y i 和直线上的点a+bx i 的偏差d i 如下:111bx a y d --=222bx a y d --=n n n bx a y d --=显然最好测量点都在直线上(即d 1=d 2=……=d n =0),求出的a 和b 是最理想的,但测量点不可能都在直线上,这样只有考虑d 1、d 2、……、d n 为最小,也就是考虑d 1+d 2+……+d n 为最小,但因d 1、d 2、……、d n 有正有负,加起来可能相互抵消,因此不可取;而|d 1|+|d 2|+……+ |d n |又不好解方程,因而不可行。
现在采取一种等效方法:当d 12+d 22+……+d n2对a 和b 为最小时,d 1、d 2、……、d n 也为最小。
取(d 12+d 22+……+d n 2)为最小值,求a 和b 的方法叫最小二乘法。
令 ∑==ni idD 12=2112][i i ni ni ib a y dD --==∑∑== (2-6-2)D 对a 和b 分别求一阶偏导数为:][211∑∑==---=∂∂ni i n i i x b na y a D][21211∑∑∑===---=∂∂n i i n i i n i i i x b x a y x b D再求二阶偏导数为:n a D 222=∂∂; ∑==∂∂ni i x b D 12222 显然: 0222≥=∂∂n a D ; 021222≥=∂∂∑=n i i x b D 满足最小值条件,令一阶偏导数为零:011=--∑∑==ni i ni ix b na y(2-6-3)01211=--∑∑∑===ni i ni i ni ii x b x a yx (2-6-4)引入平均值: ∑==ni i x n x 11; ∑==n i i y n y 11;∑==n i i x n x 1221; ∑==ni i i y x n xy 11则: 0=--x b a y02=--x b x a xy (2-6-5) 解得: x b y a -= (2-6-6)22xx y x xy b --=(2-6-7)将a 、b 值带入线性方程bx a y +=,即得到回归直线方程。
(2) y 、a 、b 的标准差在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。
操作中函数的误差大于自变量的误差即可认为满足假定。
实际上两者均是变量,都有误差,从而导致结果y 、a 、b 的标准差(n ≥6)如下:2)(21212---=-=∑∑==n a bx yn dni i ini iy σ (2-6-8)(根式的分母为n-2,是因为有两个变量)y y ni i n i i ni i a x x n x x x n xσσσ)()(222211212-=-=∑∑∑=== (2-6-9)y y ni i ni i b x x n x x n nσσσ)(1)(222112-=-=∑∑== (2-6-10)(3)相关系数相关系数是衡量一组测量数据x i 、y i 线性相关程度的参量,其定义为: ))((2222y y x x y x xy r ---=(2-6-11)r 值在0<|r|≤1中。
|r|越接近于1,x 、y 之间线性好;r 为正,直线斜率为正,称为正相关;r 为负,直线斜率为负,称为负相关。
|r|接近于0,则测量数据点分散或x i 、y i 之间为非线性。
不论测量数据好坏都能求出a 和b ,所以我们必须有一种判断测量数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r|<r 0时,测量数据是非线性的.r 0称为相关系数的起码值,与测量次数n 有关,如下表2-6-2表2-6-2 相关系数起码值r 000在进行一元线性回归之前应先求出r 值,再与r 0比较,若|r|> r 0,则x 和y 具有线性关系,可求回归直线;否则反之。
例9:灵敏电流计的电流常数K i 和内阻R g 的测量公式为g i sR U dR K R R -=12测得的数据同例7,其中间处理过程如下,试用最小二乘法求出K i 和R g ,并写出回归方程的表达式。
解:测量公式与线性方程表达式y =a+bx 比较:2R y = U x = dR K R b i s1=g R a -=数据处理如表2-6-3:中间过程可多取位:x =1.67125 y =225.0 2x =3.34625 2y =6.375×104xy =461.5625相关系数998.0))((2222=---=y y x x y x xy r查表得知,当n=8时,r 0=0.834,两者比较r>r 0,说明x 、y(即U 、R 2)之间线性相关,可以求回归直线。
求回归方程的系数22xx y x xy b --==154.6192304x b y a -==-33.4代换a R g -==33.4Ωb dR K R i i s==154.6192304K i =dbR R i s =3.7170×10-9A/mm 计算标准差为:y σ=2.64561902; a σ=2.300545589; b σ=1.257626418计算不确定度: ΔR g =a σ=2Ω; K K i ∆=bb σ=0.81%; ΔK =0.03×10-9A/mm 测量结果表达式电流计内阻: R g =(33±2)Ωgg R R ∆=6.1%电流常数: K =(3.72±0.03)×10-9A/mm KK i∆=0.81% 回归方程: R 2=155U -33 5.计算器在数据处理中的应用在处理数据时,不同的计算器的编程方式各不相同,下面以震旦AURORA SC180型计算器为例作以介绍。
(1)计算标准偏差S① 标准偏差S 的计算器运行公式:12)(111211212-+-=--=∑∑∑∑====n xx x x x x n s ni n i i n i i ni i因为 ∑==ni i x n x 11所以 1)(2112--=∑∑==n nx xs ni i ni i(只有为x i 单变量)② 操作步骤和方法(ⅰ) 按[MODE][0]键,计算器进入单变量统计计算状态。
屏右上角显示“STAT1”指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键。
(ⅲ) 数据输入:依次先键入数值,然后按[DATA]键,每完成一次输入的同时,屏幕均会显示数据的个数n 值。
(ⅳ) 数据修正:按[DATA]键之前,要删除错误数据,按[ON/C.CE];按[DATA]键后要删除错误数据,再次输入该错误值,然后按[INV][DEL]。
(ⅴ) 取分析结果:[INV][x ]:平均值[INV][∑x ]:数据和 [INV][∑x 2]: 数据平方和[INV][S]:测量列的标准偏差 [INV][n]:数据个数例10:一组等精度测量值为:83.1、83.3、83.3、83.7、83.9、83.6、83.4、83.4、83.1、83.2,试求x 、∑x 、∑x 2、S 、n 。
解:注:当n ≥6时,认为=S 。
(2)最小二乘法求回归直线① 求回归直线参量a 、b 、r 的计算器运行公式由(2-6-6)、(2-6-7)、(2-6-11)式得到以下只含x i 、y i 两个变量的公式:nx b ya ni ini i∑∑==-=11∑∑∑∑∑=====--=ni i n i i ni ii ni ini ix n x y x n yx b 1221111)(])(][)([12122112111∑∑∑∑∑∑∑=======---=n i ni i i n i i n i i ni in i i n i i i y y n x x n y x y x n r② 操作步骤和方法:(ⅰ) 按[MODE][.],计算器进入双变量统计计算状态。
屏幕右上角显示“STAT2”指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键(ⅲ) 双变量数据输入:先键入x 的值、 按[a]键, 然后键入y 的值、 按[b]键,再按[DATA]键,完成输入。
屏幕会同时显示数据的个数,即n 值。
(ⅳ) 数据修正:同单变量数据输入。
(ⅴ) 取分析结果[INV][a]:回归直线的截距 [INV][b]:回归直线的斜率[INV][r]:相关系数 还可以取以下值:[INV][x ]、[INV][y ]、[INV][Σx]、[INV][Σx 2]、[INV][Σy]、[INV][Σy 2]、[INV][Σxy], 以便计算y σ、a σ、b σ(计算器没有该三项的计算程序)。
例11: 灵敏电流计实验所测数据如下:要求所使用计算器具有计算最小二乘法的功能,求回归直线以及电流计的电流常数K i 和内阻R g 。
解: 测量公式g i sR U dR K R R -=12与线性方程表达式y =a+bx 比较y =R 2 x =U ,则:查表知道,当n =8时,r 0=0.834, r>r 0,说明U 、R 2之间线性相关。
得到: 回归方程 R 2=154U -32 电流计内阻 R g =32Ω电流常数 K =3.74×10-9A/mm习 题1.指出下列测量结果的有效数字: (1) I =5010mA(2) C =2.99792458×108m/s2.按“四舍五入”修约法,将下列数据只保留3位有效数字:(1) 1.005 (2) 979.499 (3) 980.501 (4) 6.275 (5) 3.134 3.单位变换:(1) m =3.162±0.002kg= g = mg = T (2) θ=(59.8±0.1)°=( )ˊ(3) L =98.96±0.04cm= m = mm = µm4.改错并且将一般表达式改写成科学表达式:(1) Y =(1.96×1011±5.78×109)N/m 2(2) L =(160000±100)m5.按有效数字运算规则计算下列各式:(1) 1000-5=(2) 3.2×103+3.2=(3) tg3005ˊ=(4)125.100325.100125.100325.100 +=(5) R 1=5.10k Ω,R 2=5.10×102Ω,R 3=51Ω。