线性回归的不确定度问题
- 格式:pdf
- 大小:168.93 KB
- 文档页数:16
Excel在线性回归法测量不确定度评定中的应用
范巧成
【期刊名称】《理化检验-化学分册》
【年(卷),期】2005(041)009
【摘要】介绍了如何使用Excel电子表格进行线性回归法求得测量结果的不确定度评定,可方便地获得任一测量结果的扩展不确定度.
【总页数】3页(P678-680)
【作者】范巧成
【作者单位】山东电力研究院,济南,250002
【正文语种】中文
【中图分类】O21
【相关文献】
1.Excel 在压力变送器的测量不确定度评定中的应用 [J], 李传赟;郭晋
2.Excel在测量不确定度评定中的应用 [J], 刘兴胜;陈旭
3.Excel曲线拟合功能在测量不确定度评定中的应用 [J], 乔玉娥;郑世棋;翟玉卫;吴爱华
4.偏最小二乘回归法在介损在线监测误差分析中的应用 [J], 陈敏维;邱文锋;张孔林;林一泓
5.Excel中应用趋势回归法测定电能量长期趋势 [J], 纵淑莉
因版权原因,仅展示原文概要,查看原文内容请购买。
不确定度报告不确定度报告一、问题的提出本次不确定度实验的目的是要计算出一个直线的斜率和截距,并计算出相应的不确定度。
二、试验方法1. 实验仪器:提供了一个直线回归的软件,并且计算具有线性关系的两种量的最佳拟合直线。
2. 实验操作:输入实验数据,并进行相应的计算和拟合。
三、数据处理根据实验要求,我们选择了十个数据点进行计算。
根据实验软件提供的功能,我们得到了线性拟合的最佳拟合直线。
四、不确定度计算1. 斜率的不确定度计算:通过实验软件得到的最佳拟合直线的斜率为a,可以使用公式σa=S/√Σ(xi-<x>)^2的形式进行计算。
其中,S表示拟合直线到各个数据点的距离之和,xi表示每个数据点的x坐标,<x>表示数据点x坐标的均值。
2. 截距的不确定度计算:与斜率的不确定度计算类似,可以使用公式σb=σa√Σx^2/n的形式进行计算。
其中,n表示数据点的个数。
五、结果分析通过计算,我们得到了最佳拟合直线的斜率和截距的数值,并且计算出了相应的不确定度。
在进行结果分析时,我们需要考虑到系统误差和随机误差对实验结果的影响。
六、结论通过实验计算,我们得到了直线的斜率和截距,并且计算出了相应的不确定度。
根据实验结果,我们可以得出结论:在实验条件下,该直线的斜率为a,截距为b,不确定度分别为σa和σb。
七、实验问题和改进在进行实验时,我们可能遇到了一些问题,如数据采集和计算的不准确性。
为了提高实验结果的准确性,我们可以采取以下改进措施:1. 增加数据采集的次数,以减小随机误差的影响。
2. 提高数据采集的精度,通过使用更精确的测量仪器或方法来减小系统误差的影响。
3. 进行多次实验并取平均值,以进一步减小误差。
八、实验感想通过这次实验,我们学习到了如何计算直线的斜率和截距,并且了解到了不确定度的计算方法。
实验中的问题和改进措施让我们更加注意了实验操作的准确性和数据的精确性。
实验结果的不确定度提醒我们要对实验结论进行合理的评价和解释,同时也提醒我们在进行实验时要注意数据的可靠性和实验方法的合理性。
一元线性回归系数比值不确定度的评定罗颖【摘要】In this paper regression coefficient correlation was analyzed and the formula of uncertainty of regression coefficient ratio in one dimensional linear regression equation was derived. The shortcomings in some documents about the evaluation of uncertainty of regression coefficient ratio were pointed out in this paper.%分析一元线性回归系数的相关性,导出一元线性回归系数比值不确定度的计算公式,指出了某些文献中有关回归系数比值不确定度评定存在的问题.【期刊名称】《赣南师范学院学报》【年(卷),期】2011(032)006【总页数】4页(P92-95)【关键词】线性回归;回归系数比值;相关系数;不确定度【作者】罗颖【作者单位】赣南师范学院物理与电子信息学院,江西赣州341000【正文语种】中文【中图分类】O212在大学物理实验中,经常遇到二物理量x、y间存在线性关系,常选择线性模型用最小二乘法对测量数据进行拟合(一元线性回归),得到回归方程y=a+bx中参数的最佳估计值a、b(称为回归系数)以及它们的标准偏差sa、sb,然后根据回归系数比值求出有关物理量. 比如弹簧振子中弹簧的有效质量m有效是回归直线的截距与斜率的比值, 即折合系数文献[1](2000年,第3版)给出了折合系数c的不确定度公式:显然,上式的成立条件是a、b是线性无关的. 回归系数a、b线性无关吗?文献[2](2007年,第4版)修订了上式,给出了折合系数c的不确定度公式:式中的相关系数为回归系数a,b之间的相关系数ra,b等于测量量x,y之间的相关系数r吗?如何计算回归系数a,b之间的相关系数?本文将讨论一元线性回归系数的相关性和评定一元线性回归系数比值C=a/b的不确定度.1 间接测量量的标准偏差传递公式为简单起见,设间接测量量f是直接测量量x,y的函数,即f=f(x,y)(1)在相同的条件下,对x,y作了n次测量:xi,yi(i=1,2,…,n),其平均值分别为真值分别为X,Y. 则间接测量量的真值为F=f(X,Y).将式(1)在X,Y附近作泰勒展开(只保留到一阶小量),得令上式移项后在对n次测量值求平方和,得等式两边同除以n,可得引入标准误差(2)将上式可改写为(3)式中rx,y为x,y的相关系数(4)上式中的cov(x,y)称为协方差, cov(x,y)=∑(xi-X)(yi-Y), 式(3)是关于标准误差的方和根法合成公式. 如果x和y彼此独立,则有rx,y=0,这时,式(3)可简化为(5)上述公式只具有理论意义,无法通过测量来实现,因为真值未知,也不可能作无限多次测量.在有限次测量中,直接测量量x,y的最佳值分别为间接测量量f的最佳值为可以取标准偏差(6)作为标准误差σ(X)、σ(Y)的估计值,则式(3)、式(4)可分别改写为(7)(8)相关系数的绝对值│rx,y│≤1,相关系数的数值大小表示了相关程度的好坏.rx,y=±1表示变量x、y完全线性相关,拟合(回归)直线通过全部实验点. 当rx,y=1时,拟合直线的斜率大于零;当rx,y=-1时,拟合直线的斜率小于零;当│rx,y│<1时,实验点之间的线性不大好,│rx,y│越小线性越差,rx,y=0表示变量x与y完全不相关.2 一元线性回归系数的相关性用最小二乘法得到的一元线性回归系数a、b是相关变量,可以证明它们的协方差[3]为(9)式中sy是yi的标准偏差(10)r为x,y之间的相关系数(11)回归直线截距a和斜率b的标准偏差分别为(12)(13)回归直线截距a和斜率b之间的相关系数为(14)由上式可知,回归直线截距与斜率之间的相关系数ra,b<0,表明截距与斜率是相关变量,且呈负相关. 当ra,b=-1时,表示多次“组合测量”得到的回归直线截距ai与斜率bi,在a-b图上描绘的实验点(ai,bi)均在一条斜率小于零的直线上;当│ra,b│<1时,实验点之间的线性不大好,│ra,b│越小线性越差.3 回归直线截距与斜率比值的不确定度令回归直线截距a与斜率b的比值为(15)根据式(7),有设回归系数a、b不确定度的B类分量较小,可略去不计,则u(a)=sa,u(b)=sb,u(C)=s(C),令ur(a)=u(a)/a, ur(b)=u(b)/b, ur(C)=u(C)/C,有(16)又根据式(14),有(17)或(18)式(16)~式(18)是回归直线截距与斜率比值的相对不确定度的计算公式. 回归直线截距与斜率是负相关的,交叉项的相对不确定度分量为(19)4 应用举例4.1 回归直线截距与斜率之间的相关系数不等于零文献[1]的测量举例中,折合系数c=a/(bm0)=C/(m0),回归系数a、b不确定度的B类分量较小,略去不计,m0是在分析天平上测出的,其不确定度也较小,也略去不计.在此取u(a)=sa,u(b)=sb.应用公式(20)计算结果分别为锥形弹簧振子:r=0.999 992,u(c)=0.002 4(文献[1]中u(c)=0.000 8为笔误)柱形弹簧振子:r=0.999 93,u(c)=0.003由于回归直线截距与斜率是相关变量,若忽略弹簧质量m0的不确定度,则折合系数c=a/(bm0)的不确定度u(c)的计算公式应为(21)笔者根据式(14)、式(21)处理文献[1]的实验数据,正确结果分别为:锥形弹簧振子:r=0.999 992,ra,b=-0.885 12,u(c)=0.002 7,其中折合系数c 的相对不确定度ur(c)及其分量分别为柱形弹簧振子:r=0.999 940,ra,b=-0.904 68,u(c)=0.004 5,其中折合系数c 的相对不确定度ur(c)及其分量分别为显然,回归直线截距与斜率是负相关的,此例的计算结果表明,交叉项的相对不确定度分量是不能忽略不计的,式(20)并不成立.4.2 回归直线截距与斜率之间的相关系数ra,b不等于测量量x,y之间的相关系数r 文献[2]的测量举例中,取u(a)=sa,u(b)=sb,ra,b=r. 应用公式(22)计算结果分别为锥形弹簧振子:ra,b=rx,y=r=0.999 992,u(c)=0.001 9柱形弹簧振子:ra,b=rx,y=r=0.999 93, u(c)=0.000 7笔者根据式(14)、式(21)处理文献[2]的实验数据,正确结果分别为:锥形弹簧振子:rx,y=r=0.999 992,ra,b=-0.885 12,u(c)=0.002 7柱形弹簧振子:rx,y=r=0.999 940,ra,b=-0.904 68,u(c)=0.004 5显然,回归直线截距与斜率的相关系数ra,b不等于测量量x,y的相关系数rx,y=r. 此例中两者是异号的,即测量量x,y之间的相关系数rx,y>0,表明测量量x,y是正相关,回归直线截距与斜率之间的相关系数ra,b<0,表明回归直线截距与斜率是负相关. 由此可知,式(22)并不成立. 根据式(21)计算u(c)值必定大于文献[1]的值.由于文献[2]错误地认为ra,b=rx,y=r,故导致u(c)值反而比文献[1]的还小.综上所述,回归直线截距与斜率之间的相关系数ra,b<0,截距与斜率是负相关变量,其相关系数ra,b不等于测量量x,y的相关系数rx,y.在评定回归系数比值的不确定度时,由于回归直线截距与斜率是相关变量,所以,不仅要计算截距a和斜率b的偏差对总不确定度的贡献,而且必须计入其交叉项对总不确定度的贡献.【相关文献】[1]杨述武,马葭生,贾玉民,等.普通物理实验(一、力学及热学部分)[M].北京:高等教育出版社,2000:143-147.[2]杨述武,赵立竹,沈国土.普通物理实验1力学及热学部分[M].北京:高等教育出版社,2007:95-99.[3]唐象能,戴俭华.数理统计[M].北京: 机械工业出版社,1994:154-167.。
风速传感器回归方程的不确定度评定方法研究王敏;魏根宝;周昌文【摘要】风速传感器线性回归方程的不确定度是进行计量确认的重要参数.文章根据测量不确定度评定理论,详细分析了风速传感器线性回归方程测量不确定度的误差来源,提出了基于最小二乘法评定风速传感器线性回归方程不确定度的方法,并介绍了评定步骤.为了清楚展示评定过程,列举了气象用风速传感器线性回归方程测量不确定度的评定实例,得到校准结果为V=-(0.56+0.99V')m/s,U=±0.74 m/s.结果表明:基于最小二乘法评定风速传感器线性回归方程的不确定度是可行的,此方法也可扩展到线性测量系统的不确定度评定.【期刊名称】《气象水文海洋仪器》【年(卷),期】2013(030)001【总页数】5页(P1-5)【关键词】风速传感器;不确定度;最小二乘法;回归方程【作者】王敏;魏根宝;周昌文【作者单位】安徽省大气探测技术保障中心,合肥230031;安徽省大气探测技术保障中心,合肥230031;安徽省大气探测技术保障中心,合肥230031【正文语种】中文【中图分类】P414.70 引言风速是描述大气状态的重要参数,是建立常规大气模型、分析大气运动、预报天气情况的基本要素。
在特殊的环境和应用条件下,风速是监测污染、制定生产或应急方案的重要依据。
目前,风速传感器不仅是气象台(站)不可或缺的计量设备,并广泛用于海洋、电力、能源、煤矿、消防等部门[1-3]。
由于风速传感器的指示风速和实际风速一般成线性关系,通常利用最小二乘法拟合出指示风速和实际风速的一元线性回归方程,使修正后结果接近实际风速。
对于用户来说,为了判断风速传感器的性能是否满足使用要求,需要根据测量不确定度、最大允许误差等技术指标进行计量确认[4]。
由于目前缺少对风速传感器线性回归方程不确定度的评定,这给用户在计量确认时带来困难。
因此,关于风速传感器线性回归方程的测量不确定度评定方面的研究是十分必要的。
回归分析的直线拟合不确定度探讨
极权回归分析(extreme regression analysis)是数据挖掘的重要方法,用
于确定给定的变量具有的相关性,可以有效预测和分析已有数据之间的相关性。
由于极权回归分析可以得到一条直线,因此被称为“拟合”,事实上它的结果是一条经过若干个数据点的穿越折线或直线。
而由此得出的直线有一个重要参数——拟合不确定度(Fitting Uncertainty),它反映着回归分析拟合结果的确定性,也就
是当前拟合出来的直线能够有多少精度地表示给定数据之间的相关性。
拟合不确定度的计算方法有若干种,但最常用的是拟合的相关系数,即用来衡
量数据之间的相关程度,一般而言,其取值范围介于-1和1之间。
当拟合出来的
直线靠近数据点时,说明给定的变量之间的相关性较强,拟合结果的不确定度较小,相关系数较接近1;反之则较低,相关系数较接近-1。
另外,还有一些从技术或行业角度出发的因素也影响拟合不确定度,例如考虑
到数据采样率,数据的准确性和可靠性,以及被拟合的直线的形状等。
通过考虑这些因素,可以更准确地估计拟合出来的结果,从而更好地探讨数据之间的相关性和结构性分析。
总之,拟合不确定度是极权回归分析拟合结果的重要参数,可以用来评估给定
变量之间的相关程度,借此分析大规模数据的相关性,从而更明晰地掌握用户行为和被研究对象之间的联系。
不确定性:用贝叶斯线性回归通向更好的模型选择之路关键词:概率、神经网络关注过Mathematica Stack Exchange(我强烈推荐给各位Wolfram语言的用户)的读者们可能最近看过这篇博文内容了,在那篇博文里我展示了一个我所编写的函数,可以使得贝叶斯线性回归的操作更加简单。
在完成了那个函数之后,我一直在使用这个函数,以更好地了解这个函数能做什么,并和那些使用常规拟合代数如Fit使用的函数进行比较。
在这篇博文中,我不想说太多技术方面的问题(想要了解更多贝叶斯神经网络回归的内容请参见我前一篇博文- https://wolfr.am/GMmXoLta),而想着重贝叶斯回归的实际应用和解释,并分享一些你可以从中得到的意想不到的结果。
01 准备工作获取我的BayesianLinearRegression (https://wolfr.am/GMn9Di7w)函数最简单的方法是参考我上传到Wolfram Function Repository 的内容。
如想要使用本博文中的代码范例,你可以计算下列代码,这段代码为该函数创建了一个快捷方式。
你也可以访问GitHub repository并参照安装说明,使用以下代码加载BayesianInference安装包:或者,你也可以通过计算BayesianLinearRegression 的独立源文件(https://wolfr.am/GMngf5Uj)的方式获取该函数,只是如果你没有完整的BayesianInference安装包的话,你可能无法使用我后面会用到的函数regressionPlot1D。
该函数的定义在BayesianVisualisations.wl(https://wolfr.am/GMnlzNkh)文件中。
02 回到基础我现在要做一些对有数据拟合背景的大部分人都非常熟悉的事情:多项式回归。
我可以用更复杂的例子,但是我发现用贝叶斯函数做数据拟合,即使是在如多项式回归这样简单的范例上也能延伸出很多新的可能性,所以其实这是一个非常好的演示范例。
直线回归分析及其测量不确定度评定第一节 一元线性回归分析当输入量X i 的估计值x i 是由实验数据用最小二乘法拟合的曲线上得到时,曲线上任何一点和表征曲线拟合参数的标准不确定度,可以用有关的统计程序评定。
例如有两个估计值x ,y 有线性关系y =a +bx ,对其独立测得若干对数据(x 1,y 1),(x 2,y 2),⋯,(x n ,y n ),n >2,欲求取参数a ,b 及其标准不确定度,以及预期估计值及其标准不确定度,则需要应用最小二乘法。
最小二乘法是以“残差平方和最小”为条件求得最佳值并拟合成最佳直线、最佳曲线。
图13.1给出了直线拟合的最小二乘法示意图。
图中,x i ,y i 是观测数据,v i 是残差,a 是拟合直线的截距,b 是拟合直线的斜率。
呈直线的标准曲线用下式表示:y a bx =+ (13.1)式中b 是直线的斜率(回归系数),a 是截距。
各实验数据点可表示为(x i ,y i )i =1,2,…,n 。
误差方程可用残差v i 表示为:)()()(222111n n n bx a y v bx a y v bx a y v +-=+-=+-=需要使残差平方和最小[]∑∑=+-=m in )(22i i i bx a y v 因此须同时对a 和b 求偏导数并使其为零,得到联立方程[]⎪⎪⎩⎪⎪⎨⎧=-+=---=∂∂=-+=---=∂∂∑∑∑∑∑∑====0222)(2,0222)(21121212ni i i n i i n i i i i n i i i i y x x b x na x bx a y b v y n x nb na bx a y a v式中,1111,nnii i i x x y y n n ====∑∑首先用联立方程求解b0112=+-⋅-⋅∑∑==ni ni i i i y x x b x y n x x nby i y i x ixv i a拟合直线测量数据 图13.1 最小二乘法示意图∑∑==⋅--=ni i ni i i xx n x yx n y x b 121式中,以上各式中,x 是x 值的平均值,y 是y 值的平均值。
仪器分析中线性回归标准曲线法分析结果不确定度评估一、前言对测试方法制定不确定度评估程序是ISO/IEC 17025对实验室的要求[1],也是检验工作的需要。
由ISO 等7个国际组织联合发布的《测量不确定度表达指南》[2]采用当前国际通行的观点和方法,使涉及测量的技术领域和部门可以用统一的准则对测量结果及其质量进行评定、表示和比较,满足了不同学科之间交往的需要[3]。
采用《测量不确定度表达指南》对测试结果不确定度进行评估,也是检验工作同国际标准接轨的需要。
线性回归标准曲线法是仪器分析中最常用的方法,这类仪器包括原子吸收分光光度计、发射光谱仪、分光光度计、气相(液相)色谱仪等。
这类分析测定结果的不确定度都有相似的来源,可概括为仪器精密度、标准物质不确定度及溶液制备过程中带来的不确定度等。
因此,可用相似的方法对它们进行评估。
本文以ICP-AES 法测定钢铁中磷为例,推导了仪器分析中线性回归标准曲线法测定不确定度的计算方法,并提供了计算过程所需的各参数的采集和计算方法,评估了标准不确定度、自由度和扩展不确定度的数值。
二、测定过程和数学模型仪器分析中线性回归标准曲线测定方法,利用被测物质相应的信号强度与其浓度成正比关系,通过测定已知浓度的溶液(即标准溶液)的信号强度,回归出浓度-信号强度标准曲线,从标准曲线上得到被测定溶液信号强度相应的浓度。
计算过程的数学模型如下:用y i 和y t 分别表示标准溶液和被测溶液的信号线强度,以x i 和x t 分别表示第i 个标准溶液和被测样品溶液的浓度,i=1~n ,n 表示标准溶液个数,则:y a bx t t =+ (1)其中,b xx y y xx ii i nii n=---==∑∑()()()121(2)a y bx =- (3) (1)式也可表示成:x y abt t =- (4) 把式(2)、(3)代入式(4)得:x y y xx xx y y x t t ii nii i n=----+==∑∑()()()()211(5)式(5)表明了被测量x t 与输入量x 1,x 2...x n 和y 1,y 2...y n 、y t 的函数关系,可简写成:x t f x x x n y y y n y t=(,...,,...,)1212 由上式可知,样品溶液浓度测定结果不确定度可分成标准溶液浓度不确定度分量及其信号强度不确定度分量和被测定溶液信号强度不确定度分量,其中标准溶液浓度不确定度分量可由标准样品标称含量不确定度和配制过程引入的不确定度合成得到,而信号强度不确定度分量是由仪器测量的误差引起的,可从仪器的精密度数据得到。
利用回归方程进行不确定度评定黄焕钧 张晋东莞市荣昌化工有限公司摘要本实验通过ICP法测定油漆样品中Ba元素为例,应用数理统计学中的最小二乘法建立其回归方程,同时针对校准曲线引入的不确定度进行评定。
该评定方法在实际工作中可以作为利用回归方程计算检测结果这一类型的不确定度评定的参考。
一切测量结果都不可避免的具有不确定度,一份完整的检测报告应包括对其不确定度的评定。
利用回归方程计算检测结果是分析化学中最常用的计算方法。
本文根据国家技术监督局发布的《测量不确定度评定和表示》(JJF1059-1999),以使用ICP法测定考核样品中Ba元素为例,利用数理统计学中的最小二乘法进行直线回归计算。
同时由于实验中产生不确定度的因素通常包括检测仪器、实验环境、标准物质、人员操作和分析方法,而本次主要对校准曲线的非线性引起输出值得不确定度U(C)进行评定与评估。
1 实验部分1.1 主要仪器和试剂岛津ICPE-9000,德国利曼的微波消解系统,HNO3(AR)。
浓度为1000μg/mL的Ba单元素标准溶液(从国家有色金属及电子材料分析测试中心购买)。
1.2 标准使用液的配制用2mL移液管吸取浓度为1000μg/mL的Ba标准溶液到100 mL量瓶中,加入3%(v/v)的HNO3介质定容至刻度线,从而得到20μg/mL单元素标准溶液;用13%(v/v)的HNO3分别稀释100、50、33、25和20倍,分别得到浓度为0.2、0.4、0.6、0.8与1.0μg/mL的标准溶液。
1.3 实验方法及过程简述将湿的油漆样品喷在玻璃板上,烘干,用小刀刮取,称量0.1g左右,然后加入约8mL HNO3放入微波消解系统进行消解。
消解完成待冷却后,将其过滤定容于50mL容量瓶中。
然后利用ICPE-9000光谱仪,对标准使用溶液进行测试,测出Ba标准系列的强度值A,计算强度值A与浓度关系的回归方程,然后测量样品溶液中的强度值,由回归方程可计算出样品溶液中被测组分中Ba的浓度。
不确定性:用贝叶斯线性回归通向更好的模型选择之路关键词:概率、神经网络关注过Mathematica Stack Exchange(我强烈推荐给各位Wolfram语言的用户)的读者们可能最近看过这篇博文内容了,在那篇博文里我展示了一个我所编写的函数,可以使得贝叶斯线性回归的操作更加简单。
在完成了那个函数之后,我一直在使用这个函数,以更好地了解这个函数能做什么,并和那些使用常规拟合代数如Fit使用的函数进行比较。
在这篇博文中,我不想说太多技术方面的问题(想要了解更多贝叶斯神经网络回归的内容请参见我前一篇博文- /GMmXoLta),而想着重贝叶斯回归的实际应用和解释,并分享一些你可以从中得到的意想不到的结果。
01准备工作获取我的BayesianLinearRegression (/GMn9Di7w)函数最简单的方法是参考我上传到Wolfram Function Repository 的内容。
如想要使用本博文中的代码范例,你可以计算下列代码,这段代码为该函数创建了一个快捷方式。
你也可以访问GitHub repository并参照安装说明,使用以下代码加载BayesianInference安装包:或者,你也可以通过计算 BayesianLinearRegression 的独立源文件(/GMngf5Uj)的方式获取该函数,只是如果你没有完整的BayesianInference安装包的话,你可能无法使用我后面会用到的函数regressionPlot1D。
该函数的定义在BayesianVisualisations.wl (/GMnlzNkh)文件中。
02回到基础我现在要做一些对有数据拟合背景的大部分人都非常熟悉的事情:多项式回归。
我可以用更复杂的例子,但是我发现用贝叶斯函数做数据拟合,即使是在如多项式回归这样简单的范例上也能延伸出很多新的可能性,所以其实这是一个非常好的演示范例。
下面我用了一组有直线关系趋势的数据,但同时也留下了一些问题:现在我们从第一件事情做起:为数据拟合一条直线。