气象统计方法一元线性回归分析
- 格式:pptx
- 大小:424.48 KB
- 文档页数:47
实习一:气候场、距平场、均方差场编程如下:parameter(ii=37,jj=17,mon=12,year=4)real var(ii,jj,mon,year),ave(ii,jj,mon),jp(ii,jj,mon,year)real s(ii,jj,mon)integer i,j,iy,mopen(5,file='d:\ex1\h500.dat')open(6,file='d:\ex1\ave.grd',form='binary')open(7,file='d:\ex1\jp.grd',form='binary')open(8,file='d:\ex1\s.grd',form='binary')open(12,file='d:\ex1\outall.grd',form='binary'open(9,file='d:\ex1\ave.txt')open(10,file='d:\ex1\jp.txt')open(11,file='d:\ex1\s.txt')!读数据DO iy=1,4do m=1,12!ccc read h500read(5,1000)read(5,2000) ((var(i,j,m,iy),i=1,ii),j=1,jj)enddoenddo!计算气候场do j=1,jjdo i=1,iido m=1,12ave(i,j,m)=var(i,j,m,1)+var(i,j,m,2)+var(i,j,m,3)+var(i,j,m,4)ave(i,j,m)=ave(i,j,m)/4.0enddoenddoenddo!计算距平场do iy=1,4do m=1,12do j=1,jjdo i=1,iijp(i,j,m,iy)=var(i,j,m,iy)-ave(i,j,m)enddoenddoenddoenddo!计算均方差场do j=1,jjdo i=1,iido m=1,12s(i,j,m)=jp(i,j,m,1)*jp(i,j,m,1)+jp(i,j,m,2)*jp(i,j,m,2)+jp(i,j /,m,3)*jp(i,j,m,3)+jp(i,j,m,4)*jp(i,j,m,4)s(i,j,m)=s(i,j,m)/4.0s(i,j,m)=sqrt(s(i,j,m))enddoenddoenddodo iy=1,4do m=1,12write(6)((ave(i,j,m),i=1,ii),j=1,jj)write(7)((jp(i,j,m,iy),i=1,ii),j=1,jj)write(8)((s(i,j,m),i=1,ii),j=1,jj)write(9,2000)((ave(i,j,m),i=1,ii),j=1,jj)write(10,2000)((jp(i,j,m,iy),i=1,ii),j=1,jj)write(11,2000)((s(i,j,m),i=1,ii),j=1,jj)write(12)((ave(i,j,m),i=1,ii),j=1,jj)write(12)((jp(i,j,m,iy),i=1,ii),j=1,jj)write(12)((s(i,j,m),i=1,ii),j=1,jj)enddoenddo1000 format(2i7) 2000 format(37f8.1) close(5)close(6)close(7)close(8)close(9)close(10)close(11)close(12)end给ave配的ctl文件:dset ^d:\ex1\ave.grdundef -9.99E+33title NCEP/NCAR REANALYSIS PROJECT xdef 37 linear 60.000 2.500 ydef 17 linear 0.000 2.500zdef 1 levels 500tdef 12 linear JAN1982 12mo vars 1ave 1 99 H500endvars给ave配的gs文件:'reinit''open d:\ex1\ave.ctl''enable print d:\ex1\ave.gmf'mon=1while(mon<=12)'set t 'mon'''d ave''draw title qihouchang of 'mon' ''print''c'mon=mon+1endwhile'disable print';气候场图:一月份高度的气候场呈现南高北低的状态,陆地上的高度场比较稀疏,而在西太平洋上高度场比较密集。
一元线性回归分析(1)基本概念回归分析:通过大量的观测发现变量之间存在的统计规律性,并用一定的数学模型表示变量相关关系的方法只有一个自变量并且统计量成大体一次函数的线性关系的回归分析叫一元线性回归分析。
在一元线性回归中,我们用 Ya bX =+作为回归方程,代表X 与Y 的线性关系其中:a 表示该直线在Y 轴的截距b 表示该直线的斜率也就是 Y的变化率 X 为自变量,通常是研究者事先选定的数值Y为对应于X 对变量Y 的估计值(2)最小二乘法所谓最小二乘法,就是如果散点图中每一点沿Y 轴方向到直线的距离的平方和最小,则认为这条直线的代表性最好,即使用其作为回归方程。
这样我们使得 ()2Y Y =-∑总误差最小。
Ya bX =+ 其中()()()2X X Y Y b X X --=-∑∑;a Y bX =- 2.一元线性回归方程的检验(1)方差分析法R EMS F MS = 其中()()222T Y SS Y Y Y n =-=-∑∑∑而其1T df n =- ()()2222R X SS Y Y b X n ⎡⎤⎢⎥=-=-⎢⎥⎣⎦∑∑∑其1R df = E T R SS SS SS =-其2E df n =-(2)回归系数检验bb t SE =其中b SE = 而XY s = Y为中心Y值上下波动的标准差(在知道相关系数时XY Y s s =)一元线性回归方程的应用回归分析的目的,就是在测定自变量X 与因变量Y 的关系为显著相关后,借助于你和的较优回归模型来预测在自变量X 为一定值时因变量Y 的发展变化。
当我们根据给出的X 值而预测得到点估计Y 时,Y 只代表了预测值的中点,而计算在特定置信区间内的区间估计则依靠以下公式:2p XY Y t s α±⋅n 很大时近似为1其中t 的自由度取 n-2,p Y 为对应该P X 的方程解出的点估计Y 值文章来源:博仁教育。
《气象统计方法课程实习》学生姓名 x x学号 xxxxxxxxxxxx院系大气科学专业大气科学任课教师 x x二O一四年十二月二十日实习一求500hPa高度场气候场、距平场和均方差场(1)气候场二月份高度场的气候场呈现南高北低的状态,陆地上的高度场比较稀疏,而在西太平洋上高度场比较密集。
7月份高度场的气候场总体呈现东高西低的状态,在印度半岛出现低压中心,而在赤道西太平洋地区出现高压中心,位置在130°E,25°N附近。
35°N以北高度分布很密集,而35°N以南比较稀疏。
(2)距平场1982年5月距平场在我国华东地区出现负距平,在亚洲西南部也出现低压中心,在青藏高原处为正距平。
1984年4月距平场在日本东部海洋地区形成低压中心,印度半岛的西部有一低压中心,在35°N-40°N基本都为正距平。
(3)均方差场三月份高度的均方差场整体呈现南小北大的状态。
说明低纬地区高度的波动幅度比较小,而中高纬地区高度的波动比较大。
在太平洋北部波动最大。
十月份高度的均方差场在西太平洋有极大值,其余地区波动都较小。
实习二计算给定数据资料的简单相关系数和自相关系数单相关系数和自相关系数程序:program mainparameter(n=20,m=10)integer i,j,t,max1,max2real r,s1,s2real a(n),b(n),ano1(n),ano2(n),bzh1(n),bzh2(n),r1(m),r2(m)real ave1,ave2,sum12,sum11,sum22data a/,,,,,,,,,,,,,,,,,,,data b/,,,,,,,,,,,,,,,,,,,!求平均ave1=ave2=do i=1,nave1=ave1+a(i)ave2=ave2+b(i)enddoave1=ave1/nave2=ave2/n!求距平ano1(n)=ano2(n)=do i=1,nano1(i)=a(i)-ave1ano2(i)=b(i)-ave2Enddo!求标准差s1=s2=do i=1,ns1=s1+ano1(i)*ano1(i)s2=s2+ano2(i)*ano2(i)enddos1=sqrt(s1/n)s2=sqrt(s2/n)!标准化bzh1(n)=bzh2(n)=do i=1,nbzh1(i)=ano1(i)/s1bzh2(i)=ano2(i)/s2enddo!求相关系数sum12=sum11=sum22=do i=1,nsum12=sum12+ano1(i)*ano2(i)sum11=sum11+ano1(i)*ano1(i)sum22=sum22+ano2(i)*ano2(i)enddor=sum12/sqrt(sum11*sum22)print*print*,'中国1970-1989年年平均和冬季平均气温的相关系数为r=',r print*!求自相关系数r1(m)=r2(m)=do t=1,mdo j=1,n-tr1(t)=bzh1(j)*bzh1(j+t)+r1(t)r2(t)=bzh2(j)*bzh2(j+t)+r2(t)enddor1(t)=r1(t)/(n-t)r2(t)=r2(t)/(n-t)enddo!比较自相关系数绝对值大小max1=1max2=1do t=2,mif(abs(r1(t))>abs(r1(max1)))max1=tif(abs(r2(t))>abs(r2(max2)))max2=tenddoprint*,'年平均气温自相关系数绝对值最大的滞后时间长度t为:',max1,r1(max1) print*print*,'冬季平均气温自相关系数绝对值最大的滞后时间长度t 为:',max2,r2(max2)print*end分析:中国1970-1989年年平均和冬季平均气温相关系数为,为正相关;年平均气温自相关系数绝对值最大的滞后时间长度为7,自相关系数为负,呈负相关;冬季平均气温自相关系数绝对值最大的滞后时间长度为4,自相关系数为负,呈负相关实习三(附加)计算给定数据的落后交叉相关系数和偏相关系数程序:program mainparameter(n=30,m=10)integer i,j,treal ave1,ave2,ave3,r12,r13,r23,ry1,ry2,ry3real a(n),b(n),c(n),ano1(n),ano2(n),ano3(n),bzh1(n),bzh2(n),bzh3(n) real rt12(m),rt13(m)!a-12月;b-1月;c-2月--(30个数据)data a/,,,,,,,,,,,,,,,,,,,,,,,,,,,,,data b/,,,,,,,,,,,,,,,,,,,,,,,,,,,,,data c/,,,,,,,,,,,,,,,,,,,,,,,,,,,,,!求平均ave1=ave2=ave3=do i=1,nave1=ave1+a(i)ave2=ave2+b(i)ave3=ave3+c(i)enddoave1=ave1/nave2=ave2/nave3=ave3/n!求距平ano1(n)=ano2(n)=ano3(n)=do i=1,nano1(i)=a(i)-ave1ano2(i)=b(i)-ave2ano3(i)=c(i)-ave3enddo!求标准差s1=s2=s3=do i=1,ns1=s1+ano1(i)*ano1(i)s2=s2+ano2(i)*ano2(i)s3=s3+ano3(i)*ano3(i)enddos1=sqrt(s1/n)s2=sqrt(s2/n)s3=sqrt(s3/n)!标准化bzh1(n)=bzh2(n)=bzh3(n)=do i=1,nbzh1(i)=ano1(i)/s1bzh2(i)=ano2(i)/s2bzh3(i)=ano3(i)/s3enddo!求落后交叉相关系数(滞后长度τ最大取10)12月与1月rt12;12月与2月rt13 rt12(m)=rt13(m)=do t=1,mdo i=1,n-trt13(t)=bzh1(i)*bzh3(i+t)+rt13(t)rt12(t)=bzh1(i)*bzh2(i+t)+rt12(t)enddort12(t)=rt12(t)/(n-t)rt13(t)=rt13(t)/(n-t)enddoprint*,'12月气温与1月气温的落后交叉相关系数依次为(1-10年):'print '',rt12print*print*,'12月气温与2月气温的落后交叉相关系数依次为(1-10年):'print '',rt13print*!求相关系数,12月和1月r12;12月和2月r13,1月和2月r23r12=r13=r23=do i=1,nr12=r12+bzh1(i)*bzh2(i)r13=r13+bzh1(i)*bzh3(i)r23=r23+bzh2(i)*bzh3(i)enddor12=r12/nr13=r13/nr23=r23/n!求偏相关系数,12月和2月(消除1月)ry1;1月和2月(消除12月)ry2;12月和1月(消除2月)ry3ry1=(r13-r12*r23)/sqrt((1-r23*r23)*(1-r12*r12))ry2=(r23-r12*r13)/sqrt((1-r13*r13)*(1-r12*r12))ry3=(r12-r13*r23)/sqrt((1-r23*r23)*(1-r13*r13))print*,'消除1月影响,12月与2月气温的偏相关系数:',ry1print*print '(a,',' 消除12月影响,1月与2月气温的偏相关系数:',ry2print*print*,'消除2月影响,12月与1月气温的偏相关系数:',ry3print*end分析:消除1月影响,12月与2月气温的偏相关系数为正,呈正相关;消除12月影响,1月与2月气温的偏相关系数为正,呈正相关;消除2月影响,12月与1月气温的偏相关系数为正,呈正相关实习四求给定数据的一元线性回归方程程序program mainparameter(n=20)integer i! x为环流指标(预报因子),y为气温(预报量)real x(n),y(n)real ave1,ave2,s12,s1,s2,b,b0,r,Fdata x/32,25,20,26,27,24,28,24,15,16,24,30,22,30,24,33,26,20,32,35/ data y/,,,,,,,0,,,,,,,,,,,,!求平均ave1=ave2=do i=1,nave1=ave1+x(i)ave2=ave2+y(i)enddoave1=ave1/nave2=ave2/n!求协方差、预报因子\预报量的方差s12=s1=s2=do i=1,ns12=s12+(x(i)-ave1)*(y(i)-ave2)s1=s1+(x(i)-ave1)*(x(i)-ave1)s2=s2+(y(i)-ave2)*(y(i)-ave2)enddos12=s12/ns1=s1/ns2=s2/n!求b,b0b=s12/s1b0=ave2-b*ave1!求回归方程print*,'气温和环流指标之间的一元线性回归方程为:'print'(a,,,a)',' y=',b0,b,'x'print*!检验Fr=sqrt(s1/s2)*bF=r*r/((1-r*r)/(n-2))print'(a,',' F =',Fend分析:F=>Fα=,回归方程显着实习五(附加)求给定数据的多元线性回归方程实习六(附加)分析中国夏季降水线性趋势的分布特征程序:program mainparameter(m=160,n=25)integer i,t(n),avetinteger sta(m) !站号real lon(m),lat(m),f(m,n) !经,维,记录real ave(m),ano(m,n),anot(n)real b(m),sxy(m),streal timeinteger level1000 format(3a,25i)2000 format!读数据open(5,file='d:\qxtj\6\')read(5,1000)do i=1,mread(5,*),sta(i),lon(i),lat(i),(f(i,j),j=1,n) enddo!计算数据平均,距平,得到距平数组ano(m,n)ave(m)=ano(m,n)=do i=1,mdo j=1,nave(i)=ave(i)+f(i,j)end doave(i)=ave(i)/ndo j=1,nano(i,j)=f(i,j)-ave(i)end doenddo!计算时间距平anot(n)t(n)=0avet=0anot(n)=0do i=1,nt(i)=1981+iavet=t(i)+avetenddoavet=avet/ndo i=1,nanot(i)=t(i)-avetenddo!计算b(m)(160个)b(m)=0sxy(m)=st=do j=1,nst=anot(j)*anot(j)+stEnddodo i=1,mdo j=1,nsxy(i)=ano(i,j)*anot(j)+sxy(i)enddob(i)=sxy(i)/stenddoprint*print*,'160站夏季降水线倾向率:'print '',(b(i),i=1,m)print*End分析:b(m)为正时,降水有随时间增多的趋势;b(m)为负时,降水有随时间减小的趋势实习七计算给定数据的11年滑动平均和累积距平程序:program mainparameter(n=85,k=11,nyear=1922)real dat(n),ano(n),h(n-k+1),l(n)real ave1000 format2000 format3000 format4000 format!读文件open(5,file='d:\qxtj\7\')do i=1,nread(5,*) dat(i)enddo!求距平ave=ano(n)=do i=1,nave=ave+dat(i)enddoave=ave/ndo i=1,nano(i)=dat(i)-aveenddo!滑动平均h(n-k+1)h(n-k+1)=0do i=1,n-k+1do j=i,i-1+kh(i)=h(i)+dat(j)enddoh(i)=h(i)/kenddo!累计距平l(n)l(n)=do i=1,ndo j=1,il(i)=l(i)+ano(j)enddoEnddo!输出open(6,file='d:\qxtj\7\')open(7,file='d:\qxtj\7\')write(6,1000) (h(i),i=1,n-k+1)write(7,2000) (l(i),i=1,n)close(6)close(7)write(*,'("11年滑动距平为")')write(*,3000) (h(i),i=1,n-k+1)print*write(*,'("累计距平为")')write(*,4000) (l(i),i=1,n)print*End分析:数据从1922年到2006年共85年。
《气象统计方法》复习要点及思考题一、填空题1.气候变化上通常说的异常,可以用 距平这个基本统计量来描述,它反映数据偏离平均值(气候态)的状况,把资料处理成该统计量的形式,叫做资料的中心化。
2. 距平是指要素偏离平均值(气候态)的状况,把资料处理为距平的方法叫中心化。
3. 如果一月南京气温的标准差比北京小,说明一月南京气温变化幅度比北京小,预报较为容易。
4.对资料进行标准化可以消除单位量纲不同造成的影响,其表达式为x,标准化以后资料的均方差为1,平均值是_0_。
5. 频率表是用来描述 状态资料的统计特征的。
6. 一元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)7. 多元线性回归中常采用最小二乘法求回归系数。
8. 滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。
9.最后一个累积距平值为 0 。
10. 复相关系数是衡量一个变量和 多个变量之间的线性关系程度的量。
11. 变量场X 表示为 ,则第i 个特征向量对变量X的方差贡献为 ,前P 个特征向量对变量场的累积方差贡献为 。
12. 对上题中的变量场X ,当 m>>n 时在实际计算中通常需进行时空转换。
13. 相关系数的绝对值越大,表示变量之间关系越 密切(紧密)。
14. 在事件B 已经发生的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的 条件概率。
15. 二分类预报是指只预报事件A 出现或者不出现,又称为正反预报。
16. 在对回归问题进行方差分析时,预报量的方差可以表示成_回归方差与误差或残差方差之和。
17. 气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
《气象资料的统计降尺度方法综述》篇一一、引言随着全球气候变化的影响日益显著,气象资料的准确性和精细度成为了科学研究、农业发展、城市规划等领域不可或缺的依据。
统计降尺度方法作为连接大尺度气象资料与小尺度气象数据的重要桥梁,其在气象学、气候学等领域的地位愈发重要。
本文旨在综述气象资料的统计降尺度方法,探讨其应用及发展现状,为相关领域的研究者提供参考。
二、统计降尺度方法概述统计降尺度方法是通过将大尺度气象资料与小尺度地区的气象数据相结合,实现对小尺度地区气象情况的预测和模拟。
其基本思想是通过统计模型或机器学习等方法,提取大尺度资料中的信息,并结合当地地理、气象特征等数据进行降尺度处理,以得到更加准确的小尺度气象资料。
三、常见的统计降尺度方法1. 回归分析:回归分析是一种常用的统计降尺度方法,其基本思想是利用大尺度的气象资料与小尺度的气象数据进行回归分析,建立两者之间的数学关系,从而实现对小尺度的预测。
常见的回归分析方法包括线性回归、多元回归等。
2. 机器学习方法:随着人工智能技术的发展,机器学习方法在气象资料统计降尺度中得到了广泛应用。
如支持向量机、神经网络等模型,能够通过学习大量数据中的规律和模式,实现对小尺度的预测和模拟。
3. 空间插值法:空间插值法是利用已知的气象资料,通过插值方法推算未知地区的气象数据。
常见的空间插值法包括克里金插值、逆距离加权等。
这些方法可以在考虑地理空间结构的基础上,将大尺度的气象数据有效地传递到小尺度地区。
四、统计降尺度方法的应用及发展统计降尺度方法在气象学、气候学等领域得到了广泛应用。
例如,在农业气象方面,通过对小尺度的气象数据进行预测和模拟,可以更好地指导农业生产;在城市规划方面,通过对城市气候的预测和模拟,可以为城市规划和建设提供科学依据。
此外,随着人工智能等技术的发展,统计降尺度方法的精度和效率也在不断提高。
未来,随着大数据、云计算等技术的发展,统计降尺度方法将更加智能化和精细化,为气象学、气候学等领域的研究提供更加准确的数据支持。
现代气象统计方法现代气象统计方法模型是通过对气象数据进行统计学分析和模型拟合来预测未来的气象情况。
随着计算机技术的发展,气象统计方法在预测和分析气象事件方面发挥着越来越重要的作用。
本文将介绍几种常用的现代气象统计方法。
一、回归分析模型回归分析模型是一种经典的统计方法,常用于分析气象变量之间的关系。
它可以通过拟合一个数学函数来描述气象变量之间的依赖关系,并根据这个函数来进行预测。
回归分析模型有多种类型,如线性回归、多元线性回归、非线性回归等。
通过回归分析模型,可以根据已知的气象数据来预测未来的气象变化,例如气温的变化趋势、降水的可能性等。
二、时间序列模型时间序列模型是一种用来分析时间上相关变量的统计模型。
在气象学中,气象变量的观测数据通常按照时间顺序排列,时间序列模型可以通过分析数据的时间结构来预测未来的气象变化。
常用的时间序列模型有ARIMA模型、GARCH模型等。
ARIMA模型可以用来分析时间序列中的趋势、周期性和随机性,而GARCH模型可以用来描述时间序列的波动性和风险。
三、聚类分析模型聚类分析模型是一种用来对数据进行分类和归类的统计方法。
在气象学中,聚类分析模型可以用来对气象数据进行分类,例如将不同地区的气象数据进行聚类,划分出具有相似气象特征的区域。
聚类分析模型可以帮助气象学家更好地理解气象数据的分布规律,为预测和分析气象事件提供依据。
四、人工神经网络模型人工神经网络模型是一种模仿人脑神经系统结构和功能的统计模型。
在气象学中,人工神经网络模型可以用来对气象数据进行模拟和预测。
通过训练神经网络模型,可以将输入的气象数据映射到输出的气象变量,从而实现对未来气象变化的预测。
人工神经网络模型在气象预测方面具有一定的优势,能够处理非线性和复杂的气象关系。
以上介绍了几种常用的现代气象统计方法模型。
这些方法可以帮助气象学家更好地理解和预测气象变化,提高气象服务的准确性和效率。
随着气象数据的不断增加和计算机技术的不断进步,预测和分析气象事件的能力将越来越强大。
回归分析在气象统计分析中的作用摘要各气象要素的多年观测记录用不同方式统计,其统计结果称为气候统计量。
它们是分析和描述气候特征及其变化规律的基本资料。
回归预测,即分析因变量与自变量之间相互关系,建立回归模型,求出相应参数后获得预测模型公式,从而根据自变量的数值变化去预测因变量数值变化的趋势。
回归分析是目前气象统计分析中最为常用的一种方法之一,用回归分析预测气象是气象句的常用方法之一。
关键字:回归预测、气象统计、线性回归预测。
The Application of Regressionin the weather thecovariance the analysisAbstractPrognosticate a record to use different way covariance for several years of each weather main factor,its covariance is as a result called weather covariance quantity.They are the basic dates’of[with]analysis and the description weather characteristic and its variety regulation. Return to return an estimate,then analysis because of changing quantity with from changed of quantity correlation,built up back to return model,begged to acquire estimate model formula after corresponding the parameter,thus according to from change the number of quantity variety to predict because of change quantity number the trend of the variety.Return to return the analysis is a weather to statistics analysis currently medium one of the most in common use methods,use back to return analysis to predict a weather to is one of the in common use methods of weather sentence.Key word:regression prediction,The weather statistics,the linearity regression prediction.1引言此篇论文,分为两个部分:前面部分是介绍回归分析的相关阐述和分析以及气象统计的相关知识,后一部分是实例说明。
906 求一元线形回归方程及预报一 功能 x 为自变量,y 为随机变量,给出一组n 次观测值(X i , Y i ), I=1, 2, … n, 求线形回归方程 Y=A+BX来描述Y 与X 的变化规律。
并用T 检验法检验线形回归是否显著。
若显著,可用求得的线形回归方程作预报,并给出预报值的置信区间。
二 算法简介 [16] , [15]设X 为可控制变量,Y 是依赖于X 的随机变量,取X 不全相同的n 个值X 1, X 2, …X n 作n 次独立实验,得到容量为n 的样本值(X 1, Y 1), (X 1, Y 2) , … , (X n, Y n ) 定Y 的数学期望值存在(是X 的函数) , 记为μ (x ), 称μ (x) 为Y 对X 的。
回归。
现假定样本有线形模型 (即μ(x )为线形函数)Y 1=A+BX+ε1, I=1,2,…,n (1) 其中A, B 为待定函数;X 为实验误差,且ε1ε2….εn. 独立同步分布:c1~N(0, 62);对固有的X ,有Y~N (A+BX,2σ)。
这相当于假设),0(~,2σεεN BX A Y ++= (2) 其中A ,B ,2σ 都不依赖于X 。
式(2)称为一元线形回归模型。
在一元线形回归问题中,我们主要解决三个问题1) 如何用n 对数据(X i,,Y i )对A ,B , 2σ 作出点估计; 2) 回归系数B 进行假设检验;3) 给出X 0 ,对Y 作预报,并给出预报值Y 0的置信区间。
先对A 、B 作点估计。
设估计值为Aˆ,B ˆ ,从而得经验回归直线方程 X B A Yˆˆˆ+= (3)作离差平方和2121)ˆˆ()ˆ(ini i i n i i X B A Y Y Y Q --=-=∑∑== (4) 用最小二乘法求A , B ,令⎪⎪⎩⎪⎪⎨⎧=---=∂∂=---=∂∂∑∑==ni i i i ni i i X X B A Y B Q X B A Y A Q 110)ˆˆ(20)ˆˆ(2 (5)对该方程组变形,得⎪⎪⎩⎪⎪⎨⎧=+=+∑∑∑∑∑=====n i ni i i n i i i n i ni i i Y X X B X A Y X B A n 112111ˆˆˆˆ (6)该方程组称为正规(则)方程组,解此方程组,得∑∑∑∑∑=====--=n i ni i i n i ni i i n i i i X X n Y X Y X n B1122111)())((ˆ . (7)∑∑==-=n i i n i i X n B Y n A 111ˆ1ˆ (8)由此即得经验回归直线方程(3) 实际计算时,可令⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧-=--=-=-=-=-===∑∑∑∑∑∑∑∑∑∑∑∑============n i n i ni n i i i i i i i xy n i n i ni i i i yy n i ni n i i i i xx n i n i ii Y X n Y X Y Y X X S Y n Y Y Y S X n X X X S Y n Y X n X 111111122211122211))((1))(()(1)()(1)(1,1 (9) 则得A , B 的计算公式为xxxy S S B /ˆ= (10) X B Y Aˆˆ-= (11)还可得Q 的计算公式[15]xyyy S B S Q ˆ-= (12) 可得2σ的估计。