3.2 第四讲 权及中误差的计算
- 格式:ppt
- 大小:588.00 KB
- 文档页数:47
第四讲 异方差一、 同方差与异方差:图形展示对于模型12i i i y x ββε=++,在高斯-马尔科夫假定下有:12222()iii iy E y x εββδδδ=+==其中22iεδδ=意味着同方差假定成立。
为了理解同方差假定,我们先考察图一。
在图一中,空心圆点代表(,())i ix E y ,实心圆点代表观测值(,)i i x y 观测,i y 观测是随机变量i y 的一个实现(注意,按照假定,i x 是非随机的,即在重复抽样的情况下,给定i 的取值,ix 不随样本的变化而变化),倾斜的直线代表总体回归函数:12()i iE y x ββ=+。
图一显示了一个重要特征,即,尽管12,,...y y的期望值随着12,,...x x 的不同而随之变化,但由于假定222iiyεδδδ==,它们的离散程度(方差)是不变的。
然而,假定误差项同方差从而被解释变量同方差可能并不符合经济现实。
例如,如果被解释变量y 代表居民储蓄,x 代表收入,那么经常出现的情况是,低收入居民间的储蓄不会有太大的差异,这是因为在满足基本消费后剩余收入已不多。
但在高收入居民间,储蓄可能受消费习惯、家庭成员构成等因素的影响而千差万别。
图二能够展示这种现象。
图一同方差情况图二异方差情况在图二中,依据x1所对应的分布曲线形状,x5所对应的实心圆点看起来是一个异常点(但依据x5所对应的分布曲线形状,它或许称不上是异常点)。
异常点的出现是同方差假定被违背情况下的一个典型症状,事实上通过散点图来发现异常点从而初步识别异方差现象在实践中经常被采用,见图三。
浙江工商大学金融学院姚耀军讲义系列图三异方差情况下的散点图笔记:应该注意的是,如果第一个高斯-马尔科夫假定被违背,即模型设定有误,那么也可能出现异方差症状。
例如,正确模型是非线性的,但我们错误地设定为线性,以这个线性模型为参照,散点图也许显示出明显的异方差症状。
事实上,在很多情况下,异方差症状被认为是模型错误设定的一个表现。
第四讲龙格-库塔⽅法龙格-库塔⽅法3.2 Runge-Kutta法3.2.1 显式Runge-Kutta法的⼀般形式上节已给出与初值问题(1.2.1)等价的积分形式(3.2.1)只要对右端积分⽤不同的数值求积公式近似就可得到不同的求解初值问题(1.2.1)的数值⽅法,若⽤显式单步法(3.2.2)当,即数值求积⽤左矩形公式,它就是Euler法(3.1.2),⽅法只有⼀阶精度,若取(3.2.3)就是改进Euler法,这时数值求积公式是梯形公式的⼀种近似,计算时要⽤⼆个右端函数f的值,但⽅法是⼆阶精度的.若要得到更⾼阶的公式,则求积分时必须⽤更多的f值,根据数值积分公式,可将(3.2.1)右端积分表⽰为注意,右端f中还不能直接得到,需要像改进Euler法(3.1.11)⼀样,⽤前⾯已算得的f值表⽰为(3.2.3),⼀般情况可将(3.2.2)的表⽰为(3.2.4)其中这⾥均为待定常数,公式(3.2.2),(3.2.4)称为r级的显式Runge-Kutta法,简称R-K⽅法.它每步计算r个f值(即),⽽k由前⾯(i-1)个已算出的表⽰,故公式是显式的.例i如当r=2时,公式可表⽰为(3.2.5) 其中.改进Euler 法(3.1.11)就是⼀个⼆级显式R-K ⽅法.参数取不同的值,可得到不同公式.3.2.2 ⼆、三级显式R-K ⽅法对r=2的显式R-K ⽅法(3.2.5),要求选择参数,使公式的精度阶p 尽量⾼,由局部截断误差定义11122211()()[(,())(,)]n n n n n n n T y x y x h c f x y x c f x a h y b hk ++=--+++ (3.2.6)令,对(3.2.6)式在处按Taylor 公式展开,由于将上述结果代⼊(3.2.6)得要使公式(3.2.5)具有的阶p=2,即,必须(3.2.7)即由此三式求的解不唯⼀.因r=2,由(3.2.5)式可知,于是有解(3.2.8)它表明使(3.2.5)具有⼆阶的⽅法很多,只要都可得到⼆阶精度R-K⽅法.若取,则,则得改进Euler法(3.1.11),若取,则得,此时(3.2.5)为(3.2.9)其中称为中点公式.改进的Euler法(3.1.11)及中点公式(3.2.9)是两个常⽤的⼆级R-K⽅法,注意⼆级R-K⽅法只能达到⼆阶,⽽不可能达到三阶.因为r=2只有4个参数,要达到p=3则在(3.2.6)的展开式中要增加3项,即增加三个⽅程,加上(3.2.7)的三个⽅程,共计六个⽅程求4个待定参数,验证得出是⽆解的.当然r=2,p=2的R-K⽅法(3.2.5)当取其他数时,也可得到其他公式,但系数较复杂,⼀般不再给出.对r=3的情形,要计算三个k值,即其中将按⼆元函数在处按Taylor公式展开,然后代⼊局部截断误差表达式,可得可得三阶⽅法,其系数共有8个,所应满⾜的⽅程为(3.2.10)这是8个未知数6个⽅程的⽅程组,解也是不唯⼀的,通常.⼀种常见的三级三阶R-K⽅法是下⾯的三级Kutta⽅法:(3.2.11)附:R-K 的三级Kutta ⽅法程序如下function y = DELGKT3_kuta(f, h,a,b,y0,varvec) format long; N = (b-a)/h;y = zeros(N+1,1); y(1) = y0; x = a:h:b;var = findsym(f); for i=2:N+1K1 = Funval(f,varvec,[x(i-1) y(i-1)]);K2 = Funval(f,varvec,[x(i-1)+h/2 y(i-1)+K1*h/2]); K3 = Funval(f,varvec,[x(i-1)+h y(i-1)-h*K1+K2*2*h]);y(i) = y(i-1)+h*(K1+4*K2+K3)/6; %满⾜c1+c2+c3=1,(1/6 4/6 1/6)endformat short; 3.2.3 四阶R-K ⽅法及步长的⾃动选择利⽤⼆元函数Taylor 展开式可以确定(3.2.4)中r=4,p=4的R-K ⽅法,其迭代公式为111223344()n n y y h c k c k c k c k +=++++其中1(,)n n k f x y =,2221(,(,))n n n n k f x a h y b hf x y =++,⽽33311322(,)n n k f x a h y b hk b hk =+++ 44411422433(,)n n k f x a h y b hk b hk b hk =++++共计13个参数待定,Taylor 展开分析局部截断误差,使得精度达到四阶,即误差为5()O h 。
加权平均值及其中误差此时当各观测量的精度不相同时,不能按算术平均值(6-17)式和中误差(6-19)及(6-20)式来计算观测值的最或是值和评定其精度。
计算观测量的最或然值应考虑到各观测值的质量和可靠程度,显然对精度较高的观测值,在计算最或然值时应占有较大的比重,反之,精度较低的应占较小的比重,为此的各个观测值要给定一个数值来比较它们的可靠程度,这个数值在测量计算中被称为观测值的权(weight)。
显然,观测值的精度愈高,中误差就愈小,权就愈大,反之亦然。
在测量计算中,给出了用中误差求权的定义公式),,2,1(22n i mP ii ==μ (6-21)式中P 为观测值的权,μ为任意常数,m 为各观测值对应的中误差。
在用上式求一组观测值的权P i 时,必须采用同一μ值。
当取P =1时,μ就等于m ,即μ=m ,通常称数字为1的权为单位权,单位权对应的观测值为单位权观测值。
单位权观测值对应的中误差μ为单位权中误差。
当已知一组非等精度观测值的中误差时,可以先设定μ值,然后按(6-21)式计算各观测值的权。
例如:已知三个角度观测值的中误差分别为m 1=±3″、m 2=±4″、m 3=±5″,它们的权分别为:232322222121///m P m P m P μμμ===若设"3±=μ 则 P 1=1P 2=9/16P 3=9/25 若设"1±=μ 则 P '1=1/9 P '2=1/16P '3=1/25上例中P 1:P 2:P 3=P '1:P '2:P '3=1:0.56:0.36。
可见,μ值取得不同,权值也不同,但不影响各权之间的比例关系。
当"3±=μ时,P 1就是该问题中的单位权,m 1=±3"就是单位权中误差。
中误差是用来反映观测值的绝对精度,而权是用来比较各观测值相互之间的精度高低。
中误差和协方差
中误差和协方差都是在统计学和概率论中常用来描述数据特征的统计量。
中误差是指在相同的测量条件下,对同一个量进行多次测量,所测得的数据与真值之间的平均偏差。
它反映了测量值的离散程度,可以通过多次测量取平均值的方法减小中误差。
协方差是用来度量两个变量之间的总体误差,即描述两个变量之间的相对于各自的期望值的变化趋势。
如果两个变量的变化趋势一致,那么它们之间的协方差就是正值;如果两个变量的变化趋势相反,那么它们之间的协方差就是负值。
协方差可以反映两个变量之间的相关性,但不能说明相关的程度,若衡量相关程度,则使用相关系数。
在实际应用中,中误差和协方差都有重要的作用,可以帮助我们更好地理解和分析数据。
中文名:中误差英文名:root mean square error;RMSE代替值:真值只能用最或然值性质:描述代数误差别名:标准差”或“均方根差”方法:最小二乘法计算:观测值与真值偏差平方和定义:衡量观测精度的一种数字标准计算公式测量误差按其对测量结果影响的性质,可分为:一.系统误差(system error)1.定义:在相同观测条件下,对某量进行一系列观测,如误差出现符号和大小均相同或按一定的规律变化,这种误差称为系统误差。
2.特点:具有积累性,对测量结果的影响大,但可通过一般的改正或用一定的观测方法加以消除。
二.偶然误差(accident error)1.定义:在相同观测条件下,对某量进行一系列观测,如误差出现符号和大小均不一定,这种误差称为偶然误差。
但具有一定的统计规律。
2.特点:(1)具有一定的范围。
(2)绝对值小的误差出现概率大。
(3)绝对值相等的正、负误差出现的概率相同。
(4)数学期限望等于零。
即:误差概率分布曲线呈正态分布,偶然误差要通过的一定的数学方法(测量平差)来处理。
此外,在测量工作中还要注意避免粗差(gross error)(即:错误)的出现。
§2衡量精度的指标测量上常见的精度指标有:中误差、相对误差、极限误差。
一.中误差方差——某量的真误差,∑——求和符号。
规律:标准差估值(中误差m)绝对值愈小,观测精度愈高。
在测量中,n为有限值,计算中误差m的方法,有:1.用真误差(true error)来确定中误差——适用于观测量真值已知时。
真误差Δ——观测值与其真值之差,有:标准差中误差(标准差估值), n为观测值个数。
2.用改正数来确定中误差(白塞尔公式)——适用于观测量真值未知时。
V——最或是值与观测值之差。
一般为算术平均值与观测值之差,即有:二.相对误差1.相对中误差2.往返测较差率K三.极限误差(容许误差)常以两倍或三倍中误差作为偶然误差的容许值。
即:。
§3误差传播定律一.误差传播定律设、…为相互独立的直接观测量,有函数,则有:二.权(weight)的概念1.定义:设非等精度观测值的中误差分别为m1、m2、…mn,则有:权其中,n为任意大小的常数。