5第五章 一元线性回归的假设检验
- 格式:ppt
- 大小:680.50 KB
- 文档页数:57
第五章 异方差二、简答题1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间;(3)显著性t 检验和F 检验的使用。
2.产生异方差的经济背景是什么?检验异方差的方法思路是什么?3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。
4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验5.在一元线性回归函数中,假设误差方差有如下结构:()i i i x E 22σε=如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。
三、计算题1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差):t t t D GNP C 4398.0624.019.26-+=e s :(2.73)(0.0060) (0.0736)R ²=0.999t t t GNP D GNP GNP C ⎥⎦⎤⎢⎣⎡-+=⎥⎦⎤⎢⎣⎡4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597)R ²=0.875式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。
研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。
(4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R ²加以比较?为什么?2.1964年,对9966名经济学家的调查数据如下:资料来源:“The Structure of Economists’ Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。
统计学习题集第五章相关与回归分析(总4页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--所属章节:第五章相关分析与回归分析1■在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变量数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为()。
答案:负相关。
干扰项:正相关。
干扰项:完全相关。
干扰项:非线性相关。
提示与解答:本题的正确答案为:负相关。
2■在线性相关中,若两个变量的变动方向相同,一个变量的数值增加,另一个变量数值随之增加,或一个变量的数值减少,另一个变量的数值随之减少,则称为()。
答案:正相关。
干扰项:负相关。
干扰项:完全相关。
干扰项:非线性相关。
提示与解答:本题的正确答案为:正相关。
3■下面的陈述中哪一个是错误的()。
答案:相关系数不会取负值。
干扰项:相关系数是度量两个变量之间线性关系强度的统计量。
干扰项:相关系数是一个随机变量。
干扰项:相关系数的绝对值不会大于1。
提示与解答:本题的正确答案为:相关系数不会取负值。
4■下面的陈述中哪一个是错误的()。
答案:回归分析中回归系数的显着性检验的原假设是:所检验的回归系数的真值不为0。
干扰项:相关系数显着性检验的原假设是:总体中两个变量不存在相关关系。
干扰项:回归分析中回归系数的显着性检验的原假设是:所检验的回归系数的真值为0。
干扰项:回归分析中多元线性回归方程的整体显着性检验的原假设是:自变量前的偏回归系数的真值同时为0。
提示与解答:本题的正确答案为:回归分析中回归系数的显着性检验的原假设是:所检验的回归系数的真值不为0。
5■根据你的判断,下面的相关系数值哪一个是错误的()。
答案:。
干扰项:。
干扰项:。
干扰项:0。
提示与解答:本题的正确答案为:。
6■下面关于相关系数的陈述中哪一个是错误的()。
答案:数值越大说明两个变量之间的关系越强,数值越小说明两个变量之间的关系越弱。
第五章 假设检验与一元线性回归分析 习题详解解:这是检验正态总体数学期望μ是否为提出假设:0.32:,0.32:10≠=μμH H由题设,样本容量6n =, 21.12=σ,1.121.10==σ,所以用U 检验当零假设H 0成立时,变量:)1,0(~61.10.320N X n X U -=-=σμ 因检验水平05.0=α,由05.0}|{|=≥λU P ,查表得96.1=λ 得到拒绝域: 96.1||≥u计算得: 6.31)6.318.310.326.310.306.32(61=+++++⨯=x89.061.10.326.310-=-=-=n x u σμ因 0.89 1.96u =<它没有落入拒绝域,于是不能拒绝H 0,而接受H 0,即可以认为0.32=μ,所以可以认为这批机制砖的平均抗断强度μ显着为32.0kg/cm 2。
解:这是检验正态总体数学期望μ是否大于10提出假设:10:,10:10>≤μμH H 即:10:,10:10>=μμH H由题设,样本容量5n =,221.0=σ,1.01.020==σ,km x 万1.10=,所以用U 检验当零假设H 0成立时,变量:)1,0(~51.010N X n X U -=-=σμ 因检验水平05.0=α,由05.0}{='≥λU P ,查表得64.1'=λ 得到拒绝域: 64.1≥u 计算得: 24.251.0101.100=-=-=n x u σμ 因 2.24 1.64u =>它落入拒绝域,于是拒绝零假设 H 0,而接受备择假设H 1,即可认为10>μ所以可以认为这批新摩托车的平均寿命μ有显者提高。
解:这是检验正态总体数学期望μ是否小于240提出假设:240:,240:10<≥μμH H即:240:,240:10<=μμH H由题设,样本容量6n =,6252=σ,256250==σ,220=x ,所以用U 检验当零假设H 0成立时,变量:)1,0(~625240N X n X U -=-=σμ 因检验水平05.0=α,由05.0}{='-≤λU P ,查表得64.1'=λ 得到拒绝域: 64.1-≤u 计算得:959.16252402200-=-=-=n x u σμ 因 1.959 1.64u =-<-它落入拒绝域,于是拒绝H 0,而接受H 1,即可以认为240<μ 所以可以认为今年果园每株梨树的平均产量μ显着减少。
一元线性回归方程回归系数的假设检验方法
一元线性回归方程是一种统计学方法,用于研究两个变量之间的关系。
它可以
用来预测一个变量(被解释变量)的值,另一个变量(解释变量)的值已知。
回归系数是一元线性回归方程的重要参数,它可以用来衡量解释变量对被解释变量的影响程度。
回归系数的假设检验是一种统计学方法,用于检验回归系数是否具有统计学意义。
它的基本思想是,如果回归系数的值不是0,则表明解释变量对被解释变量有
显著的影响,反之则表明解释变量对被解释变量没有显著的影响。
回归系数的假设检验一般采用t检验或F检验。
t检验是检验单个回归系数是
否具有统计学意义的方法,而F检验是检验多个回归系数是否具有统计学意义的方法。
在进行回归系数的假设检验时,首先要确定检验的显著性水平,一般为0.05
或0.01。
然后,根据检验的类型,计算t值或F值,并与检验的显著性水平比较,如果t值或F值大于显著性水平,则拒绝原假设,即认为回归系数具有统计学意义;反之,则接受原假设,即认为回归系数没有统计学意义。
回归系数的假设检验是一种重要的统计学方法,它可以用来检验回归系数是否
具有统计学意义,从而更好地理解解释变量对被解释变量的影响程度。
第五章 多元线性模型它包括多元回归分析、多元方差分析及多元协方差分析,它是多元统计分析的基础,应用十分广泛,专著很多。
此处仅介绍实用上最重要的基本内容。
§5.1 一元线性回归模型基本模型:y X u β=+ (5-1-1)2()0, ()n u Var u I εσ==式中y, 是n 维观察值的随机向量,X 是n ×p 的已知矩阵,常被认为已知的(即不当作随机),而一般认为rank(X)=p<n ,β 是p 维未知参数,叫回归系数,u 是非观察值,它代表随机误差。
常用的特例:1、 回归模型如果X 的第一列全是1,而其它变量为定量的数字,这时上式可化为如下回归模型:0111,1, 1,,i i p i p i y x x u i n βββ--=++++= (5-1-2)1n y y y ⎛⎫ ⎪= ⎪ ⎪⎝⎭, 01p βββ-⎛⎫ ⎪= ⎪ ⎪⎝⎭, 1n u u u ⎛⎫⎪= ⎪ ⎪⎝⎭, 111,11,111p n n p x x X x x --⎛⎫⎪= ⎪ ⎪⎝⎭(5-1-3) 上述式子更常用的表达法为:01111,p p y x x u βββ--=++++ (5-1-4)其中u 是随机项2()0, ()u Var u εσ==2、方差分析模型如(5-1-1) 中X 内元素取值非1即0,则该模型就是方差分析,称X 为设计矩阵。
例在有k 个处理组的单因素方差分析中,记i n 为第i 个处理中的试验数,令1, k ij n n n y =++为第j 个处理中的第i 个试验结果,这时方差分析模型常写成下式: , 1,,, 1,,ij j ij j y u i n j k μτ=++== (5-1-5)这里μ表示n 次试验的平均水平, j τ表示第j 种处理的效应, ij u 表示随机误差。
用下述记号,这个模型可化为线性模型:121112121110011001010, 101000010011001k n n k kn y y y y X y y y ⎛⎫⎛⎫⎪ ⎪⎪ ⎪⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪⎪⎪⎪ ⎪⎝⎭⎝⎭, 1211112121, k n n k k n k u u u u u u u μτβτ⎛⎫ ⎪ ⎪ ⎪ ⎪⎛⎫ ⎪⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭; 要检验k 个处理中有否显著性差异,就是检验01:k H ττ==,1:i j H ττ≠至少有一项这就是一个指标时上章中多母体的均值相等性检验。
§2.4 一元线性回归的模型检验一、经济意义检验。
二、在一元回归模型的统计检验主要包括如下几种检验1、拟合优度检验(R2检验;2、自变量显著性检验(t检验;3、残差标准差检验(SE检验。
•主要检验模型参数的符号、大小和变量之间的相关关系是否与经济理论和实际经验相符合。
一、经济意义检验i•二、统计检验•回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。
•尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。
那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。
1、拟合优度检验拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:判定系数(可决系数R2(1、总离差平方和的分解已知由一组样本观测值(X i ,Y i ,通过估计得到如下样本回归直线ii X Y 10ˆˆˆββ+=i i i i i i i y e Y Y Y Y Y Y y ˆˆ(ˆ(+=-+-=-=总离差平方和的分解ii X Y 10ˆˆˆββ+=ˆ(ˆY Y y i i -=i i i i i i i ye Y Y Y Y Y Y y ˆˆ(ˆ(+=-+-=-=Y 的i 个观测值与样本均值的离差由回归直线解释的部分回归直线不能解释的部分离差分解为两部分之和总离差平方和的分解公式:TSS=RSS+ESS,TSS 总离差平方和,ESS 为回归平方和,RSS 为残差平方和.((((((((0ˆˆˆ,0.0ˆˆ(ˆ(ˆˆ(2ˆˆ: 1022222222ˆˆˆˆˆˆ=+===-=-=--+=+=-+-=-+--+-=-+-=-=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑ii i i i i ii i i i i i i i i i i i i i i i i i i i i i X e e Y e e e Y Y e Y Y e Y Y ESS RSS y e Y Y Y Y TSS Y Y Y YY Y Y YY Y Y Y Y Y Y Y ββ而因为证明TSS=ESS+RSSY的观测值围绕其均值的总离差(total variation可分解为两部分:一部分来自回归线(ESS,另一部分则来自随机部分(RSS。