第5章相关分析和回归分析作业答案1
- 格式:doc
- 大小:40.01 KB
- 文档页数:17
回归分析考试试题及答案一、单项选择题(每题2分,共20分)1. 回归分析中,自变量和因变量之间的关系是()。
A. 确定性关系B. 函数关系C. 相关关系D. 因果关系答案:C2. 简单线性回归模型中,回归系数的估计值是通过()方法得到的。
A. 最小二乘法B. 最大似然法C. 贝叶斯方法D. 决策树方法答案:A3. 在多元线性回归分析中,如果自变量之间存在完全相关关系,则会导致()。
A. 多重共线性B. 异方差性C. 自相关D. 非线性答案:A4. 回归分析中,残差平方和(SSE)是用来衡量()的。
A. 模型的拟合优度B. 模型的预测能力C. 模型的解释能力D. 模型的预测误差答案:D5. 回归方程的显著性检验中,F检验的零假设是()。
A. 所有回归系数都等于0B. 所有回归系数都不等于0C. 至少有一个回归系数等于0D. 至少有一个回归系数不等于0答案:A6. 回归分析中,调整后的R平方(Adjusted R-squared)用于()。
A. 调整模型的复杂性B. 调整样本量的大小C. 调整自变量的数量D. 调整因变量的范围答案:C7. 在回归分析中,如果自变量的增加导致因变量的增加,则称自变量和因变量之间存在()。
A. 正相关B. 负相关C. 无相关D. 完全相关答案:A8. 回归分析中,残差的标准差(S)是用来衡量()的。
A. 模型的拟合优度B. 模型的预测能力C. 模型的解释能力D. 模型的预测误差答案:D9. 在多元线性回归中,如果一个自变量的t统计量显著,那么我们可以得出结论()。
A. 该自变量对因变量有显著影响B. 该自变量对因变量没有显著影响C. 该自变量对因变量的影响不明确D. 该自变量对因变量的影响是正的答案:A10. 回归分析中,Durbin-Watson统计量用于检测()。
A. 多重共线性B. 异方差性C. 自相关D. 非线性答案:C二、多项选择题(每题3分,共15分)11. 以下哪些因素可能导致回归模型中的异方差性?()A. 模型中遗漏了重要的解释变量B. 模型中包含了不应该包含的变量C. 模型中的误差项不是独立同分布的D. 模型中的误差项具有非恒定的方差答案:CD12. 在回归分析中,以下哪些方法可以用来处理多重共线性问题?()A. 增加样本量B. 移除相关性高的自变量C. 使用岭回归D. 增加更多的自变量答案:BC13. 以下哪些是回归分析中常用的诊断图?()A. 残差图B. 正态Q-Q图C. 散点图D. 杠杆值图答案:ABD14. 在回归分析中,以下哪些因素可能导致模型的预测能力下降?()A. 模型过拟合B. 模型欠拟合C. 模型中的误差项具有自相关性D. 模型中的误差项具有异方差性答案:ABCD15. 以下哪些是回归分析中常用的模型选择标准?()A. AIC(赤池信息准则)B. BIC(贝叶斯信息准则)C. R平方D. 调整后的R平方答案:ABCD三、简答题(每题10分,共30分)16. 简述简单线性回归模型的基本形式。
、 单项选择题1. 相关分析是研究变量之间的 A. 数量关系 C •因果关系2. 在相关分析中要求相关的两个变量3. 下列现象之间的关系哪一个属于相关关系?A. 播种量与粮食收获量之间关系 C •圆半径与圆面积之间关系 D. 单位产品成本与总成本之间关系 4. 正相关的特点是A •两个变量之间的变化方向相反 C. 两个变量之间的变化方向一致 5. 相关关系的主要特点是两个变量之间A. 存在着确定的依存关系 C. 存在着严重的依存关系 B. 存在着不完全确定的关系 D. 存在着严格的对应关系6.当自变量变化时 , 因变量也相应地随之等量变化 ,则两个变量 之间存在着A. 直线相关关系B.负相关关系C.曲线相关关系 D.正相关关系 7. 当变量 X 值增加时 ,变量 Y 值都随之下降 ,则变量 X 和 Y 之间存 在着 A. 正相关关系 C.负相关关系D.曲线相关关系8. 当变量 X 值增加时 ,变量 Y 值都随之增加 ,则变量 X 和 Y 之间存 在着 A. 直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系9. 判定现象之间相关关系密切程度的最主要方法是 A. 对现象进行定性分析 B.计算相关系数C.编制相关表 D.绘制相关图10. 相关分析对资料的要求是A. 自 变量不是随机的,因变量是随机的B. 两个变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 两个变量均为随机的 11. 相关系数第七章相关分析与回归分析B.变动关系D. 相互关系的密切程度 A. 都是随机变量C. 都不是随机变量B. 自变量是随机变量 D. 因变量是随机变量B •圆半径与圆周长之间关系B.两个变量一增一减 D. 两个变量一减一增 B.直线相关关系A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为C. 不相关D.负相关B.-1w rw 0 D. r=0 ,则相关系数 B.愈趋近于0D. 愈小于 1 ,则相关系数 B.愈趋近于0D. 愈小于116. 相关系数越接近于- 1,表明两变量间C. 负相关关系越强 D.负相关关系越弱17. 当相关系数 r=0 时 , A. 现象之间完全无关 B.相关程度较小 B. 现象之间完全相关D.无直线相关关系18. 假设产品产量与产品单位成本之间的相关系数为 -0.89,则说明这两个变量之间存在A.高度相关 B.中度相关 C. 低度相关D.显著相关19. 从变量之间相关的方向看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关20. 从变量之间相关的表现形式看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关21. 物价上涨 ,销售量下降 ,则物价与销售量之间属于 A. 无相关 B.负相关 C.正相关D.无法判断22. 配合回归直线最合理的方法是 A.随手画线法 B.半数平均法 C.最小平方法D.指数平滑法A.单相关B.复相关 13. 相关系数的取值范围是 A.-1W r < 1C.OW rw 114. 两变量之间相关程度越强 A.愈趋近于1 C.愈大于115. 两变量之间相关程度越弱 A.愈趋近于1 A. 没有相关关系B. 有曲线相关关系23.在回归直线方程y= a+ bx 中 b 表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量24.计算估计标准误差的依据是A.因变量的数列C.因变量的回归变差25.估计标准误差是反映A.平均数代表性的指标B.因变量的总变差D.因变量的剩余变差B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中 ,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程 y=10+70x, 这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为 1000件时,其生产成本为 30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数G剩余变差B.回归参数D.估计标准误差、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系2.直线相关分析的特点是A.相关系数有正负号C.只有一个相关系数E.年龄与血压之间的关系B.两个变量是对等关系D. 因变量是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量 x 与 y 之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加 5.6元D.产量为 1 千件时,单位成本为 79.4 元E.产量每增加1千件,单位成本平均减少 5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关16用最小平方法配合的回归直线 A . (y-y c )=最小值 C. (y-y c )2=最小值 E.(y-y c )2=最大值D.计算相关系数 8•当现象之间完全相关的A.0B.— 1E.计算估计标准误差 ,相关系数为C.1D.0.5E. — 0.59•相关系数r =0说明两个变量之间是 A •可能完全不相关 B •可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关E. 高度曲线相关 10下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B. 流通费用率随商品销售额的增加而减少D. 生产单位产品耗用工时,随劳动生产率的提高而减少E. 工人劳动生产率越高,则创造的产值就越多 11直线回归分析的特点有 A •存在两个回归方程 B •回归系数有正负值C. 两个变量不对等关系D. 自变量是给定的,因变量是随机的E. 利用一个回归方程,两个变量可以相互计算 12直线回归方程中的两个变量C. 必须确定哪个是自变量,哪个是因变量D. 一个是随机变量,另一个是给定变量E. 一个是自变量,另一个是因变量13. 从现象间相互关系的方向划分,相关关系可以分为 A.直线相关 B.曲线相关 D. 负相关 E.单相关14. 估计标准误差是A. 说明平均数代表性的指标B. 说明回归直线代表性指标C. 因变量估计值可靠程度指标D. 指标值愈小,表明估计值愈可靠C.正相关Ar D.r(x x)(y y)B rL xyC.rL xyL yyL xy LXX(X X)(y y) Er■(X X)2 (y y)2n xy x y、n x 2 ( x)2 、n y 2 ( y)217 方程 y c=a+bx,必须满足以下条件B. (y-y c)=02A.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E.其数值大小受计量单位的影响19相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.__________________________________________________ 研究现象之间相关关系称作相关分析。
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
第五章相关分析和回归分析练习题一、单项选择题1、相关分析研究的是()。
A、变量间的相互依存关系B、变量间的因果关系C、变量间严格的一一对应关系D、变量间的线性关系2、测定变量之间相关关系密切程度的主要方法是()。
A、相关表B、相关图C、相关系数D、定性分析3、下列情况中,称为正相关的是()。
A、随一个变量增加,另一个变量相应减少B、随一个变量减少,另一个变量相应增加C、随一个变量增加,另一个变量相应增加D、随一个变量增加,另一个变量不变4、相关系数r取值范围()。
A、︱r︱<∞B、︱r︱≤1C、r<1D、r≤0.55、相关系数等于零表明两个变量()。
A、是严格的函数关系B、不存在相关关系C、不存在线性相关关系D、存在曲线相关关系6、现象之间相互依存关系的程度是对等的,则相关系数()。
A、越小于0B、越接近-1C、越接近于1D、越接近于07、相关关系中,两个变量的关系是对待的,从而变更x对变量y的相关,同变量y对变量x的相关()。
A、是同一问题B、不一定相同C、有联系但是不是一个问题D、完全不同8、若居民收入增加,居民消费额也增加,则居民收入和居民消费额之间()。
A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9、产品产量与单件成本的相关系数是-0.80,单位成本与利润率的相关系数是-0.94,产量与利润率之间的相关系数是0.89,因此()。
A、产量与利润率的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、反映不出哪对变量的相关程度最高10、在回归分析中,自变量同因变量的地位不同,两变量y和x回归和x对y回归()。
A、是同一问题B、不一定相同C、有联系但不是一个问题D、完全不同11、回归分析中的简单回归是指()。
A、两上变量之间的回归B、变量之间的线性回归C、两个变量之间的线性回归D、变量之间的简单回归12、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
第5章相关分析和回归分析作业答案1.当变量x按一定数值变化时,变量y也近似地按固定数值变化,这表明变量x和变量y之间存在着( 3 )①完全相关关系②复相关关系③直线相关关系④没有相关关系2.单位产品成本与其产量的相关:单位产品成本与单位产品原材料消耗量的相关( 2)①前者是正相关,后者是负相关②前者是负相关,后者是正相关③两者都是正相关④两者都是负相关3.相关系数r的取值范围( 2 )①-∞<r<+∞②-1≤r≤+1③<r<1 ④0≤r≤+14.当所有观测值都落在回归直线上,则x与y之间的相关系数( 4 )①.②1③1 ④15.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( 1 )①前者无须确定,后者需要确定②前者需要确定,后者勿需确定③两者均需确定④两者都无需确定6.—元线性回归模型的参数有( 2 )①一个②两个③三个④三个以上7.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( 1 )①完全相关②微弱相关③无线性相关④高度相关8.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为10+7,这意味着年劳动生产率每提高1千元时,工人工资平均( 1 )①增加70元②减少70元③增加80元④减少80元9.下面的几个式子中,错误的是(1,3)①40-1.6x 0.89 (说明:正相关,x前面的系数应该为正值)②5-3.8x 0.94③36-2.4x 0.96④36+3.8x 0.9810.相关系数r与回归系数b的关系可以表达为( 1 )①*σσy②*③* ④*11.下列关系中,属于正相关关系的有( 1 )①合理限度内,施肥量和平均单产量之间的关系②产品产量与单位产品成本之间的关系③商品的流通费用与销售利润之间的关系.④流通费用率与商品销售量之间的关系12.直线相关分析与直线回归分析的联系表现为( 1)①相关分析是回归分析的基础②回归分析是相关分析的基础③相关分析是回归分析的深入④相关分析与回归分析互为条件13.如果估计标准误差,则表明( 1)①全部观测值和回归值都相等②回归值等于Y 、③全部观测值与回归值的离差之和为零④全部观测值都落在回归直线上14.进行相关分析,要求相关的两个变量( 1 )。
第五章相关分析一、判断题二、1.若变量X的值增加时,变量Y的值也增加,说明X与Y之间存在正相关关系;若变量X的值减少时,Y变量的值也减少,说明X与Y之间存在负相关关系。
()三、2.回归系数和相关系数都可以用来判断现象之间相关的密切程度()四、3.回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()五、4.计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()六、5.完全相关即是函数关系,其相关系数为±1。
()1、×2、×3、×4、×5、√.七、单项选择题1.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
2. A.相关关系 B.函数关系 C.回归关系 D.随机关系3.现象之间的相互关系可以归纳为两种类型,即()。
4. A.相关关系和函数关系 B.相关关系和因果关系 C.相关关系和随机关系 D.函数关系和因果关系5.在相关分析中,要求相关的两变量()。
6. A.都是随机的 B.都不是随机变量 C.因变量是随机变量 D.自变量是随机变量7.现象之间线性依存关系的程度越低,则相关系数( ) 。
8. A.越接近于-1 B. 越接近于1 C. 越接近于0 D. 在0.5和0.8之间9.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( )。
10. A.不相关 B. 负相关 C. 正相关 D. 复相关11.能够测定变量之间相关关系密切程度的主要方法是( ) 。
12. A.相关表 B.相关图 C.相关系数 D.定性分析13.下列哪两个变量之间的相关程度高()。
14. A.商品销售额和商品销售量的相关系数是0.915. B.商品销售额与商业利润率的相关系数是0.8416. C.平均流通费用率与商业利润率的相关系数是-0.9417. D.商品销售价格与销售量的相关系数是-0.9118.回归分析中的两个变量()。
第五章相关分析一、判断题二、1.若变量X的值增加时,变量Y的值也增加,说明X与Y之间存在正相关关系;若变量X的值减少时,Y变量的值也减少,说明X与Y之间存在负相关关系。
()三、2.回归系数和相关系数都可以用来判断现象之间相关的密切程度()四、3.回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()五、4.计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()六、5.完全相关即是函数关系,其相关系数为±1。
()1七、1.2.3.4.5.6.7.8.9.22. A.r=0 B.|r|=1C.-1<r<1 D.0<r<123.每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:y c=56+8x,这意味着()24. A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8%25. C.废品率每增加1%,成本每吨增加8元 D.废品率每增加1%,则每吨成本为561、B2、A3、A4、C5、B6、C7、C8、D9、B10、C.八、多项选择题1.测定现象之间有无相关关系的方法有()2.A、对现象做定性分析B、编制相关表C、绘制相关图D.计算相关系数E、计算估计标准3.下列属于负相关的现象有()4.A、商品流转的规模愈大,流通费用水平越低B、流通费用率随商品销售额的增加而减少5.C、国内生产总值随投资额的增加而增长D、生产单位产品所耗工时随劳动生产率的提高而减少E、产品产量随工人劳动生产率的提高而增加6.变量x值按一定数量增加时,变量y也按一定数量随之增加,反之亦然,则x和y之间存在()7.A、正相关关系B、直线相关关系C、负相关关系D、曲线相关关系8.E、非线性相关关系9.直线回归方程y c=a+bx中的b称为回归系数,回归系数的作用是()10.A、确定两变量之间因果的数量关系B、确定两变量的相关方向C、确定两变量相关的密切程度D、确定因变量的实际值与估计值的变异程度11.E确定当自变量增加一个单位时,因变量的平均增加量12.设产品的单位成本(元)对产量(百件)的直线回归方程为y c=76-1.85x,这表示()1九、1.2.3.4.5.6.7.8.1、1≤r<06、十、1.一种不完全的依存关系。
第5章自变量选择与逐步回归思考与练习参考答案5.1 自变量选择对回归参数的估计有何影响?答:回归自变量的选择是建立回归模型得一个极为重要的问题。
如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。
5.2自变量选择对回归预测有何影响?答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。
当选模型(p元)正确采用全模型(m 元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。
5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣?C统计量达到最小的准则来衡量回答:如果所建模型主要用于预测,则应使用p归方程的优劣。
5.4 试述前进法的思想方法。
答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,...,xm建立m个一元线性回归方程, 并计算F检验值,选择偏回归平方和显著的变量(F值最大且大于临界值)进入回归方程。
每一步只引入一个变量,同时建立m-1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的两变量变量(F值最大且大于临界值)进入回归方程。
在确定引入的两个自变量以后,再引入一个变量,建立m-2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的三个变量(F值最大)进入回归方程。
不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检验临界值Fα(1,n-p-1),回归过程结束。
1.1回归分析的基本思想及其初步应用例题:1.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在X轴上,预报变量在y轴上(0可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上解析:通常把自变量X称为解析变量,因变量y称为预报变量.选B2,若一组观测值(xi, yi) (x2, y2) ••- (x…, y n)之间满足 y-bxi+a+e;(i=l> 2. •••!!)若巳恒为0,则仁为_____________解析:e』亘为0,说明随机误差对方贡献为0.答案:1.3.假设关于某设备的使用年限x和所支出的维修费用y (万兀),有如下的统计资料:X 2 3 4 5 6y 22 38 55 65 70若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)列表如下:i 1 2 3 4 5X] 2 3 4 5 622 38 55 65 70时•44 114 220 325 420X; 4 9 16 25 36_ _ 5 5x = 4, y = 5,»;=9o, »,北=112.3z'=l z'=l5 ___况一5xy干旱,仃112.3-5x4x5 …c十正方= ------------- = ------------ -- = 1.23,S,厂2 90 —5x42小「- 5x<=|a = y -bx = 5-1.23x4 = 0.08线性回归方程为:y =bx + a = 1.23x + Q.QS ( 2 )当 x=10 时,y = 1.23x10 + 0.08 = 12.38 (万兀)即估计使用10年时维修费用是1238万元课后练习:1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7. 19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145. 83cm;B.身高在145. 83cm以上;C.身高在145. 83cm以下;D.身I W J在 145. 83cm 左右.2.两个变量y与x的回归模型中,分别选择了 4个不同模型,它们的相关指数人2如下,其中拟合效果最好的模型是()A.模型1的相关指数人2为0. 98B.模型2的相关指数R2为。
相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。
答:错。
应是相关关系。
单位成本与产量间不存在确定的数值对应关系。
2.相关系数为0表明两个变量之间不存在任何关系。
答:.错。
相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。
答:对,因果关系的判断还有赖于实质性科学的理论分析。
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。
答:错。
两者是精确的函数关系。
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。
答:对。
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。
答:对。
因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。
二、选择题1.变量之间的关系按相关程度分可分为:b 、c 、da.正相关;b. 不相关;c. 完全相关;d.不完全相关; 2.复相关系数的取值区间为:aa. 10≤≤R ;b.11≤≤-R ;c.1≤≤∞-R ;d.∞≤≤-R 1 3.修正自由度的决定系数a 、b 、da.22R R ≤; b.有时小于0 ; c. 102≤≤R ;d.比2R 更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:a 、b 、c 、da 样本容量;b 自变量预测值与自变量样本平均数的离差c 自变量预测误差;d 随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。
然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。
第5章相关分析和回归分析作业答案1.当变量x按一定数值变化时,变量y也近似地按固定数值变化,这表明变量x和变量y之间存在着( 3 )①完全相关关系②复相关关系③直线相关关系④没有相关关系2.单位产品成本与其产量的相关:单位产品成本与单位产品原材料消耗量的相关( 2)①前者是正相关,后者是负相关②前者是负相关,后者是正相关③两者都是正相关④两者都是负相关3.相关系数r的取值范围( 2 )①-∞<r<+∞②-1≤r≤+1③<r<1 ④0≤r≤+14.当所有观测值都落在回归直线上,则x与y之间的相关系数( 4 )①.②1③1 ④15.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( 1 )①前者无须确定,后者需要确定②前者需要确定,后者勿需确定③两者均需确定④两者都无需确定6.—元线性回归模型的参数有( 2 )①一个②两个③三个④三个以上7.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( 1 )①完全相关②微弱相关③无线性相关④高度相关8.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为10+7,这意味着年劳动生产率每提高1千元时,工人工资平均( 1 )①增加70元②减少70元③增加80元④减少80元9.下面的几个式子中,错误的是(1,3)①40-1.6x 0.89 (说明:正相关,x前面的系数应该为正值)②5-3.8x 0.94③36-2.4x 0.96④36+3.8x 0.9810.相关系数r与回归系数b的关系可以表达为( 1 )①*σσy②*③* ④*11.下列关系中,属于正相关关系的有( 1 )①合理限度内,施肥量和平均单产量之间的关系②产品产量与单位产品成本之间的关系③商品的流通费用与销售利润之间的关系.④流通费用率与商品销售量之间的关系12.直线相关分析与直线回归分析的联系表现为( 1)①相关分析是回归分析的基础②回归分析是相关分析的基础③相关分析是回归分析的深入④相关分析与回归分析互为条件13.如果估计标准误差,则表明( 1)①全部观测值和回归值都相等②回归值等于Y 、③全部观测值与回归值的离差之和为零④全部观测值都落在回归直线上14.进行相关分析,要求相关的两个变量( 1 )。
①都是随机的②都不是随机的③一个是随机的,一个不是随机的④随机或不随机都可以15.相关关系的土要特征是( 1 )。
①某一现象的标志与另外的标志之间存在着确定的依存关系:②某一现象的标志与另外的标志之间存在着一定的关系,但它们不是确定的关系:③某一现象的标志与另外的标志之间存在着严重的依存关系:④某一现象的标志与另外的标志之间存在着函数关系。
’16.相关分析是研究( 3 )。
①变量之间的数量关系②变量之间的变动关系。
③变量之间相互关系的密切程度④变量之间的因果关系17.相关系数r的取值范围是( 4 )。
①②-1≤r≤0③O≤r≤1 ④-1≤r≤118.现象之间相互依存关系的程度越低,则相关系数( 1 )。
①越接近于0 ②越接近于-1③越接近于1④越接近于0.5。
19.当所有观察值都落在回归直线上,则x与Y 之间的相关系数( 3 )。
①1 ②-1<r<1③1 ④O<r<120.在回归直线中,若b<O,则x与Y之间的相关系数( 4)。
①0 ②1 ③0<r<1 ④-1<r<O21.在回归直线中,b表示( 3 )。
③当x增加一个单位时,Y的平均增加量22.当相关系数时,表明( 1 )。
①现象之间完全无关②相关程度较小③现象之间完全相关④无直线相关关系23.r值越接近于-1,表明两变量间( 3 )。
①没有相关关系②线性相关关系越弱③负相关关系越强④负相关关系越弱24.已知x与y两变量间存在线性相关关系,且σ10,σ8,σ27,100,则x与y之间存存在着( 4)。
①密切的正相关②较低度的正相关③较密切的负相关④低度负相关25.下列直线回归方程中,肯定错误的是(3)。
①2+3x,.88 (2)4+5x,.55 1③10+5x,0.90 ④100-0.90x,.8326.正相关的特点是(2)。
’①当自变量的值变动时,因变量的值也随之变动;②当自变量的值增加时,因变量的值随之而有增加的趋势:③当自变量的值增加时,因变量的值随之而有减少的趋势:④当自变量的值变动时,因变量的值也随之发生大致均等的变动·27.下列现象的相关密切程度高的是(2)。
①某商店的职工人数与商品销售额之间的相关系数为0.87:(2)通费用率与商业利润率之间的相关系数为-0.94;(3)商品销售额与商业利润率之间的相关系数为0.51;…④商品销售额与流通费用率之间的相关系数为-0.81。
28.计算估计标准误差的依据是( 3)。
①因变量的数列②因变量的总变差③因变量的回归变差④因变量的剩余变差29.两个变量间的相关关系称为( 1 )。
①单相关②复相关③无相关④负相关。
30.从变量之间相关的方向看,可分为( 1 )。
①正相关与负相关②直线相关和曲线相关③单相关与复相关④完全相关和无相关31.从变量之间相关的表现形式看,可分为(2)。
①正相关与负相关②直线相关和曲线相关②相关与复相关④完全相关和无相关32.物价上涨,销售量下降,则物价与销售量之间属( 2 )。
①无相关②负相关③正相关④无法判断33.相关系数( 1 )。
①适用于单相关②适用于复相关③既适用于单相关也适用于复相关④上述两者都不适用34.估计标准误差是反映( 3 )。
①平均数代表性的指标②相关关系的指标;③回归直线的代表性指标④序时平均数代表性指标。
35.在回归分析中。
要求对应的两个变量(1,3)。
’(1)都是随机变量(3不是对等关系)36.回归直线和相关系数的符号是一致的,都可以用来判断现象是( 1,4 )(1)正相关还是负相关(4)完全相关还是不完全相关37、某校学生学习“统计学原理”的时间x与考试成绩y建立回归方程,经计算方程为20-0.8x,该方程参数的计算是(2)(2)b值是明显不对的解答:b应为正值38、在回归分析中,自变量与因变量的地位不同,在y依x回归和x依y回归是( 2 )。
(2)有联系但意义不同问题二.多项远择题1.下列现象中属于相关关系的有( 1,2,3)①压力与压强②现代化水平与劳动生产率③圆的半径与圆的面积④身高与体重⑤机械化程度与农业人口2.相关关系与函数关系各有不同特点,主要体现在( 1,2,3,4,5)(2)相关关系是一种不严格的互相依存关系(2)函数关系可以用一个数学表达式精确表达(3)函数关系中各现象均为确定性现象(4)相关关系是现象之间具有随机因素影响的依存关系(5)相关关系中现象之间仍可以通过大量观察法来寻求其变化规律3.相关关系与函数关系的联系表现在(3,5)。
①现象间的相关关系,也就是它们之间的函数关系②相关关系与函数关系可互相转化③相关关系往往可以用函数关系式表达④相关关系是函数关系的特殊形式⑤函数关系是相关关系的特殊形式4.销售额与流通费用率。
在一定条件下,存在相关关系,这种相关关系属于( 1,2 )①正相关②单相关⑨负相关④复相关⑤完全相关5.在直线相关和回归分析中( 1,2 )①据同一资料·相关系数只能计算一个②据同一资料,相关系数可以计算两个③据同一资料,回归方程只能配合一个④据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个⑤回归方程和相关系数均与自变量和因变量的确定无关6.相关系数r的数值(1,2,4,5)①可为正值②可为负值③可大于l④可等于1 ⑤可小于17.相关系数.9,这表明现象之间存在着( 1,4 )①高度相关关系 (2)低度相关关系(3)低度负相关关系④高度正相关关系⑤低度正相关关系8.相关系数的大小与估计标准误差值的大小表现为( 4,5 )①变化方向一致②各自完全独立变化③变化方向相反④时而发生一致变化,时而又发生反向变化⑤二者都受σy大小的影响解:(2)1/2, σσxσσx[(2)1/2] |9.确定直线回归方程必须满足的条件是( 1,4,5)(1)现象间确实存在数量上的相互依存关系(2)相关系数r必须等于1(3)相关现象必须均属于随机现象(4)现象间存在着较密切的直线相关关系(5)相关数列的项数必须足够多1O.当两个现象完全相关时,下列统计指标值可能为( 1,3,5 )①1 ②③1 ④⑤111.在直线回归分析中,确定直线回归方程的两个变量必须是( 1,2,5 )①一个自变量,一个因变量②均为随机变量③对等关系④一个是随机变量,一个是可控制变量⑤不对等关系12.直线相关分析的特点有( 2,3,4)。
①两个变量是对等关系:②只能算出一个相关系数:③相关系数有正负号。
表示正相关或负相关;④相关的两个变量必须都是随机的。
⑤回归方程有两个。
13.从变量之间相互关系的表现形式看,相关关系可分为( 3,4 )。
①正相关②负相关③直线相关④曲线相关⑤不相关和完全相关14.估计标准差是反映( 4,5 )。
①自变量数列的离散程度的指标:②因变量数列的离散程度的指标:③因变量估计值可靠程度的指标:④因变量估计值平均数的代表性的可靠程度的指标:⑤回归方程的代表性的指标。
15.直线相关分析与直线回归分析的区别在于(4)。
(1)相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的;(2)回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的:(3)相关系数有正负号,而回归系数只能取正值:(4)相关的两个变量是对等关系,而回归分析中的两个变量不是对等关系;?(5)相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量能计算出一个相关系数。
16.如果x和y之间相关系数等于1那么(1,4)。
①观察值和理论值的离差不存在;②y的所有理论值同它的平均值一致;③x与y是函数关系;④x与y是完全正相关:⑤x与y不相关。
17.拟合直线回归方程是为了(1,3)。
①确定两个变量之间的变动关系:②用因变量推算自变量;⑨用自变量推算因变量:④两个变量相互推算:⑤确定两个变量间的相关程度。
18.若相关系数r<O,在方程中,则(2,3,4)。
①b可以是正数②b可以是负数③a可以是正数④a可以是负数⑤b可以是零19.在直线回归方程中( 1,2,4)。
①在两个变量中须确定自变量和因变量;②一个回归方程只能作一种推算:③回归系数只能取正值;④要求两个变量都是随机变量:⑤要求因变量是随机的,而自变量是给定的。
20..工人的工资(元)依劳动生产率(千元)的回归方程为10+70x,这意味着如果( 4,5 )。
①劳动生产率等于1000元,则工人工资为提高70元:②劳动生产率每增加1000元,则工人工资增长80元:③劳动生产率不变,则工人工资为80元;④劳动生产率增加1000元.则工人工资提高70元:⑤劳动生产率减少500元,则工人工资减少35元。