回归分析练习题
- 格式:doc
- 大小:448.00 KB
- 文档页数:5
第七章回归与相关分析一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值X围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
12.判断一条回归直线与样本观测值拟合程度好坏的指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D数学成绩与统计学成绩的关系2.相关系数r的取值X围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( ) A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建=a+b x。
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
α=)。
(5)检验回归方程线性关系的显著性(0.05(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B标准误差试用版零阶偏部分1(常量).003人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平有很强的线性关系。
(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性回归系数的含义:人均GDP没增加1元,人均消费增加元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1.998a.996.996a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要模型R R 方调整的 R 方估计的标准差1.998(a)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F检验:Anova b模型平方和df均方F Sig.1回归.6801.680.000a 残差5总计.7146a. 预测变量: (常量), 人均GDP。
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
第五章相关分析和回归分析练习题一、单项选择题1、相关分析研究的是()。
A、变量间的相互依存关系B、变量间的因果关系C、变量间严格的一一对应关系D、变量间的线性关系2、测定变量之间相关关系密切程度的主要方法是()。
A、相关表B、相关图C、相关系数D、定性分析3、下列情况中,称为正相关的是()。
A、随一个变量增加,另一个变量相应减少B、随一个变量减少,另一个变量相应增加C、随一个变量增加,另一个变量相应增加D、随一个变量增加,另一个变量不变4、相关系数r取值范围()。
A、︱r︱<∞B、︱r︱≤1C、r<1D、r≤0.55、相关系数等于零表明两个变量()。
A、是严格的函数关系B、不存在相关关系C、不存在线性相关关系D、存在曲线相关关系6、现象之间相互依存关系的程度是对等的,则相关系数()。
A、越小于0B、越接近-1C、越接近于1D、越接近于07、相关关系中,两个变量的关系是对待的,从而变更x对变量y的相关,同变量y对变量x的相关()。
A、是同一问题B、不一定相同C、有联系但是不是一个问题D、完全不同8、若居民收入增加,居民消费额也增加,则居民收入和居民消费额之间()。
A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9、产品产量与单件成本的相关系数是-0.80,单位成本与利润率的相关系数是-0.94,产量与利润率之间的相关系数是0.89,因此()。
A、产量与利润率的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、反映不出哪对变量的相关程度最高10、在回归分析中,自变量同因变量的地位不同,两变量y和x回归和x对y回归()。
A、是同一问题B、不一定相同C、有联系但不是一个问题D、完全不同11、回归分析中的简单回归是指()。
A、两上变量之间的回归B、变量之间的线性回归C、两个变量之间的线性回归D、变量之间的简单回归12、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
统计学一元线性回归分析练习题一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法的学习与掌握。
同时,也介绍了极大似然估计法以及矩估计法。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为kids??0??1educ??随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
回归分析与独立性检验综合训练回归分析: 热身练习1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上 2. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右.3. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98 B.模型2的相关指数2R 为0.80 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.254. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________5.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090yx =+,下列判断正确的是() A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90 独立性检验: 热身练习1.下面是一个2×2列联表:则表中a 、b 处的值分别为( )A .94、96B .52、50C .52、60D .54、52 2.下列关于等高条形图的叙述正确的是( ).A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.关于分类变量x 与y 的随机变量K 2的观测值k ,下列说法正确的是( ).A .k 的值越大,“X 和Y 有关系”可信程度越小B .k 的值越小,“X 和Y 有关系”可信程度越小C .k 的值越接近于0,“X 和Y 无关”程度越小D .k 的值越大,“X 和Y 无关”程度越大 4.若由一个2×2列联表中的数据计算得k =4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到k =50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性约为________.6.第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:喜爱运动 不喜爱运动 总计 男 10 16 女 614 总计30(2) 基础练习1.下列变量间的关系,不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积C .正多边形的边数和顶点的角度之和D .人的年龄和身高2. “回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他提出的结论,在儿子的身高y 与父亲的身高x 的回归方程ˆya bx =+中,b ( )A .在(-1,0)内B .等于0C .在(0,1)内D .在[1,)+∞内 3.已知回归直线斜率的估计值为1.23,样本的中心点为(4,5),则回归直线方程为( )A .ˆ 1.234yx =+ B .ˆ 1.235y x =+ C .ˆ 1.230.08y x =+ D .ˆ0.08 1.23y x =+ 4.对于回归直线方程ˆ 4.67 2.85yx =+,当21x =时,y 的估计值为 5.一所大学图书馆有6台复印机供学生使用管理人员发现,每台机器的维修费用与其使用的时间有一定的关系,根据去年一年的记录,得到每周使用时间(单位:小时)与年维修费用(单位:元)的数据如下:时间 33 21 31 37 46 42 费用 16 14 25 29 38 34则使用时间与维修费用之间的相关系数为6.某种产品的广告支出与销售额(单位:百万元)之间有如下的对应关系x 2 4 5 6 8 y3040605070(1)假定x 与y 之间具有线性相关关系,求回归直线方程.(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆy bxa =+; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5435464.566.5⨯+⨯+⨯+⨯=) 8.下表为收集到的一组数据:(1)作出x 与y 的散点图,猜测(2)建立x 与y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报x =40时y 的值.综合练习:一、选择题1.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( ) Ay ∧=1.23x +4 By ∧=1.23x+5 C y ∧=1.23x+0.08 D y ∧=0.08x+1.232.回归分析中,相关指数R 2的值越大,说明残差平方和( )A 越小B 越大C 可能大也可能小D 以上都不对3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是()A 1l 与2l 一定平行B 1l 与2l 相交于点),(y xC 1l 与2l 重合D 无法判断1l 和2l 是否相交 4.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的预报最大取值是10,则x 的最大取值不能超过( )A 16B 17C 15D 12二、填空题5.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是____________6.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度。
第八章-相关与回归分析练习题第八章相关与回归分析一、单选题1.相关分析研究的是()A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着()。
A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系4.相关系数等于零表明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指()。
A、两变量在不同时间上的依存关系 B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间()。
A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是()。
A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指()。
A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为()A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则() A.表明现象正相关 B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有()。
相关分析与回归分析练习试卷1(题后含答案及解析) 题型有:1. 单选题 2. 多选题单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。
1.根据散点图8-1,可以判断两个变量之间存在( )。
A.正线性相关关系B.负线性相关关系C.非线性关系D.函数关系正确答案:A 涉及知识点:相关分析与回归分析2.假设某品牌的笔记本市场需求只与消费者的收入水平和该笔记本的市场价格水平有关。
则在假定消费者的收入水平不变的条件下,该笔记本的市场需求与其市场价格水平的相关关系就是一种( )。
A.单相关B.复相关C.偏相关D.函数关系正确答案:C解析:在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。
在假定消费者的收入水平不变的条件下,该笔记本的市场需求与其市场价格水平的关系就是一种偏相关。
知识模块:相关分析与回归分析3.相关图又称( )。
A.散布表B.折线图C.散点图D.曲线图正确答案:C解析:相关图又称散点图,是指把相关表中的原始对应数值在乎面直角坐标系中用坐标点描绘出来的图形。
知识模块:相关分析与回归分析4.下列相关系数取值中错误的是( )。
A.-0.86B.0.78C.1.25D.0正确答案:C解析:相关系数r的取值介于-1与1之间。
知识模块:相关分析与回归分析5.如果相关系数r=0,则表明两个变量之间( )。
A.相关程度很低B.不存在任何关系C.不存在线性相关关系D.存在非线性相关关系正确答案:C解析:相关系数r是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
如果相关系数r=0,说明两个变量之间不存在线性相关关系。
知识模块:相关分析与回归分析6.当所有观测值都落在回归直线上,则两个变量之间的相关系数为( )。
A.1B.-1C.+1或-1D.大于-1,小于+1正确答案:C解析:当所有观测值都落在回归直线上时,说明两个变量完全线性相关,所以相关系数为+1或-1。
1.1回归分析的基本思想及其初步应用例题:1.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在X轴上,预报变量在y轴上(0可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上解析:通常把自变量X称为解析变量,因变量y称为预报变量.选B2,若一组观测值(xi, yi) (x2, y2) ••- (x…, y n)之间满足 y-bxi+a+e;(i=l> 2. •••!!)若巳恒为0,则仁为_____________解析:e』亘为0,说明随机误差对方贡献为0.答案:1.3.假设关于某设备的使用年限x和所支出的维修费用y (万兀),有如下的统计资料:X 2 3 4 5 6y 22 38 55 65 70若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)列表如下:i 1 2 3 4 5X] 2 3 4 5 622 38 55 65 70时•44 114 220 325 420X; 4 9 16 25 36_ _ 5 5x = 4, y = 5,»;=9o, »,北=112.3z'=l z'=l5 ___况一5xy干旱,仃112.3-5x4x5 …c十正方= ------------- = ------------ -- = 1.23,S,厂2 90 —5x42小「- 5x<=|a = y -bx = 5-1.23x4 = 0.08线性回归方程为:y =bx + a = 1.23x + Q.QS ( 2 )当 x=10 时,y = 1.23x10 + 0.08 = 12.38 (万兀)即估计使用10年时维修费用是1238万元课后练习:1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7. 19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145. 83cm;B.身高在145. 83cm以上;C.身高在145. 83cm以下;D.身I W J在 145. 83cm 左右.2.两个变量y与x的回归模型中,分别选择了 4个不同模型,它们的相关指数人2如下,其中拟合效果最好的模型是()A.模型1的相关指数人2为0. 98B.模型2的相关指数R2为。
第七章相关回归分析思考题及练习题第七章思考题及练习题(⼀) 填空题1、 1、在相关关系中,把具有因果关系相互联系的两个变量中起影响作⽤的变量称为_______,把另⼀个说明观察结果的变量称为________。
2、 2、现象之间的相关关系按相关的程度分有________相关、-________相关和_______相关;按相关的⽅向分有________相关和-________相关;按相关的形式分有________相关和________相关;按影响因素的多少分有________相关和________相关。
3、 3、对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为_______;研究变量之间关系的⽅程式,根据给定的变量数值以推断另⼀变量的可能值,则称为_______。
4、 4、完全相关即是________关系,其相关系数为________。
5、 5、在相关分析中,要求两个变量都是_______;在回归分析中,要求⾃变量是_______,因变量是_______。
6、 6、相关系数是在________相关条件下⽤来说明两个变量相关________的统计分析指标。
7、 7、相关系数的变动范围介于_______与_______之间,其绝对值愈接近于_______,两个变量之间线性相关程度愈⾼;愈接近于_______,两个变量之间线性相关程度愈低。
当_______时表⽰两变量正相关;_______时表⽰两变量负相关。
8、 8、当变量x 值增加,变量y 值也增加,这是________相关关系;当变量x 值减少,变量y 值也减少,这是________相关关系。
9、 9、在判断现象之间的相关关系紧密程度时,主要⽤_______进⾏⼀般性判断,⽤_______进⾏数量上的说明。
10、 10、在回归分析中,两变量不是对等的关系,其中因变量是_______变量,⾃变量是_______量。
11、 11、已知1360))((=----∑y y x x ,14400)(2=--∑x x ,14900)(2=-∑-y y ,那么,x 和y 的相关系数r 是_______。
简单线性回归分析思考与练习参考答案第10章简单线性回归分析思考与练习参考答案⼀、最佳选择题1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。
A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错2.如果相关系数r =1,则⼀定有( C )。
A .总SS =残差SSB .残差SS =回归SSC .总SS =回归SSD .总SS >回归SS E.回归MS =残差MS3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。
A .ρ=0时,r =0B .|r |>0时,b >0C .r >0时,b <0D .r <0时,b <0 E. |r |=1时,b =14.如果相关系数r =0,则⼀定有( D )。
A .简单线性回归的截距等于0B .简单线性回归的截距等于Y 或XC .简单线性回归的残差SS 等于0D .简单线性回归的残差SS 等于SS 总E .简单线性回归的总SS 等于05.⽤最⼩⼆乘法确定直线回归⽅程的含义是( B )。
A .各观测点距直线的纵向距离相等B .各观测点距直线的纵向距离平⽅和最⼩C .各观测点距直线的垂直距离相等D .各观测点距直线的垂直距离平⽅和最⼩E .各观测点距直线的纵向距离等于零⼆、思考题1.简述简单线性回归分析的基本步骤。
答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归⽅程进⾏假设检验;④列出回归⽅程,绘制回归直线;⑤统计应⽤。
2.简述线性回归分析与线性相关的区别与联系。
答:区别:(1)资料要求上,进⾏直线回归分析的两变量,若X 为可精确测量和严格控制的变量,则对应于每个X 的Y 值要求服从正态分布;若X 、Y 都是随机变量,则要求X 、Y 服从双变量正态分布。
直线相关分析只适⽤于双变量正态分布资料。
第十二章相关与回归分析一、填空1. 如果两变量的相关系数为0,说明这两变量之间__ 。
2.相关关系按方向不同,可分为_____ 和________ 。
3. 相关关系按相关变量的多少,分为和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与 X有关系时预测 Y的全部误差 E1,减去知道 Y与 X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个1)实际观察值 Y 围绕每个估计值 Y c是服假定:从();(2)分布中围绕每个可能的 Y c 值的()是相同的。
7. 已知:工资(元)倚劳动生产率(千元)的回归方程为yc 10 80x,因此,当劳动生产率每增长 1 千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
9.积差系数 r 是(协方差)与 X 和 Y 的标准差的乘积之比。
二、单项选择1.欲以图形显示两变量 X 和 Y 的关系,最好创建( D )。
A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是(A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3.相关关系的种类按其涉及变量多少可分为()。
A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是(B )。
练习题:
1、将下表中关于某商场1989年至1998年商品流通费用与商品零售总额的资料输入到SPSS
假设1999年该商场的商品零售总额预计为36.33亿元,请预测1999年该商场的商品流通费用,将结果保存为“练习7-1.spv”文件。
2、将下表中20名糖尿病人的血糖、胰岛素、生长素的测量结果输入到SPSS中,保存为“练习7-2.sav”文件,完成下列操作:
试以血糖为因变量,胰岛素和生长素为自变量,建立多元线性回归方程,将结果保存为“练习7-2.spo”文件。
3、将下表中关于国民经济数据输入到SPSS中,保存为“练习7-3.sav”文件,完成下列操作:
判断人均GDP主要受哪些因素的影响,并建立以人均GDP为因变量的线性回归方程,将结果保存为“练习7-3.spo”文件。
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
20 年 月 日
A4打印 / 可编辑
2019
年招收攻读硕士学位研究生入学
考试试题
2019年招收攻读硕士学位研究生入学考试试题
********************************************************************************************招生专业与代码:流行病与卫生统计学100401、劳动卫生与环境卫生学100402、营养与食品卫生学100403、儿少卫生与妇幼保健学100404、卫生毒理学100405、公共卫生(专业学位)105300考试科目名称及代码:卫生综合353
整理丨尼克
本文档信息来自于网络,如您发现内容不准确或不完善,欢迎您联系我修正;如您发现内容涉嫌侵权,请与我们联系,我们将按照相关法律规定及时处理。
回归分析的基本思想及其初步应用
一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平
均值为2,数据
y 的平均值为3,则 ( )
A .回归直线必过点(2,3)
B .回归直线一定不过点(2,3)
C .点(2,3)在回归直线上方
D .点(2,3)在回归直线下方
2. 在一次试验中,测得的四组值分别是,则Y 与X 之间的回归直线方程为( )A . B . C . D.
3. 在对两个变量x ,
y 进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释; ②收集数据(i x 、
i y ),1,2i =,…,n ;
③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图
如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①
4. 下列说法中正确的是( )
A .任何两个变量都具有相关关系
B .人的知识与其年龄具有相关关系
C .散点图中的各点是分散的没有规律
D .根据散点图求得的回归直线方程都是有意义的
5. 给出下列结论:
(1)在回归分析中,可用指数系数2
R 的值判断模型的拟合效果,2
R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个.
A .1
B .2
C .3
D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时(
)
A.y 平均增加1.5个单位
B.y 平均增加2个单位
C.y 平均减少1.5个单位
D.
y 平均减少2个单位
7. 下面的各图中,散点图与相关系数r 不符合的是( )
8. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为ˆ7.1973.93y
x =+,据此可以预测这个孩子10岁时的身高,则正确的叙述是( )
A .身高一定是145.83cm
B .身高超过146.00cm
C .身高低于145.00cm
D .身高在145.83cm 左右
9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在
y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上
(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上
10. 两个变量
y 与x 的回归模型中,通常用2R 来刻画回归的效果,则正确的叙述是( )
A. 2R 越小,残差平方和小
B. 2R 越大,残差平方和大
C. 2
R 于残差平方和无关 D. 2
R 越小,残差平方和大 11. 两个变量
y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果
最好的模型是( )
A.模型1的相关指数2R 为
B.模型2的相关指数2R 为
C.模型3的相关指数2
R 为 D.模型4的相关指数2
R 为
12. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 2
13.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元
14. 下列结论正确的是( )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①② B.①②③ C.①②④ D.①②③④
15. 已知回归直线的斜率的估计值为,样本点的中心为(4,5),则回归直线方程为( ) A.
B. C. D.
二、填空题
16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数的值分别约为和,则拟合效果好的模型是 .
17. 在回归分析中残差的计算公式为 .
18. 线性回归模型(和为模型的未知参数)中,称为 .
19. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2.…n)若e i 恒为0,则R 2
为_____
三、解答题
20. 调查某市出租车使用年限x 和该年支出维修费用
y (万元)
,得到数据如下:
(2)由(1)中结论预测第10年所支出的维修费用.(1
21()()()n
i i i n
i i x x y y b x x a y bx
==⎧
-⋅-⎪
⎪=⎨-⎪⎪=-⎪⎩∑∑)
21. 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
150m时的销售价格.
(3)据(2)的结果估计当房屋面积为2
(4)求第2个点的残差。
答案
一、选择题
1. A
2. A
3. D
4. B
5. B
6. C
7. B
8. D
9. 解析:通常把自变量x 称为解析变量,因变量y 称为预报变量.选B
10. D 11. A 12. B 13. C 14. C 15. C
二、填空题 16. 甲
17. 列联表、三维柱形图、二维条形图 18. 随机误差
19. 解析: e i 恒为0,说明随机误差对y i 贡献为0.
答案:1.
三、解答题
20. 解析: (1
于是23.14
5905
453.112552
2
51
25
1=⨯-⨯⨯-=
--=
∑∑==x
x y
x y
x b i i i i
i , 08.0423.15=⨯-=-=bx y a
∴线性回归方程为:08.023.1^
+=+=x a bx y (2)当
x=10时,
38.1208.01023.1^=+⨯=y (万元)
即估计使用10年时维修费用是1238万元 回归方程为: 1.230.08y x =+ (2) 预计第10年需要支出维修费用12.38 万元.
21. 解析:(1)数据对应的散点图如图所示:
(2)1095151==∑=i i x x ,1570)(2
5
1
=-=∑=x x l i i xx ,
308))((,2.235
1
=--==∑=y y x x l y i i i xy
设所求回归直线方程为a bx y +=)
,
则1962.01570
308
≈=
=
xx
xy l l b 8166.11570
308
1092.23≈⨯
-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )
(3)据(2),当2
150x m =时,销售价格的估计值为:
2466.318166.11501962.0=+⨯=y )
(万元)。