相关回归分析练习题
- 格式:doc
- 大小:156.50 KB
- 文档页数:6
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
α=)。
(5)检验回归方程线性关系的显著性(0.05(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B标准误差试用版零阶偏部分1(常量).003人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平有很强的线性关系。
(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性回归系数的含义:人均GDP没增加1元,人均消费增加元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1.998a.996.996a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要模型R R 方调整的 R 方估计的标准差1.998(a)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F检验:Anova b模型平方和df均方F Sig.1回归.6801.680.000a 残差5总计.7146a. 预测变量: (常量), 人均GDP。
第八章 相关与回归分析一、填空题8.1.1 客观现象之间的数量联系可以归纳为两种不同的类型,一种是 ,另一种是 。
8.1.2 回归分析中对相互联系的两个或多个变量区分为 和 。
8.1.3 是指变量之间存在的严格确定的依存关系。
8.1.4 变量之间客观存在的非严格确定的依存关系,称为 。
8.1.5 按 的多少不同,相关关系可分为单相关、复相关和偏相关。
8.1.6 两个现象的相关,即一个变量对另一个变量的相关关系,称为 。
8.1.7 在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为 。
8.1.8 按变量之间相关关系的 不同,可分为完全相关、不完全相关和不相关。
8.1.9 按相关关系的 不同可分为线性相关和非线性相关。
8.1.10 线性相关中按 可分为正相关和负相关。
8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为 。
8.1.12 当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为 。
8.1.13 当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为 。
8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为 。
8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为 。
8.1.16 反映变量之间相关关系及关系密切程度的统计分析指标是 。
8.1.17 就是寻找参数01ββ和的估计值01ββ和,使因变量实际值与估计值的残差平方和达到最小。
8.1.18 正如标准差可以说明平均数代表性大小一样, 则可以说明回归线代表性的大小。
8.1.19 回归分析中的显著性检验包括两方面的内容,一是对 的显著性检验;二是对 的显著性检验。
8.1.20 对各回归系数的显著性检验,通常采用 ;对整个回归方程的显著性检验,通常采用 。
第五章相关分析和回归分析练习题一、单项选择题1、相关分析研究的是()。
A、变量间的相互依存关系B、变量间的因果关系C、变量间严格的一一对应关系D、变量间的线性关系2、测定变量之间相关关系密切程度的主要方法是()。
A、相关表B、相关图C、相关系数D、定性分析3、下列情况中,称为正相关的是()。
A、随一个变量增加,另一个变量相应减少B、随一个变量减少,另一个变量相应增加C、随一个变量增加,另一个变量相应增加D、随一个变量增加,另一个变量不变4、相关系数r取值范围()。
A、︱r︱<∞B、︱r︱≤1C、r<1D、r≤0.55、相关系数等于零表明两个变量()。
A、是严格的函数关系B、不存在相关关系C、不存在线性相关关系D、存在曲线相关关系6、现象之间相互依存关系的程度是对等的,则相关系数()。
A、越小于0B、越接近-1C、越接近于1D、越接近于07、相关关系中,两个变量的关系是对待的,从而变更x对变量y的相关,同变量y对变量x的相关()。
A、是同一问题B、不一定相同C、有联系但是不是一个问题D、完全不同8、若居民收入增加,居民消费额也增加,则居民收入和居民消费额之间()。
A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9、产品产量与单件成本的相关系数是-0.80,单位成本与利润率的相关系数是-0.94,产量与利润率之间的相关系数是0.89,因此()。
A、产量与利润率的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、反映不出哪对变量的相关程度最高10、在回归分析中,自变量同因变量的地位不同,两变量y和x回归和x对y回归()。
A、是同一问题B、不一定相同C、有联系但不是一个问题D、完全不同11、回归分析中的简单回归是指()。
A、两上变量之间的回归B、变量之间的线性回归C、两个变量之间的线性回归D、变量之间的简单回归12、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
第六章 相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。
答:错。
应是相关关系。
单位成本与产量间不存在确定的数值对应关系。
2.相关系数为0表明两个变量之间不存在任何关系。
答:.错。
相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。
答:对,因果关系的判断还有赖于实质性科学的理论分析。
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。
答:错。
两者是精确的函数关系。
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。
答:对。
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。
答:对。
因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。
二、选择题1.变量之间的关系按相关程度分可分为:b 、c 、da.正相关;b. 不相关;c. 完全相关;d.不完全相关; 2.复相关系数的取值区间为:aa. 10≤≤R ;b.11≤≤-R ;c.1≤≤∞-R ;d.∞≤≤-R 1 3.修正自由度的决定系数a 、b 、da.22R R ≤; b.有时小于0 ; c. 102≤≤R ;d.比2R 更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:a 、b 、c 、da 样本容量;b 自变量预测值与自变量样本平均数的离差c 自变量预测误差;d 随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。
然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。
练习题6(相关系数与回归分析)1某电视台非常关心新闻节目的受欢迎程度;电视节目的受欢迎程度由一套评估体系来决定,这个评估体系对每个被评估的节目评级:由1(最低)到10(最高)。
某电视台认为在新闻节目之前的节目的受欢迎程度会影响到新闻节目的受欢迎程度。
为此,他们搜集了一组30个样本,其中包含两个变量:x-新闻节目之前的节目评级;y-新闻节目的评级,数据列于为研究x与y二者之间的关系,计算相关系数,并对其进行检验。
3 使用四川绵阳地区3年生中山柏的数据“中山柏.sav”,分析月生长量与平均气温、月降雨量、月平均日照时数、月平均湿度这4个气候因素哪个因素有关?回归分析:4 零售商要了解每周的广告费X及消费额Y之间关系,记录如下数据:画出散点图,并在Y对X回归为线性的假定下,用最小二乘法算出一元回归方程.5 某厂生产某产品,其成本费用(Y,万元)与劳动量(X1,千小时)及原材料价格(X 2,万元/万吨)有密切关系。
下面列出了2002年1月~2003年6月的成本、劳动量、原材料价格资料。
要求:(1)建立二元线性回归方程,对回归系数b1、b2进行合理的解释。
(2)对所建立的回归方程进行显著性检验;(3)假定2003年7月份劳动量X1=1.19千小时,X2=2.31万元/万吨,试预测2003年7月份的成本费用。
6 用第2题资料,计算身高与坐高、体重、胸围、肩宽和骨盆宽等变量的Pearson相关关系,并用逐步回归建立方程。
(引入原则P<0.05,剔除原则P>0.051)7用第1题资料,假定模型为:y=β0+β1Xi+εi i= 1,…,30用最小二乘法估计模型参数,建立线性回归模型,对回归系数进行显著性检验,对β1的置信水平作95%的区间估计。
对x=8时的y值作预测,并作95%的预测区间。
8 家庭信用卡消费多寡与家庭年收入及家庭人口有关,具体数据如下表,要求:①做消费金额与家庭人口,消费金额与年收入的散点图;②因变量、自变量分别是什么;③建立回归方程,讨论这三者之间的关系;④讨论哪个因素对因变量影响大,理由是什么?被调查对象的家庭年收入(万元)、家庭人口和信用卡消费的金额(元)。
第十二章相关与回归分析一、填空1.如果两变量的相关系数为0,说明这两变量之间_____________。
2.相关关系按方向不同,可分为__________和__________。
3.相关关系按相关变量的多少,分为______和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值cY是服从();(2)分布中围绕每个可能的cY值的()是相同的。
7.已知:工资(元)倚劳动生产率(千元)的回归方程为xyc8010+=,因此,当劳动生产率每增长1千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
9.积差系数r是(协方差)与X和Y的标准差的乘积之比。
二、单项选择1.欲以图形显示两变量X和Y的关系,最好创建(D )。
A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是( A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3. 相关关系的种类按其涉及变量多少可分为( )。
A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是( B )。
第六章相关与回归分析习题一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值范围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系2.相关系数r的取值范围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元B减少70元C增加80元D减少80元4.假设要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y =a+b x。
1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。
要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。
(1)线性关系检验的统计量F 值是多少? (2)给定显著性水平a =0.05,F a 是多少? (3)是拒绝原假设还是不拒绝原假设?(4)假定x 与y 之间是负相关,计算相关系数r 。
(5)检验x 与y 之间的线性关系是否显著?解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;因此:F=1SSR k SSE n k --=6014018=27 (2)()1,18F α=()0.051,18F =4.41 (3)拒绝原假设,线性关系显著。
(4),由于是负相关,因此r=-0.7746(5)从F 检验看线性关系显著。
2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。
回归直线的检验:p=2.17E—09<α,回归直线显著。
3. 根据两个自变量得到的多元回归方程为12ˆ18.4 2.014.74yx x =-++,并且已知n =10,SST =6 724.125,SSR =6 216.375,1ˆ0.0813s β=,2ˆs β=0.056 7。
要求:(1)在a=0.05的显著性水平下,12,x x 与y 的线性关系是否显著? (2)在a =0.05的显著性水平下,1β是否显著?(3)在a =0.05的显著性水平下,2β是否显著?解(1)回归方程的显著性检验:假设:H 0:1β=2β=0 H 1:1β,2β不全等于0 SSE=SST-SSR=6 724.125-6 216.375=507.75 F=1SSR p SSE n p --=6724.1252507.751021--=42.85()2,7F α=4.74,F>()2,7F α,认为线性关系显著。
第八章-相关与回归分析练习题第八章相关与回归分析一、单选题1.相关分析研究的是()A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着()。
A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系4.相关系数等于零表明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指()。
A、两变量在不同时间上的依存关系 B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间()。
A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是()。
A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指()。
A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为()A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则() A.表明现象正相关 B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有()。
相关回归分析
一、双变量相关分析
某班级12名女大学生的体重与肺活量的数据如下,试分析两者有无直线相关关系。
注:首先将这组数据通过任何一种方式输入SPSS中。
其次,做散点图来判断两变量间是否存在直线相关。
只有从图形上明确两变量间存在线性相关趋势,才能继续做后面的分析。
(1)操作步骤
图像—旧对话框—散点图—简单分布,自变量体重,因变量肺活量即可得到散点图。
分析—相关—双变量,选择体重和肺活量,选择要进行的统计量即可。
(2)散点图
(4)简单解释结果(包括直线相关程度是多大,是否显著?)
根据输出结果,我们可以得到:体重与肺活量之间的Pearson相关系数为
0.749,属于中度相关。
二、现已测得20名糖尿病人的血糖(y)、胰岛素(x1)及生长激素(x2)的
测量数据,见数据pcorr.sav。
请分析糖尿病人血糖浓度与生长激素间有无相关关系。
注:从医学上来讲,血糖浓度和胰岛素间存在着密切的关系,如果忽略胰岛素的影响来分析,必然会得出错误的结论。
因此,这里需要控制胰岛素影响的情况下进行偏相关分析。
建议与不考虑胰岛素影响的情况下相关性进行比较。
(1)操作步骤
(3)简单解释结果
通过上述统计分析我们可以得到如下结论:
在无控制变量时,血糖和生长素之间的相关性为0.638,为中度相关,与胰岛素的相关性为-0.840,为高度相关。
在控制变量胰岛素时,血糖和生长素的相关性为0.2,低度相关。
三、简单线性回归方程
以练习一的数据为例(即12名女大学生的体重与肺活量),试求肺活量对体
重的直线回归方程并做相关的检验。
(1)操作步骤。
分析—回归—线性,因变量为肺活量,自变量为体重。
然后选择需要统计的统计量即可。
(2)列出直线回归方程的方差分析输出结果并简单解释模型显著性情况。
通过上述统计表格我们可以得到方差分析F分布的P=0.005<0.05。
所以拒绝原假设,说明体重和肺活量具有显著性。
(3)列出直线回归方程的回归系数输出结果并简单解释各自变量显著性情况。
通过上述统计表格我们可以得到回归系数P=0.005<0.05。
所以拒绝原假设,说明肺活量回归系数具有显著性。
四、多元线性回归方程的多重共线性诊断
现已测得20名糖尿病人的血糖(y)、胰岛素(x1)及生长激素(x2)的测量数据,见数据pcorr.sav。
建立以胰岛素和生长激素为自变量,血糖为因变量的多元线性回归方程时,诊断是否存在多重共线性。
(1)操作步骤
分析—回归—线性,选择血糖作为因变量,胰岛素和生长激素为自变量,勾选共线性诊断和相关统计量,线性回归方法为逐步,判断是否存在多重共线性。
(2)在不考虑多重共线性的基础上列出回归拟合结果。
通过检验我们可以得到在采用逐步分析不考虑共线性时,F检验P=0<0.05,所以拒绝原假设,所以胰岛素和血糖存在共线性。
(3)指出多重共线性的相关指标数值并做解释。
通过检验我们可以得到在采用逐步分析考虑共线性时,F检验P=0<0.05,所以拒绝原假设,所以胰岛素和血糖存在共线性。