第六章相关与回归分析题目
- 格式:doc
- 大小:115.50 KB
- 文档页数:4
第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。
答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。
由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。
再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。
6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。
6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。
但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。
当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。
6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。
如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X 的列向量(即X 1,X 2, X p )不相关。
6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。
第六章 相关与回归分析方式第一部份 习题一、单项选择题1.单位产品本钱与其产量的相关;单位产品本钱与单位产品原材料消耗量的相关 ( )。
A.前者是正相关,后者是负相关 B.前者是负相关,后者是正相关2.样本相关系数r 的取值范围( )。
∞<r <+∞≤r ≤1 C. -l <r <1 D. 0≤r ≤101y x ββ=+上,那么x 与y 之间的相关系数( )。
A.r =0B.r =1C.r =-1D.|r|=14.相关分析与回归分析,在是不是需要确信自变量和因变量的问题上( )。
A.前者无需确信,后者需要确信 B.前者需要确信,后者无需确信5.直线相关系数的绝对值接近1时,说明两变量相关关系的紧密程度是( )。
6.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x ,这意味着年劳动生产率每提高1千元时,工人工资平均( )。
7.下面的几个式子中,错误的选项是( )。
8.以下关系中,属于正相关关系的有( )。
9.直线相关分析与直线回归分析的联系表现为( )。
10.进行相关分析,要求相关的两个变量( )。
A.都是随机的B.都不是随机的11.相关关系的要紧特点是( )。
B.某一现象的标志与另外的标志之间存在着必然的关系,但它们不是确信的关系12.相关分析是研究( )。
13.现象之间彼此依存关系的程度越低,那么相关系数( )。
01y x ββ=+中,假设10β<,那么x 与y 之间的相关系数( )。
A. r=0B. r=1C. 0<r <1D. —l <r <0 15.当相关系数r=0时,说明( )。
A.现象之间完全无关B.相关程度较小16.已知x 与y 两变量间存在线性相关关系,且210,8,7,100xy xy n σσσ===-=,那么x 与y 之间存在着( )。
17.计算估量标准误差的依据是( )。
A.因变量的数列B.因变量的总变差18.两个变量间的相关关系称为( )。
第六章 相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。
答:错。
应是相关关系。
单位成本与产量间不存在确定的数值对应关系。
2.相关系数为0表明两个变量之间不存在任何关系。
答:.错。
相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。
答:对,因果关系的判断还有赖于实质性科学的理论分析。
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。
答:错。
两者是精确的函数关系。
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。
答:对。
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。
答:对。
因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。
二、选择题1.变量之间的关系按相关程度分可分为:b 、c 、da.正相关;b. 不相关;c. 完全相关;d.不完全相关; 2.复相关系数的取值区间为:aa. 10≤≤R ;b.11≤≤-R ;c.1≤≤∞-R ;d.∞≤≤-R 1 3.修正自由度的决定系数a 、b 、da.22R R ≤; b.有时小于0 ; c. 102≤≤R ;d.比2R 更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:a 、b 、c 、da 样本容量;b 自变量预测值与自变量样本平均数的离差c 自变量预测误差;d 随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。
然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。
第六章 相关与回归分析一、单项选择题1、相关关系是指变量间的( ④ )①严格的函数关系 ②简单关系和复杂关系 ③严格的依存关系 ④不严格的依存关系 2、单相关也叫简单相关,所涉及变量的个数为(② )①一个 ②两个 ③三个 ④多个 3、直线相关即( ① )①线性相关 ②非线性相关 ③曲线相关 ④正相关 4、相关系数的取值范围是( ④ )①(0,1) ②[0,1] ③(-1,1) ④[-1,1] 5、相关系数为零时,表明两个变量间( ② )①无相关关系 ②无直线相关关系 ③无曲线相关关系 ④中度相关关系 6、相关系数的值越接近-1,表明两个变量间( ② ) ①正线性相关关系越弱 ②负线性相关关系越强 ③线性相关关系越弱 ④线性相关关系越强 7、进行简单直线回归分析时,总是假定( ① )①自变量是非随机变量、因变量是随机变量 ②两变量都是随机变量 ③自变量是随机变量、因变量是确定性变量 ④两变量都不是随机变量 8、回归方程i i x y5.1123ˆ+=中的回归系数数值表明:当自变量每增加一个单位时,因变量( ② )①增加1.5个单位 ②平均增加1.5个单位 ③增加123个单位 ④平均增加123个单位 9、下列现象的相关密切程度高的是(② )。
①某商店的职工人数与商品销售额之间的相关系数为0.87②流通费用率与商业利润率之间的相关系数为-0.94 ③商品销售额与商业利润率之间的相关系数为0.51 ④商品销售额与流通费用率之间的相关系数为-0.81 10、从变量之间相关的表现形式看,可分为(② )。
①正相关与负相关 ②线性相关和非线性相关 ③简单相关与多元相关 ④完全相关和不完全相关 二、多项选择题1、下列表述正确的有( ③④⑤ ) ①具有明显因果关系的两变量一定不是相关关系②只要相关系数较大,两变量就一定存在密切关系③相关关系的符号可以说明两变量相互关系的方向④样本相关系数和总体相关系数之间存在抽样误差⑤相关系数的平方就是判定系数2、下列各组变量之间属于相关关系的有(①②③⑤)①家庭收入越多与其消费支出也越多②人口数与消费品的需求量③人的身高与体重④一般地说,一个国家文化素质提高,则人口的平均寿命也越长⑤在一定的施肥量范围内,施肥量增加,农作物收获量也增加3、判断现象之间有无相关关系的方法有(①②④⑤)①编制相关表②绘制相关图③计算估计标准误差④对客观现象作定性分析⑤计算相关系数4、相关分析是(①②③)①研究两个变量之间是否存在着相关关系②测定相关关系的密切程度③判断相关关系的形式④配合相关关系的方程式⑤进行统计预测或推断5、应用相关分析与回归分析需注意(①②③④⑤)。
第六章相关与回归分析习题一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值范围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系2.相关系数r的取值范围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元B减少70元C增加80元D减少80元4.假设要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y =a+b x。
课本例题:对某10户居民家庭的年可支配收入和消费支出进行调查,得到的原始资料如下, 单位:千元居民家庭编号1 2 3 4 5 6 7 8 9 10 可支配收入25 18 60 45 62 88 92 99 75 98 消费支出 20 15 40 30 42 60 65 70 53 78 (1) 计算居民可支配收入与消费支出之间的相关系数,判断这两个变量之间是否显著相关;(P223)(2) 建立居民消费支出对居民可支配收入的一元线性回归方程,并解释回归系数的经济意义;(P227)(3) 计算拟合系数2R , 解释其意义;(P230)(4) 当居民可支配收入为120千元时,利用回归方程预测相应的消费支出。
(P232)相关系数的计算222222()()()()()()i i i i XX Y Y XY nXY r X n X Y n Y X X Y Y ---==⋅---⋅-∑∑∑∑∑∑ 参数1ˆβ和0ˆβ的估计122ˆXY nXY X nX β-=-∑∑ 01ˆˆY X ββ=- 拟合系数的计算2222222211222ˆˆˆ()()](()[)ii i i X n X Y n Y y x R y y ββ===--∑∑∑∑∑∑2,,X XX ∑∑ 2,,Y Y Y ∑∑ XY ∑ 1、 解:22()()()()i i i i X X Y Y r XX Y Y --=-⋅-∑∑∑ 21025,152711,128.125Y Y Y ===∑∑,129559.16ni i i X Y ==∑2195.56,5822.3334,24.445X X X ===∑∑变量X 的离差平方和2222()1041.86()92i i X X X n x X -==-=∑∑∑, 变量Y 的离差平方和2222()21382.8()75i i Y Y Y n y Y -==-=∑∑∑变量X 和Y 离差乘积项的和()()4503.305i i i i X x y X X Y Y Y nXY =--=-=∑∑∑ 22()()4503.3050.95401041.869221382.875()()i i i i XX Y Y r X X Y Y --===⨯-⋅-∑∑∑ 2.解:(1) 2199.5,7667.15,24.9375Y YY ===∑∑,1107610.4ni i i X Y ==∑ 22670,1587328,333.75X XX ===∑∑ 12241027.275ˆ0.0589696215.5XY nXY X nX β-===-∑∑ 00ˆˆ24.93780.0589333.75 5.2700Y X ββ=-=-⨯= 样本回归方程为ˆ 5.27000.0589i iY X =+ (2)变量X 的离差平方和222696215.5,i i x X nX =-=∑∑ 变量Y 的离差平方和2222692.1188i i y Y nY =-=∑∑22221ˆˆ()0.0589696215.52415.3178i i yx β==⨯=∑∑ 222ˆ2415.31780.89812692.1188ii y R y ===∑∑,表明自变量能解释因变量89.81%左右的变动,模型的拟合效果较好。
第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。
答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。
由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。
再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。
6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。
6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。
但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。
当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。
6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。
如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X 的列向量(即X 1,X 2, X p )不相关。
6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。
A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间()与考试成绩(y)之x间建立线性回归方程y c=a+b。
经计算,方程为y c=200—0.8x,该方程参数x的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的 C a值和6值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的B都不是随机的C一个是随机的,一个不是随机的D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系B变量之间的变动关系C变量之间的相互关系的密切程度D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数( )A =0B =lC 0<<1D -1<<0r r r r12.在回归直线yc=a+bx中,b表示( )A当x增加一个单位,,y增加a的数量B当y增加一个单位时,x增加b的数量C当x增加一个单位时,y的均增加量D当y增加一个单位时,x的平均增加量13.当相关系数r=0时,表明( )A现象之间完全无关B相关程度较小C现象之间完全相关D无直线相关关系14.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关关系为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8115.估计标准误差是反映( )A平均数代表性的指标B相关关系的指标C回归直线的代表性指标D序时平均数代表性指标三、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系B圆的面积与它的半径关系C广告支出与商品销售额关系D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系2.相关系数表明两个变量之间的( )A线性关系B因果关系C变异程度D相关方向E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号E 确定回归方程时,尽管两个变量也都是随机的,但要求自变量是给定的。
第六章相关和回归分析一、填空题2、与相关关系对应的是________,是反映现象之间存在的严格的依存关系。
3、相关系数的取值范围在________和________之间,带负号表明是________,带正号表明是________。
4、直线相关中,如变量x增加或减少,变量y也相应增加或减少,称为________;如x增加或减少,y也相应减少或增加,称为________。
9、用直线方程来表明两个变量间的变动关系,并进行估计推算的分析方法成为________。
10、反映直线相关关系密切程度的指标是________ ;反映曲线相关关系密切程度的指标是________。
12、回归方程中________的系数称为回归系数。
二、是非题2、按变量之间的相关强度不同分为正相关、负相关。
4、相关系数r取值范围在+1和-1之间。
5、相关系数是直线条件下说明两个现象之间相关关系的密切程度的统计分析指标。
6、相关与回归分析是在定性分析的基础上进行的定量分析。
10、回归方程中,回归系数b的绝对值大小与变量所用计量单位的大小有关。
11、回归方程要求自变量和因变量都是随机变量。
12、回归系数b大于0或小于0时,则相关系数r也大于0或小于0。
14、估计指标标准误差Syx=0,说明实际值与估计值完全一致。
三、单项选择题1、相关关系是()A、现象间的严格的依存关系B、现象间的数量关系C、现象间不确定的关系2、相关分析是一种()A、以定量分析为前提的定性分析B、以定性分析为前提的定量分析C定性分析4、相关图又称()A、散布图B、曲折图C、散点图D、曲线图5、工人的出勤率与电视机合格率之间的相关系数如等于0.85,可以断定两者是()A、显著相关B、高度相关C、正相关D、虚假相关9、相关分析和回归分析的一个重要区别是()A、前者研究变量间的密切程度,后者研究变量间的变动关系,并用数字方程式表示B、前者研究变量间的变动关系,后者研究变量间的密切程度。
第六章相关与线性回归分析
1、
1)试利用这批数据分析课题总数与哪些因素由比较密切的关系,利用相关系数检验。
2)以课题总数作为因变量进行多元线性回归。
2、在上题数据中,计算课题总数数与投入高级职称的人年数的偏相关关系,以投入人年数、
投入科研事业费作为控制变量。
3、现有1991~2007年的人均国民生产总值增长率(G),城市居民消费价格上涨幅度(P)和企
业职工平均工资增长率(W),如下:
4、 随机抽取的10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,
所得数据如下表。
(1) 绘制散点图,说明二者之间的关系形态。
(2) 用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解
释回归系数的意义。
(3) 检验回归系数的显著性(05.0=α)。
(4) 如果航班正点率为80%,估计顾客的投诉次数。
(5) 求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。
航空公司编号
航班正点率
投诉次数 1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72 8 70.8 122 9 91.4 18 10
68.5
125
5、 一家房地产评估公司想对某城市的房地产销售价格(y )与地产的评估价值(x1)、房产
的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据见下表。
用Minitab 进行回归,回答下面的问题:
(1)写出估计的多元回归方程。
(2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
(3)检验回归方程的线性关系是否显著()。
(4)检验各回归系数是否显著()
(5)计算当x1=1000,x2=2000,x3=10000时,销售价格的预测值,置信区间(C.I)以及预测区间(P.I.)
6、一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费
用对月销售额作出估计。
下表是近8个月的销售额与广告费用数据。
(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。
(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?
(5)根据问题(2)所建立的估计方程,检验回归方程的线性关系是否显著α
(=
7、为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三
种广告方案和两种广告媒体,获得的销售量数据见下表。
试利用虚拟自变量对该问题进
.)
行线性回归分析。
(α=005。