线性回归分析练习题分析
- 格式:doc
- 大小:199.50 KB
- 文档页数:10
回归方程问题练习题回归分析是统计学中常用的一种方法,用于研究自变量和因变量之间的关系。
在实际应用中,我们常常需要利用回归方程来预测未来的趋势或做出决策。
本文将介绍一些回归方程问题练习题,帮助读者更好地理解和掌握回归分析的基本概念和方法。
问题一:假设你正在研究一个小麦种植区的产量与气温的关系。
你收集了10年的种植数据,其中包括每个月的平均气温和当年的小麦产量。
你希望根据这些数据建立一个回归方程来预测未来的小麦产量。
请问,你需要采用什么类型的回归分析?为什么?解答一:在这个问题中,气温作为自变量,小麦产量作为因变量,我们想要建立一个回归方程来描述它们之间的关系。
由于气温是一个连续变量,而小麦产量也是一个连续变量,所以我们应该采用线性回归分析,它是回归分析中最常用的一种方法。
通过建立一个线性方程,我们可以更好地预测未来小麦产量。
问题二:假设你想研究一个城市的人口增长与GDP增长之间的关系。
你搜集了过去20年的数据,包括每年的人口数量和GDP增长率。
请问,你需要如何处理这些数据才能建立一个有效的回归方程?解答二:在这个问题中,人口数量作为因变量,GDP增长率作为自变量。
为了建立一个有效的回归方程,首先我们需要将数据进行可视化和摘要统计。
可以使用散点图来观察二者之间的关系,并计算相关系数来衡量它们之间的相关性。
如果两者呈现出线性关系,我们可以使用线性回归来建立回归方程。
如果呈现出非线性关系,我们可能需要尝试其他的回归方法,如多项式回归或非线性回归。
问题三:假设你正在研究一家电商平台的销售额与广告投入之间的关系。
你搜集了过去五年的数据,包括每月的销售额和当月的广告投入。
你希望建立一个回归方程来预测未来的销售额。
请问,你需要考虑哪些因素来建立回归方程?解答三:在这个问题中,销售额作为因变量,广告投入作为自变量。
然而,广告投入可能并不是唯一影响销售额的因素。
我们可能还需要考虑其他因素,如季节性变化、市场竞争情况等。
多元线性回归模型练习题及标准答案多元线性回归模型练习题及答案————————————————————————————————作者:————————————————————————————————日期:多元线性回归模型练习一、单项选择题1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得可决系数为0.8500,则调整后的可决系数为( D )A. 0.8603B. 0.8389C. 0.8655D.0.8327 2.用一组有30个观测值的样本估计模型01122t t t ty b b x b x u =+++后,在0.05的显著性水平上对1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t大于等于( C ) A.)30(05.0t B.)28(025.0t C.)27(025.0t D.)28,1(025.0F3.线性回归模型01122......t t t k kt ty b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)4. 调整的可决系数与多元样本判定系数之间有如下关系( D )A.2211n R R n k -=-- B. 22111n R R n k -=---C.2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=----5.对模型Y i =β0+β1X 1i +β2X 2i +μi 进行总体显著性F 检验,检验的零假设是( A ) A. β1=β2=0B. β1=0C. β2=0D. β0=0或β1=06.设k 为回归模型中的参数个数,n 为样本容量。
则对多元线性回归方程进行显著性检验时,所用的F 统计量可表示为( B )A. )1()(--k RSS k n ESS B .) 1 ( ) 1 ( 2 2 - - k R k R- nC .)1()1()(22---k R k n R D .)()1/(k n TSS k ESS -- 7.多元线性回归分析中(回归模型中的参数个数为k ),调整后的可决系数2R 与可决系数2R 之间的关系( A )A.B. 2R ≥2RC. 02>R D.1)1(122----=n k n R R8.已知五元线性回归模型估计的残差平方和为8002=∑te,样本容量为46,则随机误差项t u 的方差估计量2σ为( D ) A. 33.33 B. 40 C. 38.09 D. 209.多元线性回归分析中的 ESS 反映了( C )A.因变量观测值总变差的大小B.因变量回归估计值总变差的大小C.因变量观测值与估计值之间的总变差D.Y 关于X 的边际变化23.在古典假设成立的条件下用OLS 方法估计线性回归模型参数,则参数估计量具有( C )的统计性质。
一元线性回归模型练习题P55 3.1实验问题:实验步骤与内容:1、导入数据资料2、定义样本区间3、建立一元线性回归模型4、根据一元线性回归模型解释斜率系数的经济意义以及相关系数r5、对参数进行检验6、通过计算预测2010年财政收入问题解释与结论:(1):建立深圳地方预算内财政收入对GDP的一元线性回归模型。
通过对数据的运用,可以得出一元线性回归方程为Y=26.020961+0.08882X 其中,可以得到散点图为:一元线性回归拟合图为:(2)估计所建立模型的参数,解释斜率系数的经济意义;斜率系数和简单相关系数r的正负号相同吗?=26.02096是样本回归方程的截距,它表示不受国内生产总值影响的地方预算β=0.08882表示国内生产总值每增加一个单位的地方预财政收入为26.0296,β1算财政收入平均增加0.8882个单位,从回归模型不难看出,随着变量X的增大,Y变量的值也在增大。
根据简单相关系数的概念,且从第一题所求出来的回归结果可知,r>0,两个变量之间是正相关,即斜率系数和简单相关系数r的正负号相同。
(3)对回归参数进行t检验。
由此得到t=4.081 p=0.0006808,给定显著性水平 =0.05,查表得t(19)=2.0930,由于t=4.081>2.0930,拒绝原假设,说明斜率在5%的显著性0.05/2水平下显著不为0,这表明,国内生产总值对深圳市地方预算内财政收入有显著影响。
(4)拟合优度R2是多少?由第一题求出的线性回归可得:由上图中数据分析结果可以看出R2=0.9607,说明GDP解释了地方预算内财政收入的96%,模型拟合程度较好。
(6)若2010年的国内生产总值为11000亿元,试预测2010年的财政收入。
由一元线性回归模型可知,当2010年国内生产总值为11000亿元时,地方财政收入为:Y=26.020961+0.08882X=26.020961+0.08882*11000=1003.040961(亿元)3.6实验问题题表3.6是64个国家的儿童死亡率与人均GNP 数据,请用合适的模型作儿童死亡率对人均GNP 的一元线性回归,解释回归结果的含义,画出儿童死亡率对人均GNP 倒数的散点图,并与回归结果对应解释。
第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。
同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
1.6 线性回归 典型例题 产量与生产费用的线性回归例 某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:完成下列要求:(1)计算x 与y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为a bx y+=ˆ,求系数b a 、. 分析:(1)使用样本相关系数(即相关系数)计算公式:))((1222121∑∑∑===---=ni i n i i ni ii y n y x n x yx n yx r 即可完成此问:(2)查表行出显著性水平0.05与自由度10-2相应的相关系数临界值05.0r ,通过比较r 与05.0r 的大小,以检验所得结果,来说明y 与x 之间的线性相关是否显著.(3)此问解法与上两题相同.解:(1)制表:;806.0)7.16510277119)(7.771070903(7.1657.771013292922≈⨯-⨯-⨯⨯-=r即x 与y 的相关系数806.0≈r ;(2)查表显著性水平0.05,自由度10-2=8相应的相关系数临界值6319.005.0=r ;因为,05.0r r >,所以,可以认为x 与y 之间具有线性相关关系.(3);397.07.7710709037.1657.77101329292≈⨯-⨯⨯-=b .8.1347.77397.07.165=⨯-=a说明:如果会使用含统计的科学计算器,能简单得到∑∑∑∑∑-====10110110110110122,,,,,i i i i i ii iiiiy x y x y x 这些量,就无需有制表这一步,直接算出结果就行了制表的目的是为了准确无误而快速有效地得到r 和b 的值.顺便值得一提的是:电脑中的许多应用软件,特别是表格类软件是提供统计计算函数的,用起来非常方便.产品产量与单位成本的线性回归分析分析:这是一个实际应用的回归分析问题,其实就是找出回归方程,通过回归直线方程来分析产品产量与单位成本的关系.解:设回归直线方程为,ˆa bx y+=∑∑=======61121481,79,716426,621i ni i i i y x x y x ,所以代入公式,36.77621)8182.1(71,8182.15.51062167971621614812≈⨯--=-≈-=⎪⎭⎫⎝⎛⨯-⨯⨯-=a b ,故回归直线方程为:;82.136.77ˆx y-= 由于回归系数b 为-1.82,由回归系数b 的意义可知:产量每增加1000件,单位成本下降1.82元.说明:回归分析,说明y 与x 它们之间是一元线性回归关系.回归方程中的回归系数b 和a ,刻画了这x 与y 两个量之间的变化趋势,对它们所反映出的信息进行分析,就是回归分析.对求和符号的理解例 下列表达式中错误的是( )A .∑=-+=-+nk n n na d k a 1112)1(])1([ B .∑∑==++-=-n k nk k n n a na k a 11222)1()(C .∑=-=nk nknC112 D .∑=-+=nk n kk n k n b a b a C 1)( 分析:符号“∑” 表示若干个数相加,“∑=nk 1”的下标1=k ,上标n 的含义是:将“∑=nk 1”符号后的表达式中,含k 的部分分别取1,2,3,…,n 后所得式子依次加起来,即∑=++==nk n f f f k f k f 1).()2()1()()(Λ解:分别计算ABCD 知:∑∑==-+=-+++++=-+=-+n k nk d n n na d n n a d k n a d k a 111111.2)1()1210()1(])1([Λ∑∑∑∑∑======+-=+-=-n k nk n k n k nk na k ak a k ak a k a 112211222212)2()(∑∑∑∑====++-=++-=+-nk nk n k nk k n n a na k n n a na k k a 111122222.)1(2)1(22∑=-=-+++++=++++=nk n n n n n n n n n n n n k n C C C C C C C C C C13210321.121)(ΛΛ∑=-----+=+++++=nk nn n n n n k k n k n n n n n k kn k na Cb a b C b a C b a C b a C b aC 1022211.)(ΛΛ故只有D 是错误的。
统计学一元线性回归分析练习题一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法的学习与掌握。
同时,也介绍了极大似然估计法以及矩估计法。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为kids??0??1educ??随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
多元线性回归分析实习线性回归过程(Linear Regression)可用于分析一个或多个自变量与一个因变量之间的线性数量关系,并可进行回归诊断分析。
●[例题3.1]某地29名13岁男童身高x1(cm),体重x2(kg),肺活量y(L)的实测值数据见表3.1,试建立肺活量与身高、体重的回归关系。
[ 操作过程]①[ 数据格式] 见数据文件< 多元线性回归例题.sav >该数据库有4列29行,即4个变量、29个记录(Observation),每个变量占1列,每个记录占1行,该数据格式为一般多元分析的数据格式。
②[ 过程]单击后可弹出线性回归对话框。
该对话框内有诸多选项,现分别介绍。
③[ 选项]◆因变量。
只能选入1个因变量,本例选入变量“肺活量”。
◆自变量。
可以是1个或多个,本例选入变量“身高、体重”。
◆当选择不同组合的自变量进行回归分析时,可保存每次选择的自变量,用按钮和按钮可分别向前、向后翻找各种自变量的组合。
◆选择回归模型拟合的分析方法,有5种可供选择。
Enter 强迫引入法,即一般回归分析,所选自变量全部进入方程,为系统默认方式。
Stepwise 逐步回归法,加入有显著性意义的变量和剔除无显著性意义的变量,直到所建立的方程式中不再有可加入和可剔除的变量为止。
Remove 强迫剔除法。
根据设定的条件剔除自变量。
Backward向后逐步法。
所选自变量全部进入方程,根据Options对话框中设定的标准在计算过程中逐个剔除变量,直到所建立的方程式中不再含有可剔除的变量为止。
Forward:向前逐步法。
根据Options对话框中设定的标准在计算过程中逐个加入单个变量,直到所建立的方程式中不再有可加入的变量为止。
◆选择符合某变量条件的观察单位进行分析,每次只能选入1位范围,有6种方式供选择,在Value框内输入设定值。
equal to 等于设定值。
not equal to不等于设定值。
less than小于设定值。
第二章 简单线性回归模型练习题一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。
2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。
3 ( )是因变量离差平方和,它度量因变量的总变动。
就因变量总变动的变异来源看,它由两部分因素所组成。
一个是自变量,另一个是除自变量以外的其他因素。
( )是拟合值的离散程度的度量。
它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。
( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。
4 回归方程中的回归系数是自变量对因变量的( )。
某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。
5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。
6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。
三、简答题1 在线性回归方程中,“线性”二字如何理解?2 用最小二乘法求线性回归方程系数的意义是什么?3 一元线性回归方程的基本假设条件是什么?4 方差分析方法把数据总的平方和分解成为两部分的意义是什么?5 试叙述t 检验法与相关系数检验法之间的联系。
1.1回归分析的基本思想及其初步应用例题:1.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在X轴上,预报变量在y轴上(0可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上解析:通常把自变量X称为解析变量,因变量y称为预报变量.选B2,若一组观测值(xi, yi) (x2, y2) ••- (x…, y n)之间满足 y-bxi+a+e;(i=l> 2. •••!!)若巳恒为0,则仁为_____________解析:e』亘为0,说明随机误差对方贡献为0.答案:1.3.假设关于某设备的使用年限x和所支出的维修费用y (万兀),有如下的统计资料:X 2 3 4 5 6y 22 38 55 65 70若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)列表如下:i 1 2 3 4 5X] 2 3 4 5 622 38 55 65 70时•44 114 220 325 420X; 4 9 16 25 36_ _ 5 5x = 4, y = 5,»;=9o, »,北=112.3z'=l z'=l5 ___况一5xy干旱,仃112.3-5x4x5 …c十正方= ------------- = ------------ -- = 1.23,S,厂2 90 —5x42小「- 5x<=|a = y -bx = 5-1.23x4 = 0.08线性回归方程为:y =bx + a = 1.23x + Q.QS ( 2 )当 x=10 时,y = 1.23x10 + 0.08 = 12.38 (万兀)即估计使用10年时维修费用是1238万元课后练习:1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7. 19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145. 83cm;B.身高在145. 83cm以上;C.身高在145. 83cm以下;D.身I W J在 145. 83cm 左右.2.两个变量y与x的回归模型中,分别选择了 4个不同模型,它们的相关指数人2如下,其中拟合效果最好的模型是()A.模型1的相关指数人2为0. 98B.模型2的相关指数R2为。
一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。
AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。
DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。
AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。
CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。
B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。
BA i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。
DA ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。
相关分析与回归分析同步练习试卷2(题后含答案及解析)题型有:1. 单项选择题 3. 名词解释题 4. 简答题 5. 计算分析题单项选择题每小题1分,在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。
多选无分。
1.总体总量指标的点估计值是()A.平均数乘以样本成数B.样本容量乘以样本成数C.样本指标值乘以总体单位数D.样本指标的区间估计值乘以总体单位数正确答案:C 涉及知识点:相关分析与回归分析2.理论上最符合抽样调查随机原则的形式是()A.整群抽样B.类型抽样C.阶段抽样D.简单随机抽样正确答案:D 涉及知识点:相关分析与回归分析3.()是其他抽样方式的基础,也是衡量其他抽样方式抽样效果的标准。
()A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样正确答案:A 涉及知识点:相关分析与回归分析4.为了解职工家庭生活水平状况,决定采用等距抽样进行调查,首先把职工按工资水平的高低进行排队,此种排队方法属于A.按无关标志排队B.按有关标志排队C.按简单标志排队D.按复杂标志排队正确答案:B 涉及知识点:相关分析与回归分析5.产品的单位成本随着劳动生产率的不断提高而下降,此种现象属于()A.完全相关B.不完全相关C.正相关D.负相关正确答案:D 涉及知识点:相关分析与回归分析6.只反映一个自变量和一个因变量韵相关关系是()A.正相关B.负相关C.单相关D.复相关正确答案:C 涉及知识点:相关分析与回归分析7.当相关关系的—个变量变动时,另—变量也相应地发生大致均等的变动,这种相关关系称为()A.线性相关B.非线性相关C.单相关D.完全相关正确答案:A 涉及知识点:相关分析与回归分析8.完全相关关系就是()A.函数关系B.因果关系C.狭义的相关关系D.广义的相关关系正确答案:A 涉及知识点:相关分析与回归分析9.大多数相关关系属于()A.不相关B.完全相关C.不完全相关D.无法判断正确答案:C 涉及知识点:相关分析与回归分析10.制作双变量分组相关表,应将自变量放在()A.横栏B.纵栏C.中间栏D.任意一栏正确答案:A 涉及知识点:相关分析与回归分析11.相关系数的取值范围是()A.-1≤r≤lB.-1≤r≤lC.-1<r<lD.-1≤r<1正确答案:B 涉及知识点:相关分析与回归分析12.两个变量问的相互依存程度越高,则二者之间的相关系数值越接近于()A.1B.-1C.0D.1或-1正确答案:D 涉及知识点:相关分析与回归分析13.两个现象之间相互依存关系程度越弱,则相关系数r()A.越接近于0B.越接近于-1C.越接近于1D.越接近于0.5正确答案:A 涉及知识点:相关分析与回归分析14.在相关分析中,要求相关的两个变量()A.至少有一个是随机变量B.因变量是随机变量C.都不是随机变量D.自变量是随机变量正确答案:A 涉及知识点:相关分析与回归分析名词解释题每小题3分15.一元线性回归模型正确答案:一元线性回归模型又称简单直线回归模型,它是根据两个变量的成对数据,配合直线方程式,再根据自变量的变动值,来推算因变量的估计值的一种统计分析方法。
CDA数据分析师LevelⅡ考试题库案例之线性回归问题
案例:
问题1:如果某年广告投入为6个单位,则销售量的预测值为()个单位
A、372.2
B、386.2
C、3921
D、296.3
答案:A
问题2:如果该回归的R方为0.975,则销售量与广告费用之间的相关系数是多少?
A、0.8621
B、0.9877
C、0.521
D、0.9756
答案:B
问题3:关于截距(intercept)理解错误的是?
A、截距项是回归模型中重要的组成部分,不可省略
B、根据历史数据拟合曲线,该曲线与级轴的交点为(0,363.6891)
C、说明在即便在没有广告投入的年份,也可以出售363.7单位的车辆
D、由于并没有广告费用为0的样本数据,因此这只是预测值,并不是真实销售情况
答案:C
问题4:以下说法正确的是?
A、因为只提供了回归系数检验,所以无法判断该模型对应的F检验是否显著
B、根据网归系数,可知营销费用每增加一元,汽车的销售量就可以增加1.42辆
C、虽然只提供了回归系数检验,但是该模型对应的F检验肯定是是著的
D、如果截距项对应的P值大于0.2,则回归方程中不应该包含截距项
答案:A
问题5:回归系数的含义是什么?
A、汽车销量每增加一个单位,广告费用就增加1.42个单位
B、汽车销量每增加一个单位,广告费用就增加19.98个单位
C、广告费用每增加一个单位,汽车销量就增加19.98个单位
D、广告费用每增加一个单位,汽车销量就增加1.42个单位
答案:D。
线性回归分析法例题一、单选题1.相关分析研究的是()A、变量间相互关系的紧密程度B、变量之间因果关系C、变量之间严苛的相依关系D、变量之间的线性关系2.若变量X的值减少时,变量Y的值也减少,那么变量X和变量Y之间存有着()。
A、正相关关系B、负相关关系C、直线有关关系D、曲线有关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正有关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零说明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存有线性相关关系D.存在曲线线性相关关系5.有关关系的主要特征就是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的`标志之间存有着一定的依存关系,但它们不是确认的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存有着不确认的直线关系6.时间数列自身相关是指()。
A、两变量在相同时间上的依存关系B、两变量静态的依存关系C、一个变量随其时间相同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,表明两个变量之间()。
A、不存在相关关系B、相关程度很低C、有关程度很高D、全然负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、并无有关B、存有正有关C、存在负相关D、无法判断是否相关9.有关分析对资料的建议就是()。
A.两变量均为随机的B.两变量均不是随机的C、自变量就是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.重回分析中直观重回就是指()。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性重回D.两个变量之间的线性重回11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为时,其生产成本为元,其中不随产量变化的成本为元,则成本总额对产量的回归方程为()A. y=+24xB. y=6+0.24xC. y=+6xD. y=24+x12.直线回归方程中,若回归系数为负,则()A.表明现象正相关B.表明现象负相关C.说明有关程度较弱D.无法表明有关方向和程度二、多项选择题1.以下属有关关系的存有()。
多元线性回归模型(习题与解答)第三章多元线性回归模型一、习题(一)基本知识类题型3-1.解释下列概念:1)多元线性回归2)虚变量3)正规方程组4)无偏性5)一致性6)参数估计量的置信区间7)被解释变量预测值的置信区间8)受约束回归9)无约束回归10)参数稳定性检验3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1)i i i X Yεββ++=3102)i i i X Yεββ++=log103)i i i X Yεββ++=log log104)i i i X Yεβββ++=)(2105)i ii X Yεββ+=106)i i i X Yεββ+−+=)1(1107)i i i i X X Yεβββ+++=10221103-3.多元线性回归模型与一元线性回归模型有哪些区别?3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?3-6.请说明区间估计的含义。
(二)基本证明与问答类题型3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:i ki k i i i u x x x y+++++=ββββL22110,n i,,2,1L =的正规方程组,及其推导过程。
3-8.对于多元线性回归模型,证明:(1)∑=0i e(2)0)ˆˆˆ(ˆ110=+++=∑∑iki k i i i e x x e yβββL3-9.为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?3-10.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否有等价的作用?3-11.设有模型:u x x y+++=22110βββ,试在下列条件下:(1)121=+ββ(2)21ββ=分别求出1β和2β的最小二乘估计量。
... . . . 资料 . .. §1 回归分析
1.1 回归分析 1.2 相关系数 一、基础过关 1. 下列变量之间的关系是函数关系的是 ( ) A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩施用肥料量和粮食产量 2. 在以下四个散点图中,
其中适用于作线性回归的散点图为 ( ) A.①② B.①③ C.②③ D.③④ 3. 下列变量中,属于负相关的是 ( ) A.收入增加,储蓄额增加 B.产量增加,生产费用增加 C.收入增加,支出增加 D.价格下降,消费增加 4. 已知对一组观察值(xi,yi)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为 ( ) A.y=0.51x+6.65 B.y=6.65x+0.51 ... . . . 资料 . .. C.y=0.51x+42.30 D.y=42.30x+0.51 5. 对于回归分析,下列说法错误的是 ( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 B.线性相关系数可以是正的,也可以是负的 C.回归分析中,如果r2=1,说明x与y之间完全相关 D.样本相关系数r∈(-1,1) 6. 下表是x和y之间的一组数据,则y关于x的回归方程必过 ( ) x 1 2 3 4
y 1 3 5 7
A.点(2,3) B.点(1.5,4) C.点(2.5,4) D.点(2.5,5) 7. 若线性回归方程中的回归系数b=0,则相关系数r=________. 二、能力提升 8. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下: 尿汞含量x 2 4 6 8 10 消光系数y 64 138 205 285 360 若y与x具有线性相关关系,则线性回归方程是____________________. 9. 若施化肥量x(kg)与小麦产量y(kg)之间的线性回归方程为y=250+4x,当施化肥量为50 kg时,预计小麦产量为________ kg. 10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下: 零件的个数x/个 2 3 4 5 加工的时间y/小时 2.5 3 4 4.5 若加工时间y与零件个数x之间有较好的相关关系. (1)求加工时间与零件个数的线性回归方程; (2)试预报加工10个零件需要的时间. 11.在一段时间,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为: 1 2 3 4 5 价格x 1.4 1.6 1.8 2 2.2 需求量y 12 10 7 5 3
已知∑5i=1xiyi=62,∑5i=1x2i=16.6. (1)画出散点图; (2)求出y对x的线性回归方程; ... . . . 资料 . .. (3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t). 12.某运动员训练次数与运动成绩之间的数据关系如下: 次数x 30 33 35 37 39 44 46 50 成绩y 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出回归方程; (3)计算相关系数并进行相关性检验; (4)试预测该运动员训练47次及55次的成绩. 三、探究与拓展 13.从某地成年男子中随机抽取n个人,测得平均身高为x=172 cm,标准差为sx=7.6 cm,平均体重y=
72 kg,标准差sy=15.2 kg,相关系数r=lxylxxlyy=0.5,求由身高估计平均体重的回归方程y=β0+β1x,以及由体重估计平均身高的回归方程x=a+by. ... . .
. 资料 . .. 答案 1.A 2.B 3.D 4.A 5.D 6.C 7.0 8.y=-11.3+36.95x 9.450 10.解 (1)由表中数据,利用科学计算器得
x=2+3+4+54=3.5,
y=2.5+3+4+4.54=3.5,
∑4i=1xiyi=52.5,∑4i=1
x2i=54,
b=∑4i=1xiyi-4x y∑4i=1x2i-4x2
=52.5-4×3.5×3.554-4×3.52=0.7, a=y-bx=1.05,
因此,所求的线性回归方程为y=0.7x+1.05. (2)将x=10代入线性回归方程,得y=0.7×10+1.05=8.05(小时),即加工10个零件的预报时间为8.05小时. 11.解 (1)散点图如下图所示:
(2)因为x=15×9=1.8,y=15×37=7.4,∑5i=1xiyi=62,∑5i=1x2i=16.6, 所以b=∑5i=1xiyi-5x y∑5i=1x2i-5x2=62-5×1.8×7.416.6-5×1.82=-11.5, a=y-bx=7.4+11.5×1.8=28.1,
故y对x的线性回归方程为y=28.1-11.5x. (3)y=28.1-11.5×1.9=6.25(t). ... . . . 资料 . .. 所以,如果价格定为1.9万元,则需求量大约是6.25 t. 12.解 (1)作出该运动员训练次数x与成绩y之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.
(2)列表计算: 次数xi 成绩yi x2i y2i xiyi 30 30 900 900 900 33 34 1 089 1 156 1 122 35 37 1 225 1 369 1 295 37 39 1 369 1 521 1 443 39 42 1 521 1 764 1 638 44 46 1 936 2 116 2 024 46 48 2 116 2 304 2 208 50 51 2 500 2 601 2 550 由上表可求得x=39.25,y=40.875, ∑8i=1x2i=12 656,∑8i=1
y2i=13 731,
∑8i=1
xiyi=13 180,
∴b=∑8i=1xiyi-8x y∑8i=1x2i-8x2≈1.041 5, a=y-bx=-0.003 88,
∴线性回归方程为y=1.041 5x-0.003 88. (3)计算相关系数r=0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y=1.041 5x-0.003 88作为该运动员成绩的预报值. 将x=47和x=55分别代入该方程可得y=49和y=57.故预测该运动员训练47次和55次的成绩分别为49和57.
13.解 ∵sx=lxyn,sy=lxyn, ... . . . 资料 . .. ∴lxyn=rlxyn·lyy
n=0.5×7.6×15.2=57.76.∴β1=lxynlxy
n
=57.767.62=1,
β0=y-β1x=72-1×172=-100.
故由身高估计平均体重的回归方程为y=x-100.
由x,y位置的对称性,得b=lxynlxyn=57.7615.22=0.25, ∴a=x-by=172-0.25×72=154. 故由体重估计平均身高的回归方程为x=0.25y+154.
1.3 可线性化的回归分析 一、基础过关 1. 某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是 ( ) A.y=-10x+200 B.y=10x+200 C.y=-10x-200 D.y=10x-200 2. 在线性回归方程y=a+bx中,回归系数b表示 ( ) A.当x=0时,y的平均值 B.x变动一个单位时,y的实际变动量 C.y变动一个单位时,x的平均变动量 D.x变动一个单位时,y的平均变动量 3. 对于指数曲线y=aebx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为 ( ) A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx 4. 下列说法错误的是( ) A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系 B.把非线性回归化为线性回归为我们解决问题提供一种方法 C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系 D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决 5. 每一吨铸铁成本yc(元)与铸件废品率x%建立的回归方程yc=56+8x,下列说确的是 ( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 6. 为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值