袁卫《统计学》(第3版)课后习题-相关与回归分析(圣才出品)
- 格式:pdf
- 大小:1.48 MB
- 文档页数:24
版权归wagxjysys所有违者必究第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
、 单项选择题1. 相关分析是研究变量之间的 A. 数量关系 C •因果关系2. 在相关分析中要求相关的两个变量3. 下列现象之间的关系哪一个属于相关关系?A. 播种量与粮食收获量之间关系 C •圆半径与圆面积之间关系 D. 单位产品成本与总成本之间关系 4. 正相关的特点是A •两个变量之间的变化方向相反 C. 两个变量之间的变化方向一致 5. 相关关系的主要特点是两个变量之间A. 存在着确定的依存关系 C. 存在着严重的依存关系 B. 存在着不完全确定的关系 D. 存在着严格的对应关系6.当自变量变化时 , 因变量也相应地随之等量变化 ,则两个变量 之间存在着A. 直线相关关系B.负相关关系C.曲线相关关系 D.正相关关系 7. 当变量 X 值增加时 ,变量 Y 值都随之下降 ,则变量 X 和 Y 之间存 在着 A. 正相关关系 C.负相关关系D.曲线相关关系8. 当变量 X 值增加时 ,变量 Y 值都随之增加 ,则变量 X 和 Y 之间存 在着 A. 直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系9. 判定现象之间相关关系密切程度的最主要方法是 A. 对现象进行定性分析 B.计算相关系数C.编制相关表 D.绘制相关图10. 相关分析对资料的要求是A. 自 变量不是随机的,因变量是随机的B. 两个变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 两个变量均为随机的 11. 相关系数第七章相关分析与回归分析B.变动关系D. 相互关系的密切程度 A. 都是随机变量C. 都不是随机变量B. 自变量是随机变量 D. 因变量是随机变量B •圆半径与圆周长之间关系B.两个变量一增一减 D. 两个变量一减一增 B.直线相关关系A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为C. 不相关D.负相关B.-1w rw 0 D. r=0 ,则相关系数 B.愈趋近于0D. 愈小于 1 ,则相关系数 B.愈趋近于0D. 愈小于116. 相关系数越接近于- 1,表明两变量间C. 负相关关系越强 D.负相关关系越弱17. 当相关系数 r=0 时 , A. 现象之间完全无关 B.相关程度较小 B. 现象之间完全相关D.无直线相关关系18. 假设产品产量与产品单位成本之间的相关系数为 -0.89,则说明这两个变量之间存在A.高度相关 B.中度相关 C. 低度相关D.显著相关19. 从变量之间相关的方向看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关20. 从变量之间相关的表现形式看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关21. 物价上涨 ,销售量下降 ,则物价与销售量之间属于 A. 无相关 B.负相关 C.正相关D.无法判断22. 配合回归直线最合理的方法是 A.随手画线法 B.半数平均法 C.最小平方法D.指数平滑法A.单相关B.复相关 13. 相关系数的取值范围是 A.-1W r < 1C.OW rw 114. 两变量之间相关程度越强 A.愈趋近于1 C.愈大于115. 两变量之间相关程度越弱 A.愈趋近于1 A. 没有相关关系B. 有曲线相关关系23.在回归直线方程y= a+ bx 中 b 表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量24.计算估计标准误差的依据是A.因变量的数列C.因变量的回归变差25.估计标准误差是反映A.平均数代表性的指标B.因变量的总变差D.因变量的剩余变差B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中 ,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程 y=10+70x, 这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为 1000件时,其生产成本为 30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数G剩余变差B.回归参数D.估计标准误差、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系2.直线相关分析的特点是A.相关系数有正负号C.只有一个相关系数E.年龄与血压之间的关系B.两个变量是对等关系D. 因变量是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量 x 与 y 之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加 5.6元D.产量为 1 千件时,单位成本为 79.4 元E.产量每增加1千件,单位成本平均减少 5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关16用最小平方法配合的回归直线 A . (y-y c )=最小值 C. (y-y c )2=最小值 E.(y-y c )2=最大值D.计算相关系数 8•当现象之间完全相关的A.0B.— 1E.计算估计标准误差 ,相关系数为C.1D.0.5E. — 0.59•相关系数r =0说明两个变量之间是 A •可能完全不相关 B •可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关E. 高度曲线相关 10下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B. 流通费用率随商品销售额的增加而减少D. 生产单位产品耗用工时,随劳动生产率的提高而减少E. 工人劳动生产率越高,则创造的产值就越多 11直线回归分析的特点有 A •存在两个回归方程 B •回归系数有正负值C. 两个变量不对等关系D. 自变量是给定的,因变量是随机的E. 利用一个回归方程,两个变量可以相互计算 12直线回归方程中的两个变量C. 必须确定哪个是自变量,哪个是因变量D. 一个是随机变量,另一个是给定变量E. 一个是自变量,另一个是因变量13. 从现象间相互关系的方向划分,相关关系可以分为 A.直线相关 B.曲线相关 D. 负相关 E.单相关14. 估计标准误差是A. 说明平均数代表性的指标B. 说明回归直线代表性指标C. 因变量估计值可靠程度指标D. 指标值愈小,表明估计值愈可靠C.正相关Ar D.r(x x)(y y)B rL xyC.rL xyL yyL xy LXX(X X)(y y) Er■(X X)2 (y y)2n xy x y、n x 2 ( x)2 、n y 2 ( y)217 方程 y c=a+bx,必须满足以下条件B. (y-y c)=02A.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E.其数值大小受计量单位的影响19相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.__________________________________________________ 研究现象之间相关关系称作相关分析。
第6章方差分析与实验设计一、单项选择题1.方差分析所要研究的问题是()。
A.各总体的方差是否相等B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量的影响是否显著D.分类型因变量对数值型自变量的影响是否显著【答案】C【解析】方差分析是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所要研究的问题就是分类型自变量对数值型因变量的影响。
2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。
A.提高B.降低C.等于0D.等于1【答案】B【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:1-(1-α)6=0.265>0.05。
方差分析则排除了错误累积的概率。
3.在单因素方差分析中,涉及的两个变量是()。
A.数值型变量B.分类型变量C.一个分类型自变量和一个数值型的因变量D.一个数值型的自变量和一个分类型自变量【答案】C4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。
A.只包括随机误差B.只包括系统误差C.既包括随机误差,也包括系统误差D.有时包括随机误差,有时包括系统误差【答案】C【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。
组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
5.在单因素方差分析中,各次试验观测应()。
A.相互关联B.相互独立C .计量逐步精确D .方法逐步改进【答案】B 【解析】方差分析中有三个基本的假定:①每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;②各个总体的方差2σ必须相同。
第二部分课后习题第1章数据与统计学1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。
(2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。
当开始增加施肥量时,产量增加较快。
以后增加同样的施肥量,粮食产量的增加量逐渐减少。
当施肥量增加到一定数值量,产量不再增加。
这时如果再增加肥料,产量反而会减少。
(3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。
3.联系实际简要说明统计数据的来源。
答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。
4.直接获取统计数据的渠道主要有哪些?答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。
(2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。
5.简要说明抽样误差和非抽样误差。
答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。
但它又是可以计量的,并且是可以控制的。
在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。
(2)非抽样误差是由于调查过程中各有关环节工作失误造成的。
第四章、参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。
设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量。
2.说明区间估计的基本原理答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。
置信水平反映估计的可信度,而区间的长度反映估计的精确度。
3.解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知的,置信区间是一个随机区间。
置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。
4.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。
练习题:●1.解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,(1)样本均值的抽样标准差σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2Z 6×0.7906=1.5496。
●2.解:(1)已假定总体标准差为σ=15元,则样本均值的抽样标准误差为x σ15=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E=α/2Z 6×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,这时总体均值的置信区间为±α/2x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
为大家谋福利,低价供应第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:C B C ED B C C B C(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
第三部分章节题库第1章数据与统计学一、单项选择题1.被马克思誉为“政治经济学之父,在某种程度上也是统计学的创始人”的是()。
A.布莱斯·帕斯卡B.威廉·配第C.费马D.约翰·格朗特【答案】B【解析】布莱斯·帕斯卡和费马是古典概率论的奠基人;约翰·格朗特是人口统计的创始人。
2.统计学的两大分类是()。
A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计【答案】D3.下列不属于描述统计问题的是()。
A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法。
4.下列叙述中,采用推断统计方法的是()。
A.用饼图描述某企业职工的学历构成B.反映大学生统计学成绩的条形图C.一个城市在1月份的平均汽油价格D.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量【答案】D【解析】推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
由题可知,根据36个橘子的平均重量估计果园中橘子的平均重量属于推断统计方法。
5.如果一个样本因人故意操纵而出现偏差,这种误差属于()。
A.抽样误差B.非抽样误差C.设计误差D.实验误差【答案】B【解析】非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,人为干扰造成的误差,调查中由于被调查者不回答产生的误差等。
6.下列说法错误的是()。
A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差【答案】B【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。