统计案例练习题答案已
做
文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]
统计案例专题练习(高二文)
一、知识点归纳 1.线性回归方程
①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系
③线性回归方程:a bx y +=∧
(最小二乘法)
1
221n
i i i n
i
i x y nx y b x nx a y bx
==?
-?
?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。 2. 相关系数(判定两个变量线性相关性):∑∑∑===----=
n
i n
i i i
n
i i i
y y x x
y y x x
r 1
1
2
21
)()()
)((
注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关;
(2)||r 越接近于1,两个变量的线性相关性越强;||r 接近于0时,两个变量之间几乎不存在线性相关关系。 3.回归分析中归效果的判定:
(1)回归平方和:∑=-n i i y y 1
2
)(-2
1
)(∑=∧
-n
i yi yi
相关指数∑∑==∧
---=n
i i i
n
i i i
y y
y y R 12
1
2
2)()(1 。
注:①2R 得知越大,说明残差平方和越小,则模型拟合效果越好;
②2R 越接近于1,,则回归效果越好。
4.独立性检验(分类变量关系):随机变量2K 越大,说明两个分类变量,关系越强,反之,越弱。
K2=
n(ad?bc)2
(a+b)(c+d)(a+c)(b+d)
一、选择题
1.下列属于相关现象的是()
A.利息与利率B.居民收入与储蓄存款
C.电视机产量与苹果产量D.某种商品的销售额与销售价格
2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()
A.2 3.841
K>B.2 3.841
K<C.2 6.635
K>D.2 6.635
K<
3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()
A.0个B.1个C.2个D.3个
4.当2 3.841
K>时,认为事件A与事件B()
A.有95%的把握有关B.有99%的把握有关
C.没有理由说它们有关D.不确定
5.已知回归直线方程y bx a
=+,其中3
a=且样本点中心为(12)
,,则回归直线方程为()
A.3
y x
=+B.23
y x
=-+C.3
y x
=-+D.3
y x
=-
6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:
你认为性别与是否喜欢数学课程之间有关系的把握有()
A.0 B.95%C.99%D.100%
8.在回归直线方程y a bx
=+中,回归系数b表示()
A.当0
x=时,y的平均值B.x变动一个单位时,y的实际变动量
C.y变动一个单位时,x的平均变动量D.x变动一个单位时,y的平均变动量
9.对于回归分析,下列说法错误的是()
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果21
r∈-,
r=,说明x与y之间完全相关D.样本相关系数(11)
10.在画两个变量的散点图时,下面哪个叙述是正确的( )
(A)预报变量在x轴上,解释变量在y轴上 (B)解释变量在x轴上,预报变量在y轴上
(C)可以选择两个变量中任意一个变量在x轴上(D)选择两个变量中任意一个变量在y轴上
11、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=+用这个模型预测这个孩子10岁时的身高,则正确的叙述是()
A.身高一定是145.83cm;
B.身高在145.83cm以上;
C.身高在145.83cm以下;
D.身高在145.83cm左右.
12、两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数2R如下,其中拟合效果最好的模型是( )
A.模型1的相关指数2
R为 B.模型2的相关指数2R为
R为 D.模型4的相关指数2R为
C.模型3的相关指数2
14、工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为?6090
=+,
y x 下列判断正确的是()
A.劳动生产率为1000元时,工资为50元
B.劳动生产率提高1000元时,工资提高150元
C.劳动生产率提高1000元时,工资提高90元
D.劳动生产率为1000元时,工资为90元
15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( ) A.越大 B.越小 C.无法判断 D.以上都不对
16、对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是( )
A . k 越大," X 与Y 有关系”可信程度越小;
B . k 越小," X 与Y 有关系”可信程度越小;
C . k 越接近于0," X 与Y 无关”程度越小
D . k 越大," X 与Y 无关”程度越大 17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K 2的观测值为k=,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;
D.以上三种说法都不正确.
18、设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )
A. b 与r 的符号相同
B. a 与r 的符号相同
C. b 与r 的相反
D. a 与r 的符号相反
则y 与x 的线性回归方程为y=bx+a 必过( )
A.(2,2)点
B.(,0)点
C.(1,2)点
D.(,4)点
20、已知回归直线的斜率的估计值是,样本点的中心为(4,5),则回归直线的方程是( )
A.y ∧
=+4 B. y ∧=+5 C. y ∧=+ D. y ∧
=+
21、为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )
A. 1l 与2l 重合
B. 1l 与2l 一定平行
C. 1l 与2l 相交于点),(y x
D. 无法判断1l 和2l 是否相交
22、下列说法正确的有( )
①回归方程适用于一切样本和总体。 ②回归方程一般都有时间性。③样本取值的范围会影响回归方程的适用范围。④回归方程得到的预报值是预报变量的精确值。 A. ①② B. ②③ C. ③④ D. ①③ 23、考察棉花种子经过处理跟生病之间的关系 得到如下表数据:根据以上数据,则( ) A.种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病 D. 以上都是错误的
24.某化工厂为预测某产品的回收率y ,需要研究
它和原料有效成份含量之间的相关关系,现取了8对观测值,计算得:8
152i i x ==∑,
8
1
228i
i y
==∑,821
478i i x ==∑,8
1
1849i i i x y ==∑,则y 与x 的回归直线方程是( )
A.11.47 2.62y x =+ B.11.47 2.62y x =-+ C. 2.6211.47y x x =+ D.11.47 2.62y x =-
25.如图所示,图中有5组数据,去掉B 组数据后,剩下的4组数据
的线性相关性最大( ) A.E
B.C
C.D
D.A
26.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90%
B.95%
C.99%
D.100%
27.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:
你认为婴儿的性别与出生时间有关系的把握为( ) A.80%
B.90%
C.95%
D.99%
28.已知线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数
b ( ) A.可以小于0
B.只能大于0 C.可以为0
D.只能小于0
29.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( )
A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元 30.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①②
B.②③
C.①③
D.①②③
二、填空题
31.对于回归直线方程 4.75257y x =+,当28x =时,y 的估计值为 . 32.直线回归方程y a bx =+恒过定点 .
34、若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为
35、若有一组数据的总偏差平方和为100,相关指数为,则期残差平方和为_____ 回归平方和为____
37、某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,
y 与x 具有相关关系,回归方程562.166.0?+=x y
(单位:千元),若某城市居民消费水平为,估计该城市消费额占人均工资收入的百分比为( ) 三、解答题
38、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
对于教育机构的研究项目,根据上述数据能得出什么结论.
39、某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表: 生产线与产品合格率列联表
请问甲、乙两线生产的产品合格率在多大程度上有关系 40、若两个分类变量X 与Y 的列联表为:
则“X 与Y 之间有关系”这个结论出错的可能性为多少 、
四、课下练习
1.在画两个变量的散点图时,下面哪个叙述是正确的( )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个在x轴上
D. 以选择两个变量中任意一个在y轴上
2.下列说法正确的有( )
①回归方程适用于一切样本和总体。②回归方程一般都有时间性。③样本取值的范围会影响回归方程的适用范围。④回归方程得到的预报值是预报变量的精确值。
A.①②
B.②③
C.③④
D.①③
3.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )
A.总偏差平方和
B.残差平方和
C.回归平方和
D.相关指数R2
4.下列结论正确的是( )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系
③回归关系是对具有函数关系的两个变量进行统计分析的一种方法
④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A.①②
B.①②③
C.①②④
D.①②③④
5.已知回归直线的斜率的估计值是,样本点的中心为(4,5),则回归直线的方程是
( )
A.y∧=+4
B. y∧=+5
C. y∧=+
D. y∧=+
6回归分析中,相关指数R2的值越大,说明残差平方和( )
A.越小
B.越大
C.可能大也可能小
D.以上都不对
7若回归直线方程中的回归系数b=0时,则相关系数r= ( )
B.-1
C.0
D.无法确定
8利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度。如果k>,那么就有把握认为“X和Y有关系”的百分比为
%%