统计案例练习题
- 格式:docx
- 大小:33.44 KB
- 文档页数:9
统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。
简单统计练习题统计学作为一门重要的学科,对于数据的收集、整理和分析具有至关重要的作用。
通过统计,我们可以更好地理解数据背后的信息,做出科学的决策和预测。
为了帮助大家更好地掌握统计知识,本篇文章将提供一些简单的统计练习题,供大家练习。
题目一:某班级有50名学生,其中男生30人,女生20人。
请计算男生和女生的比例。
解答:男生比例=男生人数/总人数 = 30/50 = 0.6女生比例=女生人数/总人数 = 20/50 = 0.4题目二:某公司招聘了10名员工,其中有3名本科生,6名硕士生,1名博士生。
请计算本科生、硕士生和博士生的比例。
解答:本科生比例=本科生人数/总人数 = 3/10 = 0.3硕士生比例=硕士生人数/总人数 = 6/10 = 0.6博士生比例=博士生人数/总人数 = 1/10 = 0.1题目三:某餐厅上午8点到下午5点的客流量如下所示,请计算上午8点到中午12点和中午12点到下午5点的客流量占比。
上午8点到中午12点客流量:30人中午12点到下午5点客流量:70人解答:上午8点到中午12点客流量占比=上午8点到中午12点客流量/总客流量 = 30/(30+70) = 0.3中午12点到下午5点客流量占比=中午12点到下午5点客流量/总客流量 = 70/(30+70) = 0.7通过以上三道练习题,我们可以了解到统计学在实际问题中的应用。
通过计算比例,我们可以更直观地看到不同类别的数据之间的关系。
当然,这只是统计学的冰山一角,作为一门复杂的学科,统计学还有更多的方法和技巧可以帮助我们更好地理解和利用数据。
希望通过这些简单的统计练习题,大家能够对统计学有更深入的了解,并且能够灵活运用于实际问题中。
只有不断练习和实践,我们才能在统计学这条道路上越走越远,为各行各业的发展贡献自己的力量。
第1篇一、案例分析题背景材料:某市统计局为了全面了解该市企业的发展状况,决定对该市所有企业进行一次全面的统计调查。
调查内容主要包括企业的基本情况、财务状况、生产经营状况等。
在调查过程中,某市统计局发现部分企业存在以下问题:1. 部分企业未按时提交统计报表,甚至有些企业拒绝提供任何统计资料;2. 部分企业提供的数据存在虚假、伪造现象,严重影响了统计数据的真实性;3. 部分企业未按照规定设置统计机构,未配备专职统计人员。
问题:1. 根据我国《统计法》及相关法律法规,分析上述企业存在的问题,并指出应承担的法律责任。
2. 针对上述问题,某市统计局应采取哪些措施确保统计调查的顺利进行?3. 如何提高企业统计法律法规意识,确保统计数据的真实性?二、案例分析一、企业存在的问题及法律责任1. 未按时提交统计报表:根据《统计法》第三十八条规定,统计调查对象应当依照统计法和国家统计制度的规定,按时、如实提供统计资料。
未按时提交统计报表的行为违反了《统计法》的相关规定,企业应承担相应的法律责任。
2. 提供虚假、伪造数据:根据《统计法》第四十二条规定,统计调查对象提供虚假、伪造的统计资料,由县级以上人民政府统计机构责令改正,给予警告,可以并处五万元以下的罚款;构成犯罪的,依法追究刑事责任。
3. 未按规定设置统计机构、配备统计人员:根据《统计法》第二十六条规定,企业应当建立健全统计机构,配备专职或者兼职统计人员。
未按规定设置统计机构、配备统计人员的行为违反了《统计法》的相关规定,企业应承担相应的法律责任。
二、某市统计局应采取的措施1. 加强宣传和培训:某市统计局应加大对统计法律法规的宣传力度,提高企业对统计工作的认识,定期对企业进行统计法律法规培训,增强企业统计法律法规意识。
2. 严格执法:某市统计局应加强对统计违法行为的查处力度,对未按时提交统计报表、提供虚假、伪造数据等违法行为,依法予以处罚。
3. 强化统计服务:某市统计局应积极为企业提供统计服务,帮助企业解决统计工作中遇到的问题,提高企业统计工作的质量。
第一章:统计案例一.选择题1. 炼钢时钢水的含碳量与冶炼时间有( )A.确定性关系B.相关关系C.函数关系D.无任何关系 2.下列说法正确的有( )①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A. ①② B. ②③ C. ③④ D. ①③ 3.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系 ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法 ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①② B. ①②③ C. ①②④ D. ①②③④ 4. 设有一个回归方程为y=2-2.5x,则变量x 增加一个单位时( ) A.y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( ) A. y ∧=1.23x +4 B. y ∧=1.23x+5 C. y ∧=1.23x+0.08 D. y ∧=0.08x+1.23 6. 已知x 与y 之间的一组数据:则y 与x 的线性回归方程为y=bx+a 必过( )A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点7. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A. 越大B.越小C.无法判断D. 以上都不对 8.身高与体重有关系可以用( )分析来分析A.殘差B.回归C.二维条形图D.独立检验9. 设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反10. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 重合B. 1l 与2l 一定平行C. 1l 与2l 相交于点),(y xD. 无法判断1l 和2l 是否相交 11. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:A.种子经过处理跟是否生病有关B. 种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病D. 以上都是错误的12.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的预报最大取值是10,则x 的最大取值不能超过( ) A.16 B.17 C.15 D.12 二.填空题13 .有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系; (2)曲线上的点与该点的坐标之间的关系; (3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是 14. 归直线方程为y=0.5x-0.81,则x=25时,y 的估计值为15. 在两个变量的回归分析中,作散点图的目的是______________________________16. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比(x )和收入低于官方的贫困线的人数占本州人数的百分比(y )之间的相关系数 (填充“大于0”或“小于0”) 三.解答题17. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?18.若)101(,1531≤≤=+=i iy y i x i i ,求.,y x19.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表:生产线与产品合格率列联表请问甲、乙两线生产的产品合格率在多大程度上有关系?20.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1) 用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图 (2) 描述解释变量与预报变量之间的关系 (3) 计算残差、相关指数R 2.1.1 回归分析的基本思想及其初步应用例题:1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上 2. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为3. 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 24.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e中,b=_______,a=_________e称为_________6. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)变量y对x进行相关性检验;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A.各分类变量的频数B.分类变量的百分比C.分类变量的样本数D.分类变量的具体值2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( )A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对K的观测值K ,说法正确的是()3.对分类变量X 与Y 的随机变量2A . k 越大," X 与Y 有关系”可信程度越小;B . k 越小," X 与Y 有关系”可信程度越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k2=4.013,那么有把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别 专业非统计专业统计专业 男 13 10 女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
第一章 统计案例 测试题一、选择题 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2. 已知盒中装有 3 只螺口与 7 只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡, 电工师傅每次从中任取一只并不放回,则在他第 1 次抽到的是螺口灯泡的条件下,第 2 次抽到的是卡口灯泡的概率为 ( )3 2 7 7 A. B. C. D. 10 9 8 93. 如图所示,图中有 5 组数据,去掉组数据后(填字母代号),剩下的 4 组数据的线性相关性最大( )A. E B. C C. D D. A4. 得到如下结果( 单位: 人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A. 90% B. 95% C. 99% D.100%5. 调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:晚上 白天 合计男婴 24 31 55 女婴 8 26 34 合计 32 57 89你认为婴儿的性别与出生时间有关系的把握为( )A. 80% B. 90% C. 95% D. 99%6. 已知有线性相关关系的两个变量建立的回归直线方程为 y = a + bx ,方程中的回归系数 b ( )A.可以小于 0 B.只能大于 0 C.可以为 0 D.只能小于 0 7. 每一吨铸铁成本 y c (元)与铸件废品率 x %建立的回归方程 y c = 56 + 8x ,下列说法正确的是( ) A.废品率每增加 1%,成本每吨增加 64 元B.废品率每增加 1%,成本每吨增加 8% C.废品率每增加 1%,成本每吨增加 8 元D.如果废品率增加 1%,则每吨成本为 56 元 8. 下列说法中正确的有:①若 r > 0 ,则 x 增大时,y 也相应增大;②若 r < 0 ,则 x 增大时,y 也相应增大;③若r = 1,或 r = -1,则 x 与 y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③9. 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与摄氏温度-5 04712151923273136热饮杯数15615013212813011610489937654A.100 B.143 C.200 D.243不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91996510.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:优秀不优秀合计甲班10 35 45乙班7 38 45合计17 73 90利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7二、填空题11.某矿山采煤的单位成本Y 与采煤量x 有关,其数据如下:则Y 对x 的回归系数.采煤量289 298 316 322 327 329 329 331 350 (千吨)单位成本43.5 42.9 42.1 39.6 39.1 38.5 38.0 38.0 37.0(元)12.对于回归直线方程 y=4.75x+257,当x=28时,y的估计值为.13.在某医院,因为患心脏病而住院的665 名男性病人中,有214 人秃顶;而另外772 名不=是因为患心脏病而住院的男性病人中有175 人秃顶,则2.3 114.设A、B 为两个事件,若事件A 和B 同时发生的概率为,在事件A 发生的条件下,事件B 发生的概率为,10 2 则事件A 发生的概率为.15.由一个 2*2 列联表中数据计算得2= 4.013 ,有把握认为两个变量有关系.三、解答题 1 1 116.国庆节放假,甲去北京旅游的概率为,乙、丙去北京旅游的概率分别为,.假定三人的行动相互之间没有影响,求这段时间内至少有1 人去北京旅3游的概率 4 517.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了 392 名成年人进行调查,所得数据如下表所示:积极支持教育改革不太赞成教育改革合计大学专科以上学历39 157 196大学专科以下学历29 167 196合计68 324 392对于教育机构的研究项目,根据上述数据能得出什么结论.18.1907 年一项关于 16 艘轮船的研究中,船的吨位区间位于 192 吨到3246 吨,船员的人数从 5 人到32 人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差 1000 吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?19.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线(1)(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从 3~16 岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.20.某个服装店经营某种服装,在某周内获纯利 y(元),与该周每天销售这种服装件数 x 之间的一组数据关系见表:7已知∑ x 2= 280 , ∑ y 2= 45309 , ∑ x y= 3487 .(1) i 求=1ix ,y ;ii =1 i ii =1(2) 画出散点图; (3) 判断纯利 y 与每天销售件数 x 之间是否线性相关,如果线性相关,求出回归方程.2 3 21. 甲、乙两人各射击一次,击中目标的概率分别是 和 .假设两人射击是否击中目标相互之间没有影响;每人各3 4次射击是否击中目标,相互之间也没有影响.(1) 求甲射击 4 次,至少有 1 次未击中目标的概率;(2) 假设某人连续 2 次未击中目标,则中止其射击.问:乙恰好射击 5 次后,被中止射击的概率是多少?第一章 统计案例检测题答案一、选择题1-5 BDACB 6-10 ACCBB二、填空题 11. -0.1229 3 12.39013. 16.37314. 约为 6.323cm ;(5)回归系数与每年平均增长的身高之间近似相等. 15. 95%四、解答题20. 解 : ( 1)x =3 +4 +5 +6 +7 +8 +9 = 6 ,716. 1 1 166 + 69 + 73 + 81+ 89 + 90 + 91解:因甲、乙、丙去北京旅游的概率分别为 ,, .3 4 52 3 4y = ≈ 79.86 ;7(2) 略; 因此,他们不去北京旅游的概率分别为 ,,,所以,3 4 52 3 4 3(3)由散点图知,y 与 x 有线性相关关系, 至少有 1 人去北京旅游的概率为 P =1- × × = .3 4 5 5 2 392⨯ (39⨯167 -157 ⨯ 29)2设回归直线方程: y = bx + a , 17. 解: K = 196⨯196⨯ 68⨯ 324≈ 1.78 .3487 - 7 ⨯ 6⨯ 559 7 133因为1.78 < 2.706 ,所以我们没有理由说人具有大学专 b = 280 - 7 ⨯ 36= = 4.75 ,28科以上学历(包括大学专科)和对待教育改革态度有关.18. 解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6, ∴船员平均相差 6 人;a = 79.86 - 6⨯ 4.75 = 51.36 . ∴回归直线方程 y = 4.75x + 51.36 .21.解:(1)记“甲连续射击 4 次至少有 1 次未击中目标”为事件 A 1.由题意,射击 4 次,相当于作 4 次独立重复试验.2 65 故 P (A 1)=1-P (A 1)=1-( )4= ,( 2) 最小的船估计的船员数为: 9.1+0.006× 192=9.1+1.152=10.252≈10(人).最 大 的 船 估 计 的 船 员 数 为 : 9.1+0.006× 3246=9.1+19.476=28.576≈28(人). 19.解:(1)数据的散点图如下:(2) 用 y 表 示身高,x 表示年龄,则数据的回归3 81所以甲连续射击 4 次至少有一次未击中目标的概率为65. 1(2)记“乙恰好射击 5 次后被中止射击”为事件 A 3,“乙第 i 次射击未击中”为事件 D i (i =1,2,3,4,5),则 1 A 3=D 5D 4·D 3·(D 2D 1),且 P (D i )= .4 由于各事件相互独立,故 P (A 3)=P (D 5)·P (D 4)·P (D 3)·P (D 2D 1) 1 1 3 1 1 45 = × × ×(1- × )= . 4 4 4 4 4 1 02445方程为 y =6.317x +71.984;(3) 在该例中,回归系数 6.317 表示该人在一年中增加的高度;(4) 每年身高的增长数略.3~16 岁身高的年均增长数 所以乙恰好射击 5 次后被中止射击的概率为 .1 02458。
第九章 统计9.3 统计案例 公司员工的肥胖情况调查分析(基础练)一、单选题(共5小题,满分25分,每小题5分)1.甲、乙两名射击运动员分别进行了5次射击训练,成绩(单位:环)如下: 甲:7,8,8,8,9 乙:6,6,7,7,10;若甲、乙两名运动员的平均成绩分别用21,x x 表示,方差分别为 2221,s s 表示,则( )A.21x x >, 2221s s > B.21x x >, 2221s s < C.21x x <, 2221s s < D.21x x <, 2221s s >【答案】 B【解析】85988871=++++=x , 2.751077661=++++=x ,故 21x x > .s 21;s22, 故s s 2221< , 故选:B.2.已知数据x 1,x 2,x 3,…,x n 是上海普通职工n(n ≥3,n ∈N *)个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则在这n +1个数据中,下列说法不正确的是( ) A .年收入平均数大大增大 B .中位数可能不变 C .方差变大 D .方差可能不变【答案】D【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为加入此数据更加分散而变大.故选:D3.一组数据的方差为2s ,平均数为x ,将这组数据中的每一个数都乘以2,所得的一组新数据的方差和平均数分别为( ) A .212s ,12x B .22s ,2x C .24s ,2x D .2s ,x【答案】C【解析】设该组数据为123,,,,n x x x x ,将这组数据中的每一个数都乘以2,则有1232,22,,2,n x x x x ⋯,平均数为2x .又()()()2222121n s x x x x x x n ⎡⎤=⨯-+-++-⎢⎥⎣⎦,则新数据的方差为()()()22221212222224n x x x x x x s n ⎡⎤⨯-+-++-=⎣⎦, 故选:C.4.如图是某公司2020年1月到10月的销售额(单位:万元)的折线图,销售额在35万元以下为亏损,超过35万元为盈利,则下列说法错误的是( )A .这10个月中销售额最低的是1月份B .从1月到6月销售额逐渐增加C .这10个月中有3个月是亏损的D .这10个月销售额的中位数是43万元 【答案】B【解析】根据折线图知,这10个月中销售额最低的是1月份,为30万元,所以A 正确; 从1月到6月销售额是先增加后减少,再增加,所以B 错误;1月,3月和4月的销售额低于35万元,其它月份都高于35万元,所以C 正确; 这10个月的销售额从小到大排列为30,32,34,40,41,45,48,60,78,80万元, 其中位数是()14145432⨯+=万元,所以D 正确. 故选:B 5.某校从参加高一年级期末考试的学生中抽取60名学生的成绩(均为整数),其成绩的频率分布直方图如图所示,由此估计此次考试成绩的中位数,众数和平均数分别是( )A.73.3,75,72 B.73.3,80,73C.70,70,76 D.70,75,75【答案】A【解析】由频率分布直方图知,小于70的有24人,大于80的有18人,则在[70,80]之间18人,所以中位数为70103+≈73.3;众数就是分布图里最高的小矩形底边的中点,即[70,80]的中点横坐标,是75;平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.故选: A.二、多选题(共3小题,满分15分,每小题5分,少选得3分,多选不得分)6.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是()A.甲的化学成绩领先年级平均分最多.B.甲有2个科目的成绩低于年级平均分.C.甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果. 【答案】A【解析】根据雷达图,可知物理成绩领先年级平均分最多,即A 错误; 甲的政治、历史两个科目的成绩低于年级平均分,即B 正确; 甲的成绩最好的前两个科目是化学和地理,即C 正确;对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D 正确. 故选:A.7.某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是( )A .该地区城乡居民储蓄存款年底余额总数逐年上升B .到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C .城镇居民存款年底余额逐年下降D .2017年城乡居民存款年底余额增长率大约为225% 【答案】AD【解析】由条形图可知,余额总数逐年上升,故A 项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B 项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C 项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D 项正确.故选:AD. 8.如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年总销售量为4870台D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC 三、填空题(共3小题,满分15分,每小题5分,一题两空,第一空2分)9.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为_________ 【答案】0.7【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7. 故答案为:0.710.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为 . 【答案】10【解析】设样本数据为:12345,,,,x x x x x ()1234557x x x x x ∴++++÷=()()222157754s x x ⎡⎤=-++-÷=⎣⎦()()22151********,35x x x x x x x ∴-++-=++++=若样本数据中的最大值为11,不妨设511x =,由于样本数据互不相同,与()()22157720x x -++-=这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为 10, 故答案为:1011.为实现国民经济新“三步走”的发展战略目标,国家加大了扶贫攻坚的力度.某地区在2015 年以前的年均脱贫率(脱离贫困的户数占当年贫困户总数的比)为.2015年开始,全面实施“精准扶贫”政策后,扶贫效果明显提高,其中2019年度实施的扶贫项目,各项目参加户数占比(参加该项目户数占 2019 年贫困户总数的比)及该项目的脱贫率见下表:实施项目 种植业 养殖业 工厂就业 服务业 参加用户比脱贫率那么2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的______倍 【答案】 【解析】设贫困户总数为a,脱贫率,所以 .故 2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的 倍. 故答案为:四、解答题:(本题共3小题,共45分。
统计学案例分析单选题100道及答案解析1. 为了了解某工厂生产的一批灯泡的使用寿命,从中抽取了100 只进行检测,在这个问题中,样本是()A. 工厂生产的一批灯泡B. 抽取的100 只灯泡C. 100D. 每只灯泡的使用寿命答案:B解析:样本是从总体中抽取的一部分个体,这里抽取的100 只灯泡就是样本。
2. 一组数据的最大值与最小值之差称为()A. 极差B. 方差C. 标准差D. 平均差答案:A解析:极差是一组数据中的最大值减去最小值。
3. 下列指标中,属于位置平均数的是()A. 算术平均数B. 调和平均数C. 几何平均数D. 中位数答案:D解析:中位数是将数据排序后,位于中间位置的数值,属于位置平均数。
4. 若一组数据的偏态系数为0,则该组数据的分布为()A. 对称分布B. 右偏分布C. 左偏分布D. 无法确定答案:A解析:偏态系数为0 时,数据分布为对称分布。
5. 抽样调查中,样本容量的确定取决于()A. 总体标准差B. 允许误差C. 抽样方法D. 以上都是答案:D解析:样本容量的确定需要考虑总体标准差、允许误差和抽样方法等因素。
6. 在假设检验中,原假设和备择假设()A. 只有一个成立B. 都有可能成立C. 都有可能不成立D. 原假设一定成立,备择假设不一定成立答案:A解析:原假设和备择假设相互对立,只有一个成立。
7. 对于两个变量之间的线性相关程度,常用()来衡量。
A. 相关系数B. 决定系数C. 回归系数D. 残差平方和答案:A解析:相关系数用于衡量两个变量之间的线性相关程度。
8. 下列哪种抽样方法不是概率抽样()A. 简单随机抽样B. 系统抽样C. 方便抽样D. 分层抽样答案:C解析:方便抽样是非概率抽样方法。
9. 一组数据的标准差越大,说明()A. 数据的离散程度越大B. 数据的离散程度越小C. 平均数越大D. 平均数越小答案:A解析:标准差越大,数据的离散程度越大。
10. 若一组数据服从正态分布,则其均值和中位数的关系是()A. 均值大于中位数B. 均值小于中位数C. 均值等于中位数D. 无法确定答案:C解析:正态分布的数据,均值等于中位数。
高中统计案例试题及答案一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 一组数据的中位数是所有数据排序后位于中间位置的数值,如果数据个数为奇数,则中位数是:A. 第一个数据B. 最后一个数据C. 位于中间位置的数值D. 无法确定答案:C3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 折线图D. 散点图答案:C二、填空题4. 某班级有30名学生,他们的数学成绩分别为:70, 85, 90, 75, 95, 80, 85, 70, 80, 90, 85, 95, 75, 70, 80, 90, 85, 95, 75, 70, 80, 85, 90, 95, 75。
这组数据的平均数是____。
答案:825. 如果一组数据的方差是25,那么它的标准差是____。
答案:5三、简答题6. 描述统计学中的“样本”和“总体”的概念,并举例说明。
答案:在统计学中,“总体”指的是研究对象的全体,而“样本”是从总体中随机抽取的一部分个体。
例如,如果我们想要了解全国高中生的数学成绩水平,全国所有高中生的数学成绩就是总体,而如果我们随机抽取了1000名高中生的数学成绩进行研究,这1000名高中生的数学成绩就是我们的样本。
四、计算题7. 某工厂生产了一批零件,其长度的测量数据如下:20, 22, 21, 23, 20, 21, 22, 21, 22, 23。
请计算这组数据的平均数、中位数、方差和标准差。
答案:平均数 = (20+22+21+23+20+21+22+21+22+23) / 10 = 21.5中位数 = (21+22) / 2 = 21.5方差 = [(20-21.5)² + (22-21.5)² + ... + (23-21.5)²] / 10 = 1.65标准差= √1.65 ≈ 1.29结束语:通过上述试题及答案,我们可以看出,统计学是一门应用广泛的学科,它可以帮助我们更好地理解和分析数据。
第一章 统计案例 测试题一、选择题1.下列属于相关现象的是( ) A.利息与利率B.居民收入与储蓄存款 C.电视机产量与苹果产量D.某种商品的销售额与销售价格2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( )A.310B.29C.78D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( )A.E B.C C.D D.A4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100%5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99%6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏 温度 5-0 4 7 12 15 19 23 27 31 36热饮 杯数156 150 132 128 130 116 104 89 93 76 54如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143 C.200 D.243 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55女婴 8 26 34合计 32 57 8910.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:优秀 不优秀 合计 甲班 10 35 45 乙班 7 38 45 合计 17 73 90利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于( ) A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7 二、填空题11.某矿山采煤的单位成本Y 与采煤量x 有关,其数据如下: 则Y 对x 的回归系数 . 12.对于回归直线方程4.75257y x =+,当28x =时,y 的估计值为 . 13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不=是因为患心脏病而住院的男性病人中有175人秃顶,则2χ .14.设A 、B 为两个事件,若事件A 和B 同时发生的概率为310,在事件A 发生的条件下,事件B 发生的概率为12,则事件A 发生的概率为________________. 15.由一个 2*2 列联表中数据计算得 2χ = 4.013 ,有__________ 把握认为两个变量有关系.三、解答题 16.国庆节放假,甲去北京旅游的概率为13,乙、丙去北京旅游的概率分别为14,15.假定三人的行动相互之间没有影响,求这段时间内至少有1人去北京旅游的概率17.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论. 采煤量 (千吨)289 298 316 322 327 329 329 331 350单位成本 (元)43.5 42.9 42.1 39.6 39.1 38.5 38.0 38.0 37.0积极支持教育改革 不太赞成教育改革 合计大学专科以上学历 39 157 196 大学专科以下学历 29 167 196合计 68 324 39218.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?19.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:年龄/周3 4 5 6 7 8 9岁身高/cm 90.8 97.6 104.2 110.9 115.6 122.0 128.5年龄/周10 11 12 13 14 15 16岁身高/cm 134.2 140.8 147.6 154.2 160.9 167.6 173.0(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.20.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:已知721280i i x ==∑,72145309i i y ==∑,713487i i i x y ==∑.(1)求x y ,;(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.21.甲、乙两人各射击一次,击中目标的概率分别是23和34.假设两人射击是否击中目标相互之间没有影响;每人各次射击是否击中目标,相互之间也没有影响.(1)求甲射击4次,至少有1次未击中目标的概率;(2)假设某人连续2次未击中目标,则中止其射击.问:乙恰好射击5次后,被中止射击的概率是多少? x3 4 5 6 7 8 9 y66 69 73 81 89 90 91第一章 统计案例检测题答案一、选择题1-5 BDACB 6-10 ACCBB 二、填空题11.0.1229- 12. 390 13. 16.373 14.35 15. 95% 四、解答题16.解:因甲、乙、丙去北京旅游的概率分别为13,14,15.因此,他们不去北京旅游的概率分别为23,34,45,所以,至少有1人去北京旅游的概率为P =1-23×34×45=35.17.解:22392(3916715729) 1.7819619668324K ⨯⨯-⨯=≈⨯⨯⨯.因为1.78 2.706<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.18. 解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6, ∴船员平均相差6人;(2)最小的船估计的船员数为:9.1+0.006×192=9.1+1.152=10.252≈10(人).最大的船估计的船员数为:9.1+0.006×3246=9.1+19.476=28.576≈28(人).19.解:(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为y =6.317x +71.984;增加的高度;(4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm ;(5)回归系数与每年平均增长的身高之间近似相等. 20. 解:(1)345678967x ++++++==,6669738189909179.867y ++++++=≈;(2)略;(3)由散点图知,y 与x 有线性相关关系, 设回归直线方程:y bx a =+, 5593487761337 4.7528073628b -⨯⨯===-⨯,79.866 4.7551.36a =-⨯=. ∴回归直线方程4.7551.36y x =+. 21.解:(1)记“甲连续射击4次至少有1次未击中目标”为事件A 1.由题意,射击4次,相当于作4次独立重复试验.故P (A 1)=1-P (A 1)=1-(23)4=6581,所以甲连续射击4次至少有一次未击中目标的概率为6581. (2)记“乙恰好射击5次后被中止射击”为事件A 3,“乙第i 次射击未击中”为事件D i (i =1,2,3,4,5),则A 3=D 5D 4·D 3·(D 2D 1),且P (D i )=14.由于各事件相互独立,故P (A 3)=P (D 5)·P (D 4)·P (D 3)·P (D 2D 1) =14×14×34×(1-14×14)=451 024. 所以乙恰好射击5次后被中止射击的概率为451 024.。
C.没有理由说它们有关D.不确定统计案例专题练习(高二文)'、知识点归纳1. 线性回归方程① 变量之间的两类关系: 函数关系与相关关系;②制作散点图,判断线性相关关系③线性回归方程:(最小二乘法)注意:线性回归直线经过定点。
2.相关系数(判定两个变量线性相关性) :注:⑴>0时,变量正相关;<0时,变量负相关;(2)越接近于1,两个变量的线性相关性越强; 接近于0时,两个变量之间几乎不存在线性相关关系。
3.回归分析中归效果的判定: (1 )回归平方和:一 相关指数。
注:①得知越大,说明残差平方和越小,则模型拟合效果越好;② 越接近于1,则回归效果越好。
一bc)2(n -f- b) (c + d) (H + c) (b d)一、选择题1•下列属于相关现象的是( A. 利息与利率C.电视机产量与苹果产量 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费; ③ 家庭的支出与收入.其中不是函数关系的有()A. 0个B. 1个C. 2个D. 3个 4.当时,认为事件与事件( )A.有的把握有关B.有的把握有关)E.居民收入与储蓄存款D.某种商品的销售额与销售价格2.如果有95%勺把握说事件A 和B 有关,那么具体算出的数据满足(A.B. C. D.5•已知回归直线方程,其中且样本点中心为,则回归直线方程为(6.为了考察中学生的性别与是否喜欢数学课程之间的关系, 在某校中学生中随机抽取了 300名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有()&在回归直线方程中,回归系数表示(9.对于回归分析,下列说法错误的是(A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B. 线性相关系数可以是正的,也可以是负的11、 一位母亲记录了儿子 3〜9岁的身高,由此建立的身高与年龄的回归模型为 y=+用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定是 145.83cm;B.身高在145.83cm 以上;C.身高在145.83cm 以下; D. 身高在145.83cm 左右.12、 两个变量y 与x 的回归模型中,分别选择了 4个不同模型,它们的相关指数R 2如下其中拟合效果最好的模型是()A.模型1的相关指数R 2为B.模型2的相关指数R 2为C.模型3的相关指数R 2为D.模型4的相关指数R 2为14、工人月工资y (元)依劳动生产率 x (千元)变化的回归直线方程为 ? 60 90x ,下列判断正确的是()A.E. C. D.A. 0B. C. D.A.当时,的平均值B.X 变动一个单位时, y 的实际变动量C. y 变动一个单位时,x 的平均变动量D.x 变动一个单位时,y 的平均变动量C.回归分析中,如果,说明 x 与y 之间完全相关 10.在画两个变量的散点图时,下面哪个叙述是正确的 (A )预报变量在x 轴上,解释变量在 y 轴上 (B ) (C )可以选择两个变量中任意一个变量在D.样本相关系数 ()解释变量在x 轴上,预报变量在 y 轴上X 轴上(D )选择两个变量中任意一个变量在 y 轴上A.劳动生产率为1000元时,工资为50元B.劳动生产率提高 1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高 90元D.劳动生产率为1000元时,工资为90元15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘 积相差越大两个变量有关系的可能性就( )A.越大B. 越小C.无法判断D. 以上都不对16、对分类变量X 与Y 的随机变量K 2的观测值K ,说法正确的是()A . k 越大,” X 与Y 有关系”可信程度越小;B . k 越小,” X 与Y 有关系”可信程度 越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大,” X 与Y 无关”程度越大17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A. 若K 2的观测值为k=,我们有99%勺把握认为吸烟与患肺病有关系,那么在 100个吸烟的人 中必有99人患有肺病;B. 从独立性检验可知有 99%勺把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有 99%勺可能患有肺病;C. 若从统计量中求出有 95%的把握认为吸烟与患肺病有关系, 是指有5%的可能性使得推判出现错误;D. 以上三种说法都不正确.18、 设两个变量x 和y 之间具有线性相关关系,它们的相关系数是 r , y 关于x 的回归直线 的斜率是b ,纵截距是a ,那么必有( )A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反 19、则y A. (2, 2)点 B. (, 0)点 C. (1, 2)点 D. (, 4)点 20、已知回归直线的斜率的估计值是,样本点的中心为 21、为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究, 利用线性回归方法得到回归直线方程l 1和丨2,两人计算知x 相同,y 也相同,下列正确的是()A. h 与12重合B. l 1与12 —定平行C. h 与12相交于点(x,y )D.无法判断h 和丨2是否 相交(4 , 5),则回归直线的方程是()A.y =+ 4B.y =+5C.y =+D .y =+22、下列说法正确的有() ①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
病 D. 以上都是错误的24.某化工厂为预测某产品的回收率 y ,需要研究它和原料有效成份含量之间的相关关系,现取了 8对观测值,计算得:,,,,则与x 的回归直线方程是( )A. B. C.D.25.如图所示,图中有 5组数据,去掉B 组数据后,剩下的4组数据的线 性相关性最大( )A.B.C.D.26.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了 9965人,得到如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( )A.B.C.D.27•调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:A.①②B.②③ C. ③④23、考察棉花种子经过处理跟生病之间的关系 得到如下表数据:根据以上数据,则 ()A.种子经过处理跟是否生病有关B. 种子经过处理跟是否生病无关 C.种子是否经过处理决定是否生D.①③A. B. C. D.28. 已知线性相关关系的两个变量建立的回归直线方程为,方程中的回归系数 b ()A.可以小于0B.只能大于0C.可以为0D.只能小于029. 每一吨铸铁成本(元)与铸件废品率建立的回归方程,下列说法正确的是()A.废品率每增加1%成本每吨增加64元B.废品率每增加1%成本每吨增加8%C.废品率每增加1%成本每吨增加8元D.如果废品率增加1%则每吨成本为56元30. 下列说法中正确的有:①若,则x增大时,y也相应增大;②若,则x 增大时,y也相应增大;③若,或,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上()A.①②B.②③C.①③D.①②③二、填空题31.___________________________________________ 对于回归直线方程,当时,的估计值为.32._______________________________ 直线回归方程恒过定点 .34、若一组观测值(X1,y 1)(X2,y x n,y n)之间满足y i=bx i+a+e (i=1 、2.…n)若e i恒为0,贝U R2为_____________35、若有一组数据的总偏差平方和为100,相关指数为,则期残差平方和为_________ 回归平方和为 ___37、某考察团对全国10大城市进行职工人均平均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程? 0.66x 1.562 (单位:千元),若某城市居民消费水平为估计该城市消费额占人均工资收入的百分比为()三、解答题38、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的你认为婴儿的性别与出生时间有关系的把握为()关系,随机抽取了392名成年人进行调查,所得数据如下表所示:39、某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表:四、课下练习1. 在画两个变量的散点图时,下面哪个叙述是正确的 A.预报变量在x 轴上,解释变量在 C.可以选择两个变量中任意一个在2. 下列说法正确的有()①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A. ①②B.②③C.③④D.①③3. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ()A.总偏差平方和B. 残差平方和C. 回归平方和D.相关指数R 24. 下列结论正确的是() ①函数关系是一种确定性关系;②相关关系是一种非确定性关系③ 回归关系是对具有函数关系的两个变量进行统计分析的一种方法 ④ 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①② B. ①②③ C. ①②④ D. ①②③④5. 已知回归直线的斜率的估计值是,样本点的中心为(4,5),则回归直线的方程是()A. y =+ 4B.y =+5 C. y =+ D. y =+40、若两个分类变量 X 与Y 的列联表为:则“ X 与Y 之间有关系”这个结论出错的可能性为多少?y 轴上 B. x 轴上 D.()解释变量在x 轴上,预报变量在 y 轴上 以选择两个变量中任意一个在y 轴上6回归分析中,相关指数R2的值越大,说明残差平方和()A.越小B. 越大C.可能大也可能小D. 以上都不对7若回归直线方程中的回归系数b=0时,则相关系数r=()B. —1C.0D.无法确定8利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X% %。