课时作业(五十五)
第55讲 变量的相关性与统计案例 [时间:45分钟 分值:100分]
基础热身 1.[2011·广东六校联考] 有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积;
⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( )
A .①③
B .②④
C .②⑤
D .④⑤ 2.[2011·丰台二模] 已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且
回归方程为y ^
=0.95x +a ,则a =( )
A.3.25 B .2.6 C .3.[2011·大连双基检测] 为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好都为s ,变量y 的观测数据的平均值恰好都为t ,那么下列说法中正确的是( )
A .直线l 1,l 2有公共点(s ,t )
B .直线l 1,l 2相交,但是公共点未必是(s ,t )
C .由于斜率相等,所以直线l 1,l 2必定平行
D .直线l 1,l 2必定重合 4.[2011·新余二模] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进
则至少有)
附:K 2
=n (ad -bc )2
5.观察下列散点图,则①正相关;②负相关;③不相关,它们的排列顺序与图形相对应的是( )
A .a —①,b -②,c -③
B .a -②,b -③,c -①
C .a -②,b -①,c -③
D .a -①,b -③,c -②
6.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系
B .都可以用一条直线近似地表示两者的关系
C .都可以作出散点图
D .都可以用确定的表达式表示两者的关系 7.[2011·江西卷] 为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下
则y 对x A .y =x -1 B .y =x +1
C .y =88+1
2
x D .y =176
8.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病
C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D .以上三种说法都不正确 9.[2011·枣庄二模] 某单位为了了解用电量y (kW·h)与气温x (℃)之间的关系,随机统
计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程y ^
=-2x +a ,预测当气温为-4℃时,用电量约为( )
A.68 kW·h B C .66 kW·h D .65 kW·h 10.[2010·广东卷] 市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)
有________线性相关关系.
11.[2011·辽宁卷] 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的
回归直线方程:y ^
=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
12.[2011·九江六校三联] 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:
若由资料可知y 对x 呈线性相关关系,且线性回归方程为y =a +bx ,其中已知b =1.23,
请估计使用年限为20年时,维修费用约为________.
13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.
14.(10分)
(1)(2)根据上表提供的数据,求出y 关于x 的线性回归方程; (3)据此估计广告费用为10万元时,所得的销售收入.
(参考数值:∑i =1
5
x 2i =145,∑i =1
5
x i y i =1270)
15.(13分)[2011·巢湖质检] 地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视.某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛.图K55-2(1)和图K55-2(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.
图K55-2
(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)
(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常
附:K 2=(a +b )(c .临界值表:
难点突破
16.(12分)[2011·揭阳一模] 某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:g),重量值落在(495,510]的产品为合格品,否则为不合格品.下表是甲流水线样本频数分布表,图K55-3是乙流水线样本的频率分布直方图.
(1)根据上表数据作出甲流水线样本的频率分布直方图;
(2)若以频率作为概率,试估计从甲、乙两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少?
(3)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为“产品的包装质量
参考公式:K2=
n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
,其中n=a+b+c+d
课时作业(五十五)
【基础热身】
1.C [解析] 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.
2.B [解析] x =2,y =4.5,因为回归方程经过点(x ,y ),所以a =4.5-0.95×2=2.6,故选B.
3.A [解析] 因为甲、乙两组观测数据的平均值都是(s ,t ),则由最小二乘法知线性回
归直线方程为y ^
=bx +a ,而a =y -b x ,(s ,t )在直线l 1,l 2上,故选A.
4.99.5% [解析] K 2
=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50(20×15-5×10)2
25×25×30×20
=8.333>7.879,
则至少有99.5%的把握认为喜爱打篮球与性别有关.
【能力提升】
5.D [解析] 变量的相关性的图形表示法,在相关变量中,图a 从左下角到右上角是正相关,图c 从左上角到右下角是负相关,图b 的点分布不规则是不相关,故选D.
6.C [解析] 给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或函数关系,故选C.
7.C [解析] 由表中数据知回归直线是上升的,首先排除D.x =176,y =176,由线性回归性质知:点(x ,y )=(176,176)一定在回归直线上,代入各选项检验,只有C 符合,故选C.
8.C [解析] 根据独立性检验的思想知,某人吸烟,只能说其患肺病的可能性较大,有99%的把握认为吸烟与患肺病有关系,但并没有理由认为吸烟者有99%的可能患肺病,故选C.
9.A [解析] 由表中数据,得x =14(18+13+10-1)=10,y =1
4
(24+34+38+64)=
40,
因为点(x ,y )在回归直线上,则40=-2×10+a ,a =60,
当x =-4时,y ^
=-2×(-4)+60=68,故选A.
10.13 正 [解析] 本题考查了统计中的线性相关关系、中位数等知识点,该知识点在高考考纲中是A 级要求.
11.0.254 [解析] 由题意得y ^2-y ^
1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
12.24.68万元 [解析] 易求得(x ,y )=(4,5),所以a =y -b x =5-1.23×4=0.08, 所以y ^
=0.08+1.23x ,
当x =20时,维修费用约为0.08+1.23×20=24.68.
13.① [解析] K 2≈3.918>3.841,而P (K 2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.
14.[解答] (1)散点图如图所示:
(2)x =2+4+5+6+8
5
=5,
y =
20+30+50+50+70
5
=44,
∑i = 15
x 2i = 22 + 42 + 52 + 62 + 82
= 145,
∑i =1
5
x i y i =2×20+4×30+5×50+6×50+8×70=1 270,
b = ∑i = 1
5
x i y i -5x y ∑i = 1
5x 2i -5x
2
=
1270-5×5×44
145-5×25
= 8.5,
a =y -
-b x =44-8.5×5=1.5,
因此回归直线方程为y =8.5x +1.5.
(3)当x =10时,y =8.5×10+1.5=86.5. 15.[解答] (1)七年级学生竞赛平均成绩为 (45×30+55×40+65×20+75×10)÷100=56(分), 八年级学生竞赛平均成绩为
(45×15+55×35+65×35+75×15)÷100=60(分). (2)2×2列联表如下:
∴K 2=200×(50×30-50×70)100×100×120×80
≈8.333>6.635,
∴有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”. 【难点突破】
16.[解答] (1)
(2) (0.06+0.09+0.03)×5×40=36,
故甲样本合格品的频率为30
40=0.75,
乙样本合格品的频率为36
40
=0.9,
据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75, 从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:
∵K2=
n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
=
80×(120-360)
66×14×40×40
≈3.117>2.706.
∴有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关.
1.【2015·新课标II】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); 价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.【2015·福建】某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率; (Ⅱ)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望.
3.【2015·山东】若n是一个三位正整数,且n的个位数字大于十位数字,十位数字大于百位数字,则称n为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10 分;若能被10整除,得1分. 整除,得1 (I)写出所有个位数字是5的“三位递增数” ; (II)若甲参加活动,求甲得分X的分布列和数学期望EX. 4.【2015·安徽】已知2件次品和3件正品放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束. (Ⅰ)求第一次检测出的是次品且第二次检测出的是正品的概率; (Ⅱ)已知每检测一件产品需要费用100元,设X表示直到检测出2件次品或者检测出3件正品时所 需要的检测费用(单位:元),求X的分布列和均值(数学期望).
统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:
s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样
高中数学之概率与统计 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m ; 等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ; 设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式 ()m P A n = 求值; 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的 概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: 求概率的步骤是: 第一步,确定事件性质?? ?? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算 ?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1. 在五个数字12345,,,,中,。 例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [解答过程]0.3提示:13 35C 33. 54C 10 2P ===?
第十三章概率与统计本章知识结构图
第一节 概率及其计算 考纲解读 1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。 2.了解两个互斥事件的概率的加法公式。 3.掌握古典概型及其概率计算公式。 4.了解随机数的意义,能运用模拟方法估计概率。 5.了解几何概型的意义。 命题趋势探究 1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。 2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。 知识点精讲 一、必然事件、不可能事件、随机事件 在一定条件下: ①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件。 二、概率 在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。对于必然事件A ,;对于不可能事件A ,=0. 三、基本事件和基本事件空间 在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。 四、两个基本概型的概率公式 1、古典概型 条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A) = ()A card P A card = Ω包含基本事件数基本事件总数 2、几何概型 条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为 A μ.
()P A = A μμΩ 。 五、互斥事件的概率 1、互斥事件 在一次实验中不能同时发生的事件称为互斥事件。事件A 与事件B 互斥,则 ()()() P A B P A P B =+U 。 2、对立事件 事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。 ()() 1P A p A =- 。 3、互斥事件与对立事件的联系 对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。 题型归纳及思路提示 题型176 古典概型 思路提示 首先确定事件类型为古典概型,古典概型特征有二:有限个不同的基本事件及各基本事件发生的可能性是均等的;其次计算出基本事件的总数及事件A 所包含的基本事件数;最后计算 ()A P A = 包含基本事件数 基本事件总数。 例13.1 设平面向量(),1m a m =,()2,n b n = ,其中{}, 1.2,3,4m n ∈ (1)请列出有序数组(),m n 的所有可能结果; (2) 若“使得()m m n a a b ⊥-成立的(),m n 为事件A ,求事件A 发生的概率。 分析:两向量垂直的充要条件是两向量的数量积为0,从而可得m 与n 的关系,再从以上 (),m n 的16个有序数组中筛选出符合条件的,即得事件A 包含的基本事件个数。 解析:(1)由{}, 1.2,3,4m n ∈,有序数组(),m n 的所有可能结果为()1,1 , ()()() 1,2,1,3,1,4, ()()()() 2,1,2,2,2,3,2,4, ()()()() 3,1,3,2,3,3,3,4, ()()()()4,1,4,2,4,3,4,4 共16个。 (2)因为(),1m a m =,()2,n b n =,所以()2,1m n a b m n -=-- .又()m m n a a b ⊥-,得 ()(),12,10m m n ?--= ,即22m 10m n -+-= ,所以()21n m =- 。故事件A 包含的
全国一卷真题分析---概率统计 1.(2011年)根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的 概率为0.3,设各车主购买保险相互独立. (Ⅰ)求该地1位车主至少购买甲、乙两种保险中的l种的概率; (Ⅱ)X表示该地的l00位车主中,甲、乙两种保险都不购买的车主数.求X的期望. 2.(2012年)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果 当天卖不完,剩下的玫瑰花作垃圾处理.(Ⅰ)若花店一天购进16朵玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,N n )的函数解析式;(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 以100天记录的各需求量的频率作为 各需求量发生的概率. (ⅰ)若花店一天购进16枝玫瑰花,X表示当天的利润(单位:元),求X的分布列、数学期望及方差; (ⅱ)若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由. 3.(2013年)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中 优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下, 这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为1 2, 且各件产品是否为优质品相互独立. (1)求这批产品通过检验的概率; (2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望. 1
§10.2统计及统计案例 考纲解读 分析解读
从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
11 12 13 3 5 7 2 2 4 6 9 1 5 5 7 图1 统计与概率专题 一、知识点 1、随机抽样:系统抽样、简单随机抽样、分层抽样 1、用简单随机抽样从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的概率是( ) A . 1001 B .251 C .5 1 D . 5 1 2、为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为( ) A .40 B .30 C .20 D .12 3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A .3人 B .4人 C .7人 D .12人 2、古典概型与几何概型 1、一枚硬币连掷3次,只有一次出现正面的概率是( ) A .83 B .32 C .31 D .4 1 2、如图所示,在正方形区域任意投掷一枚钉子,假设区域内每一点被投中的可能性相等,那么钉子投进阴影区域的概率为____________. 3、线性回归方程 用最小二乘法求线性回归方程系数公式1 2 211 ???n i i i n i x y nx y b a y bx x nx ==-==--∑∑,. 二、巩固练习 1、随机抽取某中学12位高三同学,调查他们春节期间购书费用(单位:元),获得数据的茎叶图如图1, 这12位同学购书的平均费用是( ) A.125元 B.5.125元 C.126元 D.5.126元 2、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,时速在[50,60) 的汽车大约有( ) A .30辆 B . 40辆 C .60辆 D .80辆 3、某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师 的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其 他教师中共抽取了16人,则该校共有教师 ______人. 4、执行下边的程序框图,若0.8p =,则输出的n = . 0.04 0.030.020.01频率 组距时速8070605040开始 10n S ==, S p 是 输入p 结束 输出n 12n S S =+ 否 1n n =+ (第12题图)
统计概率大题题型总结 题型一 频率分布直方图与茎叶图 例1.(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如 图所示,其中茎为十位数,叶为个位数. (Ⅰ) 根据茎叶图计算样本均值; (Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人; (Ⅲ) 从该车间12名工人中,任取2人,求恰有名优秀工人的概率. 例2.(2013新课标Ⅱ理)经销商经销某种农产品,在一个销售季度内,每售出t 该产品获利润500 元,未售出的产品,每t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t 该农产品,以X (单位:t,150100≤≤X )表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内销商该农产品的利润. (Ⅰ)将T 表示为X 的函数; (Ⅱ)根据直方图估计利润T 不少于57000元的概率; 1 7 9 2 0 1 5 3 0 第17题图
(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若[100,110)X ∈,则取105X =,且105X =的概率等于需求量落入[100,110)的概率),求利润T 的数学期望. 变式1. 【2015高考重庆,理3】重庆市2013年各月的平均气温(o C )数据的茎叶图如下: 08912 58 200338312 则这组数据的中位数是( ) A 、19 B 、20 C 、21.5 D 、23 /频率组距0.010 0.0150.0200.0250.030100110120130140150需求量/x t
高考数学概率与统计 SANY GROUP system office room 【SANYUA16H-
第16讲概率与统计 概率内容的新概念较多,相近概念容易混淆,本课时就学生易犯错误作如下归纳总结: 类型一“非等可能”与“等可能”混同 例1 掷两枚骰子,求所得的点数之和为6的概率. 错解掷两枚骰子出现的点数之和2,3,4,…,12共11种基本事件,所以概率为 P=1 11 剖析以上11种基本事件不是等可能的,如点数和2只有(1,1),而点数之和为6有(1,5)、(2,4)、(3,3)、(4,2)、(5,1)共5种.事实上,掷两枚骰子共有36 种基本事件,且是等可能的,所以“所得点数之和为6”的概率为P=5 36 . 类型二“互斥”与“对立”混同 例2 把红、黑、白、蓝4张纸牌随机地分给甲、乙、丙、丁4个人,每个人分得1张,事件“甲分得红牌”与“乙分得红牌”是() A.对立事件 B.不可能事件 C.互斥但不对立事件 D.以上均不对 错解A 剖析本题错误的原因在于把“互斥”与“对立”混同,二者的联系与区别主要体现在: (1)两事件对立,必定互斥,但互斥未必对立;(2)互斥概念适用于多个事件,但对 立概念只适用于两个事件;(3)两个事件互斥只表明这两个事件不能同时发生,即至多只能发生其中一个,但可以都不发生;而两事件对立则表示它们有且仅有一个发生. 事件“甲分得红牌”与“乙分得红牌”是不能同时发生的两个事件,这两个事件可能恰有一个发生,一个不发生,可能两个都不发生,所以应选C.
类型三 “互斥”与“独立”混同 例3 甲投篮命中率为O .8,乙投篮命中率为,每人投3次,两人恰好都命中2次的 概率是多少? 错解 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,则两人都恰好投中 两次为事件A+B ,P(A+B)=P(A)+P(B): 22223 30.80.20.70.30.825c c ?+?= 剖析 本题错误的原因是把相互独立同时发生的事件当成互斥事件来考虑,将两人都恰 好投中2次理解为“甲恰好投中两次”与“乙恰好投中两次”的和.互斥事件是指 两个事件不可能同时发生;两事件相互独立是指一个事件的发生与否对另一个 事件发生与否没有影响,它们虽然都描绘了两个事件间的关系,但所描绘的关 系是根本不同. 解: 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,且A ,B 相互独 立, 则两人都恰好投中两次为事件A·B ,于是P(A·B)=P(A)×P(B)= 类型四 “条件概率P(B / A)”与“积事件的概率P(A·B)”混同 例4 袋中有6个黄色、4个白色的乒乓球,作不放回抽样,每次任取一球,取2次, 求第二次才取到黄色球的概率. 错解 记“第一次取到白球”为事件A ,“第二次取到黄球”为事件B,”第二次才取到黄球” 为事件C,所以P(C)=P(B/A)=6293 =. 剖析 本题错误在于P(A ?B)与P(B/A)的含义没有弄清, P(A ?B)表示在样本空间S 中,A 与B 同时发生的概率;而P (B/A )表示在缩减的样本空间S A 中,作为条件的 A 已经发生的条件下事件 B 发生的概率。 解: P (C )= P(A ?B)=P (A )P (B/A )= 46410915 ?=. 备用
高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为() A.1%B.2%C.3%D.5% C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食 品开支的30 = 1 , 30+40+100+80+ 50 10 1 ∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.] 2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为() A.4B. 3C.2D.1 B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.] 3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频