几率统计习题汇编
- 格式:pdf
- 大小:269.00 KB
- 文档页数:9
九年级数学概率统计练习题及答案一、选择题1. 下列各项中,属于概率的是:A. 李明抽到红球的可能性是10%B. 今天下雨的可能性是80%C. 买彩票中奖的可能性是1/1000000D. 扔一次骰子掷出的点数是4的可能性是1/62. 某班级有30个学生,其中有18个男生和12个女生。
从班级中随机选取一个学生,男生和女生被选到的概率相等。
那么,被选到的学生是男生的概率是多少?A. 2/3B. 1/3C. 3/5D. 1/23. 一副扑克牌中有52张牌,其中红心牌有13张。
从扑克牌中随机抽一张牌,抽到红心牌的概率是多少?A. 1/4B. 1/2C. 1/13D. 1/52二、填空题1. 从数字1、2、3、4、5中任意抽取一个数,抽到奇数的概率是_________。
2. 一组数据:10、12、14、16、18中,大于15的数的概率是_________。
3. 一枚硬币抛掷,正面向上的概率是_________。
三、计算题1. 某班级有40个学生,其中有18个男生和22个女生。
从班级中随机选取两个学生,分别计算:a) 选出的两个学生都是男生的概率是多少?b) 选出的两个学生一个是男生一个是女生的概率是多少?2. 一副扑克牌中有52张牌,其中黑色牌有26张。
从扑克牌中随机抽取两张牌,并将它们放回,再抽取一张牌。
计算:a) 三次抽取都是黑色牌的概率是多少?b) 三次抽取中至少有一张黑色牌的概率是多少?四、解答题1. 一组数据:5、7、9、11、13,从中随机抽取一个数。
计算抽取奇数的概率。
答案解析:一、选择题1. D2. A3. A二、填空题1. 3/52. 3/53. 1/2三、计算题1.a) 18/40 × 17/39 = 9/20 × 17/39 = 153/780b) 18/40 × 22/39 + 22/40 × 18/39 = 396/780 = 2/5 2.a) 26/52 × 26/52 × 26/52 = 27/64b) 1 - (26/52 × 26/52 × 26/52) = 37/64四、解答题1. 3/5通过以上习题,希望能够帮助同学们加深对数学概率统计的理解和掌握。
概率与统计大题练习一、解答题1.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:经计算:1266i i x x ===∑1,336i i y y ===∑, 1()()557i i i x x y y =--=∑, 21()84i i x x =-=∑ ,621()3930ii yy =-=∑,621()23.6ˆ64i i y y=-=∑ ,8.0605e 3167≈其中,i i x y 分别为试验数据中的温度和死亡株数, 1,2,3,4,5,6i =1.若用线性回归模型,求y 关于x 的回归方程ˆˆˆy bx a =+ (结果精确到0.1);2.若用非线性回归模型求得y 关于x 的回归方程为0.23030.06ˆx ye =,且相关指数为20.9522R =. (i)试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好;(ii)用拟合效果好的模型预测温度为35C ︒时该批紫甘薯死亡株数(结果取整数). 附:对于一组数据1122(,),(,),,(,)n n u v u v u v c,其回归直线ˆˆˆv u αβ=+的斜率和截距的最小二乘估计分别为:121()(),()ˆˆˆnii i nii uu v v av u uu ββ==--==--∑∑;相关指数为: 22121(ˆ()1)niii niii v vR v v ==-=--∑∑2.交通安全法有规定:机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过马路,应当避让:我们将符合这条规定的称为"礼让斑马线",不符合这条规定的称为"不礼让斑马线".下表是大庆市某十字路口监控设备所抓拍的5个月内驾驶员"不礼让斑马线"行为的统计数据:, (2)求"不礼让斑马线"的驾驶员人数y 关于月份x 之间的线性回归方程(3)若从4,5月份"不礼让斑马线"的驾驶员中分别选取4人和2人,再从所选取的6人中任意抽取2人进行交规调查,求抽取的2人分别来自两个月份的概率;参考公式:线性回归方程:ˆˆˆybx a =+,其中()()()1122211ˆˆˆ,nnii i ii i nni ii i xx y y x ynxy b ay bx x x xnx ====---===---∑∑∑∑, 相关系数()()nii xx y y r --=∑.3.经观测,某昆虫的产卵数y 与温度x 有关,现将收集到的温度i x 和产卵数()1,2,,10i y i =⋯的10表中11ln ,10i i i z y z z ===∑,1.根据散点图判断, y a bx =+,y a =+21c x y c e = 哪一个适宜作为y 与x 之间的回归方程模型?(给出判断即可,不必说明理由) 2.根据1的判断结果及表中数据. ①试求y 关于x 回归方程;②已知用人工培养该昆虫的成本()h x 与温度x 和产卵数y 的关系为 2.4170h x x lny =-+()(),当温度x (x 取整数)为何值时,培养成本的预报值最小?附:对于一组数据()()()1122,,,,,n n u v u v u v ⋯,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121,nii i nii uu v vv uuuβαβ==--==--∑∑4.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为3.2.根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;3.若按下面的方法从甲班优秀的学生中抽取一人;把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到9号或10号的概率.参考公式与临界值表:22()n ad bcK-=.5. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.我国 2.5PM 标准采用世卫组织设定的最宽限值,即 2.5PM 日均值在35微克/立方米以下空气质量为一级;在35微克/立方米75~微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标,某试点城市环保局从该市市区2011年全年每天的 2.5PM 监测数据中随机的抽取15天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶)1.从这15天的2.5PM 日均监测数据中,随机抽出三天,求恰有一天空气质量达到一级的概率; 2.从这15天的数据中任取三天数据,记ξ表示抽到 2.5PM 监测数据超标天数,求ξ的分布列;3.以这15天的 2.5PM 日均值来估计一年的空气质量情况,则一年(按360天计算)中平均有多少天的空气质量达到一级或二级6.某校从高二年级学生中随机抽取60名学生,将其期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),,[90,100]后得到如下频率分布直方图.1.根据频率分布直方图,估计该校高二年级学生期中考试政治成绩的平均分、众数、中位数;(小数点后保留一位有效数字)2.用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则[70,80),分数段抽取的人数是多少?7.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位: cm ).根据长期生产经验,可以认为这条生产线状态下生产的零件的尺寸服从正态分布()2,N μσ.(1)假设生产正态正常,记X 表示一天内抽取的16个零件中其尺寸在()3,3μσμσ-+之外的零件数,求()1P X ≥及X 的数学期望.(2)一天内抽检零件中,如果出现了尺寸在()3,3μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. ①试说明上述监控生产过程方法的合理性; ②下面是检验员在一天内抽取的16个零件的尺寸:0.212=,其中i x 为抽取的第i 个零件的尺寸, 1,2,,16i =⋯.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除()3,ˆˆˆ3ˆμσμσ-+之外的数据,用剩下的数据估计μ和σ (精确到0.01). 附:若随机变量Z 服从正态分布()2,N μσ,则()16330.9974,0.99740.09p Z μσμσ-<<+=≈≈8、甲、乙二人用 张扑克牌(分别是红桃 、红桃 、红桃 、方片 )玩游戏,他们将扑克牌洗匀后,背面朝上放在桌面上,甲先抽,乙后抽,抽出的牌不放回,各抽一张.1.设 表示甲、乙抽到的牌的数字组成的数组,写出甲、乙二人抽到的牌的所有情况;2.若甲抽到红桃 ,则乙抽到的牌的数字比 大的概率是多少?3.甲、乙约定:若甲抽到的牌的数字比乙大,则甲胜,反之,则乙胜.你认为此游戏是否公平,说明你的理由.9.在6(13)x -的展开式中,(1)求展开式中各项的二项式系数和;(2)求第4项的二项式系数和第4项的系数.(3)设6234560123456(13)x a a x a x a x a x a x a x -=++++++,求123456a a a a a a +++++的值.10.已知()*22n n N x ⎫∈⎪⎭的展开式中第五项的系数与第三项的系数的比是10:1.(1)求展开式中各项系数的和; (2)求展开式中含32x 的项;(3)求展开式中系数最大的项和二项式系数最大的项.11.有3名男生.4名女生,在下列不同条件下,求不同的排列方法总数. ①选其中5人排成一排;②排成前后两排,前排3人,后排4人; ③全体排成一排,甲不站排头也不站排尾; ④全体排成一排,女生必须站在一起; ⑤全体排成一排,男生互不相邻;⑥全体排成一排,甲.乙两人中间恰好有3人; ⑦全体排成一排,甲必须排在乙前面;⑧全部排成一排,甲不排在左端,乙不排在右端.12.用()*3,N n n n ≥∈种不同的颜色给如图所示的,,,A B C D 四个区域涂色,要求相邻区域不能用同一种颜色.1.当6n =时,图①、图②各有多少种不同的涂色方案?2.若图③有180种不同的涂色方案,求n 的值.参考答案1.答案:1.解:由题意得, ()()()1215576.638ˆ4niii n i i x x yy bx x ==--==≈-∑∑ ∴33 6.63263.ˆ194a=-⨯=- ∴y 关于x 的线性回归方程为: 6.6394ˆ1.yx =- 2.(i)线性回归方程 6.6386ˆ1.yx =-对应的相关系数为: ()()6221621236.641110.06020.93983930ii i iii y y R yy ==-=-=-≈-=-∑∑, 因为0.93980.9522<比线性回归方程 6.6386ˆ1.yx =-拟合效果更好. (ii)由(i)知,当温度35x =︒时, 0.2303358.06050.06e 0.06e 0.0631769ˆ10y ⨯==≈⨯≈,即当温度为35C 时该批紫甘薯死亡株数为1902.答案:(1)依题意513,100,1420i i i x y x y ====∑,()()5521155,80ii i i i x x x y y ===--=-∑∑,()()5522117500i i i i x x y y ==--=∑∑,计算()()0.921nii xx y y r --==≈-∑具有很强的线性相关关系.(2)1221142053100ˆ85559ni ii nii x ynxybxnx ==--⨯⨯===--⨯-∑∑,ˆ100(8)3124a y bx=-=--⨯=, 所以y 关于月份x 之间的线性回归方程为8124y x =-+.(3) 从4月份选取的4人分别记为1234,,,a a a a 从5月份选取的2人分别记为12,B B 从这6人中任意抽取2人进行交规调查包含的基本事件有{}{}{}{}{}{}121314111223,,,,,,,,,,,a a a a a a a B a B a a ,{}{}{}{}{}{}{}{}{}242122343132414212,,,,,,,,,,,,,,,,,a a a B a B a a a B a B a B a B B B共15个, 其中"抽取的2人分别来自两个月份"包含的基本事件为{}{}{}{}{}{}111221223132,,,,,,,,,,,a B a B a B a B a B a B ,{}{}4142,,,a B a B 共8个,设抽取的2人分别来自两个月份为事件A ,则8()15P A =.3.答案:1.根据散点图判断,看出样本点分布在一条指数函数的周围,所以21c xy c e=适宜作为y 与x 之间的回归方程模型2.①令ln z y =,则21ln z c x c =+, ()()()101210213011505iii ii x x zzc x x ==--===-∑∑, 12ln 3.33c z c x =-=-,13.3375z x ∴=-13.335x zy e e-∴==②()()211ln 2.4170 3.33 2.4170 5.7317055h x x y x x x x ⎛⎫=-+=--+=-+⎪⎝⎭5.7314125x ∴=≈⨯时,培养成本的预报值最小2.根据列联表中的数据,得到22110(10302050)7.48710.82860503080K ⨯⨯-⨯=≈<⨯⨯⨯. 因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.3.设“抽到9或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(),,x y所有的基本事件有()()()():1,1,1,2,1,3,,6,6,⋯共36个.事件A 包含的基本事件有()()()()()()():3,6,4,5,5,4,6,3,5,5,4,6,6,4,共7个.∴7()36P A =,即抽到9号或10号的概率为736. 5.答案:1.记“从15天的 2.5PM 日均监测数据中,随机抽出三天,恰有一天空气质量达到一级”为事件A ,1251031545()91C C P A C ⋅==. 2.依据条件, ξ服从超几何分布:其中15,5,3N M n ===,ξ的可能值为0,1,2,3,其分布列为:()()351030,1,2,3k kC C P k k C ξ-===3. 依题意可知,一年中每天空气质量达到一级或二级的概率为102153P ==, 一年中空气质量达到一级或二级的天数为η,则2(360,)3nB23602403E η∴=⨯=,一年中平均有240天的空气质量达到一级或二级 6.答案:1.由图可知众数为75,当分数70.3x <时对应的频率为0.5,所以中位数为70.3,平均数为450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=2.67.答案:(1)抽取的一个零件的尺寸在()3,3μσμσ-+之内的概率为0.9974, 从而零件的尺寸在()3,3μσμσ-+之外的概率为0.0026, 故()16,0.0026X B ~,因此()()1611010.99740.0408P X P X ≥=-==-≈,X 的数学期望为160.00260.0416EX =⨯=.(2)①如果生产状态正常,一个零件尺寸在()3,3μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在()3,3μσμσ-+之外的零件的概韦只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检査,可见上述监控生产过程的方法是合理的.②由9.97,0.212x s =≈,得μ的估计值为ˆ9.97μ=,σ的估计值为0.212σ∧=,由样本数据可以看出有一个零件的尺寸在()3,ˆˆˆ3ˆμσμσ-+之外,因此需对当天的生产过程进行检査. 剔除()3,ˆˆˆ3ˆμσμσ-+之外的数据9.22,剩下数据的平均数为()1169.979.2210.0215⨯-= 因此μ的估计值为10.02.162221160.212169.971591.134ii x==⨯+⨯≈∑剔除162221160.212169.971591.134ii x==⨯+⨯≈∑之外的数据9.22.剩下数据的样本方差为()221159.1349.221510.020.00815--⨯≈. 因此σ0.09≈. 8. 答案:(1)共12种不同的情况。
佳音教育高考专题概率与统计大题60练[ gary专用gary2013-4-5题型一 直方图1.在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如右表:(I )在答题卡上完成频率分布表,并在给定的坐标系中画出频率分布直方图;(II )估计纤度落在[1.381.50),中的概率及纤度小于1.40的概率是多少?(III )统计方法中,同一组数据常用该组区间的中点值(例如区间[1.301.34),的中点值是1.32)作为代表.据此,估计纤度的期望.解:(Ⅰ)(Ⅱ)纤度落在[)1.381.50,中的概率约为0.300.290.100.69++=,纤度小于1.40的概率样本数据约为10.040.250.300.442++⨯=.(Ⅲ)总体数据的期望约为1.320.04 1.360.25 1.400.30 1.440.29 1.480.10 1.520.02 1.4088⨯+⨯+⨯+⨯+⨯+⨯=.2.根据空气质量指数API(为整数)的不同,可将空气质量分级如下表:对某城市一年(365天)的空气质量进行监测,获得的API数据按照区间,,,,,进行分组,得到频率分布直方图如图5.(1)求直方图中的值;(2)计算一年中空气质量分别为良和轻微污染的天数;(3)求该城市某一周至少有2天的空气质量为良或轻微污染的概率.(结果用分数表示.已知,,,)解:(1)由图可知,解得;(2);]50,0[ ]100,50(]150,100(]200,150(]250,200(]300,250(x7812557=12827=++36521825318257 91251239125818253=++573365⨯=-=150x++365218253(18257509125123150)9125818253⨯-=⨯++18250119=x219)5036525018250119(365=⨯+⨯⨯(3)该城市一年中每天空气质量为良或轻微污染的概率为,则空气质量不为良且不为轻微污染的概率为,一周至少有两天空气质量为良或轻微污染的概率为. 3.(2009浙江卷理)(本题满分14分)在这个自然数中,任取个数.(I )求这个数中恰有个是偶数的概率;(II )设为这个数中两数相邻的组数(例如:若取出的数为,则有两组相邻的数和,此时的值是).求随机变量的分布列及其数学期望.解析:(I )记“这3个数恰有一个是偶数”为事件A ,则; (II )随机变量的取值为的分布列为所以的数学期望为题型二 抽样问题4. 一汽车厂生产A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A 轿车B 轿车C 舒适型 100 150 z 标准型300450600按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. (1) 求z 的值.(2) 用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;(3) 用随机抽样的方法从B 类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4, 8.6,533652195036525018250119==⨯+⨯52531=-7812576653)53()52()53()52(116670777=--C C 1,2,3,,99331ξ31,2,31,22,3ξ2ξE ξ12453910()21C C P A C ==ξ0,1,2,ξξ012122123E ξ=⨯+⨯+⨯=9.2, 9.6, 8.7, 9.3, 9.0, 8.2.把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.解: (1).设该厂本月生产轿车为n 辆,由题意得,,所以n=2000. z=2000-100-300-150-450-600=400(2) 设所抽样本中有m 辆舒适型轿车,因为用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,所以,解得m=2也就是抽取了2辆舒适型轿车,3辆标准型轿车,分别记作S 1,S 2;B 1,B 2,B 3,则从中任取2辆的所有基本事件为(S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),(B 1 ,B 2), (B 2 ,B 3) ,(B 1 ,B 3)共10个,其中至少有1辆舒适型轿车的基本事件有7个基本事件: (S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),所以从中任取2辆,至少有1辆舒适型轿车的概率为. (3)样本的平均数为, 那么与样本平均数之差的绝对值不超过0.5的数为9.4, 8.6, 9.2, 8.7, 9.3, 9.0这6个数,总的个数为8,所以该数与样本平均数之差的绝对值不超过0.5的概率为. 【命题立意】:本题为概率与统计的知识内容,涉及到分层抽样以及古典概型求事件的概率问题.要读懂题意,分清类型,列出基本事件,查清个数.,利用公式解答.5 .为了了解某工厂开展群众体育活动的情况,拟采用分层抽样的方法从A ,B,C 三个区中抽取7个工厂进行调查,已知A,B ,C 区中分别有18,27,18个工厂(Ⅰ)求从A,B,C 区中分别抽取的工厂个数;(Ⅱ)若从抽取的7个工厂中随机抽取2个进行调查结果的对比,用列举法计算这2个工厂中至少有1个来自A 区的概率。
2024年数学高三下册概率统计基础练习题(含答案)试题部分一、选择题:1. 已知一组数据的方差是9,那么这组数据的标准差是()A. 3B. 9C. 3²D. 1/32. 下列哪个图形能够表示一个离散型随机变量X的概率分布()A. 直方图B. 折线图C. 散点图D. 条形图3. 抛掷一枚质地均匀的硬币三次,恰好出现两次正面朝上的概率是()A. 1/2B. 1/3C. 3/8D. 1/44. 已知随机变量X服从二项分布,且P(X=0)=0.16,P(X=1)=0.32,则P(X=2)等于()A. 0.16B. 0.32C. 0.48D. 0.645. 下列关于正态分布的说法,错误的是()A. 正态分布是连续型概率分布B. 正态分布曲线呈钟形C. 正态分布的均数等于0,标准差等于1D. 正态分布曲线关于x轴对称6. 设随机变量X的分布列为:X=1的概率为0.2,X=2的概率为0.3,X=3的概率为0.5,则E(X)等于()A. 1B. 2C. 2.5D. 37. 已知一组数据的平均数为50,标准差为5,那么这组数据的中位数()A. 一定大于50B. 一定小于50C. 一定等于50D. 无法确定8. 在一组数据中,众数与众数的频率之和等于()A. 1B. 0C. 数据总数D. 频率9. 下列关于概率的说法,正确的是()A. 必然事件的概率为0B. 不可能事件的概率为1C. 随机事件的概率介于0和1之间D. 互斥事件的概率之和等于110. 在一个箱子中有5个红球,3个蓝球,2个绿球,随机取出一个球,取到红球或绿球的概率是()A. 2/5B. 3/5C. 4/5D. 1/2二、判断题:1. 样本方差越大,说明数据的波动越大。
()2. 两个互斥事件的概率之和一定等于1。
()3. 随机变量X的期望值E(X)一定等于它的众数。
()4. 在二项分布中,如果n固定,p越大,概率分布越集中。
()5. 正态分布曲线下,面积等于1的部分对应的横坐标范围是负无穷到正无穷。
概率统计大题综合知识点总结1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x =x 1+x 2+⋯⋯+x nn ,反映样本的平均水平(4)方差:s 2=(x 1−x )2+(x 2−x )2+⋯⋯(x n −x )2n反映样本的波动程度,稳定程度和离散程度;s 2越大,样本波动越大,越不稳定;s 2越小,样本波动越小,越稳定;(5)标准差:σ=s 2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值−最小值2.求随机变量X 的分布列的步骤:(1)理解X 的意义,写出X 可能取得全部值;(2)求X 取每个值的概率;(3)写出X 的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量X 的期望、方差,求aX +b a ,b ∈R 的期望与方差,利用期望和方差的性质E aX +b =aE X +b ,D aX +b =a 2D X 进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若ξ~B (n ,p ),则Eξ=np ,Dξ=np (1-p ).4.求解概率最大问题的关键是能够通过P ξ=k ≥P ξ=k +1P ξ=k ≥Pξ=k -1构造出不等关系,结合组合数公式求解结果5.线性回归分析解题方法:(1)计算x ,y,ni =1x i 2 ,ni =1x i y i 的值;(2)计算回归系数a ,b ;(3)写出回归直线方程y =b x +a.线性回归直线方程为:y =b x +a ,b=ni =1x i −x y i −yni =1x i −x2=ni =1x i y i −nx yni =1x i 2−nx2,a =y −b x其中x ,y为样本中心,回归直线必过该点(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r =n i =1x i −x y i −y n i =1x i −x 2 n i =1y i −y 2 =ni =1x i y i −nx yn i =1x i 2−nx 2ni =1y i 2−ny2r >0,正相关;r <0,负相关r ≤1,且r 越接近于1,线性相关性越强;r 越接近于0,线性相关性越弱,几乎不存在线性相关性6.独立性检验解题方法:(1)依题意完成列联表;(2)用公式求解;(3)对比观测值即可得到所求结论的可能性独立性检验计算公式:K 2=n ad -bc 2a +b c +d a +c b +d模拟训练一、解答题1.(2023·福建三明·统考三模)在二十大报告中,体育、健康等关键词被多次提及,促进群众体育和竞技体育全面发展,加快建设体育强国是全面建设社会主义现代化国家的一个重要目标.某校为丰富学生的课外活动,加强学生体质健康,拟举行羽毛球团体赛,赛制采取3局2胜制,每局都是单打模式,每队有5名队员,比赛中每个队员至多上场一次且是否上场是随机的,每局比赛结果互不影响.经过小组赛后,最终甲、乙两队进入最后的决赛,根据前期比赛的数据统计,甲队种子选手M 对乙队每名队员的胜率均为34,甲队其余4名队员对乙队每名队员的胜率均为12.(注:比赛结果没有平局)(1)求甲队最终2:1获胜且种子选手M 上场的概率;(2)已知甲队2:1获得最终胜利,求种子选手M 上场的概率.【答案】(1)740(2)711【分析】(1)设事件A i =“种子选手M 第i 局上场”i =1,2,3 ,事件B =“甲队最终2:1获胜且种子选手M 上场”,求出P A i 、P B A i i =1,2,3 的值,利用全概率公式可求得P B 的值;(2)设事件A 0=“种子选手M 未上场”,事件C =“甲队2:1获得胜利”,计算出P C 、P A 0C 的值,利用贝叶斯公式可求得P A 0C 的值.【详解】(1)解:设事件A i =“种子选手M 第i 局上场”i =1,2,3 ,事件B =“甲队最终2:1获胜且种子选手M 上场”.由全概率公式知,P B =P B A 1 ⋅P A 1 +P B A 2 ⋅P A 2 +P B A 3 ⋅P A 3因为每名队员上场顺序随机,故P A i =15i =1,2,3 ,P B A 1 =34×12×12+14×12×12=14,P B A 2 =12×34×12+12×14×12=14,P B A 3 =C 12⋅12×12×34=38.所以P B =∑3i =1P B A i P A i =14×15+14×15+38×15=740,所以甲队最终2:1获胜且种子选手M 上场的概率为740.(2)解:设事件A 0=“种子选手M 未上场”,事件C =“甲队2:1获得胜利”,P A 0 =A 34A 35=25,P A 0 =1-25=35,P C A 0 =C 12×12×12×12=14,P C =P B +P C A 0 ⋅P A 0 =740+14×25=1140,因为P A 0 C =P A 0CP C.由(1)知P A 0 C =P B =740,所以P A 0 C =P A 0 C P C =7401140=711.所以,已知甲队2:1获得最终胜利,种子选手M 上场的概率为711.2.(2023·湖北武汉·统考模拟预测)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2022年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从武汉市的中学里挑选优秀学生参加数学、物理、化学、信息技术学科夏令营活动.(1)若化学组的12名学员中恰有5人来自同一中学,从这12名学员中选取3人,ξ表示选取的人中来自该中学的人数,求ξ的分布列和数学期望;(2)在夏令营开幕式的晚会上,物理组举行了一次学科知识竞答活动.规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利,假设每轮答题结果互不影响.已知甲、乙两位同学组成一组,甲、乙答对每道题的概率分别为p 1,p 2,且p 1+p 2=43,如果甲、乙两位同学想在此次答题活动中取得6轮胜利,那么理论上至少要参加多少轮竞赛?【答案】(1)分布列见解析,E (ξ)=54(2)11轮【分析】(1)根据超几何分布列分布列计算数学期望即可;(2)先求每轮答题中取得胜利的概率的最大值,再应用独立重复实验数学期望的范围求出最少轮数.【详解】(1)由题意可知ξ的可能取值有0、1、2、3,P (ξ=0)=C 37C 312=744,P (ξ=1)=C 15C 27C 312=2144,P (ξ=2)=C 17C 25C 312=722,P (ξ=3)=C 35C 312=122所以,随机变量ξ的分布列如下表所示:ξ0123P7442144722122所以E (ξ)=0×744+1×2144+2×722+3×122=54.(2)他们在每轮答题中取得胜利的概率为Q =C 12p 11-p 1 C 22p 22+C 22p 21C 12p 21-p 2 +C 22p 21C 22p 22=2p 1p 2p 1+p 2 -3p 1p 2 2=83p 1p 2-3p 1p 2 2,由0≤p 1≤1,0≤p 2≤1,p 1+p 2=43,得13≤p 1≤1,则p1p2=p143-p1=43p1-p21=-p1-232+49,因此p1p2∈13,49,令t=p1p2∈13,49,Q=83t-3t2=-3t-492+1627,于是当t=49时,Q max=1627.要使答题轮数取最小值,则每轮答题中取得胜利的概率取最大值16 27.设他们小组在n轮答题中取得胜利的次数为X,则X∼B n,16 27,E(X)=1627n,由E(X)≥6,即1627n≥6,解得n≥10.125.而n∈N*,则n min=11,所以理论上至少要进行11轮答题.3.(2023·福建宁德·校考二模)某科研团以为了考察某种药物预防疾病的效果,进行动物实验,得到如下列联表.患病未患病总计服用药物1045末服用药物50总计30(1)请将上面的列联表补充完整.(2)认为“药物对预防疾病有效”犯错误的概率是多少?(3)为了进一步研究,现按分层抽样的方法从未患病动物中抽取10只,设其中未服用药物的动物数为ξ,求ξ的分布列与期望.下面的临界值表供参考:P(K2≥k)0.150.100.050.0250.0100.0050.001k 2.0722706 3.841 5.024 6.6357.87910.828(参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)【答案】(1)列联表见解析(2)2.5%(3)分布列见解析,数学期望为1.6【分析】(1)根据表中的数据完成列联表即可;(2)由公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算K2,然后根据临界值表进行判断;(3)由题意可得ξ的值可能为0,1,2,3,4,求出相应的概率,从而可求得ξ的分布列与期望.【详解】(1)列联表补充如下:患病末患病总计服用药物104555末服用药物203050总计3075105(2)K2=105×(10×30-20×45)230×75×55×50=33655≈6.109>5.024.∵P K2≥5.024=0.025,∴认为“药物对预防疾病有效”犯错误的概率是2.5%.(3)根据题意,10只未患病动物中,有6只服用药物,4只未服用药物,所以ξ的值可能为0,1,2,3,4,则P (ξ=0)=C 46C 410=15210,P (ξ=1)=C 36C 14C 410=80210,P (ξ=2)=C 26C 24C 410=90210,P (ξ=3)=C 16C 34C 410=24210,P (ξ=4)=C 44C 410=1210,ξ的分布列如下:ξ01234P152108021090210242101210则E (ξ)=0×15210+1×80210+2×90210+3×24210+4×1210=1.6.4.(2023·江苏常州·校考一模)设X ,Y 是一个二维离散型随机变量,它们的一切可能取的值为a i ,b j ,其中i ,j ∈N *,令p ij =P X =a i ,Y =b j ,称p ij i ,j ∈N * 是二维离散型随机变量X ,Y 的联合分布列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;X ,Yb 1b 2b 3⋅⋅⋅a 1p 11p 12p 13⋅⋅⋅a 2p 21p 22p 23⋅⋅⋅a 3p 31p 32p 33⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅现有n n ∈N * 个球等可能的放入编号为1,2,3的三个盒子中,记落入第1号盒子中的球的个数为X ,落入第2号盒子中的球的个数为Y .(1)当n =2时,求X ,Y 的联合分布列,并写成分布表的形式;(2)设p k =nm =0P X =k ,Y =m ,k ∈N 且k ≤n ,求nk =0kp k 的值.(参考公式:若X ~B n ,p ,则nk =0kC k n p k1-p n -k =np )【答案】(1)答案见解析(2)n 3【分析】(1)X 的取值为0,1,2,Y 的取值为0,1,2,分别计算概率即可;(2)计算得p k =Ckn13k23n -k,则n k =0kp k =nk =0kC k n 13k23n -k,最后利用二项分布的期望公式即可得到答案.【详解】(1)若n =2,X 的取值为0,1,2,Y 的取值为0,1,2,则P X =0,Y =0 =132=19,P X =0,Y =1 =C 12×13×13=29,P X =0,Y =2 =132=19,P X =1,Y =0 =C 12×13×13=29,P X =1,Y =1 =C 12×13×13=29,P X =2,Y =0 =132=19,P X =1,Y =2 =P X =2,Y =1 =P X =2,Y =2 =0,故X ,Y 的联合分布列为X ,Y 0120192919129290219(2)当k +m >n 时,P X =k ,Y =m =0,故p k =nm =0P X =k ,Y =m =n -km =0P X =k ,Y =m =n -km =0P C k n C m n -k ⋅13n=C k n 3n n -k m =0C m n -k =C kn 3n 2n -k =C k n13 k23n -k所以nk =0kp k =nk =0kC k n13k23n -k,由二项分布的期望公式可得nk =0kp k =n 3.5.(2023·江苏南京·南京市第九中学校考模拟预测)某种疾病可分为A ,B 两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A 型疾病的人数占男性患者的56,女性患A 型疾病的人数占女性患者的13.A 型病B 型病合计男女合计(1)填写2×2列联表,若本次调查得出“在犯错误的概率不超过0.005的前提下认为‘所患疾病的类型'与‘性别'有关”的结论,求被调查的男性患者至少有多少人?(2)某团队进行预防A 型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m m >0 元.该团队研发的疫苗每次接种后产生抗体的概率为p 0<p <1 ,如果一个周期内至少2次出现抗体,则该周期结束后终止试验,否则进入第二个周期.若p =23,试验人数为1000人,试估计该试验用于接种疫苗的总费用.K 2=n ad -bc 2a +b c +d a +c b +d,P K 2≥k 0 0.100.050.010.0050.001k 02.7063.8416.6357.87910.828【答案】(1)列联表见解析,被调查的男性患者至少有12;(2)340009m 元【分析】(1)设男性患者有x 人,结合题设写出列联表,应用卡方公式求卡方值,根据独立检验的基本思想列不等式求x 范围,再由x 6∈Z ,x3∈Z 确定x 最小值;(2)由题意试验每人的接种费用为ξ的可能取值为3m ,6m ,独立事件乘法公式求出对应概率,进而求出期望,根据总人数求出总费用的期望即可.【详解】(1)设男性患者有x 人,则女性患者有2x 人,2×2列联表如下:A 型病B 型病合计男5x6x 6x 女2x 34x 32x 合计3x 23x 23x假设H 0:患者所患疾病类型与性别之间无关联,根据列联表中的数据K 2=3x 5x 6⋅4x 3-x 6⋅2x 3 23x 2⋅3x 2⋅2x ⋅x =2x 3,要使在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则2x 3>7.879,解得x >11.8185,因为x 6∈Z ,x3∈Z ,所以x 的最小整数值为12,因此,男性患者至少有12人.(2)设该试验每人的接种费用为ξ元,则ξ的可能取值为3m ,6m .则P ξ=3m =C 23p 21-p +p 3=-2p 3+3p 2,P ξ=6m =1+2p 3-3p 2,所以E ξ =3m ⋅-2p 3+3p 2 +6m ⋅1+2p 3-3p 2 =3m 2p 3-3p 2+2 ,因为p =23,试验人数为1000人,所以该试验用于接种疫苗的总费用为1000E ξ ,所以1000×3m 2×23 3-3×23 2+2 =340009m 元.6.(2023·安徽蚌埠·统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据α=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X 的分布列和数学期望.附:χ2=n ad -bc 2a +b c +d a +c b +dα0.10.050.010.0050.001x α2.7063.8416.6357.87910.828【答案】(1)有99.9%的把握认为该校学生喜欢足球与性别有关;(2)分布列见解析,数学期望为116.【分析】(1)完善列联表,计算χ2的观测值,再与临界值表比对作答.(2)求出X 的可能值,求出各个值对应的概率,列出分布列并求出期望作答.【详解】(1)依题意,2×2列联表如下:喜欢足球不喜欢足球合计男生6040100女生3070100合计90110200零假设H 0:该校学生喜欢足球与性别无关,χ2的观测值为χ2=200(60×70-30×40)2100×100×90×110≈18.182>10.828=x 0.001,根据小概率值α=0.001的独立性检验,推断H 0不成立,所以有99.9%的把握认为该校学生喜欢足球与性别有关.(2)依题意,X 的可能值为0,1,2,3,P (X =0)=1-23 2×1-12 =118,P (X =1)=C 12×231-23 ×1-12 +1-23 2×12=518,P (X =2)=C 12×231-23 ×12+23 2×1-12 =818=49,P (X =3)=23 2×12=29,所以X 的分布列为:X0123P1185184929数学期望E (X )=0×118+1×518+2×49+3×29=116.7.(2023·海南海口·海南华侨中学校考模拟预测)在以视觉为主导的社交媒体时代,人们常借助具有美颜功能的产品对自我形象进行美化.移动端的美颜拍摄类APP 主要有两类:A 类是以自拍人像、美颜美妆为核心功能的APP ;B 类是图片编辑、精修等图片美化类APP .某机构为调查市民对上述A ,B 两类APP 的使用情况,随机调查了部分市民.已知被调查的市民中使用过A 类APP 的占60%,使用过B 类APP 的占50%,设个人对美颜拍摄类APP 类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP 的概率;(2)从样本人群中任选5人,记X 为5人中使用过美颜拍摄类APP 的人数,设X 的数学期望为E X ,求P X =E X ;(3)在单独使用过A ,B 两类APP 的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A 类APP ,乙组对B 类APP 分别评分如下:甲组评分9486929687939082乙组评分8583859175908380记甲、乙两组评分的平均数分别为x 1 ,x 2 ,标准差分别为s 1,s 2,试判断哪组评价更合理.(设V i =s ix i (i =1,2),V i 越小,则认为对应组评价更合理.)参考数据:0.1925≈0.439,0.2325≈0.482.【答案】(1)0.8(2)256625(3)甲组对A 类APP 的评价更合理.【分析】(1)求出“使用过A 类APP ”和“使用过B 类APP ”的概率,再由对立事件的概率公式求解即可.(2)题意知X ∼B 5,45,由二项分布的数学期望公式可求出E X ,再由二项分布的概率公式即可求出P X =E X .(3)由平均数和方差的公式求解即可得出答案.【详解】(1)设事件A 表示“使用过A 类APP ”,事件B 表示“使用过B 类APP ”,由题意知P A =0.6,P B =0.5.任选一人,该人使用过美颜拍摄类APP 的概率:P =1-P A B=1-0.4×0.5=0.8.(2)由题意知X ∼B 5,45,则X 的数学期望E X =5×45=4.P X =E X =P X =4 =C 4545 4×15=256625.(3)x 1 =94+86+92+96+87+93+90+828=90,x 2 =85+83+85+91+75+90+83+808=84,s 1=1842+-4 2+22+62+-3 2+32+02+-8 2 =19.25≈4.39,s 2=1812+-1 2+12+72+-9 2+62+-1 2+-4 2 =23.25≈4.82,V 1=s 1x 1=4.3990<V 2=s 2x 2=4.8284,故甲组对A 类APP 的评价更合理.8.(2023·广东·统考模拟预测)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,且一台机器的故障由一个维修工处理.已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器;方案二:由甲乙两人共同维护6台机器,丙负责其他工作.(1)对于方案一,设X 为甲维护的机器某一时刻发生故障的台数,求X 的分布列与数学期望E (X );(2)在两种方案下,分别计算某一时刻机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?【答案】(1)分布列见解析,12(2)7214096,3472048,方案二能让故障机器更大概率得到及时维修,使得工厂的生产效率更高.【分析】(1)根据题意得到随机变量X ~B 2,14,结合独立重复试验的概率计算公式求得相应的概率,列出分布列,结合期望的公式,即可求解;(2)根据题意,分别求得方案一和方案二中,结合对立事件和独立重复试验的概率计算公式,分别求得机器发生故障时不能及时维修的概率P 1和P 2,根据大小关系,即可得到结论.【详解】(1)解:由题意,车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,可得方案一中,随机变量X ~B 2,14,则P X=0=342=916,P X=1=C12⋅14⋅34=38,P X=2=142=116,所以随机变量X的分布列为:X012P 91638116所以期望为E X=2×14=12.(2)解:对于方案一:“机器发生故障时不能及时维修”等价于“甲、乙、丙三人中,至少有一人负责的2台机器同时发生故障”,设机器发生故障时不能及时维修的概率为P1,则其概率为P1=1-1-P X=23=1-1-1 163=7214096.对于方案二:设机器发生故障时不能及时维修的概率为P2,则P2=1-346-C16⋅14⋅34 5-C26⋅14 2⋅34 4=1-36+6×35+15×344096=3472048,可得P2<P1,即方案二能让故障机器更大概率得到及时维修,使得工厂的生产效率更高.9.(2023·福建福州·福建省福州第一中学校考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某健身连锁机构对其会员的年龄等级和一个月内到健身房健身次数进行了统计,制作成如下两个统计图.图1为会员年龄分布图(年龄为整数),其中将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类;图2为会员一个月内到健身房次数分布扇形图,其中将一个月内到健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图表数据,补全2×2列联表,并依据小概率值α=0.05的独立性检验,是否可以认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计(2)该健身机构在今年年底将针对全部的150名会员举办消费返利活动,预设有如下两种方案.方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”给予奖励.其中,健身爱好者和健身达人中的“幸运之星”每人分别奖励500元和800元.方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球.若摸到红球的总数为2,则可获得100元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.如果每位健身爱好者均可参加1次摸奖游戏;每位健身达人均可参加3次摸奖游戏(每次摸奖的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.附:χ2=n(ad-bc)2a+bc+da+cb+d.α0.100.050.0250.0100.0050.001χα 2.706 3.841 5.024 6.6357.87910.828【答案】(1)列联表见解析,“健身达人”与年龄无关(2)施行方案1投资较少,理由见解析【分析】(1)根据题意计算相关数据填好列联表,利用公式计算χ2,对照参考数据得出结论;(2)按分层抽样计算方案1奖励的总金额ξ1;方案2中,设η表示参加一次摸奖游戏所获得的奖励金,则η的可能取值为0,100,300,计算对应概率,得出分布列,数学期望Eη ,进而计算按照方案2奖励的总金额ξ2,比较ξ1,ξ2即可得出答案.【详解】(1)根据年轻人标准结合图1可得年轻人占比为80%,则年轻人人数为100×80%=80,非年轻人为20人,根据图2表格得健身达人所占比60%,所以其人数为100×60%=60,根据其中年轻人占比56,所以健身达人中年轻人人数为60×56=50,非年轻人为10人;健身爱好者人数为100-60=40,再通过总共年轻人合计为80人,则健身爱好者中年轻人人数为80-50=30,根据非年轻人总共为20人,健身爱好者中非年轻人人数为20-10=10,所以列联表为:年轻人非年轻人合计健身达人501060健身爱好者301040合计8020100零假设为H0:“健身达人”与年龄无关联,根据列联表中的数据,可得χ2=100×(50×10-30×10)280×20×60×40=2524≈1.042<3.841,依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即“健身达人”与年龄无关.(2)方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”,则“幸运之星”中的健身爱好者和健身达人的人数分别为18.2%+21.8%×20=8,30.1%+19.2%+10.7%×20=12,按照方案1奖励的总金额为ξ1=8×500+12×800=13600(元).方案2:设η表示参加一次摸奖游戏所获得的奖励金,全部的150名会员中的健身爱好者和健身达人的人数分别为18.2%+21.8%×150=60,30.1%+19.2%+10.7%×150=90,则η的可能取值为0,100,300.由题意,每摸球1次,摸到红球的概率为P =C 12C 15=25,所以P η=0 =C 0335 325 0+C 1335 225 1=81125,P η=100 =C 2335 125 2=36125,P η=300 =C 3335 025 3=8125.所以η的分布列为:η0100300P81125361258125数学期望为E η =0×81125+100×36125+300×8125=48(元),按照方案2奖励的总金额为ξ2=60+3×90 ×48=15840(元),因为由ξ1<ξ2,所以施行方案1投资较少.10.(2023·云南昭通·校联考模拟预测)为了检测某种抗病毒疫苗的免疫效果,需要进行临床人体试验.研究人员将疫苗注射到200名志愿者体内,一段时间后测量志愿者的某项指标值,按0,20 ,20,40 ,40,60 ,60,80 ,80,100 分组,绘制频率分布直方图如图所示.试验发现志愿者体内产生抗体的共有160人,其中该项指标值不小于60的有110人.假设志愿者注射疫苗后是否产生抗体相互独立.(1)填写下面的2×2列联表,并根据列联表及小概率值α=0.05的独立性检验,判断能否认为注射疫苗后志愿者产生抗体与指标值不小于60有关.抗体指标值合计小于60不小于60有抗体没有抗体合计(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40名志愿者进行第二次注射疫苗,结果又有m 名志愿者产生抗体.(i )用频率估计概率,已知一名志愿者注射2次疫苗后产生抗体的概率p =0.9,求m 的值;(ⅱ)以(i )中的概率p 作为人体注射2次疫苗后产生抗体的概率,再进行另一组人体接种试验,记110名志愿者注射2次疫苗后产生抗体的数量为随机变量X,求P X=k最大时的k的值.参考公式:χ2=n ad-bc2a+bc+da+cb+d(其中n=a+b+c+d为样本容量).α0.500.400.250.150.1000.0500.025xα0.4550.708 1.323 2.072 2.706 3.841 5.024【答案】(1)列联表见解析,认为注射疫苗后志愿者产生抗体与指标值不小于60有关;(2)(i)20;(ⅱ)99.【分析】(1)完善列联表,计算χ2的观测值,再与临界值表比对作答.(2)(i)利用对立事件、相互独立事件的概率公式求解作答;(ⅱ)利用二项分布的概率公式,列出不等式组并求解作答.【详解】(1)由频率分布直方图,知200名志愿者按指标值分布为:在[0,20)内有0.0025×20×200=10 (人),在[20,40)内有0.00625×20×200=25(人),在[40,60)内有0.00875×20×200=35(人),在[60,80)内有0.025×20×200=100(人),在80,100内有0.0075×20×200=30(人),依题意,有抗体且指标值小于60的有50人,而指标值小于60的志愿者共有10+25+35=70人,则指标值小于60且没有抗体的志愿者有20人,指标值不小于60且没有抗体的志愿者有20人,所以2×2列联表如下:抗体指标值合计小于60不小于60有抗体50110160没有抗体202040合计70130200零假设H0:注射疫苗后志愿者产生抗体与指标值不小于60无关联,根据列联表中数据,得χ2=200×(50×20-20×110)2160×40×70×130≈4.945>3.841,根据小概率值α=0.05的独立性检验,推断H0不成立,即认为注射疫苗后志愿者产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05.(2)(i)令事件A=“志愿者第一次注射疫苗产生抗体”,事件B=“志愿者第二次注射疫苗产生抗体”,事件C=“志愿者注射2次疫苗后产生抗体”,记事件A,B,C发生的概率分别为P(A),P(B),P(C),则P A=160200=0.8,P B =m40,P C =1-P AP B=1-0.2×1-m40=0.9,解得:m=20,所以m=20.(ⅱ)依题意,随机变量X∼B(110,0.9),P(X=k)=C k110×0.9k×0.1110-k(k∈N,k≤110),显然P(X=0),P(X=110)不是最大的,即当P(X=k)最大时,k∈N∗,k<110,于是P(X=k)≥P(X=k-1)P(X=k)≥P(X=k+1),即C k110×0.9k×0.1110-k≥C k-1110×0.9k-1×0.1111-kC k110×0.9k×0.1110-k≥C k+1110×0.9k+1×0.1109-k,则110!k!(110-k)!×0.9≥110!(k-1)!(111-k)!×0.1110!k!(110-k)!×0.1≥110!(k+1)!(109-k)!×0.9,整理得9(111-k)≥kk+1≥9(110-k),解得98910≤k≤99910,因此k=99,所以P(X=k)最大时,k的值为99.11.(2023·湖南长沙·长沙市实验中学校考二模)首批全国文明典范城市将于2023年评选,每三年评选一次,2021年长沙市入选为全国文明典范城市试点城市,目前我市正全力争创首批全国文明典范城市,某学校号召师生利用周末从事创建志愿活动.高一(1)班一组有男生4人,女生2人,现随机选取2人作为志愿者参加活动,志愿活动共有交通协管员、创建宣传员、文明监督员三项可供选择,每名女生至多从中选择参加2项活动,且选择参加1项或2项的可能性均为12;每名男生至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为12,每人每参加1项活动可获得综合评价10分,选择参加几项活动彼此互不影响,求:(1)在有女生参加活动的条件下,恰有一名女生的概率;(2)记随机选取的两人得分之和为X,求X的期望.【答案】(1)8 9(2)E X =1303【分析】(1)根据条件概率求解即可;(2)先求出参加人数的分布列及期望,再根据参加人数与得分的关系求出得分的期望即可.【详解】(1)设事件A为:“至少有一名女生参加活动”,设事件B为:“恰有一名女生参加活动”.则P AB=C14⋅C12C26=815,P A =1-C24C26=35.所以在有女生参加活动的条件下,恰有一名女生的概率为:P B A=P ABP A=89;(2)因为女生参加活动得分为12×10+12×20=15;男生参加活动得分为12×20+12×30=25.设恰有Y名女生参加活动,则有2-Y名男生参加活动,所以P Y=0=C24C26=25,P Y=1=C14⋅C12C26=815,P Y=2=C22C26=115,所以E Y=1×815+2×115=23,又X=15Y+252-Y=50-10Y,所以E X=50-10E Y=50-10×23=1303.12.(2023·江苏南京·南京市第一中学校考模拟预测)为了宣传航空科普知识,某校组织了航空知识竞赛活动.活动规定初赛需要从8道备选题中随机抽取4道题目进行作答.假设在8道备选题中,小明正确完成每道题的概率都是34且每道题正确完成与否互不影响,小宇能正确完成其中6道题且另外2道题不能完成.(1)求小明至少正确完成其中3道题的概率;(2)设随机变量X表示小宇正确完成题目的个数,求X的分布列及数学期望;(3)现规定至少完成其中3道题才能进入决赛,请你根据所学概率知识,判断小明和小宇两人中选择谁去参加市级比赛(活动规则不变)会更好,并说明理由.【答案】(1)189256(2)分布列见解析,3(3)选择小宇,理由见解析【分析】(1)小明至少正确完成其中3道题包含两种情况:一是小明正确完成3道题,二是小明正确完成4道题,然后由互斥事件的概率公式求解即可;(2)由题意得X 的可能取值为2,3,4,然后求各自对应的概率,从而可求出X 的分布列及数学期望;(3)分别计算出他们两人至少完成其中3道题的概率,通过比较概率的大小可得答案.【详解】(1)记“小明至少正确完成其中3道题”为事件A ,则P A =C 3434 314+C 4434 4=189256.(2)X 的可能取值为2,3,4P X =2 =C 22C 26C 48=1570=314,P X =3 =C 12C 36C 48=4070=47,P X =4 =C 02C 46C 48=1570=314,X 的分布列为;X 234P31447314数学期望E X =2×314+3×47+4×314=3.(3)由(1)知,小明进入决赛的概率为P A =189256;记“小宇至少正确完成其中3道题”为事件B ,则P B =47+314=1114;因为P B >P A ,故小宇进决赛的可能性更大,所以应选择小宇去参加比赛.13.(2023·广东·校联考模拟预测)某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.(1)若甲第一关通过的概率为23,第二关通过的概率为56,求甲可以进入第三关的概率;(2)已知该闯关活动累计得分服从正态分布,且满分为450分,现要根据得分给共2500名参加者中得分前400名发放奖励.①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.附:若随机变量Z ∼N μ,σ2 ,则P μ-σ≤X ≤μ+σ ≈0.6827;P μ-2σ≤X ≤μ+2σ ≈0.9545;P μ-3σ≤X ≤μ+3σ ≈0.9973.【答案】(1)7081。
高考数学2024概率与统计历年题目全集概率与统计是高中数学中一门重要的学科,也是高考数学考试的一部分。
在概率与统计中,我们需要通过概率的计算和统计的方法来分析和解决实际问题。
为了帮助同学们复习和准备高考数学考试,本文整理了高考数学2024概率与统计历年题目全集,希望能对同学们有所帮助。
1. 单项选择题1) 已知概率为P(A) = 0.2,P(B) = 0.4,事件A、B相互独立,求P(A并B)的值。
2) 一次抛掷一硬币,设正面向上的概率为p,反面向上的概率为q。
连续抛掷3次硬币,求正面朝上的次数不超过2次的概率。
3) 某音乐社有男生40人,女生60人。
从中随机抽取一人,求抽到女生的概率。
2. 典型案例题1) 某超市中购买了100个某品牌产品,其中有5个是次品。
现从中不放回地连续抽取3个产品,求至少有一个次品的概率。
2) 某餐厅的饭菜有4个主食和6个副食。
现从中选择2个饭菜,求至少有一个主食的概率。
3. 解答题1) 设事件A与事件B相互独立,且P(A) = 0.3,P(B) = 0.5。
求下列事件的概率:a) P(A并B)b) P(A或B)c) P(A的对立事件)2) 设P(A) = 0.4,P(B) = 0.3,P(A并B) = 0.1,求下列事件的概率:a) P(A的对立事件)b) P(B的对立事件)c) P(A或B)3) 有一批产品,其中20%是次品。
现从中不放回地连续抽取3个产品,求以下事件的概率:a) 已抽出的3个产品都是次品;b) 至少有一个次品。
(提示:利用组合数学中的排列、组合知识进行计算)本文仅列举了一部分高考数学2024概率与统计历年题目,希望能给同学们提供一些复习和备考的参考。
在备考过程中,同学们还需结合教材和课堂上的知识,多进行习题训练和模拟考试,提高解题能力和应试技巧。
祝同学们取得优异的高考成绩!。
概率统计复习题答案1. 随机变量X服从标准正态分布,求P(X > 1.96)。
答案:根据标准正态分布表,P(X > 1.96) = 1 - P(X ≤ 1.96) = 1 - 0.975 = 0.025。
2. 设随机变量X服从二项分布B(n, p),其中n=10,p=0.3,求X的期望E(X)和方差Var(X)。
答案:E(X) = np = 10 × 0.3 = 3,Var(X) = np(1-p) = 10 × 0.3 × 0.7 = 2.1。
3. 某工厂生产的零件寿命服从指数分布,其概率密度函数为f(x) = λe^(-λx),其中λ > 0,求该零件寿命超过1000小时的概率。
答案:P(X > 1000) = ∫(1000, +∞) λe^(-λx) dx = e^(-λ×1000)。
4. 已知随机变量X和Y的联合概率密度函数为f(x, y),求X和Y的协方差Cov(X, Y)。
答案:Cov(X, Y) = E[(X - E(X))(Y - E(Y))] = ∫∫(x -E(X))(y - E(Y))f(x, y) dxdy。
5. 某地区连续三天的降雨量分别为X1, X2, X3,若X1, X2, X3相互独立且都服从正态分布N(μ, σ^2),求三天总降雨量X = X1 + X2 + X3的分布。
答案:X = X1 + X2 + X3,由于X1, X2, X3相互独立且都服从正态分布,根据正态分布的性质,X也服从正态分布,即X ~ N(3μ,3σ^2)。
6. 设随机变量X服从泊松分布,其参数为λ,求X的期望E(X)和方差Var(X)。
答案:对于泊松分布,其期望和方差都等于参数λ,即E(X) = λ,V ar(X) = λ。
7. 某工厂生产的零件合格率为0.95,求在100个零件中至少有90个合格的概率。
答案:设Y为100个零件中合格的零件数,则Y服从二项分布B(100, 0.95)。
概率和统计考试题库答案一、单项选择题1. 随机变量X服从二项分布B(3, 0.5),则P(X=1)的值为()。
A. 0.375B. 0.5C. 0.25D. 0.75答案:A2. 已知随机变量X服从正态分布N(0, 1),则P(-1<X<2)的值为()。
A. 0.6826B. 0.8413C. 0.9544D. 0.9772答案:C3. 一组数据的平均数为10,方差为4,则该组数据的众数可能为()。
A. 8B. 10C. 12D. 14答案:B4. 已知随机变量X服从泊松分布,其期望为2,则P(X=0)的值为()。
A. 0.1353B. 0.2588C. 0.0183D. 0.0549答案:C5. 一组数据的中位数为15,众数为20,则该组数据的平均数可能为()。
A. 10B. 15C. 20D. 25答案:C二、多项选择题6. 以下哪些事件是不可能事件()。
A. 抛一枚硬币,正面朝上B. 抛一枚硬币,反面朝上C. 抛一枚硬币,正面和反面同时朝上D. 抛一枚硬币,正面和反面都不朝上答案:CD7. 以下哪些分布是离散型随机变量的分布()。
A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:BC8. 以下哪些统计量可以用来衡量数据的离散程度()。
A. 平均数B. 方差C. 标准差D. 众数答案:BC9. 以下哪些统计方法可以用来估计总体参数()。
A. 点估计B. 区间估计C. 假设检验D. 回归分析答案:AB10. 以下哪些是随机变量X和Y的协方差的性质()。
A. 协方差总是非负的B. 协方差总是非正的C. 协方差可以是正的、负的或零D. 协方差总是零答案:C三、判断题11. 随机变量X和Y的协方差为零,说明X和Y是独立的。
()答案:错误12. 一组数据的方差越大,说明这组数据越稳定。
()答案:错误13. 正态分布是连续型随机变量的分布。
()答案:正确14. 随机变量X服从二项分布B(n, p),其期望E(X)=np。
历年(2019-2023)高考数学真题专项(概率与统计解答题)汇编考点01:统计案例及应用1 (2021年全国高考乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:122S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).2 (2020年高考数学课标Ⅰ卷文科)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下: 甲分厂产品等级的频数分布表等级 ABCD频数40202020乙分厂产品等级的频数分布表等级 ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A 级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?3 (2019年高考数学课标Ⅲ卷文科)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下实验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据实验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中的a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用改组区间的中点值为代表).4 (2019年高考数学课标Ⅱ卷文科)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 147 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.5.(2022新高考全国II 卷·)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表); (2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).考点02相关关系与回归分析1.(2022年高考全国乙卷(文)·)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m )和材积量(单位:3m ),得到如下数据:样本号i 12345678910总和根部横截面积i x0.04 0.06 0.04 0.08 0.08 0050050.07 0.07 0.06 0.6材积0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9..量i y并计算得10101022i i i ii=1i=1i=10.038, 1.6158,0.2474x y x y===∑∑∑.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数i i(1.377)()nx x y yr--=≈∑.2.(2020年高考数学课标Ⅱ卷文科·)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix==∑,2011200iiy==∑,202180iixx=-=∑(,2021)9000iiy y=-=∑(,201)800iiix yx y=--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i,y i)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r)ni ix yx y--∑((≈1.414.考点03 独立性检验1.(2022年全国高考甲卷(文)·)甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数 A 240 20 B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有0090的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k …0.100 0.050 0.010 k2.7063.8416.6352.(2020年新高考I 卷(山东卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表: 2SOPM2.5[0,50](50,150] (150,475][0,35]32 18 4 (35,75]6 8 12 (75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表: 2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥ 0.050 0.010 0.001 k3.841 6.63510.8283 .(2020新高考II 卷(海南卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?的附:22()()()()()n ad bc K a b c d a c b d -=++++,4.(2021年高考全国甲卷文科·)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++ ()2P K k ≥ 0.050 0.0100.001k 3.841 6.635 10.8285.(2020年高考数学课标Ⅲ卷文科·)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 [0,200](200,400](400,600]1(优) 2 16 25 2(良)51012的3(轻度污染) 67 84(中度污染) 72 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.8286.(2019年高考数学课标Ⅰ卷文科·)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客40 10女顾客30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.2()P K k…0.050 0.010 0.001 k 3.841 6.635 10.828参考答案考点01:统计案例及应用1 (2021年全国高考乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:122S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x yS S ====;(2)新设备生产产品的该项指标的均值较旧设备有显著提高. 【答案解析】:(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,22222222210.20.300.20.10.200.10.20.30.03610S +++++++++==,222222222220.20.10.20.30.200.30.20.10.20.0410S +++++++++==(2)依题意,0.320.15y x -==⨯==,=y x -≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高.2 (2020年高考数学课标Ⅰ卷文科)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲.分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数 4020 20 20乙分厂产品等级的频数分布表等级 A B C D频数 2817 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?【答案】(1)甲分厂加工出来的A级品的概率为0.4,乙分厂加工出来的A级品的概率为0.28;(2)选甲分厂,理由见答案解析.【答案解析】(1)由表可知,甲厂加工出来的一件产品为A级品的概率为400.4100=,乙厂加工出来的一件产品为A级品的概率为280.28 100=;(2)甲分厂加工100件产品总利润为()()()()4090252050252020252050251500⨯-+⨯-+⨯--⨯+=元,所以甲分厂加工100件产品的平均利润为15元每件;乙分厂加工100件产品的总利润为()()()()2890201750203420202150201000⨯-+⨯-+⨯--⨯+=元,所以乙分厂加工100件产品的平均利润为10元每件.故厂家选择甲分厂承接加工任务.3 (2019年高考数学课标Ⅲ卷文科)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下实验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据实验数据分别得到如下直方图:的记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中的a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用改组区间的中点值为代表). 【答案】【答案解析】:(1)C 为事件:“乙离子残留在体内的百分比不低于5.5”, 根据直方图得到P (C )的估计值为0.70. 则由频率分布直方图得: 0.200.150.70.050.1510.7a b ++=⎧⎨++=-⎩, 解得乙离子残留百分比直方图中0.35a =,0.10b =. (2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x =⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.156x =⨯+⨯+⨯+⨯+⨯+⨯=乙.4 (2019年高考数学课标Ⅱ卷文科)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 147 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈. 【答案】【答案解析】:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=,()52211100i i i s n y y ==-∑222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(2022新高考全国II 卷·)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表); (2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001). 【答案】(1)47.9岁; (2)0.89; (3)0.0014.【答案解析】:(1)平均年龄(50.001150.002250.012350.017450.023x =⨯+⨯+⨯+⨯+⨯ 550.020650.017750.006850.002)1047.9+⨯+⨯+⨯+⨯⨯=(岁). (2)设A ={一人患这种疾病的年龄在区间[20,70)},所以()1()1(0.0010.0020.0060.002)1010.110.89P A P A =-=-+++⨯=-=.(3)设{B =任选一人年龄位于区间}[40,50),{C =任选一人患这种疾病}, 则由条件概率公式可得 ()0.1%0.023100.0010.23(|)0.00143750.0014()16%0.16P BC P C B P B ⨯⨯⨯====≈.考点02相关关系与回归分析1.(2022年高考全国乙卷(文)·)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m )和材积量(单位:3m ),得到如下数据: 样本号i 12345678910总和根部横截面积i x0.04 0.06 0.04 0.08 0.08 0050050.07 0.07 0.06 0.6材积量i y0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得10101022ii i i i=1i=1i=10.038, 1.6158,0.2474xy x y ===∑∑∑.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数ii( 1.377)()nx x y y r --=≈∑.【答案】(1)20.06m ;30.39m (2)0.97..(3)31209m【答案解析】:【小问1详解】样本中10棵这种树木的根部横截面积的平均值0.60.0610x == 样本中10棵这种树木的材积量的平均值 3.90.3910y == 据此可估计该林区这种树木平均一棵的根部横截面积为20.06m , 平均一棵的材积量为30.39m 【小问2详解】()()1010iii i10x x y y x y xyr ---==∑∑0.01340.970.01377==≈≈则0.97r ≈ 【小问3详解】设该林区这种树木的总材积量的估计值为3m Y , 又已知树木的材积量与其根部横截面积近似成正比, 可得0.06186=0.39Y,解之得3=1209m Y . 则该林区这种树木总材积量估计为31209m2.(2020年高考数学课标Ⅱ卷文科·)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,202180i ix x =-=∑(,2021)9000i i y y =-=∑(,201)800i i i x y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.的附:相关系数r)niix y x y --∑((≈1.414.【答案】(1)12000;(2)0.94;(3)详见答案解析【答案解析】(1)样区野生动物平均数为201111200602020ii y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20()()0.943iix x y y r --===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.考点03 独立性检验1.(2022年全国高考甲卷(文)·)甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数 A 240 20 B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有0090的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k …0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【答案解析】根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M ,则24012()26013P M ==; B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则210()28074P N ==. A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表准点班次数未准点班次数 合计A 240 20 260B 210 30 240 合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关. 2.(2020年新高考I 卷(山东卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表: 2SOPM2.5[0,50](50,150] (150,475][0,35]32 18 4 (35,75]6812(75,115]3 7 10(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表: 2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥ 0.050 0.010 0.001 k3.841 6.63510.828【答案】(1)0.64;(2)答案见答案解析;(3)有.【答案解析】:(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:2SO2.5PM[]0,150(]150,475合计[]0,7564 16 80 (]75,11510 10 20 合计 7426100(3)根据22⨯列联表中的数据可得的222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 3 .(2020新高考II 卷(海南卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.64;(2)答案见答案解析;(3)有.【答案解析】:(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:2SO2.5PM[]0,150(]150,475合计[]0,7564 16 80 (]75,11510 10 20 合计 7426100(3)根据22⨯列联表中的数据可得222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 【题目栏目】统计\相关关系、回归分析与独立性检验\独立性检验4.(2021年高考全国甲卷文科·)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++ ()2P K k ≥ 0.050 0.0100.001k 3.841 6.635 10.828【答案】(1)75%;60%;的(2)能.答案解析:(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.5.(2020年高考数学课标Ⅲ卷文科·)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400] (400,600]1(优) 216 252(良) 510 123(轻度污染) 67 84(中度污染) 72 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001 k 3.841 6.635 10.828【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见答案解析.【答案解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量不好 3337 空气质量好 228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.6.(2019年高考数学课标Ⅰ卷文科·)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:22()()()()()n ad bc K a b c d a c b d -=++++.2()P K k …0.050 0.010 0.001 k3.8416.63510.828【答案】【答案解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.850=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)22100(40203010)4.76250507030K⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.。
概率统计复习题答案一、选择题1. 某随机事件A的概率为0.3,那么它的补事件的概率为:A. 0.7B. 0.6C. 0.9D. 0.5答案:A2. 随机变量X服从正态分布N(μ, σ²),其中μ=0,σ=1,那么P(-1 < X < 1)的值最接近:A. 0.6827B. 0.9545C. 0.9772D. 0.9997答案:B3. 一组数据的平均数是50,标准差是10,那么这组数据的方差是:A. 5B. 10C. 100D. 1000答案:C二、填空题1. 假设随机变量X服从二项分布B(n, p),其中n=10,p=0.3,那么P(X=3)等于______。
(答案:0.2668)2. 假设随机变量Y服从泊松分布P(λ),其中λ=2,那么P(Y=1)等于______。
(答案:0.2707)三、简答题1. 请简述什么是大数定律。
答案:大数定律是概率论中的一个概念,它描述了随着试验次数的增加,样本均值会趋近于总体均值的性质。
具体来说,如果进行足够多次的独立同分布的随机试验,那么这些试验的平均结果会越来越接近总体的真实均值。
2. 请解释什么是中心极限定理。
答案:中心极限定理是概率论中的一个重要定理,它指出了在一定条件下,大量相互独立的随机变量之和经过标准化后,其分布趋近于正态分布,无论这些随机变量本身是否服从正态分布。
四、计算题1. 某工厂生产的零件,其长度服从正态分布N(100, 25)。
求长度超过105mm的零件所占的比例。
答案:首先计算Z值,Z = (105 - 100) / √25 = 2。
然后查标准正态分布表,得到P(Z > 2) ≈ 0.0228。
因此,长度超过105mm的零件所占的比例约为2.28%。
2. 某次考试的分数服从正态分布N(70, 16),求分数在65到85之间的学生所占的比例。
答案:首先计算两个Z值,Z1 = (65 - 70) / √16 = -0.5,Z2 = (85 - 70) / √16 = 1.5。