高中数学选修统计和概率
- 格式:doc
- 大小:1.01 MB
- 文档页数:6
高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型(定量数据与定性数据)2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数(算术平均数)- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。
这篇文章是为了提供一个关于高中数学统计与概率的知识点概览,适用于教育目的。
每个部分都包含了关键的子标题和简短的描述,以便于理解和使用。
5.1.1 数据的收集【课程标准】(1)获取数据的基本途径及相关概念:①知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.②了解总体、样本、样本量的概念,了解数据的随机性.(2)抽样:①简单随机抽样通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数表法.会计算样本均值和样本方差,了解样本与总体的关系.②分层随机抽样通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.结合具体实例,掌握分层随机抽样的样本均值和样本方差.③抽样方法的选择在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.新知初探·自主学习——突出基础性教材要点知识点一总体与样本所考察问题涉及的对象全体是________,总体中每个对象都是________,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是________容量.知识点二简单随机抽样1.简单随机抽样的意义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法.2.简单随机抽样的分类简单随机抽样{____________________状元随笔 (1)对总体、个体、样本、样本容量的认识总体:统计中所考察对象的全体叫做总体.个体:总体中的每一个考察对象叫做个体.样本:从总体中抽取的一部分个体叫做样本.样本容量:样本的个体的数目叫做样本容量.(2)简单随机抽样必须具备的几个特点①被抽取样本的总体中的个体数N 是有限的.②抽取的样本个体数n 小于或等于总体中的个体数N.③样本中的每个个体都是逐个不放回抽取的.④每个个体入样的可能性均为n N .3.随机数表法进行简单随机抽样的步骤状元随笔 用随机数表法进行简单随机抽样的规则(1)定方向:读数的方向(向左、向右、向上或向下都可以).(2)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止.知识点三分层抽样1.分层抽样的定义一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称分层抽样)注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.2.分层抽样的步骤:(1)分层:按某种特征将总体分成若干部分.(2)按比例确定每层抽取个体的个数.(3)各层分别按简单随机抽样的方法抽取.(4)综合每层抽样,组成样本.状元随笔应用分层抽样法的前提条件①总体可以分层,层与层之间有明显区别,而层内个体间差异较小.②每层中所抽取的个体差异可按各层个体在总体中所占的比例抽取.③分层抽样要求对总体的情况有一定的了解,明确分层的界限和数目.基础自测1.某校期末考试后,为了分析该校高一年级1000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是( )A.1000名学生是总体B.每名学生是个体C.100名学生的成绩是一个个体D.样本的容量是1002.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )A.抽签法 B.简单随机抽样法C.分层抽样法D.随机数表法3.某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( ) A.100B.150C.200D.2504.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人课堂探究·素养提升——强化创新性题型1 简单随机抽样的概念[经典例题]例1 下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样过程中,从中任取一种玩具检验后再放回;(3)某社区组织100名党员研读《十九大报告》,学习十九大精神;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.方法归纳简单随机抽样的四个特征跟踪训练1 下列抽样方式是否是简单随机抽样?(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,检验其质量是否合格;(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.题型2 简单随机抽样的应用[经典例题]例2 (1)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程;(2)某车间工人加工了一批零件共40件.为了了解这批零件的质量情况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出抽样步骤.状元随笔(1)总体中的个体数有限,可以采用简单易行的抽签法,按照抽签法的步骤进行即可.抽签法:按照抽签法的步骤:“编号,制号签,搅拌均匀,随机抽取,得号码”进行.→→方法归纳(1)抽签法的优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便.况且,如果号签搅拌不均匀,可能导致抽样不公平.(2)在随机数表法抽样的过程中要注意:①编号要求位数相同,读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.②第一个数字的抽取是随机的.③读数的方向是任意的,且事先定好.跟踪训练2 (1)第十三届中国(徐州)国际园林博览会于2021年9月开幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程;(2)有一批机器,编号为1,2,3,…,112.请用随机数法抽取10台入样,写出抽样过程.题型3 分层抽样的概念及计算[经典例题]例3 (1)某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )A .抽签法B .简单随机抽样C .分层抽样D .随机数表法(2)某市有大型超市200家,中型超市400家,小型超市1400家.为掌握各类超市的营业情况,现按分层抽样的方法抽取一个容量为100的样本,应抽取中型超市________家.状元随笔 (1)有明显差异用分层抽样.→方法归纳(1)各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.(2)分层抽样中有关抽样比的计算方法对于分层抽样中的比值问题,常利用以下关系式巧解: ①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.跟踪训练3 (1)某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)( )A .抽签法B .随机数表法C.简单随机法D.分层抽样法(2)某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是 ( ) 关键看是否有明显差异A.简单随机法B.抽签法C.随机数表法D.分层抽样法(3)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.题型4 分层抽样的概念及应用例4 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12000人,分别来自4个城区,其中东城区2400人,西城区4600人,南城区3800人,北城区1200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.状元随笔由题知有明显差异,利用分层抽样抽样.(1)分多少层.(2)比例是多少.(3)每层抽多少.方法归纳(1)如果总体中的个体有差异时,就用分层抽样抽取样本,用分层抽样抽取样本时,要把性质、结构相同的个体,组成一层.(2)每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取.这样抽取能使所得到的样本结的比例都等于样本容量在总体中的比例,即抽样比=样本容量总体容量构与总体结构相同,可以提高样本对总体的代表性.跟踪训练4 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.第五章 统计与概率5.1 统计5.1.1 数据的收集新知初探·自主学习知识点一总体 个体 样本知识点二2.抽签法 随机数表法3.编号 任意 规则 编号[基础自测]1.解析:由随机抽样的基本概念可得,选D.答案:D2.解析:总体由差异明显的三部分组成,应选用分层抽样.答案:C3.解析:方法一:由题意可得70n−70=3 5001 500,解得n =100,故选A. 方法二:由题意,抽样比为703 500=150,总体容量为3500+1500=5000,故n =5000×150=100.答案:A4.解析:先求抽样比n N =903 600+5 400+1 800=1120,再各层按抽样比分别抽取,甲校抽取3600×1120=30(人),乙校抽取5400×1120=45(人),丙校抽取1800×1120=15(人),故选B. 答案:B课堂探究·素养提升例 1 【解析】 (1)不是简单随机抽样,因为简单随机抽样要求被抽取样本的总体的个数是有限的.(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.(3)不是简单随机抽样,因为这100名党员是挑选出来的,该社区每个人被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.跟踪训练1 解析:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.(1)总体个数不是有限的.(2)不符合“等可能性”的要求.例2 【解析】(1)利用抽签法,步骤如下:①将30辆汽车编号,号码是1,2, (30)②将号码分别写在一张纸条上,揉成团,制成号签;③将得到的号签放入一个不透明的袋子中,并搅拌均匀;④从袋子中依次抽取3个号签,并记录上面的编号;⑤所得号码对应的3辆汽车就是要抽取的对象.(2)抽样步骤是:第一步,先将40件零件编号,可以编号为00,01,02,…,38,39.第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数0开始.为便于说明,我们将随机数表中的第6行到第10行分别摘录如下:6606574717 3407276850 3669736170 6581339885 11199291708105010805 4557182405 3530342814 8879907439 23403097328326977602 020******* 6855574818 7305385247 18623885796357332135 0532547048 9055857518 2846828709 83401256247379645753 0352964778 3580834282 6093520344 3527388435第三步,从选定的数0开始向右读下去,得一个两位数字号码02,将它取出;继续向右读,得到02,由于前面已经取出,将它去掉;继续下去,去掉重复的号码,又得到05,16,18,38,33,21,35,32,28.至此,10个样本号码已经取满,于是,所要抽取的样本号码是02,05,16,18,38,33,21,35,32,28.与这10个号码对应的零件即是抽取的样本个体.跟踪训练2 解析:(1)抽样过程如下:第一步,先将30名大学生进行编号,从1到30.第二步,将编号写在形状、大小相同的号签上.第三步,将号签放到一个不透明的盒子中搅拌均匀,然后从盒子中逐个抽取8个号签.第四步,将与号签上的编号对应的大学生抽出,即得样本.(2)方法一:第一步,将原来的编号调整为001,002,003, (112)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第14行第7个数“0”,向右读.第三步,从“0”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到020,086,013,110,089,021,080,098,027,002.第四步,对应原来编号为20,86,13,110,89,21,80,98,27,2的机器便是要抽取的对象.方法二:第一步,将原来的编号调整为101,102,103, (212)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“1”,向右读.第三步,从“1”开始,向右读,每次读取三位,凡不在101~212中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到173,119,170,187,186,125,140,109,184,178.第四步,对应原来编号为73,19,70,87,86,25,40,9,84,78的机器便是要抽取的对象.例3 【解析】 (1)各部分之间有明显的差异是分层抽样的依据.(2)依据题意,可得抽样比为100200+400+1 400=120,故应抽取中型超市400×120=20(家).【答案】 (1)C (2)20跟踪训练3 解析:(1)因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.(2)总体中个体差异比较明显40800=30600=120,且抽取的比例也符合分层抽样.(3)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18.答案:(1)D (2)D (3)18例4 【解析】 采用分层抽样的方式抽取参加现场节目的观众,步骤如下:第一步,分层.按城区分为四层:东城区、西城区、南城区、北城区.第二步,确定抽样比.样本容量n =60,总体容量N =12000,故抽样比k =n N =6012 000=1200.第三步,按比例确定每层抽取个体数.在东城区抽取2400×1200=12(人),在西城区抽取4600×1200=23(人),在南城区抽取3800×1200=19(人),在北城区抽取1200×1200=6(人).第四步,在各层分别用简单随机抽样法抽取样本.将各城区抽取的观众合在一起组成样本.跟踪训练4 解析:先将产品按等级分成三层;第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为30100=310,所以应在第一层中抽取产品20×310=6(个),在第二层中抽取产品30×310=9(个),在第三层中抽取产品50×3=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数表法10在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.。
高中数学统计与概率知识点高中数学统计与概率知识点第一部分:统计一、众数众数是一组数据中出现次数最多的数据。
它反映了数据的集中趋势,但当数据大小差异很大时,众数的准确值难以判断。
此外,当众数出现次数不具明显优势时,用它来反映数据的典型水平是不可靠的。
二、中位数中位数是一组数据中位于最中间的数据,当数据为偶数个时,为最中间两个数据的平均数。
求中位数时,需要先将数据排序,然后根据数据的个数来确定中位数。
三、众数、中位数及平均数的求法众数由所给数据可直接求出;求中位数时,需要先排序,然后根据数据的个数来确定中位数;求平均数时,需要将各数据的总和除以数据的个数。
四、中位数与众数的特点中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是;众数考察的是一组数据中出现的频数,它的大小只与这组数据的个别数据有关,可能是一个或多个,甚至没有。
五、平均数、中位数与众数的异同平均数、中位数和众数都是描述一组数据集中趋势的量,都有单位。
平均数反映数据的平均水平,与每个数据都有关系,应用最广;中位数不受个别偏大或偏小数据的影响;众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、样本数据的分散程度对于样本数据x1,x2,…,xn,可以通过各数据到其平均数的平均距离来反映样本数据的分散程度。
平均距离的计算公式为12n。
本文介绍了统计学中常用的标准差,以及简单随机抽样的定义和特点。
其中,简单随机抽样的主要特点包括总体个体数有限、逐个抽取、不放回、公平性。
抽签法是一种简单易行的抽样方法,但在总体个数较多时可能会导致样本代表性差。
随机数表法是另一种常用的抽样方法,其步骤包括编号、选定起始位置和依次读取。
最后,对于从100个个体中抽取一个容量为10的样本,可以采用抽签法或随机数表法进行编号。
十三、系统抽样的一般步骤在使用系统抽样从总体中抽取样本时,首先需要将总体中的所有个体进行编号。
举例来说,如果要从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,因此需要先从总体中随机剔除5个个体,再均衡分成60部分。
概率与统计统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】1 .抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)一、单选题1.(2020·上海闵行区·高三二模)某县共有300个村,现采用系统抽样方法,抽取15个村作为样本,调查农民的生活和生产状况,将300个村编上1到300的号码,求得间隔数3002015k==,即每20个村抽取一个村,在1到20中随机抽取一个数,如果抽到的是7,则从41到60这20个数中应取的号码数是( ) A .45B .46C .47D .48 【答案】C【分析】根据系统抽样的定义和性质即可得到结论.【详解】解:根据题意,样本间隔数3002015k ==,在1到20中抽到的是7, 则41到60为第3组,此时对应的数为7+2×20=47.故选:C.【点睛】本题主要考查系统抽样的应用,样本间距是解决本题的关键,比较基础.2.(2020·上海松江区·高三其他模拟)已知6260126(1)x a a x a x a x +=+++⋯+,在0,a 1,a 2,a ,⋅⋅⋅6a 这7个数中,从中任取两数,则所取的两数之和为偶数的概率为( )A .12B .37C .47D .821【答案】B【分析】根据6260126(1)x a a x a x a x +=+++⋯+,将0,a 1,a 2,a ,⋅⋅⋅6a 计算出来,分清几个奇数,几个偶数, 得到从中任取两数的种数;所取的两数之和为偶数的种数,代入古典概型的概率公式求解.【详解】因为6260126(1)x a a x a x a x +=+++⋯+,0,a 1,a 2,a ,⋅⋅⋅6a 这7个数分别为:061,C =166,C =2615,C =3620,C =4615,C =566,C =661,C =. 4个奇数,3个偶数;从中任取两数共有:2721C =种;所取的两数之和为偶数的有:22439C C +=;∴所取的两数之和为偶数的概率为:93217=. 故选:B.【点睛】本题主要考查二项式系数和古典概型的概率,还考查了运算求解的能力,属于基础题.3.(2019·上海杨浦区·高三一模)某象棋俱乐部有队员5人,其中女队员2人,现随机选派2人参加一个象棋比赛,则选出的2人中恰有1人是女队员的概率为( )A .310B .35C .25D .23【答案】B【分析】直接利用概率公式计算得到答案.【详解】11322563105C C P C ⨯=== ,故选:B 【点睛】本题考查了概率的计算,属于简单题.4.(2019·上海黄浦区·高三二模)在某段时间内,甲地不下雨的概率为1P (101P <<),乙地不下雨的概率为2P (201P <<),若在这段时间内两地下雨相互独立,则这段时间内两地都下雨的概率为( ) A .12PPB .121PP -C .12(1)P P -D .12(1)(1)P P -- 【答案】D【分析】根据相互独立事件的概率,可直接写出结果.【详解】因为甲地不下雨的概率为1P ,乙地不下雨的概率为2P ,且在这段时间内两地下雨相互独立, 所以这段时间内两地都下雨的概率为()()1211P P P =--.故选D【点睛】本题主要考查相互独立事件的概率,熟记概念即可,属于基础题型.二、填空题5.(2020·上海奉贤区·高三一模)某工厂生产A 、B 两种型号的不同产品,产品数量之比为2:3.用分层抽样的方法抽出一个样本容量为n 的样本,则其中A 种型号的产品有14件.现从样本中抽出两件产品,此时含有A 型号产品的概率为__________. 【答案】1117【分析】先由分层抽样抽样比求B 种型号抽取件数,以及n ,再根据古典概型公式求概率. 【详解】设B 种型号抽取m 件,所以1423m =,解得:21m =,142135n =+=, 从样本中抽取2件,含有A 型号产品的概率2111414212351117C C C P C +==.故答案为:11176.(2019·上海市建平中学高三月考)一个总体分为A ,B 两层,其个体数之比为4:1,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中甲、乙都被抽到的概率为128,则总体中的个体数为 _____ . 【答案】40【解析】设B 层中的个体数为n ,则211828nn C =⇒=,则总体中的个体数为8540.⨯=7.(2020·上海黄浦区·高三二模)某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【分析】由分层抽样的计算方法有,中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得到答案.【详解】该社区共有14028080500++=户.利用分层抽样的方法, 中等收入家庭应选28010056500⨯=户,故答案为:56 【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.8.(2020·上海高三其他模拟)某校三个年级中,高一年级有学生400人,高二年级有学生360人,高三年级有学生340人,现采用分层抽样的方法从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________.【答案】17【分析】由于分层抽样是按比例抽取,若设高三年级的学生抽取了x 人,则有40034020x=,求出x 的值即可【详解】解:设高三年级的学生抽取了x 人,则由题意得 40034020x=,解得17x =,故答案为:17 【点睛】此题考查分层抽样,属于基础题.9.(2016·上海杨浦区·复旦附中高三月考)如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为________.【答案】9【分析】根据频率分布直方图计算出日销售量不少于150个的频率,然后乘以30即可.【详解】根据频率分布直方图可知,一个月内日销售量不少于150个的频率为()0.0040.002500.3+⨯=, 因此,这家面包店一个月内日销售量不少于150个的天数为300.39⨯=.故答案为9.【点睛】本题考查频率分布直方图的应用,解题时要明确频数、频率和样本容量三者之间的关系,考查计算能力,属于基础题.10.(2020·上海高三专题练习)中位数为1010的一组数构成等差数列,其末项为 2015,则该数列的首项为__________.【答案】5.【解析】设数列的首项为1a ,则12015210102020a+=⨯=,所以15a =,故该数列的首项为5,所以答案应填:5.【考点定位】等差中项.11.(2020·上海浦东新区·高三一模)在7(2)x +的二项展开式中任取一项,则该项系数为有理数的概率为_________.(用数字作答)【答案】12【分析】根据二项展开式的通项,确定有理项所对应的r 的值,从而确定其概率. 【详解】7(2)x +展开式的通项为()77217722rr rr rr r T C x C x --+==,07,r r N ≤≤∈, 当且仅当r 为偶数时,该项系数为有理数,故有0,2,4,6r =满足题意,故所求概率4182P ==.【点睛】(1)二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n 和r 的隐含条件,即n ,r 均为非负整数,且n ≥r ,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.(2)求两个多项式的积的特定项,可先化简或利用分类加法计数原理讨论求解.12.(2020·上海松江区·高三一模)从包含学生甲的1200名学生中随机抽取一个容量为80的样本,则学生甲被抽到的概率___.【答案】115【分析】基本事件总数801200n C =,学生甲被抽到包含的基本事件个数79112001m C C =,由此能求出学生甲被抽到的概率.【详解】解:从包含学生甲的1200名学生中随机抽取一个容量为80的样本,基本事件总数801200n C =, 学生甲被抽到包含的基本事件个数79112001m C C =,∴学生甲被抽到的概率79111991801200115C C m P n C ===. 故答案为:115. 【点睛】方法点睛:求概率常用的方法是:先定性(六种概率:古典概型的概率、几何概型的概率、独立事件的概率、互斥事件的概率、条件概率和独立重复试验的概率),再定量.13.(2019·上海市建平中学高三月考)已知方程221x y a b+=表示的曲线为C ,任取a 、{}1,2,3,4,5b ∈,则曲线C 表示焦距等于2的椭圆的概率等于________. 【答案】825【分析】计算出基本事件的总数,并列举出事件“曲线C 表示焦距等于2的椭圆”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.【详解】所有可能的(),a b 的组数为:5525⨯=,又因为焦距22c =,所以1c =,所以1a b -=±, 则满足条件的有:()1,2、()2,3、()3,4、()4,5、()5,4、()4,3、()3,2、()2,1,共8组, 所以概率为:825P =.故答案为:825. 【点睛】方法点睛:计算古典概型概率的方法如下:(1)列举法;(2)数状图法;(3)列表法;(4)排列、组合数的应用.14.(2020·上海徐汇区·高三一模)小王同学有4本不同的数学书,3本不同的物理书和3本不同的化学书,从中任取2本,则这2本书属于不同学科的概率为______________(结果用分数表示). 【答案】1115【分析】利用古典概型公式计算概率.【详解】共43310++=本不同的数,任取2本包含21045C =种方法,若从中任取两本,这2本书属于不同学科的情况有11111143433333C C C C C C ⋅+⋅+⋅=,所以这2本书属于不同学科的概率33114515P ==. 故答案为:111515.(2020·上海高三一模)近年来,人们的支付方式发生了巨大转变,使用移动支付购买商品已成为一部分人的消费习惯.某企业为了解该企业员工A 、B 两种移动支付方式的使用情况,从全体员工中随机抽取了100人,统计了他们在某个月的消费支出情况.发现样本中A ,B 两种支付方式都没有使用过的有5人;使用了A 、B 两种方式支付的员工,支付金额和相应人数分布如下:依据以上数据估算:若从该公司随机抽取1名员工,则该员工在该月A 、B 两种支付方式都使用过的概率为______.【答案】310【分析】根据题意,计算出两种支付方式都使用过的人数,即可得到该员工在该月A 、B 两种支付方式都使用过的概率.【详解】解:依题意,使用过A 种支付方式的人数为:18292370++=,使用过B 种支付方式的人数为:10242155++=,又两种支付方式都没用过的有5人,所以两种支付方式都用过的有()()7055100530+--=,所以该员工在该月A 、B 两种支付方式都使用过的概率30310010p ==. 故答案为:310. 【点睛】本题考查了古典概型的概率,主要考查计算能力,属于基础题.16.(2020·上海大学附属中学高三三模)一名工人维护甲、乙两台独立的机床,在一小时内,甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,则一小时内没有一台机床需要维护的概率为________【答案】0.42【分析】根据甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,利用独立事件和对立事件的概率求法求解.【详解】因为甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,所以一小时内没有一台机床需要维护的概率为()()10.410.30.42-⨯-=,故答案为:0.42【点睛】本题主要考查独立事件和对立事件的概率,属于基础题.17.(2020·上海长宁区·高三三模)2021年某省将实行“312++”的新高考模式,即语文、数学、英语三科必选,物理、历史二选一,化学、生物、政治、地理四选二,若甲同学选科没有偏好,且不受其他因素影响,则甲同学同时选择历史和化学的概率为________ 【答案】14【分析】甲同学从物理、历史二选一,其中选历史的概率为12,从化学、生物、政治、地理四选二,有6种选法,其中选化学的有3种,从而可得四选二,选化学的概率为12,然后由分步原理可得同时选择历史和化学的概率.【详解】解:由甲同学选科没有偏好,且不受其他因素影响,所以甲同学从物理、历史二选一选历史的概率为12,甲同学从化学、生物、政治、地理四选二有:化学与生物,化学与政治,化学与地理,生物与政治,生物与地理,政治与地理共6种不同的选法,其中选化学的有3种,所以四选二中有化学的概率为12, 所以由分步原理可知甲同学同时选择历史和化学的概率为111=224⨯, 故答案为:14 【点睛】此题考查古典概型概率以及独立事件概率乘法公式的求法,考查理解运算能力,属于基础题. 18.(2019·上海市七宝中学高三三模)一名信息员维护甲乙两公司的5G 网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________【答案】0.88【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可.【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护",所以至少有一个公司不需要维护的概率为10.30.40.88p =-⨯=,故答案为0.88.【点睛】本题主要考查概率的求法以及相互独立事件概率计算公式和对立事件的概率计算公式的应用. 19.(2019·上海金山区·高三二模)若生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别为0.01、0.02,每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率是________(结果用小数表示)【答案】0.9702【分析】利用对立事件概率计算公式和相互独立事件概率乘法公式能求出经过两道工序后得到的零件不是废品的概率.【详解】生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别0.01、0.02, 每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率:p =(1﹣0.01)(1﹣0.02)=0.9702.故答案为0.9702.【点睛】本题考查概率的求法,考查对立事件概率计算公式和相互独立事件概率乘法公式等基础知识,考查运算求解能力,是基础题.三、解答题20.(2019·上海普陀区·)某城市自2014年至2019年每年年初统计得到的人口数量如表所示.(1)设第n 年的人口数量为n a (2014年为第1年),根据表中的数据,描述该城市人口数量和2014年至2018年每年该城市人口的增长数量的变化趋势;(2)研究统计人员用函数0.6544450()2000 4.48781x P x e -=++拟合该城市的人口数量,其中x 的单位是年.假设2014年初对应0x =,()P x 的单位是万.设()P x 的反函数为()T x ,求(2440)T 的值(精确到0.1),并解释其实际意义.【分析】(1)根据表中的数据可得从2014年到2019年人口增加的数量,逐年增多,从2017年后,增加的人数逐年减少,但人口总数是逐年增加的;(2)根据函数的表达式,以及反函数的定义,代值计算即可.【详解】(1)201520142135208253f f -=-=,201620152203213568f f -=-=,201720162276220373f f -=-=,201820172339227663f f -=-=,201920182385233946f f -=-=,由上述计算可知,该地区2014年至2019年每年人口增长数量呈先增后减的变化趋势,每一年任可总数呈逐渐递增的趋势;(2)因为0.65444.48781x e -+为单调递减函数,则()P x 为单调递增函数,则0(2440)T x =0()2440P x ⇒=, 代入000.6544450()200024404.48781x P x e -=+=+,解得08.1x =,即(2440)8.1T =, 其实际意义为:可根据数学模型预测人口数量增长规律,及提供有效依据,到2022年人口接近2440万.【点睛】该题考查的是有关统计的问题,涉及到的知识点有利用表格判断其变化趋势,利用题中所给的函数解析式,计算相关的量,反函数的定义,属于中档题目.。
高中数学概率与统计知识点总结概率与统计一、概率及随机变量的分布列、期望与方差1.概率及其计算概率是指某个事件发生的可能性大小,可以用数值表示。
计算概率时,可以采用几个互斥事件和事件概率的加法公式。
如果事件A与事件B互斥,则P(AB)=P(A)+P(B)。
如果事件A1,A2,…,An两两互斥,则事件A1+A2+…+An发生的概率等于这n个事件分别发生的概率的和,即P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。
如果事件B与事件A互为对立事件,则P(A)=1-P(B)。
2.随机变量的分布列、期望与方差随机变量是指在随机试验中可能出现的各种结果所对应的变量。
常用的离散型随机变量的分布列包括二项分布和超几何分布。
二项分布指在n次独立重复试验中,事件A发生k次的概率为C(n,k)p^k(1-p)^(n-k),事件A发生的次数是一个随机变量X,其分布列为X~B(n,p)。
超几何分布指在含有M件次品的N件产品中,任取n件,其中恰有X件次品的概率为C(M,k)C(N-M,n-k)/C(N,n),其中m=min(M,n),且n,N,M,N∈N*,称随机变量X的分布列为超几何分布列,称随机变量X服从超几何分布。
2.条件概率及相互独立事件同时发生的概率条件概率是指在已知事件A发生的条件下,事件B发生的概率。
一般地,设A,B为两个事件,且P(A)>0,则P(B|A)=P(AB)/P(A)。
在古典概型中,若用n(A)表示事件A中基本事件的个数,则P(B|A)=n(AB)/n(A)。
相互独立事件是指两个或多个事件之间互不影响,即其中一个事件的发生不会影响其他事件的发生。
如果A,B相互独立,则P(AB)=P(A)P(B)。
如果A与B相互独立,则A与B,A与B,A与B也都相互独立。
3.独立重复试验与二项分布独立重复试验是指在一系列相互独立的试验中,每个试验的结果只有两种可能,即成功或失败。
在n次独立重复试验中,事件A发生k次的概率为C(n,k)p^k(1-p)^(n-k),事件A发生的次数是一个随机变量X,其分布列为X~B(n,p)。
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件:①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的分布列. ξ1x 2x … i x … P1p2p…i p…有性质① ,2,1,01=≥i p ; ②121=++++ i p p p .注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列.4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是得到随机变量ξ的概率分布列. ξ1 2 3… k… Pqqpp q 2…p q 1k -…我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNkn MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm =,则k 的范围可以写为k=0,1,…,n.〕⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系.设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)b a a (1)b a a (C b)(a ba C k)P (ηkn k k n nkn k k n =+-+=+==--,即η~)(ba a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样. 二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为 ξ1x 2x … i x … P1p2p…i p…则称 ++++=n n p x p x p x E 2211ξ为ξ的数学期望或平均数、均值.数学期望又简称期望.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ. ⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p + q = 1)⑷二项分布:∑=⋅-⋅=-np q p k n k n k E k n k )!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1) ⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .ξ 0 1 Pqpξ0 1 P qp三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =所围成的曲边梯形的面积 (如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x ” 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f . (σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中. 3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=- x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计▲yxa by=f (x )算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).▲xy a标准正态分布曲线S 阴=0.5S a =0.5+SS。
高中数学知识点总结统计与概率高中数学知识点总结——统计与概率统计与概率是高中数学中的一个重要分支,它涉及到数据的收集、整理、分析,以及随机事件的概率计算等内容。
本文将对高中数学中的统计与概率知识点进行总结和解析。
一、统计学基础1. 总体和样本在统计学中,所研究的对象被称为总体,而从总体中选取的一部分元素被称为样本。
样本是对总体的一种抽样,通过对样本的研究来了解总体的特征。
2. 参数与统计量总体的特征可以用参数来描述,例如总体的均值、标准差等。
而样本的特征可以用统计量来描述,例如样本的均值、标准差等。
通过对样本的统计量进行分析,可以推断总体的参数。
3. 频数和频率统计学中常用到的两个概念是频数和频率。
频数指某个特定数值在样本或总体中出现的次数,频率指频数与样本或总体的大小之比,通常以百分比表示。
二、统计图表1. 条形图条形图是一种用长方形的长度表示各种数据间比较大小的图表形式。
它适用于展示不同类别的数量或比例的差异。
2. 折线图折线图通过在坐标系上连接数据点,在时间序列上展示数据的变化趋势,是描述连续数据变化情况的一种图表形式。
3. 散点图散点图用来展示两个变量之间的关系,其中每个数据点代表一个样本,横坐标表示一个变量,纵坐标表示另一个变量。
4. 饼图饼图是将一个圆分成若干部分,每个部分的面积与相应类别的频数或频率成比例,用于展示不同类别在总体中的占比情况。
三、概率论基础1. 随机事件与样本空间随机事件是指在一次实验中可能发生、也可能不发生的事件。
样本空间是指所有可能结果的集合。
随机事件可以用样本空间中的子集来表示。
2. 频率与概率频率是指某个事件在相同条件下重复实验中出现的频率,概率是指某个事件发生的可能性大小。
频率与概率之间存在着一种近似关系。
3. 条件概率与独立事件条件概率是指在某个事件已经发生的条件下,其他事件发生的概率。
如果两个事件的发生互不影响,即一个事件的发生不会改变另一个事件发生的概率,那么这两个事件是独立事件。
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。