mathematics教程第9章概率统计计算
- 格式:ppt
- 大小:1.20 MB
- 文档页数:33
第九章概率统计必修二统计、概率选择性必修三第六章计数原理第七章随机变量及其分布第八章成对数据的统计分析一. 两个计数原理、排列与组合1.分类加法计数原理完成一件事,有n类不同方案,在第1类方案中有m1种不同的方法,在第2类方案中有m2种不同的方法……在第n类方案中有m n种不同的方法.那么完成这件事共有N=________________种不同的方法.2.分步乘法计数原理完成一件事,需要分成n个步骤,做第1步有m1种不同的方法,做第2步有m2种不同的方法……做第n 步有m n种不同的方法.那么完成这件事共有N=____________种不同的方法.3. 排列组合定义(1)排列数的定义:从n个不同元素中取出m(m≤n)个元素的的个数,叫做从n个不同元素中取出m个元素的排列数,用表示.(2)组合数的定义:从n个不同元素中取出m(m≤n)个元素的的个数,叫做从n个不同元素中取出m个元素的组合数,用表示.4. 排列数与组合数的公式与性质公式(1)A m n==n!(n-m)!(2)C m n=A m nA m m=n(n-1)(n-2)…(n-m+1)m!=性质(1)0!=;A n n=(2)C m n=C n-mn;C m n+1=(3) (不定系数转为定系数)kC n k==(0≤k≤n,k∈N)题组1.1. 有5个编了号的抽屉,要放进3本不同的书,不同的方法有种2.5人分到三家医院,每个医院至少一人,有___________种分法.3. 3名女生和4名男生排成一排,在下列情形中各有多少种?列式并写出结果.(1)如果女生全排在一起_________________(2)如果女生都不相邻_________________(3)如果女生不站两端_________________ (4)其中甲必须排在乙前面(可不邻) _________________(5)其中甲不站左端,乙不站右端_________________4.证明结论:kC n k=nC n−1k−10≤k≤n,k∈N二. 二项式定理1.二项式定理2.(1)C0n=,C n n=C m n+1=+ .(2)C m n=.(3)当n为偶数时,二项式系数中_____最大;当n为奇数时,二项式系数中以______和________最大.(4)二项系数和:C0n+C1n+…+C n n=.C1n+C3n+C5n+…=C0n+C2n+C4n+…=________.题组2. 回归课本1.(1+x)2+(1+x)3+⋯+(1+x)9的展开式中2x的系数是()A. 60B. 80C. 84D. 1202.求(9x3√x )n展开式中第3项与第5项的二项式系数相等,则展开式的常数项为;有理项有_______项。
可编辑修改精选全文完整版第九章统计统计学有多种不同的定义,综合来说,统计学是收集、处理、分析、解释数据并从数据中得出结论的科学.作为专门研究有效收集和分析数据的科学,可以说凡是一个实际问题涉及数据处理,都应该利用统计学方法去分析和解决.统计方法不仅有用,对于理解周围的世界经常也是不可或缺的,它提供了对许多现象获得新见解的方法.现在统计学已深入到科学、技术、工程和现代社会生活的各个方面.尤其当我们进入大数据时代和“互联网+”时代,作为研究数据分析的重要数学技术,统计学方法在相关领域的应用已成为数学应用的主要方法.统计素养已成为一名效率公民的基本素养.从新中国成立以来,在中学数学课程中,统计经历从无到有、从描述统计到推断统计、从选修变为必修的过程,其要求和地位都在不断提高.《课程标准2021年版》把“概率与统计”与“函数”“代数与几何”并列作为高中数学课程内容主线之一,并贯穿必修、选择性必修和选修整个数学课程.除了在初中统计基础上进一步学习数据收集和整理的方法、数据直观图表的表示方法、数据统计特征的刻画方法外,要求能用样本的统计特征推断总体的统计特征,包括单变量总体集中趋势参数、离散程度参数、取值规律和百分位数的估计,双变量总体的相关关系、一元线性回归模型和独立性的推断.相比初中统计以描述统计为主,高中统计以推断统计为主,更加强调数据的随机性.在统计的学习过程中,应让学生感悟在实际生活中进行科学决策的必要性和可行性;体会统计思维与确定性思维的差异、归纳推断与演绎证明的差异;通过实际操作、计算机模拟等活动,积累数据分析的经验.通过统计的学习,还应帮助学生建立正确的随机观念,养成通过数据来分析问题的习惯,学会抓住事物的主要因素等,发展数据分析、数学建模、逻辑推理、数学运算和数学抽象等数学学科核心素养,实现统计的教育价值.一、本章内容安排统计是通过数据分析来解决问题的,数据分析的过程体现了统计解决问题的基本思路.因此,让学生了解这个过程,对整体把握统计学科的特点,理解具体的数据分析方法和应用数据分析方法解决实际问题都是非常重要的.数据分析的过程存在多种不同的划分,《课程标准2021年版》对数据分析过程的划分如下:虽然在不同的数据分析过程划分中,划分的环节数、每个环节提法等不完全一致,但都遵循从收集数据到分析数据再到得出结论的基本过程.本章内容主要根据数据分析的基本过程进行安排,把学习内容分为三节.“9.1随机抽样”主要学习收集和整理数据的方法;“9.2样本估计总体”主要学习分析数据的方法,包括数据直观图表的表示方法和数据统计特征的刻画方法等,以及根据样本数据的统计特征估计总体的统计特征;“9.3统计案例公司员工的肥胖情况调查分析”是对前两节所学知识的综合应用.本章的知识结构如下:二、突出数据分析的基本过程,在过程中学习数据分析方法为了达到有效分析数据的目的,统计中会用到各种数据分析的方法,每个数据分析环节都有各自专属的数据分析方法,例如数据收集有随机抽样方法,数据分析有各种数字特征等,这些方法构成了统计研究和学习的主要内容.虽然很多具体的数据分析方法是针对数据分析过程中的某一个环节的,但其方法的合理性要放在整个数据分析过程中去理解.例如,一种抽样方法好坏要通过其抽取的数据对总体估计的效果进行评价,一个数字特征的选取合适与否取决于是否达到最终的统计目的等.因此,要理解数据分析方法的合理性,不能只针对某个环节孤立地进行学习,而应该放在数据分析的过程中进行学习.本章不管是抽样方法的学习,还是样本估计总体的学习,都尽可能通过具体案例的完整解决,让学生经历数据分析的基本过程,在基本过程中来学习数据分析的方法,理解数据分析的思路,并运用所学知识和方法解决实际问题.例如,简单随机抽样方法属于数据收集的内容,教科书并不是直接介绍简单随机抽样方法的定义和不同实现方法,而是设置了以下的问题:问题1家具厂要为树人中学高一年级制作课桌椅,事先想了解整个年级学生的平均身高,以便设定可调节课桌椅的标准高度.已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本?这是一个以估计总体均值为目的的抽样调查问题,但问题的解决需要经历数据分析的整个过程.在这个问题的解决过程中,不仅学习简单随机抽样方法的实现,还要通过总体均值和样本均值的比较,评价简单随机抽样方法的效果,体会简单随机抽样方法的特点.三、结合典型案例学习数据分析方法统计学是一门应用性很强的学科,它的概念和方法产生的动力基本都来自解决实际问题的需要.与建立在概念和定义基础上,通过演绎方式进行研究的数学其他分支不同,统计学是建立在数据基础上,通过归纳方式研究随机现象,通过数据分析解决问题.因此,统计的学习有别其他数学分支,需结合具体案例,由具体问题驱动学习,在问题的解决中体会数据的随机性,学习统计的概念和方法,积累数据分析的经验.而且结合具体案例还可以克服由于概念和方法的抽象性带来的理解困难.因此,结合具体案例介绍概念和方法是统计教科书编写的一个主要原则.由于统计的概念和方法都有各自的特点和适用范围,因而根据不同内容的特点,选择典型的案例就成为一个关键的问题.在中学阶段,案例的典型性不仅要体现统计概念、方法引入的必要性和解决问题的适切性,案例的背景还要符合学生的认知特点,有助于理解相关的概念和方法.教科书要尽量采用学生熟悉的案例背景,通过设计恰当的统计问题,在问题的解决中学习有关统计知识.例如,教科书在学习具体的抽样方法前,通过全国人口调查这个案例引入统计调查中涉及的一些基本概念.一方面,全国人口调查是学生比较熟悉的真实统计调查案例,让学生感受统计学科的重要性和应用性.另一方面全国人口调查不仅有普查,还有抽样调查,除了可以引入全面调查、抽样调查、总体、个体、样本、样本量等基本概念外,通过了解全国人口调查实施普查和抽样调查的背景及原因,可以进一步明确两种抽样方式的特点,以及抽样调查的必要性,帮助学生建立和完善有关统计调查的概观知识.这对后续进入具体随机抽样方法的学习是非常必要的.又如,教科书以同一个案例背景贯穿简单随机抽样和分层随机抽样的学习.在简单随机抽样问题1的基础上,教科书在随机分层抽样中设置了以下问题:问题2在树人中学高一年级的712名学生中,男生有326名、女生386名.能否利用这个辅助信息改进简单随机抽样方法,减少这种“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?教科书之所以采用“调查一个学校高一年级的平均身高”作为抽样调查的案例,主要考虑在通常情况下,对于一所学校的高一年级的学生数,既有进行抽样调查的必要性,又有进行全面调查的可行性,即获得总体均值是可行的,这使教科书后续比较样本均值与总体均值,进而评价随机抽样的效果显得比较自然.而两种抽样方法的学习使用同一案例背景,只是改变男生、女生人数这个条件,不仅有利于比较两种抽样方法的效果,而且有利于理解两种抽样方法的联系与区别.四、加强数据分析方法的形成过程,体现方法的合理性在数据分析方法中会用到很多数学的工具,如果不了解数学符号和公式背后的统计思想和数学原理,容易把统计学习变成纯粹的画图列表、公式计算等程序性操作,学生体会不到数据分析方法的合理性.方法引入的必要性,可以通过合适的案例背景来体现,而体现方法的合理性,则需要加强从直观想法到数学表达的转化过程,这个过程也是积累数据分析经验的过程.体现了方法的必要性和合理性,不仅使得知识的产生显得自然,也有利于学生更好地把握方法的本质.本章数据分析方法中,数学工具的使用主要是在用数字特征刻画数据的统计特征中.对于数字特征,主要是要理解其统计含义.有些数字特征的定义形式比较简单,其统计含义相对比较容易理解.例如,平均数刻画了一组数据平均水平,众数是一组数据最典型的代表,极差刻画了一组数据的波动范围等.但有些数字特征的数学表达相对复杂,其统计含义有时并不能一目了然,例如中位数、方差、标准差,尤其是分层抽样的方差公式.对于数字特征,往往是先有刻画数据某一方面的特征需要,再根据需要定义数字特征的.如果了解数字特征定义的目的是刻画数据哪一方面的特征,不仅有助于学生理解数字特征的统计含义,而且有利于理解数字特征定义的形式.例如,如果学生了解了中位数是把一组数据按大小分成个数相等两部分的那个数,就很容易理解中位数为什么要根据数据的个数,分奇偶两种情况进行定义.又如,方差和标准差都可以用来刻画一组数据离散程度,它们的公式初看起来都比较复杂,但了解了它们定义的过程,就容易理解它们在刻画数据离散程度上的特点,以及之所以定义成现在这种形式.为了让学生更好地理解方差和标准差的统计含义,积累数据分析的经验,教科书详细呈现了方差概念的形成过程.教科书首先通过比较两名射击运动员成绩稳定性,让学生体会定义数字特征刻画数据离散程度的必要性.通过分析,把刻画一组数据的离散程度问题逐步转化为刻画与平均数的“平均距离”大小的数学问题.在数学中,距离可以有多种定义,教科书先呈现学生最容易想到的“绝对值距离”,由于绝对值的数学性质不够好,为了避免含有绝对值,又引入“平方和距离”,以此作为刻画数据的离散程度的数字特征,即方差.这个从统计直观到数学表达逐步优化的数据分析过程,在数字特征的定义中具有一般意义,积累的经验有助于理解选择性必修中样本相关系数的定义.五、加强信息技术与统计的融合1.培养学生使用信息技术的意识和初步能力统计是通过数据分析解决问题的.在数据分析中经常会涉及数据的整理、可视化表示、计算等数据处理,尤其当样本量比较大时,工作量就会变得非常大.运用计算器、计算机等信息技术工具,不仅可以实现快速、准确地列表、画图、计算等数据处理,而且能使大量人工难以完成的数据处理变成可能.会使用信息技术处理数据是现代统计学习的重要组成部分.在高中统计的学习中,应该培养学生使用信息技术的意识和初步能力.为了给学生在统计学习中运用信息技术提供支持,在高中统计的起始章,教科书安排选学栏目“信息技术应用统计软件的应用”,集中介绍电子表格和R两款软件的基本统计功能,其中电子表格软件是使用比较普遍且具有一定统计功能的办公软件,而R软件则是统计专业人员中使用普遍且免费的专业统计软件.在后续统计的章节中,教科书结合有关内容,在适合使用的信息技术的地方,以边注的形式对给予提示.2.利用信息技术提高教学的效率和质量信息技术既是现代统计的组成部分,也是统计学习的有效辅助手段.通过合理使用信息技术,可以把学生从机械、烦琐的数据处理中解放出来,把更多精力集中于统计概念和方法的理解,从而提高教学的效率和质量.例如,绘制频率分布直方图涉及数据的分组、频率的计算、图形的绘制等大量工作,用统计软件可以快速绘制出不同组距和组数的直方图,节约重复计算、机械性操作的时间,把更多的精力花在直方图信息的提取上.又如,平均数、方差等特征数的计算,在学生已经知道如何计算的情况下,统计软件的使用就可以大大节约时间,进而把更多的精力花在理解特征数的统计含义上.3.通过随机模拟直观解释数据分析方法的合理性统计是研究数据收集和分析数据的科学,其研究重点是如何有效地收集和分析数据,所有数据分析方法都是为了达到这个目的.这里的“有效”既包括人力、物力、时间的节省,也包括估计精确度和可靠度的提高.在没有足够概率理论知识刻画估计的精确度和可靠度时,如何让学生了解样本和总体的关系,体会数据分析方法的科学性就成为统计内容呈现的重点.在中学统计中,信息技术一个很大的作用是可以实现随机模拟,它使大量重复试验成为可能.通过随机模拟,可以让学生体会样本数据的随机性和规律性,了解样本和总体之间的关系,这可以在很大程度上直观解释一些数据分析方法的合理性,弥补由于理论知识不足造成的理解困难.例如,在随机抽样的学习中,需要讨论样本量对于抽样估计效果的影响,以及评价简单随机抽样和分层随机抽样的估计效果,在理论上进行说明并不容易.因此,教科书通过随机模拟的方式,让学生直观观察的多次抽样的结果图1和图2,在此基础上归纳概括随机抽样方法的特点.。
必修2数学第九章统计知识点一、随机抽样。
1. 简单随机抽样。
- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
- 常用方法:抽签法和随机数法。
- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。
2. 系统抽样。
- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
- 步骤:- 先将总体的N个个体编号。
- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。
- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。
- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。
3. 分层抽样。
- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。
- 步骤:- 根据已有的信息,将总体分成互不相交的层。
- 计算各层中个体的个数与总体个数的比。
- 按各层个体数占总体数的比确定各层应抽取的样本容量。
- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。
- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。
二、用样本估计总体。
第九章统计(公式、定理、结论图表)1.全面调查和抽样调查调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中①抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体称为样本.样本量:样本中包含的个体数称为样本量2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中②逐个抽取n(1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都③相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内④未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个⑤不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=⑥Y1+Y2+…+Y NN ⑦1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i 1,2,…,k),则总体均值还可以写成加权平均数的形式Y⑧1 N∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=⑨y1+y2+…+y nn ⑩1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行①简单随机抽样,再把所有子总体中抽取的样本②合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层③样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.7.画频率分布直方图的步骤(1)求极差:极差为一组数据中①最大值与②最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成③5~12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、④频数累计、频数、⑤频率.其中频数合计应是样本容量,频率合计是⑥1;(5)画频率分布直方图:横轴表示分组,纵轴表示⑦频率组距.小长方形的面积组距×⑧频率组距⑨频率,各小长方形的面积的总和等于1.8.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图反映统计对象在不同时间(或其他合适情形)的发展变化情况9.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.10.计算一组n个数据的第p百分位数的步骤第1步,按②从小到大排列原始数据.第2步,计算i ③n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的④平均数.11.四分位数⑤第25百分位数,⑥第50百分位数,⑦第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.12.众数、中位数和平均数的定义(1)众数:一组数据中①出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于②中间位置的数.如果这组数据是偶数个,则取③中间两个数据的平均数.(3)平均数:一组数据的④和除以数据个数所得到的数.13.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的⑤横坐标与小矩形的⑥面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该⑦相等.(3)众数:众数是⑧最高小矩形底边的中点所对应的数据.【特别提醒】众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中信息很少的一部分,对极端值不敏感14.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为①1n∑i=1n(x i-x)2②1n∑i=1nx i2-x2,标准差为③√1n∑i=1n(x i-x)2.15.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2④1N∑i=1N(Y i-Y)2为总体方差,S ⑤√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i 1,2,…,k),则总体方差为S2⑥1N∑i=1kf i(Y i-Y)2.16.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2⑦1n∑i=1n(y i-y)2为样本方差,s ⑧√s2为样本标准差.17.标准差的意义标准差刻画了数据的⑨离散程度或⑩波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【特别提醒】对标准差和方差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.18.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].<解题方法与技巧>1.使用分层随机抽样法应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.2.进行分层随机抽样的相关计算时,常用到的关系(1)样本容量n总体容量N 该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;(3)样本的平均数和各层的样本平均数的关系:w mm+n x+nm+ny MM+Nx+NM+Ny.典例1:某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定.3.频率分布直方图的性质(1)因为小长方形的面积组距×频率组距=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.(2)在频率分布直方图中,各小长方形的面积的总和等于1.(3)样本容量频数相应的频率.4.频率分布直方图中第p百分位数的计算方法方法一:(1)确定百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为f a%,f b%,则第p百分位数为a+p%-f a%f b%-f a%×(b-a).方法二:设出百分位数的值,利用百分位数的定义计算.典例2:为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.5.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.6.利用样本数字特征进行决策时的两个关注点(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响较大;中位数是样本数据所占频率的等分线,不受极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.7.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点8.计算分层随机抽样的方差s 2的步骤(1)确定x 1,x 2,s 12,s 22;(2)确定x ;(3)应用公式s 2 n1n [s 12+(x 1-x)2]+n2n [s 22+(x 2-x)2]计算s 2.9.数据分析的要点要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从平均数的大小去决定哪一组的成绩好,解决像这样的实际问题还得从实际的角度去分析.典例3:甲、乙两人在一次射击比赛中各射靶5次.两人成绩的统计表如甲表、乙表所示,请根据你所学统计知识,进一步判断这两个人这次比赛中的成绩情况. 甲表:乙表:【解析】甲、乙两人比赛的中位数、平均数如下:甲的平均数是4567865x ++++==甲;乙的平均数是536965x ⨯++==乙;甲、乙的平均数都是6,甲的中位数是6,乙的中位数是5,甲的总体成绩好些; 从方差看,甲的方差是2222221[(2)(1)012]25s =-+-+++=甲, 乙的方差是22221[3(1)03] 2.45s =⨯-++=乙;甲的成绩较乙的成绩好;甲的极差是8―4=4,乙的极差是9―5=4.【总结升华】平均数、众数、中位数描述了数据的集中趋势,极差、方差和标准差描述了数据的波动大小,也可以说反映了各个数据与其平均数的离散程度,方差越大,数据的离散程度越大,越不稳定;方差越小,数据的离散程度越小,越稳定.。