高中数学复习课统计教学案苏教版
- 格式:doc
- 大小:456.50 KB
- 文档页数:14
苏教版高中高二数学必修3《统计》教案及教学反思一、教学目标通过本节课的学习和思考,让学生了解并掌握以下知识:1.了解概率统计是什么,以及它在我们日常生活中的应用;2.掌握二项分布的概念、性质和应用,能够利用二项分布进行实际问题的解决;3.掌握泊松分布的基本知识和特点,能够根据实际情况选择不同的分布模型;4.能够利用中心极限定理解决实际问题和对数据进行分析。
二、教学内容1. 概率统计(1)概念概率统计是概率论和统计学的组合,它主要研究随机现象的规律和规律的应用问题。
(2)应用在我们的生活和工作中,概率统计有着非常重要的应用。
例如:天气预报、金融风险分析、质量控制、医学诊断等等。
2. 二项分布(1)概念二项分布是把n个相同的独立的伯努利试验重复进行,且每次试验只有两个结果时的概率分布。
(2)性质二项分布具有以下性质:•试验次数n确定时,二项分布仅由成功概率p确定;•二项分布是离散分布,其取值只能是非负整数;•二项分布是对称的当且仅当p=0.5.(3)应用二项分布的应用非常广泛,例如:球类比赛的胜负、某种产品的合格率、股票价格上涨或下跌的概率等。
3. 泊松分布(1)概念泊松分布是一种离散分布,它适用于表示单位时间或空间内某事件发生次数的概率分布。
(2)特点泊松分布的特点:•事件出现次数的概率与时间长度成正比,与时间长度无关;•事件的发生是独立的,且在一段时间内发生的次数是有限的;•很多的小概率事件会造成一个大概率事件。
(3)应用泊松分布广泛应用于解决人群中非病因的死亡率、单位时间内某机器失效的次数、电话交换机接到电话的数量等问题。
4. 中心极限定理(1)概念中心极限定理是数理统计学的基本定理,它表明在适当的条件下,大量独立随机变量之和的分布趋近于正态分布。
(2)应用中心极限定理常被应用于测量样本的均值和方差,通过对均值和方差的估计抽取出随机变量,从而推断总体的均值和方差。
三、教学方法本节课的教学采用多媒体辅助教学的方式,老师通过讲授理论知识,观看视频,模拟实验等多种形式将重点难点知识点讲透彻,深入学生的思想中。
2。
4线性回归方程庖丁巧解牛知识·巧学一、相关关系变量之间的常见关系:一类是确定性函数关系,变量之间的关系可以用函数表示.如正方形的边长l与面积S之间就是确定性函数关系,可以用函数S=l2表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x有关。
一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系。
在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.辨析比较函数关系与相关关系的区别与联系相同点:两者均是指两个变量间的关系;不同点:①函数关系是一种确定性关系,自变量的任一取值,因变量都有唯一确定的值与之对应;相关关系是非确定性关系,因变量的取值具有一定的随机性;②函数关系是因果关系,而相关关系不一定是因果关系,也可能是伴随关系;③相关关系的分析方向及方法,由于相关关系的不确定性,在寻找变量间相关性的过程中,统计发挥着重要的作用,而函数关系则可以通过函数的性质来进行研究.二、线性回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析。
通俗地讲,回归分析就是寻找相关关系中非确定性关系的某种确定性。
1。
散点图我们把表示具有相关关系的两个变量x、y的一组数据(x n,y n)(n=1,2,3,…)对应的一些点(即样本点)画在坐标系内,得到的图形叫做散点图。
如:某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据:(单位:千克)施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455观察表中数据,大体上随着施化肥量的增加,水稻的产量也在增加。
只是表中两者之间的关系表现得不是很确切,需要对数据进行分析.为此我们可以作统计图表,以便对两者有一个直观的印象和判断.除上述的统计图表外,我们还可以用另一种统计图——散点图来分析。
苏科版数学统计高中教案
教学内容:苏科版高中数学统计部分
教学目标:使学生了解数学统计的基本概念,掌握统计的基本方法和应用技巧。
教学重点:数据的收集、整理和处理;统计量的计算和解释;概率的计算和应用。
教学难点:数据的分析和解读;概率的复杂计算和应用。
教学准备:
1. 教师备课:准备教案、教材、教具等教学资源;
2. 学生备课:学生复习前几章内容,预习本节课内容;
3. 教室准备:确保教学环境符合教学要求。
教学过程:
一、导入(5分钟)
1. 简要复习上节课内容;
2. 引入本节课要学习的内容。
二、讲解(15分钟)
1. 数据的收集与整理;
2. 数据的图表表示;
3. 统计量的计算和解释;
4. 概率的概念和计算方法。
三、练习(20分钟)
1. 完成教材中相关习题;
2. 分组讨论解题思路;
3. 随堂测验。
四、总结(5分钟)
1. 课堂小结本节课内容;
2. 引入下节课内容。
五、作业(5分钟)
布置相关作业。
教学反思:
本节课的教学重点在于让学生掌握统计量的计算和解释,以及概率的计算方法。
通过练习和讨论,学生的学习兴趣和动力得到了激发。
下一节课将进一步巩固和拓展学生对数学统计和概率的理解。
高中数学统计章节教案
目标:通过本节课的学习,学生能够了解统计学的基本概念、方法和应用,能够实际运用
统计方法解决问题。
教学重点:统计的基本概念、数据的整理和描述统计
教学难点:数据的整理和描述统计的应用
教学过程:
一、导入(5分钟)
教师引入统计学的概念,向学生介绍统计学的意义和作用,并举一些实际生活中统计数据
的例子。
二、讲解知识点(15分钟)
1. 统计的定义
2. 数据的分类
3. 数据的整理方法:频数表、频率表、直方图等
4. 描述统计:均值、中位数、众数、标准差等
三、示例分析(15分钟)
老师通过例题向学生讲解数据的整理和描述统计的具体方法,并带领学生一起分析样本数据,计算各种描述统计指标。
四、练习(15分钟)
让学生自行分析一组数据,并完成相应的描述统计工作,包括计算均值、中位数、众数、
标准差等,并进行数据的图表展示。
五、小结(5分钟)
总结本节课的内容,强调统计在解决问题中的重要性,并提醒学生掌握好统计的基本方法。
六、作业布置(5分钟)
布置练习题作业,要求学生通过实际问题应用所学知识,完成描述统计的计算和分析。
教学反思:
本节课主要介绍了统计学的基本概念和方法,包括数据的整理和描述统计。
通过实例分析和练习,学生能够更好地掌握统计学的基础知识,并能够应用到实际问题中。
希望学生能够在课后多加练习,加深对统计学的理解和应用能力。
2.1.2 系统抽样整体设计教材分析当总体中个体比拟多,抽签法与随机数表法用于选取样本就比拟烦琐,而且也不能保证样本代表性,所以本节课将要学习又一种新抽样方法——系统抽样.在教学时教师不仅要让学生了解系统抽样概念,而且还要让学生掌握如何进展系统抽样,以及在进展系统抽样时所要注意一些事项,如怎样进展分段,应该分成多少段,分段时如总体个数不能被样本容量整除怎么办等等.在教学中要教会学生会比拟各种方法适用范围与各自优缺点,并会根据实际情况选择恰当抽样方法,且在讲解系统抽样时必须紧扣“每个个体被抽取概率是相等〞理论依据.黑格尔说:“教师是学生心目中‘权威人物’,是儿童心目中最神圣偶像.〞因此,我们教师在教学中要建立民主师生关系,要有意突破常规,让学生敢于在课堂上表现自己,教师也要善于表扬他们.教学时,教师要让学生充分发挥自己潜能,培养他们会对现有知识独立钻研创新精神,并培养他们会用现有知识合理辐射数学思维,得出一些具有个人特色正确结论.三维目标了解系统抽样概念及抽样步骤,会用系统抽样从总体中抽取样本,能运用所学知识判断、分析与选择抽取样本方法.能从现实生活或其他学科提出有价值数学问题,并能加以解决,培养学生运用统计思想表达思考与解决现实世界中问题能力,让学生感受数学美学价值在于鲜活实际应用,立志于学习与研究数学,最大限度地用数学知识效劳于社会,同时自身也能获得最正确生存环境.重点难点教学重点:系统抽样应用.教学难点:对系统抽样中“系统〞思想理解;对样本随机性理解.课时安排1课时教学过程导入新课当总体中个体数比拟多时,采用抽签法或随机数表法那么比拟烦琐,那么该如何抽样?如:某校高一年级共有20个班,每班有50名学生.为了了解高一学生视力状况,从这1 000人中抽取一个容量为100样本进展检查,应该怎样抽取?学生思考,交流讨论,然后代表发言,教师修改总结.推进新课新知探究1.将总体平均分成几个局部,然后按照一定规那么,从每个局部中抽取一个个体作为样本,这样抽样方法称为系统抽样〔systematic sampling〕.2.假设要沉着量为N总体中抽取容量为n样本,系统抽样步骤为:〔1〕采用随机方式将总体中N 个个体编号;〔2〕将编号按间隔k 分段,当n N 是整数时,取k=n N ;当n N 不是整数时,从总体中剔除一些个体,使剩下总体中个体个数N′能被n 整除,这时取k=nN ,并将剩下总体重新编号; 系统抽样与简单随机抽样联系:将总体均分后每一局部进展抽样时,采用是简单随机抽样.系统抽样优点是简便易行,当对总体构造有一定了解时,充分利用已有信息对总体中个体进展排队再抽样,可提高抽样效率;当总体中个体存在一种自然编号时,便于施行系统抽样法.系统抽样缺点是在不了解样本总体情况下,所抽出样本具有一定偏差.〔3〕在第一段中用简单随机抽样确定起始个体编号l ;〔4〕按照一定规那么抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k 个体抽出.应用例如〔多媒体出示题目,学生思考〕例1 一条流水线生产某种产品,每天都可生产128件这种产品,我们要对一周内生产这种产品作抽样检验,方法是抽取这一周内每天下午2点到2点半之间下线8件产品作检验.这里采用了哪种抽取样本方法分析:此抽样选用了“等时〞抽样,与“等间距〞类似而作出判断.解:系统抽样.点评:解决此题要弄清楚目前所学两种抽样概念与特点.例2 某校为了了解全校住校生对学校食堂意见,打算从全校1 000名住校生中抽取50名进展调查,用系统抽样法进展抽取,并写出过程.分析:根据系统抽样步骤可解此题.解:首先将这1 000名学生从1开场进展编号,然后按号码顺1000=20,再从号码1~20第一段中序均分成50段,每段个体数为50用简单随机抽样抽取一个号码,假设抽到是9号,然后从9 开场,每隔20个号码抽取一个,这样就得到容量为50样本编号:9、29、49、…、989,这样,我们就得到一个容量为50样本,这种抽样方法就是系统抽样.N是整数.点评:此题“分段〞比拟方便,因为分段间隔k=n例3 某单位在岗职工共624人,为了调查工人用于上班途中所用时间,决定抽取10%工人进展调查,如何采用系统抽样方法完成这一抽样?分析:总体中每一个个体,都必须等可能地入样.为了实现“等距〞入样,且又等概率,应先剔除,再“分段〞,后定起始数.解:抽样过程如下:〔1〕先将在岗工人624人,用随机方式编号〔如按出生年月日编号〕:000,001,002, (623)〔2〕由题知应抽取62人作为样本,因为624不能被62整除,所以应从总体中剔除4个,将余下620人按编号顺序补齐000,001,002,…,619,并分成62个段,每段10人.〔3〕在第一段000,001,002,…,009这十个编号中,随机定一个起始号l 〔如006〕.〔4〕最后编号为006,016,026,…,59610名工人就为所要抽取样本.点评:1.系统抽样步骤可概括为:〔1〕编号〔采用随机方式将总体中个体编号,为简便起见,有时可直接利用个体所带号码,如考生准考证号、街道上各户门牌号,等等〕.n N 〔N 为总体中个体数,n 为样本容量〕是整数时, k=n N ;当n N 不是整数时,通过从总体中剔除一些个体,使剩下个体数N′能被n 整除,这时k=nN 〕. 〔3〕确定起始个体编号l 〔在第一段用简单随机抽样确定起始个体编号l 〕.〔4〕按照事先确定规那么.......抽取样本〔通常是将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕.“事先确定规那么〞说明不一定按“通常〞方法〔即将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕来抽取样本.2.学生解答,归纳步骤后由学生修改整理,教师巡视点拨,对整理较好同学进展及时表扬或鼓励,激发学生自信.思考:在用系统抽样方法抽样过程中,会用怎样“规那么〞来取除起始号以外其他编号呢?看例4.例4 一个总体中有100个个体,随机编号为0、1、2、 (99)依编号顺序平均分成10个小组,组号依次为1、2、3、…、10,现用系统抽样方法抽取一个容量为10样本,规定如果在第1组随机抽取号码为m,那么在第k(k≥2)组中抽取号码个位数字与m+k个位数字一样.假设m=6,那么第7组中抽取号码为__________________.分析:此题与课本中总结“通常〞方法〔即每隔10抽出一个号码〕有所不同,挖掘点在于条件“第一个号码m之后,在第k组中抽取号码个位数字与m+k个位数字一样〞.解:因为,第1组号码0~9;第2组号码10~19;第3组号码20~29;依次下去第7组中抽取号码十位数字是6.此题要求“在抽取了第一个号码m之后,在第k组中抽取号码个位数字与m+k 个位数字一样〞限制了各组抽出号码个位数.利用m及k值,求出m+k个位数字,即此题中由m=6,k=7得m+k=13,显然,m+k=13个位数字是3,故从第7组中抽取号码是63.所有被抽出号码依次为:6,18,29,30,41,52,63,74,85,96.它们“不等距〞.点评:此题是福建2004年高考卷第15〔文〕题,如果按照系统抽样经历做法“等间距〞做此题话,那么不达.一位教育专家曾指出:学习如果过分地依赖学习者经历或感情世界,即通过纯粹经历积累,而不是通过认知活动对经历进展加工,那么学习将会出现危机,因此必须重视人思维教育.所以,我们在教学时要留足够时间给学生探究,充分暴露学生思维,让学生自己打破思维中过多“经历〞束缚,展示学生创造性学习思维活动过程.知能训练课本本节练习.解答:1.系统抽样中总体与样本比必须是整数,而1 252被50整除余2,因此必须随机剔除2人.应选A.2.具体步骤为:第一步,将1 003名学生,用随机方式编号〔如按出生年月日编号〕:0000,0001,0002,…,1 002.第二步,由题知:应抽取20名学生作为样本,因为1 003不能被20整除,所以应从总体中随机剔除3名学生,将余下1 000名学生按编号顺序补齐为0000,0001,0002,…,0999,并分成20个段,每段50名学生.第三步,在第一段0000,0001,0002,…,0049这50个编号中,随机定一个起始号l〔如0006〕.第四步,编号为0006,0056,0106,…,095620名学生就是所要抽取样本.3.可选择在某个年级进展,如选择高一年级.先将所有学生随机地进展编号;然后将他们分成m段,每段n人〔如总人数不能被均分,可随机地剔除几个人再分〕;再从第一段随机抽取一个号码〔如l〕;那么编号为l,l+n,l+2n,…,l+(m-1)n学生就是需要.最后测量这些学生两臂平展长度及身高,再分别计算两组数据平均数.课堂小结〔先让一位同学总结,其他同学补充,教师完善,并用多媒体展示出来〕(1)系统抽样适用于总体中个数较多情况,因为这时采用简单随机抽样显得不方便.(2)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中个体均分后每一段进展抽样时,采用是简单随机抽样.(3)与简单随机抽样一样,系统抽样也属于等概率抽样.作业为了了解某地参加英语口语水平测试5 027名学生成绩,从中抽取了200名学生成绩进展统计分析,请写出运用系统抽样抽取样本步骤.解:具体步骤为:第一步,将参加计算机水平测试5 027名学生用随机方式编号〔如按准考证编号〕0000,0001, (5026)第二步,由题知:应抽取200人作为样本,因为5 027不能被200整除,所以应从总体中剔除27个,将余下5 000人按编号顺序补齐0000,0001,…,4999,分成200个段,每段25人.第三步,在第一段0000,0001,…,0024这25个编号中,随机定一个起始号l〔如0022〕.第四步,编号为0022,0047,…,4997工人就为所要抽取样本.设计感想由于这局部内容比拟简单,所以整节课以学生为主,尤其是根底在中下游学生,要激发他们学习积极性,从而活泼课堂气氛,使每个学生都全身心投入,动脑、举例.。
2.3.1 平均数及其估计庖丁巧解牛知识·巧学一、平均数公式样本数据 a 1,a 2,…,a n 的平均数或均值:a a a1n1aa12ninni 1.在总体中抽取样本求出样本的平均数,这样就可以用它来估计总体的平均水平,应注意到样本 平均数只是总体平均数的近似.在样本频率分布直方图中,平均数是直方图的“重心”,即平 衡点.n学法一得 求和符号ai i 1的使用:“∑”希腊字母,表示求和的意思,读作“西格马”,n a i 中 i 是变量,i 从 1到 n,即 a 1,a 2,…,a n ,i 1a i只是一个符号,表示 a 1,a 2,…,a n 相加,n因此,ai i 1nn=a 1+a 2+…+a n ,用它书写比较方便.再如2 ,aia )(x等等.在统计学及高2i i 1i 1等数学中普遍使用这个符号. 二、平均数的性质(1)若给定一组数据 x 1,x 2,…,x n 的平均数为 x ,则 ax 1,ax 2,…,ax n 的平均数为 a x ; (2)若给定一组数据 x 1,x 2,…,x n 的平均数为 x ,则 ax 1+b ,ax 2+b ,…,ax n +b 的平均数为 a x +b ;(3)若给定的一组数据 x 1,x 2,…,x n 较大,直接求平均数较为烦琐时,可以将每个数据都 减去常数 a ,得到一组新数据 x 1′,x 2′,…,x n ′,计算出新数据组的平均数为 x ,则原数据组的平均数为 x+a ;(4)若 M 个数的平均数是 X ,N 个数的平均数是 Y ,则这 M+N 个数的平均数是MX MN Y N.如 果两组数 x 1,x 2,…,x n 和 y 1,y 2,…,y n 的样本平均数分别是 x 和 y ,那么一组数x1+y1,x2+y2, …,x n+y n的平均数是x2 y .三、众数,中位数,平均数各自的作用(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使得无法客观地反映总体特征.(2)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,容易计算,它仅1利用了数据中排在中间数据的信息.但它对极端值的不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所 以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正 因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息. 但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.联想发散 如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去 掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过 低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性. 四、加权平均数一般地,若取值 x 1,x 2, …,x n ,其频率分别为 p 1,p 2, …,p n , 则平均数为 a =x 1p 1+x 2p 2+…+x n p n .证明:设总体为 n ,样本 x 1,x 2, …,x n 出现的次数为 m 1,m 2, …,m n ,则 p 1= m 1 ,p 2= 2=n m 2 ,…,p n= nm n , n x mx mx m∴a1 122nn =x 1p 1+x 2p 2+…+x n p n.n使用此公式可简化计算. 典题·热题知识点一 样本平均数的基本概念110例 1 若 s 2=(x15) ,写出其展开式.2i10i 11 思路分析:原式是求 x 1-15,x 2-15,…,x 10-15共 10项的平方和的101解:s 2=[(x 1-15)2+(x 2-15)2+…+(x 10-15)2].10. 例 2 若 a 、b 、c 的平均数是 x ,则 2a+1,2b-1,2c+3的平均数是()a b cA.2aB.x +1C.D.2x +13a b c思路解析:[(2a+1)+(2b-1)+(2c+3)]/3=2+1.3答案:D知识点二 利用众数、中位数、平均数对总体进行分析 例 3被誉为“杂交水稻之父”的中国科学院院士袁隆平,为得到良种水稻,进行了大量的试验, 下表是在 10个试验点对甲、乙两个品种的对比试验结果:品种各试验点亩产量(kg)1 2 3 4 5 6 7 8 9 10甲390 409 427 397 420 482 397 389 438 432乙404 386 363 375 375 430 373 370 353 412试估计哪个品种的平均产量更高一些?思路分析:需要计算甲、乙两个品种的平均亩产量.解:甲、乙两个品种的样本平均数分别是2x=(390+409+…+432)÷10=418.1,甲x=(404+386+…+412)÷10=384.1.乙由x甲>x乙可以估计,甲种水稻的平均产量比乙种水稻的平均产量要高一些.巧解提示本题解法中计算平均数较繁,一般地,可以以400为常数a,所有各数分别减去400得出一组新数据,再求10个新数据的平均数x′,从而求出平均数x=x′+400,这样计算过程较为简便.例4 某工厂人员及工资构成如下表:人员经理管理人员高级技工工人学徒合计周工资 2 200 250 220 200 100人数 1 6 5 10 1 23合计 2 200 1 500 1 100 2 000 100 6 900(1)指出这个问题中的众数、中位数、平均数;(2)在这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?思路分析:本题应着眼于众数、中位数、平均数各自的特点及适应对象.众数是数据中出现次数最多的数.中位数是指如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数. 一组数据的总和除以数据的个数所得的商就是平均数.解:(1)由表格数据可知众数为200.∵2200+1 500=3 700>1 100+2 000+100=3 200,∴中位数为250.平均数为(2 200+1 500+1 100+2 000+100)÷23=300.(2)虽然平均数为300元/周,但由表格中所列出的数据可以看出,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.误区警示该题进一步说明平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观.问题·探究思想方法探究1 n问题我们常用算术平均数ain 1i〔其中a i(i=1,2, …,n)为n个实验数据〕作为数据a1,a2, …,a n的“最理想”的近似值,它的依据是什么呢?探究过程:处理实验数据的原则是使这个近似值与实验数据之间的离差最小.设这个近似值为x,那么它与n个实验值a i(i=1,2, …,n)的离差分别为x-a1,x-a2,x-a3,…,x-a n.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即(x-a1)2+(x-a2)2+…+(x-a n)2=nx2-2(a1+a2+…+a n)x+a12+a22+…+a n2,所以当x= a a a1 时,离差的平方和最小,2 nn故可用a a a1 2 n作为表示这个物理量的理想近似值.n3探究结论:平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小.4。
复习课(二) 统计抽样方法高考对抽样方法的考查主要是基础题,难度不大.系统抽样和分层抽样是考查的热点,考查形式以填空题为主.[考点精要]1.简单随机抽样(1)特征:①一个一个不放回的抽取.②每个个体被抽到可能性相等.(2)常用方法:①抽签法.②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.[典例](1)(山东高考改编)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________.(2)(江苏高考)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.(3)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为______.[解析](1)抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939,落入区间[451,750]的有459,489,…,729共10人,即做B 卷的有10人.(2)设应从高二年级抽取x 名学生,则x 50=310,∴x =15.(3)该地区中小学生人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取高中生近视眼人数为2 000×2%×50%=20.[答案](1)10 (2)15 (3)200,20 [类题通法](1)系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除.(2)分层抽样中,易忽视每层抽取的个体的比例是相同的.[题组训练]1.为了解1 000名学生的学习情况,采用系统抽样的方法从中抽取容量为40的样本,则分段的间隔为________.解析:根据系统抽样的特点可知,分段间隔为1 00040=25.答案:252.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.解析:抽样比为40150+150+400+300=4100.因此丙专业应抽取4100×400=16(人).答案:163.(北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为______.解析:设该样本中老年教师人数为x,则有x900=3201 600,故x=180.答案:180高考对各种统计图表的考查主要是基础题,频率分布条形图和直方图是考查的热点,但也要注意关注茎叶图。
江苏考卷在这一部分的考查形式主要是填空题,解决这部分考题,关键要掌握各类图表构成的要件及意义.[考点精要]统计图表的识读1.频率分布表的特点(1)表中所有频数之和等于样本容量. (2)表中所有频率之和为1. (3)各小组的频率=各小组的频数样本容量.2.频率分布直方图特点(1)纵轴上的点表示频率除以组距.(2)每一个小矩形面积等于这一小组的频率. (3)所有小矩形面积之和为1. 3.茎叶图(1)所有信息都可以从图中得到. (2)同一组数据中的相同数据要一一列出.[典例] (1)对一批产品的长度(单位:毫米)进行抽样检测, 如图为检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上为一等品, 在区间[15,20)和[25,30)上为二等品, 在区间[10,15)和[30,35]上为三等品. 用频率估计概率, 现从该批产品中随机抽取1件, 则其为二等品的概率是____________.(2)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为________.(3)(全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图.给出下列结论①逐年比较,2008年减少二氧化硫排放量的效果最显著;②2007年我国治理二氧化硫排放显现成效;③2006年以来我国二氧化硫年排放量呈减少趋势.其中正确结论的序号为________.[解析](1)由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45.(2)这10个数据落在区间[22,30)内的有22,22,27,29共4个,∴其频率为410=0.4.(3)由图知2007年到2008年二氧化碳排放量下降最多,故①对.由图知2006年到2007年矩形高度明显下降,故②对.由图知2006年以后除2011年稍有上升外其余年份都是逐年下降的,故③对.[答案](1)0.45(2)0.4(3)①②③[类题通法](1)解决该类问题时,应正确理解图表中各个量的意义,通过图表掌握信息是解决该类问题的关键.(2)各种统计图表的构成要熟悉;条形图和直方图不要混淆.[题组训练]1.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)由(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,得x=0.004 4.(2)数据落在[100,250)内的频率可求得为0.7,∴月用电量在[100,250)内的户数为100×0.7=70.答案:(1)0.004 4(2)702.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.解析:周长在[80,90)的频率为0.015×10=0.15,周长在[90,100)的频率为0.025×10=0.25,故符合要求的树木有(0.15+0.25)×60=24.答案:243.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,则购物的人数在[30,35)上的班数有________个.解析:在[30,35)中有30,33,34共3个. 答案:3样本的数字特征也是各类考试的重点内容之一:其中方差及平均数是考查的热点,但也要适当关注众数、中位数等.江苏考卷这一部分内容都考基础题,难度不大,考查形式以填空题为主,处理时首先要熟记相关公式及相关特征数的作用,其次要注意运算的准确性.[考点精要]给定一组数据x 1,x 2,…,x n众数在一组数据中,出现次数最多的数据叫做这组数据的众数 中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数)在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数 样本数据的平均数,即x -=1n(x 1+x 2+…+x n )方差S 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中s 为样本标准差据的中位数是________.(2)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:样本的数字特征则以上两组数据的方差中较小的一个为s 2=______.(3)(安徽高考)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.[解析](1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2)由题意知:x -甲=15(6+7+7+8+7)=7,x -乙=15(6+7+6+7+9)=7,s 2甲=15[(6-7)2+(8-7)2]=25,s 2乙=15[(6-7)2+(6-7)2+(9-7)2]=65,∵25<65,∴s 2=25. (3)由样本数据x 1,x 2,…,x 10的标准差s =8,得s 2=64,故数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.[答案](1)20 (2)25(3)16[题组训练]1.(广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x nn=5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n =2(x 1+x 2+…+x n )+nn=2x +1=2×5+1=11.答案:112.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该数据的方差s 2=________.解析:x =15(10+6+8+5+6)=7,∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165. 答案:1653.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则x甲________x乙,m甲________m乙(填“>”“<”).解析:可求x甲=34516,x乙=45716,∴x甲<x乙,又可求m甲=20,m乙=29,∴m甲<m乙.答案:<<1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为________.解析:由系统抽样的特点知,从号码003开始每间隔60050=12人抽出1个,设抽出的第n个号码为a n,则a n=3+12(n-1),n∈N*,由a n≤300知n≤25;由a n≤495知n≤42,所以第一营区被抽取的人数为25,第二营区被抽取的人数为42-25=17,第三营区被抽取的人数为50-42=8.答案:25,17,82.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.解析:抽样比为624=14,∴丙组中应抽取城市数为8×14=2.答案:23.从总体中抽取的样本数据共有m个a,n个b,p个c,则总体的平均数x的估计值为________.解析:因为总体平均数x的估计值就是样本平均数,故x=ma+nb+pc m+n+p.答案:ma+nb+pc m+n+p4.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,若甲运动员的中位数为a,乙运动员的众数为b,则a-b=________.解析:由茎叶图可知,a=19,b=11,∴a-b=8.答案:85.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是______________.解析:由茎叶图知中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案:46,45,566.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.解析:低于60分的频率是(0.005+0.01)×20=0.3,所以该班学生人数是150.3=50. 答案:507.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为________,________.解析:∵中位数为5,∴5=4+x 2,∴x =6. x =-1+0+4+6+7+146=5, s 2=16i =16(x i -x )2=16[(5+1)2+(5-0)2+(5-4)2+(5-6)2+(5-7)2+(5-14)2]=2423. 答案:5 24238.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.解析:志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.答案:129.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据.则A,B两样本的下列数字特征对应相同的是________(填序号).①众数②平均数③中位数④标准差解析:对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.答案:④10.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设x1≤x2≤x3≤x4,根据已知条件得到x1+x2+x3+x4=8,且x2+x3=4,所以x1+x4=4,又因为14[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2]=1,所以(x1-2)2+(x2-2)2=2,又因为x1,x2,x3,x4是正整数,所以(x1-2)2=(x2-2)2=1,所以x1=1,x2=1,x3=3,x4=3.答案:1,1,3,311.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88.则高一学生的达标率约为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.12.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13, x 乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.13.某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解:(1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).14.某种产品的广告支出x 与销售额y (单位:百万元)之间有如下的对应关系 x 2 4 5 6 8 y 30 40 60 50 70(1)假定y 与x 之间具有线性相关关系,求线性回归方程;(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?解:(1)x =15(2+4+5+6+8)=5, y =15(30+40+60+50+70)=50, 5i =1x 2i =22+42+52+62+82=145.5i =1x i y i =2×30+4×40+5×60+6×50+8×70=1 380.∴b =5i =1x i y i -5x y 5i =1x 2i -5x 2=1 380-5×5×50145-5×52=6.5, a =y -bx -=50-6.5×5=17.5,∴线性回归方程为y ^=6.5x +17.5.(2)由线性回归方程得y ^≥60,即6.5x +17.5≥60,∴x ≥8513≈6.54, ∴广告费用支出应不少于6.54百万元.。