高考数学 第九章第二节 用样本估计总体新人教A版
- 格式:ppt
- 大小:1.29 MB
- 文档页数:61
人教A 版数学必修第二册第九章《统计》同步讲义9.2 用样本估计总体一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积= =频率.(二)频率分布直方图的性质1.因为小矩形的面积= = ,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数.(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n 个数据的第p百分位数的一般步骤如下:第1步,按从小到大排列原始数据;第2步,计算i =n ×p %;第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.四.总体集中趋势的估计(一)众数、中位数、平均数1.众数:一组数据中出现次数最多的数.2.中位数:如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n(x 1+x 2+…+x n )叫做这n 个数的平均数.(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 五.总体离散程度的估计1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数= ,方差为标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.4.分层随机抽样的方差设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,s 2,…,s 2n ,相应的权重分别为w 1,w 2,…,w n,则这个样本的方差为x s =Y n22i i 11S (Y Y)N ==-∑n222ii i i 1S w [S(x x)]==+-∑题型一 总体取值规律的估计【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )A .800B .600C .700D .750【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )A .45B .46C .54D .70【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多()[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,2050350kW h ⋅:[100,200)A .16B .30C .32D .62【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )A .这10年的人口出生率逐年下降B .这10年的人口出生率超过12‰的年数所占比例等于45%C .这10年的人口出生率的80%分位数为13.57‰D .这10年的人口出生率的平均数小于12‰题型二 总体百位分数的估计【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )A .290B .295C .300D .330【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是()[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]A .55B .57.25C .58.75D .60题型三 总体集中趋势的估计【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.则三个结论中,正确结论个数为( ).A .3B .2C .1D .0【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )A .B .C .D .【例3-3】(2023春·浙江温州)(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质a b c <<b a c <<a c b <<b<c<a量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )A .估计该样本的众数是B .估计该样本的均值是C .估计该样本的中位数是D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人题型四 总体离散程度的估计【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )A .甲的平均数大,方差小B .平均数相等,甲方差大C .平均数相等,甲方差小D .平均数和方差都相等【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则()4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)87.58086852200A .骑车时间的中位数的估计值是22分钟B .坐公交车时间的40%分位数的估计值是19分钟C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )A .若数据,方差,则所有的数据都为0B .若数据,的平均数为,则的平均数为6C .若数据,的方差为,则的方差为12D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于9012,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n = 12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%答案解析一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:极差为一组数据中最大值与最小值的差.2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=小组频数样本容量.5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.(二)频率分布直方图的性质1.因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。