高三总复习用样本估计总体1
- 格式:docx
- 大小:222.46 KB
- 文档页数:10
高考数学用样本估计总体知识点大全推荐文章总经理工作评语大全热度:乡镇补贴细则大全热度: 2017在校大学生入党申请书范文大全热度: 2019清明祭扫演讲稿大全热度:2017建军90周年观后感大全热度:高中数学课程标准中,用样本估计总体已经成为必修内容,下面是店铺给大家带来的高考数学用样本估计总体知识点大全,希望对你有帮助。
高考数学用样本估计总体知识点一、频率分布的概念1、概念:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2、频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
注;(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率频率,故每组样本的频率为组距×,即矩形的面积. 组距组距。
(3)直方图中每组样本的频数为频率×总体数.3、频率分布折线图、总体密度曲线(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(2)总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。
二、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
1、茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
用样本估计总体要用样本估计总体的平均数和方差,首先需要了解一些基本概念和方法。
这篇文章将从样本、总体、样本估计等方面进行讨论,并介绍一些常见的样本估计方法。
1.样本与总体:样本是指从总体中选取的一部分观察值,总体是指研究对象的全部观察值的集合。
通常情况下,我们无法直接获得总体的所有观察值,但可以通过选取一部分样本来对总体进行估计。
2.样本估计:样本估计是通过对样本数据进行分析,得出对总体的一些参数的估计值。
常见的参数包括总体的平均数、方差、比例等。
3.样本的选择:为了保证样本的代表性,需要采用一定的抽样方法。
简单随机抽样是常用的抽样方法之一,它的特点是每个样本被选中的概率相等。
其他常用的抽样方法包括等距抽样、分层抽样等。
4.样本均值的估计:样本均值是用来估计总体均值的一个重要指标。
样本均值的估计值可以通过计算样本观察值的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本均值的估计公式为:样本均值的估计值 = (x1 + x2 + ... + xn) / n。
其中,n表示样本容量。
5.样本方差的估计:样本方差是用来估计总体方差的一个重要指标。
样本方差的估计值可以通过计算样本观察值与样本均值之差的平方的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本方差的估计公式为:样本方差的估计值= ((x1 - 样本均值的估计值)^2 + (x2 - 样本均值的估计值)^2 + ... + (xn - 样本均值的估计值)^2) / (n - 1)。
其中,n表示样本容量。
6.置信区间:在样本估计中,通常需要给出一个区间估计来反映估计值的准确程度。
置信区间是一个包含总体参数真值的区间,置信度表示该区间包含总体参数真值的概率。
置信区间的计算需要考虑样本容量、样本分布以及所选的置信水平等因素。
综上所述,通过样本对总体的平均数和方差进行估计是统计学中常见的问题。
根据样本均值的估计和样本方差的估计公式,可以计算出相应的估计值。
高三数学用样本估计总体试题1.某学生在一门功课的22次考试中,所得分数如下茎叶图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5【答案】B【解析】22次考试分数最大为98,最小为56,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118,故选B.【考点】茎叶图.2. PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5的浓度越大,大气环境质量越差.右边的茎叶图表示的是成都市区甲乙两个监测站某10日内每天的PM2.5浓度读数(单位:),则下列说法正确的是( )A.这10日内甲、乙监测站读数的极差相等B.这10日内甲、乙监测站读数的中位数中,乙的较大C.这10日内乙监测站读数的众数与中位数相等D.这10日内甲、乙监测站读数的平均数相等【答案】C【解析】甲的极差是98-43=55,乙的极差是94-37=57,两者不相等,A错误;甲的中位数是=74,乙的中位数是68,甲的中位数较大,B错误;乙的众数为68,与中位数相同,C正确;甲的平均数是(43+63+65+72+73+75+78+81+86+98)×=73.4乙的平均数是(37+58+61+65+68+68+71+77+82+94)×=68.1,可知D错误【考点】统计,茎叶图,极差,中位数,众数,平均数.3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5) 4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5) 3根据样本的概率分布估计,大于或等于31.5的数据约占()A.B.C.D.【答案】B【解析】大于或等于31.5的数据是最后的3组,故大于或等于31.5的数据约占=.4.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)(2)质量指标值的样本平均数为100,质量指标值的样本方差为104(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)根据频率分布表与频率分布直方图的关系,先根据:频率=频数/总数计算出各组的频率,再根据:高度=频率/组距计算出各组的高度,即可以组距为横坐标高度为纵坐标作出频率分布直方图;(2)根据题意欲计算样本方差先要计算出样本平均数,由平均数计算公式可得:质量指标值的样本平均数为,进而由方差公式可得:质量指标值的样本方差为;(3)根据题意可知质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.试题解析:(1)(2)质量指标值的样本平均数为.质量指标值的样本方差为.所以这种产品质量指标值(3)质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【考点】1.频率分布表;2.频率分布直方图;3.平均数与方差的计算5.某车间名工人年龄数据如下表:合计(1)求这名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这名工人年龄的茎叶图;(3)求这名工人年龄的方差.【答案】(1)众数为,极差为;(2)详见解析;(3).【解析】(1)根据频率分布表中的相关信息结合众数与极差的定义求出众数与极差;(2)根据频率分布表中的信息以及茎叶图的作法作出这名工人年龄的茎叶图;(3)根据茎叶图所反映的信息,先求出平均数,然后根据方差的计算公式求出这名工人年龄的方差.(1)这名工人年龄的众数为,极差为;(2)茎叶图如下:(3)年龄的平均数为,故这名工人年龄的方差为.【考点】本题考查茎叶图、样本的数字特征,考查茎叶图的绘制,以及样本的众数、极差、平均数以及方差的计算,属于中等题.6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【答案】C【解析】由图知,样本总数为设第三组中有疗效的人数为,则,故选C.【考点】频率分布直方图.7.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)【答案】(1);(2),;(3)第4组.【解析】(1)由频率分布表与频率分布直方图即可得结果;(2)由频率分布直方图即可得的值;(3)求平均数..(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6=2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是.从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的概率为.(2)课外阅读时间落在组的有17人,频率为,所以,课外阅读时间落在组的有25人,频率为,所以.(3)估计样本中的100名学生课外阅读时间的平均数在第4组.【考点】本小题主要考查频率分布表、频率分布直方图、频率与概率的关系等基础知识,难度不大,熟练基础知识是解决好本类题目的关键.8.(2014·厦门模拟)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】因为=1,得a=-1,所以s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.9.在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积的,且样本容量为300,则中间一组的频数为( )A.30B.40C.50D.60【答案】C【解析】设中间一个小矩形的面积为x,则其余(n-1)个小矩形面积和为5x,所以x=。
第五章 用样本推断总体(考点讲义)1.样本容量:样本中个体的数目叫做样本容量。
2.在用样本特性估计总体特性时,要注意一是样本要有代表性,二是样本容量要足够大。
3.求平均数的公式:123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围,进一步组织学生开展课外阅读,让学生在丰富多彩的书海中,扩大知识源,亲近母语,提高文学素养.某校准备开展“与经典为友、与名著为伴”的阅读活动,活动前对本校学生进行了“你最喜欢的图书类型(只写一项)”的随机抽样调查,相关数据统计如下:请根据以上信息解答下列问题:(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整,并求出扇形统计图中小说所对应的圆心角度数;(3)已知该校共有学生800人,利用样本数据估计全校学生中最喜欢科幻人数约为多少人?【解析】(1)用其它初一它的百分比即可;(2)用360∘乘以所占得百分比;(3)用样本估计总体.解:(1)20÷10%=200(名).由图1,得n=40,m=100-20-10-40=30答:该校对200名学生进行了抽样调查;m=30,n=40(2)如图:小说对应的圆心角度数为360∘×20%=72∘;(3)800×30%=240.答:全校学生中最喜欢小说的人数约为240名.【对应训练1】为了估计湖里有多少条鱼,小刚先从湖里捞出了100条鱼做上标记,然后放回湖里去.经过一段时间,带有标记的鱼完全混合于鱼群后,小刚又从湖里捞出200条鱼,如果其中15条有标记,那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼,发现其中15条有标记”,即可求得有标记的所占比例,而这一比例也适用于整体,据此即可解答.【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”.粮仓开仓收粮,有人送来谷米1608石,验得其中夹有谷粒.现从中抽取谷米一把,共数得256粒,其中夹有谷粒32粒,则这批谷米内夹有谷粒约是________石.【答案】201【解析】根据256粒内夹谷32粒,可得比例,再乘以1608石,即可得出答案.【解答】解:根据题意,得1608×32=201(石),256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动,要求每人植3至6棵,活动结束后随机抽查了若干名学生每人的植树量,并分为四种类型,A:3棵;B:4棵;C:5棵;D:6棵,将各类的人数绘制成扇形图(如图1)和条形图(如图2).回答下列问题:(1)这次调查一共抽查了________名学生的植树量;请将条形图补充完整;(2)被调查学生每人植树量的众数是________棵、中位数是________棵;(3)求被调查学生每人植树量的平均数,并估计这280名学生共植树多少棵?【解析】(1)由B类型的人数及其所占百分比可得总人数,总人数乘以D类型的对应的百分比即可求出其人数,据此可补全图形;(2)根据众数和中位数的概念可得答案;(3)先求出样本的平均数,再乘以总人数即可.【解答】(1)这次调查一共抽查植树的学生人数为8÷40%=20(人),D类人数=20×10%=2(人);条形图补充如图:(2)植树4棵的人数最多,则众数是4,共有20人植树,其中位数是第10、11人植树数量的平均数,则中位数是4,(3)x=4×48×562×7=5.3(棵),205.3×280=148(棵).答:估计这3280名学生共植树1484棵.【类型二】用样本估计总体【例2】为了提高学生的综合素养,某校开设了五门第二课堂活动课,按照类别分为:A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”.为了了解学生对每种活动课的喜爱情况,随机抽取了部分同学进行调查,将调查结果绘制成如下两幅不完整的统计图.根据信息,回答下列问题:(1)本次调查的样本容量为________,统计图中的a=________,b=________;(2)通过计算补全条形统计图;(3)该校共有3000名学生,请你估计全校喜爱“雕刻”的学生人数.解:(1)样本容量为1815%=120,a=120×10%=12,b=120×30%=36.故答案为:120;12;36.(2)组频数:120―18―12―30―36=24(人),补全条形统计图如图所示:(3)3000×30120=750(人),答:该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球,除颜色外其它都相同,小明进行了多次摸球试验,发现摸到白色乒乓球的频率稳定在0.2左右,由此可知盒子中黄色乒乓球约有…()A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测,其中有2件是次品.试据此估计这批电子元件中大约有________件次品.【答案】20【解析】根据随机抽取100件进行检测,其中有2件是次品,可以计算出这批电子元件中大约有多少件次品.【跟踪训练3】书籍是人类进步的阶梯.为了解学生的课外阅读情况,某校随机抽查了部分学生本学期阅读课外书的册数,并绘制出如下统计图.(1)共抽查了多少名学生?(2)请补全条形统计图,并写出被抽查学生本学期阅读课外书册数的众数、中位数;(3)根据抽查结果,请估计该校1200名学生中本学期课外阅读5册书的学生人数.解:(1)12÷30%=40(名).(2)如图所示,由图知,众数为5,中位数为5.(3)∵抽查的样本中,课外阅读5册书的学生人数占14×100%=35%,40∴估计该校学生课外阅读5册书的学生人数约占35%,∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420(人).【类型三】用样本频率估计总体频率【例3】中长跑(男生1000m,女生800m)是河南省某市中招体育考试的必考项目.甲、乙两校为了解本校九年级学生的训练情况,各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分:30分),将成绩进行统计、整理与分析,过程如下:【收集数据】【整理数据】整理以上数据,得到模拟测试成绩x(分)的频数分布表.【分析数据】根据以上数据,得到以下统计量.根据以上信息,回答下列问题:(1)填空:a= ________,b=_________, m=________, n=________;(2)综合上表中的统计量,推断________校学生中长跑成绩更好,理由为________(写出一条即可)(3)若甲、乙两校各有800名学生,请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名?解:(1)由数据可得,a=7,b=8,m=24.75,n=23.4. 故答案为:7;8;24.75;23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高,且甲校学生成绩的方差比乙校学生成绩的方差小,成绩较稳定.(答案不唯一,合理即可)故答案为:甲.=720(名),(3)(800+800)×1082020答:估计两校中长跑模拟测试成绩不低于25分的学生一共有720名.【跟踪训练】今年是建党100周年,为了让全校学生牢固树立爱国爱党的崇高信念,某校开展了形式多样的党史学习教育活动,八、九年级(各有500名学生)举行了一次党史知识竞答(满分为100分),然后随机各抽取20名同学的成绩进行了收集、统计与分析,过程如下:【收集数据】两个年级抽取的20名同学的成绩如下表:八年级:7968878985598997898998938586899077898379九年级:8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理:成绩x(分)50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率(90分及以上为优秀)如下表:年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息,回答下列问题:(1)填空:a=________,b= ________,c=________,d=________;(2)请估计此次知识竞答中,八年级成绩优秀的学生人数;(3)小李同学认为九年级的整体成绩更好,请从至少两个方面分析其合理性.解:(1)由表中数据可知,九年级落在60≤x<70内的只有62,故a=1;九年级落在70≤x<80内的有71,78,故b=2;八年级成绩按照从小到大的顺序排列后,落在第10,11的数为87,89,∴中位数为88,故c=88;九年级90分及以上的学生有11人,∴九年级的优秀率为1120×100%=55%.故答案为:1;2;88;55%.(2)∵500×20%=100,∴估计此次知识竞答中,八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数,中位数和优秀率均高于八年级,说明九年级平均成绩更高,高分更多,因此九年级整体成绩更好.【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码,结果如下表:鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋,你认为应该怎样进货比较合理?解析:先求出各鞋码所占比例,再乘200,即可得到所需进货数.解:由表中数据可知各鞋码的女生的比例,根据比例进货.需要进35.5码运动鞋:200×440=20(双),需要进36码运动鞋:200×640=30(双)需要进36.5码运动鞋:200×1640=80(双),需要进37码运动鞋:200×1240=60(双)需要进37.5码运动鞋:200×240=10(双)。
用样本本去估计总体知识梳理:1.作频率分布直方图的步骤:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
2.频率分布折线图和总体密度曲线折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.用茎叶图刻画数据的两个优点,(1)所有数据都可以从数据中得到;(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较大时,茎叶图的效果就不是很好了.4.平均数、众数、中位数、标准差和方差(1)、平均数:平均数是用来表示数据的平均水平。
一般用来表示,计算公式:(2)、众数:一组数据中出现次数最多的数。
(3)、中位数:将数据从小到大的顺序排列,若有奇数个数,则最中间的数是中位数。
若有偶数个数,则中间两个数的平均数是中位数。
(4)、标准差:是样本数据到平均数的一种平均距离,用来刻画数据的分散程度,一般用s 来表示,计算公式: ,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
(5)方差:方差是标准差的平方,它也可以用来刻画数据的分散程度,计算公式: 。
5.有样本频率分布估计总体分布通常分为两种情况:(1)、当总体中的个体取不同值很少时,其频率分布表由所取样本的不同值及其相应频率表示,就是相应的条形图;(2)、当总体中的个体不同值很多时,就用频率分布直方图来表示相应的样本的频率分布。
6、利用频率分布直方图来估计众数、中位数、平均数在频率分布直方图中,众数的估计值......是其中最高矩形底边中点的横坐标;中位数...的估计值等于频率分...的左边和右边的直方图面积相等;平均数布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。