随机抽样及随机分组-课件PPT
- 格式:ppt
- 大小:447.50 KB
- 文档页数:36
第1讲随机抽样、用样本估计总体一、知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)分层抽样①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.2.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.巧用四个有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x-+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方. 二、教材衍化1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.解析:由分层抽样可得 2 4002 400+2 000+n×90=36,则n =1 600,所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24. 答案:242.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案:533.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)×(3)√(4)√(5)√(6)√二、易错纠偏常见误区|(1)随机数表法的规则不熟出错;(2)频率分布直方图识图不清;1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001, (499)行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0682.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50考点一随机抽样(基础型)复习指导| 1.理解随机抽样的必要性和重要性.2.学会用简单随机抽样的方法从总体中抽取样本.3.通过对实例的分析,了解分层抽样的方法.核心素养:数据分析1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为()A.12B.6C.4D.3解析:选D .青年教师的人数为120×30%=36,所以青年女教师为12人,故青年女教师被选出的人数为12×30120=3.故选D . 2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281据此估计,该射击运动员4次射击至少3次击中目标的概率为________.解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P =1-520=1520=0.75. 答案:0.753.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.解析:由题意知n =28,设其中有男队员x 人,女队员有y 人.则⎩⎪⎨⎪⎧x +y =28,x -y =4,56m =x y .解得x =16,y =12,m =42.答案:42(1)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)分层抽样问题类型及解题思路①求某层应抽个体数量,根据该层所占总体的比例计算.②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.考点二样本的数字特征(应用型)复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.核心素养:数据分析、数学运算(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A .92,2.8B .92,2C .93,2D .93,2.8(2)(2020·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1)由题意得所剩数据:90,90,93,94,93.所以平均数x -=90+90+93+94+935=92. 方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8. (2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2. 【答案】 (1)A (2)2 2【迁移探究】 (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B .平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B .2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:A .119.3B .119.7C .123.3D .126.7解析:选C .由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.故选C .3.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10,则2+x2=3,解得x =4,所以这组数据的平均数为 x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9考点三 频率分布直方图(应用型)复习指导| 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.核心素养:直观想象、数据分析角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.【解】(1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x ≥50.记该实体店一天获利不低于800元为事件A,则P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.故该实体店一天获利不低于800元的概率为0.38.角度二求样本的数字特征(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率;②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;(2)); (3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下:(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78, 方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. (3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)[基础题组练]1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A .23B .09C .02D .16解析:选D .从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.2.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:若在“不喜欢的男性青年观众”中抽取了6人,则n =( )A .12B .16C .20D .24解析:选D .由题意得3030+10+30+50=30120=6n,解得n =24.故选D .3.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A .记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .4.(多选)某学生5次考试的成绩(单位:分)分别为85,67,m ,80,93,其中m >0.若该学生在这5次考试中成绩的中位数为80,则得分的平均数可能为( )A .70B .75C .80D .85解析:选ABC .已知的四次成绩按照由小到大的顺序排列为67,80,85,93,该学生这5次考试成绩的中位数为80,则m ≤80,所以平均数85+67+m +80+935≤81,可知平均数可能为70,75,80,不可能为85.故选ABC .5.(多选)从某地区年龄在25~55岁的人员中,随机抽取100人,了解他们对今年两会热点问题的看法,绘制出频率分布直方图,如图所示,则下列说法正确的是( )A .抽取的100人中,年龄在40~45岁的人数大约为20B .抽取的100人中,年龄在35~45岁的人数大约为40C .抽取的100人中,年龄在40~50岁的人数大约为50D .抽取的100人中,年龄在35~50岁的人数大约为60解析:选AD .根据频率分布直方图的性质得(0.01+0.05+0.06+a +0.02+0.02)×5=1,解得a =0.04,所以抽取的100人中,年龄在40~45岁的大约为0.04×5×100=20,所以A 正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B 不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C 不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D 正确.故选AD .6.(2020·开封市定位考试)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号产品共抽取了24件,则C 种型号产品抽取的件数为________.解析:依题意得24120=k k +5+3,解得k =2,所以C 种型号产品抽取的件数为32+5+3×120=36.答案:367.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.答案:丙8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04(2)4409.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a、b、c(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81. (3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73, 所以这次数学测验的年级平均分大约为73分.10.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数;(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元). [综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A .σ22B .σ2C .2σ2D .4σ2解析:选D .设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n. 则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D . 2.(多选)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2015年至2019年我国新闻出版业和数字出版业营收情况,则下列说法正确的是( )A .2015年至2019年我国新闻出版业和数字出版业营收均逐年增加B .2019年我国数字出版业营收超过2015年我国数字出版业营收的2倍C .2019年我国新闻出版业营收超过2015年我国新闻出版业营收的1.5倍D .2019年我国数字出版业营收占新闻出版业营收的比例未超过三分之一解析:选ABD .根据图示数据可知A 正确;1 935.5×2=3 871<5 720.9,故B 正确;16 635.3×1.5=24 952.95>23 595.8,故C 不正确;23 595.8×13≈7 865>5 720.9,故D 正确.故选ABD .3.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13; x -乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500, 由y ≥1 750,得200≤x ≤500,所以P (y ≥1 750)=P (200≤x ≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7. 故估计利润y 不小于1 750元的概率为0.7.。
简单随机抽样ppt课件CATALOGUE 目录•抽样调查基本概念与原理•简单随机抽样方法与技术•简单随机抽样实施步骤与注意事项•简单随机抽样优缺点分析•案例解析:简单随机抽样在实际应用中举例•实验设计与数据分析方法介绍01抽样调查基本概念与原理抽样调查定义及作用抽样调查定义抽样调查作用抽样方法与分类抽样方法简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样分类概率抽样和非概率抽样。
简单随机抽样原理简单随机抽样的定义简单随机抽样也称为单纯随机抽样、纯随机抽样、SRS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
简单随机抽样的特点简单随机抽样的优点是操作简单,符合随机原则,是抽样理论的基础。
缺点是当总体中单位过多时,对总体分布的规律性要求高,样本分布的代表性可能受到影响,在实际应用中受到一定限制。
如果单位分布情况极不均匀时,样本代表性可能明显下降。
02简单随机抽样方法与技术抽签法原理01优点02缺点03优点相对于抽签法,随机数表法更加客观、公正,且适用于总体数量较大的情况。
原理利用随机数表作为抽样工具,根据总体数量确定所需的随机数范围,然后从随机数表中选取符合要求的数字,这些数字对应的个体即构成样本。
缺点需要预先准备随机数表,且在某些情况下可能存在周期性规律,影响抽样的随机性。
随机数表法计算机生成随机数法原理优点缺点03简单随机抽样实施步骤与注意事项确定研究目标定义总体确定样本量030201明确总体和样本范围制定抽样框和抽样计划制定抽样框选择抽样方法制定抽样计划实施抽样过程并记录按照抽样计划进行抽样严格遵守抽样计划,确保抽样的随机性和代表性。
记录抽样过程详细记录每个样本的抽取情况,包括抽取时间、地点、人员等信息。
保证样本的完整性确保抽取的样本能够完整反映总体的特征,避免因样本损坏或遗失而影响研究结果。
注意事项及避免误差措施控制抽样误差避免主观偏见通过增加样本量、改进抽样方法等措施,有效控制抽样误差,提高研究的准确性和可靠性。