第九章抽样统计分析的基本知识
- 格式:ppt
- 大小:2.21 MB
- 文档页数:67
(名师选题)2023年人教版高中数学第九章统计考点题型与解题方法单选题1、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A4、数据x1,x2,x3,…,x m的平均数为x,数据y1,y2,y3,…,y n的平均数为y,则数据x1,x2,x3,…,x m,y1,y2,y3,…,y n的平均数为()A.xn +ymB.xm+ynC.nx+mym+n D.mx+nym+n答案:D分析:利用平均数的计算公式计算.由题意得:x1+x2+x3+⋯+x m=mx,y1+y2+y3+⋯+y n=ny,所以x1+x2+x3+⋯+x m+y1+y2+y3+⋯+y nm+n =mx+nym+n故选:D5、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C6、新冠肺炎疫情的发生,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示:图1为国内三大产业比重,图2为第三产业中各行业比重.以下关于我国上半年经济数据的说法正确的是()A.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平B.第一产业的生产总值超过第三产业中“房地产业”的生产总值C.若“住宿餐饮业”生产总值为7500亿元,则“金融业”生产总值为32500亿元D.若“金融业”生产总值为41040亿元,则第二产业生产总值为166500亿元答案:D分析:利用扇形统计图和第三产业中各行业比重统计图的数据即可求解.对于A,57%×6%=3.42%<6%,错误;对于B,57%×13%=7.41%>6%,错误;对于C,75003%×16%=4000(亿),错误;对于D,根据题意,第二产业生产总值为4104016%×57%×37%=166500亿元,正确.故选:D.7、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x,方差为s2,则()A.x=5,s2=2B.x=5,s2=1.6C.x=4.9,s2=1.6D.x=5.1,s2=2答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.8、中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是()A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三增加了1倍以上C.这一星期内甲的日步数的平均值大于乙D.这一星期内甲的日步数的方差大于乙答案:B分析:对于A:直接求出中位数;对于B:求出乙的星期三和星期四步数,计算可得;对于C:分别计算出甲、乙平均数,即可判断;对于D:分别计算出甲、乙方差,即可判断;对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:乙的星期三步数7030,星期四步数12970.因为129707030≈1.84<2,所以没有增加1倍上.故B不正确;对于C:x甲=17(16000+7965+12700+2435+16800+9500+11600)=11000,x乙=17(14200+12300+7030+12970+5340+11600+10060)=10500.所以x甲>x乙.故C正确;对于D:s甲2=17[(16000−11000)2+(7965−11000)2+(12700−11000)2+(2435−11000)2+(16800−11000)2+(9500−11000)2+(11600−11000)2]≈20958636s乙2=17[(14200−10500)2+(12300−10500)2+(7030−10500)2+(12970−10500)2+(5340−10500)2+(11600−10500)2+(10060−10500)2]≈9014429所以s甲2>s乙2.故D正确;故选:B.9、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.10、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.11、某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是()A.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3000名学生,则课外知识测试成绩能得优秀的同学大约有1440名答案:C分析:由百分比图知,成绩为100分、80分、60分、40分的百分比分别为12%, 48%, 32%, 8%,结合各项的描述即可判断其正误.由图知,及格率为1−8%=92%,故A错误.该测试满分同学的百分比为1−8%−32%−48%=12%,即有12%×200=24名,B错误.由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确.由题意,3000名学生成绩能得优秀的同学有3000×(48%+12%)=1800,故D错误.故选:C12、为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一学生的身高答案:B分析:找出考查的对象是某校高一学生的身高,得到样本是抽取的40名高一学生的身高.总体是240名高一学生的身高情况,则个体是每个学生的身高情况,故样本是40名学生的身高情况.故选:B.小提示:本题考查的抽样相关概念的理解,注意区分总体、个体、样本、样本容量这四个概念,属于基础题. 双空题13、一组数据:7,6,3,2,8,3,5,6,9,7的中位数是___________;85%分位数是___________.答案:68分析:首先将数据从小到大排列,即可求出中位数与85%分位数;解:将数据从小到大排列为:2、3、3、5、6、6、7、7、8、9,故中位数为6,又10×85%=8.5,故这一组数据的85%为第9个数为8;所以答案是:6;8;14、设样本数据x1、x2、…、x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,⋯,10),则y1、y2、⋯、y10的均值和方差分别为________,_________.答案:1+a4解析:由题意得出110∑x i10i=1=1,110∑(x i−1)210i=1=4,然后利用平均数和方差的计算公式可计算出数据y1、y2、⋯、y10的均值和方差.由题意可得110∑x i10i=1=1,110∑(x i−1)210i=1=4,则y1、y2、⋯、y10的均值为y=110∑y i10i=1=110∑(x i+a)10i=1=110(∑x i10i=1+10a)=110∑x i10i=1+a=1+a,方差为s2=110∑(y i−y)210i=1=110∑[(x i+a)−(1+a)]210i=1=110∑(x i−1)210i=1=4.所以答案是:1+a;4.小提示:本题考查平均数和方差的计算,灵活利用平均数和方差公式计算是解答的关键,考查计算能力,属于基础题.15、某校高一年级三个班共有学生120名,这三个班的男女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=_________.现用分层抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为________.答案: 24 9分析:由于每个个体被抽到的概率都相等,由x120=0.2,可得得x的值.先求出三班总人数为 36,用分层抽样的方法在全年级抽取30名学生,求出每个学生被抽到的概率为30120,用三班总人数乘以此概率,即得所求.由题意可得x120=0.2,解得x=24.三班总人数为120−20−20−24−20=36,用分层抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9,所以答案是: 24; 9.小提示:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.16、下表记录了某地区一年之内的月降水量.根据上述统计表,该地区月降水量的中位数是______;80%分位数是_________.答案: 56 64分析:根据中位数和百分位数求解数据按从小到大排序得:46,48,51,53,53,56,56,56,58,64,66,71,它的中位数为56;80%×12=9.6,第10个数是64所以答案是:56,6417、要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为________、________.答案:分层抽样简单随机抽样解析:根据分层抽样和简单随机抽样的定义直接判断即可.解析:①各层间差距较大,宜用分层抽样;②总体较少,宜用简单随机抽样.所以答案是:分层抽样,简单随机抽样.小提示:本题考查抽样方法,旨在考查学生对概念的掌握程度,考查阅读能力.解答题18、某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有m(m>20)人,按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计这m人的平均年龄和第80百分位数;(2)现从以上各组中采用分层随机抽样的方法抽取20人,担任本市的宣传使者.若第四组宣传使者的年龄的平,第五组宣传使者的年龄的平均数与方差分别为43和1,求这m人中35~45岁所有人均数与方差分别为37和52的年龄的方差.答案:(1)平均年龄32.25岁,第80百分位数为37.5;(2)10.分析:(1)直接根据频率分布直方图计算平均数和百分位数;(2)由分层抽样得第四组和第五组分别抽取4人和2人,进而设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,第四组和第五组所有宣传使者的年龄平均数为z,方差为s2,进而根据方差{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]},代入计算即可得答案.公式有s2=16解:(1)设这m人的平均年龄为x,则x=22.5×0.05+27.5×0.35+32.5×0.3+37.5×0.2+42.5×0.1=32.25.设第80百分位数为a,由5×0.02+(40−a)×0.04=0.2,解得a=37.5.(2)由频率分布直方图得各组人数之比为1:7:6:4:2,故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取4人和2人,设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,,s52=1,则x4=37,x5=43,s42=52设第四组和第五组所有宣传使者的年龄平均数为z,方差为s2.=39,则z=4x4+2x56{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]}=10,s2=16因此,第四组和第五组所有宣传使者的年龄方差为10,据此,可估计这m人中年龄在35~45岁的所有人的年龄方差约为10.19、为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约为1000万,从0岁到100岁的居民年龄结构的频率分布直方图如图1所示.为了解各年龄段居民签约家庭医生的情况,现调查了1000名年满18周岁的居民,各年龄段被访者签约率如图2所示.(1)估计该城市年龄在50岁以上且已签约家庭医生的居民人数;(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的签约率提高到55%以上,应着重提高图2中哪个年龄段的签约率?并根据已有数据陈述理由.答案:(1)195.99万;(2)应着重提高30-50这个年龄段的签约率,理由见解析.解析:(1)根据题中频率分布直方图与各年龄段被访者的签约率,分别计算50岁以上各年龄段的居民人数,再求和,即可得出结果;(2)根据题中条件,先确定年龄在18-30岁的人数,年龄在30-50岁的人数,以及年龄在50岁以上的人数,即可确定结果.(1)该城市年龄在50-60岁的签约人数为:1000×0.015×10×55.7%=83.55万;在60-70岁的签约人数为:1000×0.010×10×61.7%=61.7万;在70-80岁的签约人数为:1000×0.004×10×70.0%=28万;在80岁以上的签约人数为:1000×0.003×10×75.8%=22.74万;故该城市年龄在50岁以上且已签约家庭医生的居民人数为:83.55+61.7+28+22 .74=195.99万;(2)年龄在10-20岁的人数为:1000×0.005×10=50万;年龄在20-30岁的人数为:1000×0.018×10=180万.所以,年龄在18-30岁的人数大于180万,小于230万,签约率为30.3%;年龄在30-50岁的人数为1000×0.037×10=370万,签约率为37.1%.年龄在50岁以上的人数为:1000×0.032×10=320万,签约率超过55%,上升空间不大.故由以上数据可知这个城市在30-50岁这个年龄段的人数为370万,基数较其他年龄段是最大的,且签约率非常低,所以为把该地区满18周岁居民的签约率提高到以上,应着重提高30-50这个年龄段的签约率.20、某服装公司计划今年夏天在其下属实体店销售一男款衬衫,上市之前拟在该公司的线上旗舰店进行连续20天的试销,定价为260元/件.试销结束后统计得到该线上专营店这20天的日销售量(单位:件)的数据如图.(1)若该线上专营店试销期间每件衬衫的进价为200元,求试销期间该衬衫日销售总利润高于9500元的频率.(2)试销结束后,这款衬衫正式在实体店销售,每件衬衫定价为360元,但公司对实体店经销商不零售,只提供衬衫的整箱批发,大箱每箱有70件,批发价为160元/件;小箱每箱有60件,批发价为165元/件.某实体店决定每天批发大小相同的2箱衬衫,根据公司规定,当天没销售出的衬衫按批发价的8折转给另一家实体店.根据往年的销售经验,该实体店的销售量为线上专营店销售量的80%,以线上专营店这20天的试销量估计该实体店连续20天的销售量.以该实体店连续20天销售该款衬衫的总利润作为决策,试问该实体店每天应该批发2大箱衬衫还是2小箱衬衫?答案:(1)0.55;(2)该实体店应该每天批发2大箱衬衫.分析:(1)先利用不等式性质求得要使得日销售总利润高于9500元时日销售衬衫的件数的取值范围,然后根据频数分布图计算对应的天数,从而求得响应频率;.(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.分别就选择批发2小箱时和2大箱时各种情况下的日利润列举计算,并求得相应的总利润,进行比较大小即可做出判断.解:(1)因为试销期间每件衬衫的利润为260−200=60元,≈158.3,所以要使得日销售总利润高于9500元,则日销售衬衫的件数大于950060=0.55.故所求频率为7+420(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.若选择批发2小箱,则批发成本为60×2×165=19800元,当日销售量为48件时,当日利润为48×360+0.8×(120−48)×165−19800=6984元;当日销售量为80件时,当日利润为48×360+0.8×(120−80)×165−19800=14280;当日销量为128件或160件时,当日利润为120×360−19800=23400元.所以这20天销售这款衬衫的总利润为6984×3+14280×6+23400×11=364032元.若选择批发2大箱,则批发成本为70×2×160=22400元,当日销售量为48件时,当日利润为48×360+0.8×(140−48)×160−22400=6656元;当日销售量为80件时,当日利润为80×360+0.8×(140−80)×160−22400=14080元;当日销量为128件时,当日利润为128×360+0.8×(140−128)×160−22400=25216元.当日销售量为160件时,当日利润为140×360−22400=28000元.所以这20天销售这款衬衫的总利润为6656×3+14080×6+25216×7+28000×4=392960元. 因为392960>364032,所以该实体店应该每天批发2大箱衬衫.。
材料员-专业基础知识-抽样统计分析基本知识[单选题]1.如果一个总体是由质量明显差异的几个部分组成,则宜采用()。
A.整群抽样B.分层随机抽样C.系统抽样D.简单随机抽样(江南博哥)正确答案:B参考解析:分层抽样试讲质量明显差异的几个部分分成若干层,使层内质量均匀,而层间差异较为明显。
[单选题]2.抽样一般程序的第一步为()。
A.制定抽样框B.制定抽样方案C.界定抽样总体D.预估样本质量正确答案:C参考解析:抽样一般程序的第一步为界定抽样总体。
[单选题]3.对于左缓坡型直方图,其可能的原因是()A.分组组数不当B.原材料发生变化,或者临时他人顶班作业C.操作中对上限控制太严D.数据收集不正常正确答案:C参考解析:左缓坡型主要是由于操作中对上限控制太严造成的。
[单选题]4.在统计工作中,可以根据产品的质量管理规程或实际()选定总体的范围。
A.工作需要B.功能需要C.特性需要D.其他需求正确答案:A参考解析:在统计工作中,可以根据产品的质量管理规程或实际工作需要选定总体的范围。
[单选题]5.分层抽样的特点是()。
A.层内差异小,层间差异大B.层间差异小,层内差异大C.层问差异小D.层间差异大正确答案:A参考解析:因为只有层间差异大,才能保证抽样的有效性,而层内差异小是要保证层内每个个体的差别不大,能够使其抽样精确度提高。
[单选题]6.简单随机抽样又称纯随机抽样,()随机抽样。
A.局部B.不完全C.完全D.其他正确答案:C参考解析:简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
[单选题]7.在数理统计分析法中,用来显示在质量控制中两种质量数据之间关系的方法是:()。
A.统计调查表法B.直方图法C.控制图法D.相关图法正确答案:D参考解析:统计调查表法是利用专门设计的统计表对数据进行收集、整理和粗略分析质量状态的一种方法。
直方图法是用以描述质量分布状态的一种分析方法。
人教版高中数学必修二《第九章统计》单元导学案《9.1.1简单的随机抽样》导学案【学习目标】1.体会随机抽样的必要性和重要性2.理解随机抽样的目的和基本要求;3.掌握简单随机抽样中的抽签法、随机数法的一般步骤【自主学习】知识点1 统计的基本概念1.总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.2.个体:构成总体的每一个元素作为个体.3.样本:从总体中抽出若干个个体所组成的集合叫样本.4.样本容量:样本中个体的数目叫样本容量.知识点2 简单随机抽样1.一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的四个特点(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点3 抽签法和随机数法1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.3.利用随机数法抽取个体时的注意事项(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. (2)定方向:读数的方向(向左、向右、向上或向下都可以).(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.知识点4 总体平均数和加权平均数1.一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称∑==++=Ni iN YN N Y Y Y Y 1211 为总体均值,又称总体平均数.2.一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的一组数据的平均数为x 1f 1+x 2f 2+…+x n f nf 1+f 2+…+f n.这个平均数叫做加权平均数,其中f 1, f 2,…, f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即f i (i =1,2,…,k )越大,表明x i 的个数越多,“权”就越大.【合作探究】探究一 简单随机抽样的判断【例1】下面的抽样是简单随机抽样吗?为什么?(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,连续拿出四件;(2)某学校从300名学生中一次性抽取20名学生调查睡眠情况.解 (1)不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点. (2)不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.反思与感悟 当抽样具有:(1)总体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每个个体被抽到的机会等可能时,为简单随机抽样,否则不是简单随机抽样.【练习1】下面的抽样方法是简单随机抽样的是( )A .盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里B .某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,称其重量是否合格C .某校分别从行政人员、教师、后勤人员中抽取2人,14人,4人了解对他们学校机构改革的意见D .从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)答案 D解析 依据简单随机抽样的特点知,只有D 符合.探究二 简单随机抽样等可能性应用【例2】一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.答案310 18解析 因为简单随机抽样过程中每个个体被抽到的可能性均为n N ,所以第一个空填310.因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为110,第二次抽取时,剩余9个小球,每个小球被抽到的可能性为19,第三次抽取时,剩余8个小球,每个小球被抽到的可能性为18.反思与感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的概率相同,在整个抽样过程中各个个体被抽到的机会也都相等.【练习2】从总体容量为N 的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N 的值为( )A .120B .200C .150D .100答案 A解析 因为从含有N 个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为1N,在整个抽样过程中每个个体被抽到的可能性为30N ,所以30N=0.25,从而有N =120.故选A.探究三 抽签法的应用【例3】某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解 方案如下:第一步,将18名志愿者编号,号码为01,02,03,…,18. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放到一个不透明的盒子中,充分搅匀. 第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员.反思与感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.【练习3】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴. 解 第一步,将20架钢琴编号,号码是01,02,…,20. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀. 第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号. 第五步,与所得号码对应的5架钢琴就是要进行质量检查的对象.探究四 随机数法的应用【例4】假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001, (799)第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7). 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.【练习4】总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )A .答案D解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为01.探究五 总体平均数和加权平均数【例5】小林在八年级第一学期的数学书面测验成绩分别为:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分,如果按照平时、期中、期末的权重分别为10%、30%、60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?解:x (平时单元测试平均成绩)=84+76+923=84(分).所以总平均成绩为84×10%+82×30%+90×60%10%+30%+60%=87(分).所以小林该学期数学书面测验的总平均成绩应为87分【练习5】2. “一世”又叫“一代”.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也”,清代·段玉裁《说文解字注》:“三十年为一世,按父子相继曰世”.而当代中国学者测算“一代”平均为25年.另根据国际一家研究机构的研究报告显示,全球家族企业的平均寿命其实只有26年,约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代甚至更久远(为了研究方便,超过四代的可忽略不计).根据该研究机构的研究报告,可以估计该机构所认为的“一代”大约为()A. 23年B. 22年C. 21年D. 20年答案:B【分析】设“一代”为x年,根据约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代,列出频率分布表,然后根据平均寿命其实只有26年,利用平均数的求法求解.【详解】设“一代”为x年,由题意得:企业寿命的频率分布表为:又因为全球家族企业的平均寿命其实只有26年,所以家族企业的平均寿命为:0.540.50.28 1.50.14 2.50.04 3.526⨯+⨯+⨯+⨯=,x x x xx≈,解得22故选:B《9.1.2分层随机抽样 9.1.3获取数据的途径》导学案【学习目标】1.理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本2.记住分层随机抽样的特点和步骤3.利用分层随机抽样的方法解决实际问题4.了解获取数据的途径,并学会简单应用【自主学习】知识点1 分层随机抽样的概念 (1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)适用范围当总体是由差异明显的几个部分组成时,往往采用分层随机抽样. (3)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.知识点2 分层随机抽样的步骤(1)根据已掌握的信息,将总体分成若干部分.(2)根据总体中的个体数N 和样本量n 计算出抽样比k =nN.(3)根据抽样比k 计算出各层中应抽取的个体数:n N·N i (其中N i 为第i 层所包含的个体总数).(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n 的样本.【合作探究】探究一 分层随机抽样的概念【例1-1】(1) 下列问题中,最适合用分层随机抽样抽取样本的是( ) A .从10名同学中抽取3人参加座谈会B .一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】(1)B (2)C[分析] 当总体由差异明显的几部分组成时,该样本的抽取适合用分层随机抽样,结合题中的四个选项及分层随机抽样的特点可对(1)(2)作出判断.[解析] (1)A中总体个体无明显差异且个数较少,不适合用分层随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.(2)保证每个个体等可能地被抽取是简单随机抽样和分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.归纳总结:1.使用分层随机抽样的前提:,分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【练习1】某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.分层随机抽样法D.任何抽样法都可以【答案】 C解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.探究二分层随机抽样的设计【例2】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.[分析] 观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→成样[解] 因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较妥. ∵20100=15,∴105=2,705=14,205=4. ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人. 因副处级以上干部与工人数都较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.归纳总结:分层随机抽样的特点1适用于总体由差异明显的几部分组成的情况.2更充分体现和反映了总体的情况.3等可能抽样,每个个体被抽到的可能性都相等.【练习2】某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的数量为( )A .15,15,16B .6,30,10C .10,13,23D .12,16,18 【答案】 B解析:三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆). 探究三 获取数据的途径【例3】为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )A .通过调查获取数据B .通过试验获取数据C .通过观察获取数据D .通过查询获得数据【答案】D [因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.]归纳总结:【练习3】下列调查方案中,抽样方法合适、样本具有代表性的是( )A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查【答案】B[A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.]《9.2.1总体取值规律的估计》导学案【学习目标】1.学会用频率分布直方图表示样本数据2.能通过频率分布直方图对数据做出总体统计【自主学习】知识点1 频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.知识点2 频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.【合作探究】探究一 频率分布概念的理【答案】【例1】例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 【答案】 D【答案】析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.归纳总结:由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.【练习1】一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 【答案】 D【答案】析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.探究二 频率分布直方图的绘制【例2】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?【答案】(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.归纳总结:频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.【练习2】如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.【答案】(1)样本频率分布表如下:(2)(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.探究三频率分布直方图的应用【例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).【答案】 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.归纳总结:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【练习3】某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )A.45 B.50 C.55 D.60【答案】 B【答案】析结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为150.30=50,故选B.《9.2.2总体百分位数的估计》导学案【学习目标】1.理解百分位数的概念2.掌握计算百分位数的方法【自主学习】知识点1 百分位数(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.知识点2 如何计算百分位数下面的步骤来说明如何计算第p百分位数.第1步:以递增顺序排列原始数据(即从小到大排列).第2步:计算 i =np %.第3步:①若 i 不是整数,将 i 向上取整.大于i 的比邻整数即为第p 百分位数的位置;②若i 是整数,则第p 百分位数是第i 项与第(i +1)项数据的平均值.【合作探究】探究一 百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g) 如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0. (1)分别求出这组数据的第25,75,95百分位数. (2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4, 则第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g, 第95百分位数是9.9 g ,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.【练习1】以下数据为参加数学竞赛决赛的15人的成绩: 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位数是( ) A .90 B .90.5 C .91 D .91.5答案B [把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.]探究二 百分位数的综合应用【例2】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y (单位:元)关于月用电量x (单位:千瓦时)的函数解析式. (2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a ,b 的值.(3)根据(2)中求得的数据计算用电量的75%分位数.[解] (1)当0≤x ≤200时,y =0.5x ;当200<x ≤400时,y =0.5×200+0.8×(x -200)=0.8x -60; 当x >400时,y =0.5×200+0.8×200+1.0×(x -400)=x -140. 所以y 与x 之间的函数解析式为 y =⎩⎪⎨⎪⎧0.5x ,0≤x ≤200,0.8x -60,200<x ≤400,x -140,x >400.(2)由(1)可知,当y =260时,x =400,即用电量不超过400千瓦时的占80%, 结合频率分布直方图可知⎩⎪⎨⎪⎧0.001×100+2×100b +0.003×100=0.8,100a +0.000 5×100=0.2,解得a =0.001 5,b =0.002 0. (3)设75%分位数为m ,。
抽样统计分析的基本知识(一)数理统计的基本概念、抽样调查的方法Z9.1.1全数检查和抽样检查的基本概念,理解总体、单位产品、批和样品、样本统计量、抽样分布、抽样检验的含义。
(P213)判断题1. (易)与全数检查相比,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,因此应选择全数检查。
【答案】错误【解析】鉴于单位产品质量的波动性和样本抽取的偶然性,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,但与全数检查相比,其明显的优势是经济性。
见教材第9章第1节P213。
2. (易)“不合格”是对单位产品的判定。
【答案】错误【解析】“不合格”是对质量特性的判定,“不合格品”是对单位产品的判定,单位产品的质量特性不符合规定,即为不合格。
见教材第9章第1节P214。
3. (易)样本统计量是样本的函数,是一个随机变量。
【答案】正确【解析】样本统计量是随机变量,随着抽到的样本单位不同其取值也会有变化,统计量是样本的函数,是一个随机变量。
见教材第9章第1节P214。
单选题1. (中)组成总体的基本元素称为()。
A.样本B.个体C.单位产品D.子样【答案】B【解析】在数理统计学中,总体是所研究对象的全体,个体是组成总体的基本元素,样本是从总体中随机抽取出来,被抽中的个体称为样品。
见教材第9章第1节P213。
Z9.1.2 样本数据特征值的含义,常用的数据特征值有算数平均数、中位数、极差、标准差、变异系数等,掌握其计算公式。
(P215)判断题1. (易)当样本数为偶数时,取居中两个数的平均值作为中位数。
【答案】正确【解析】样本中位数是将样本数据按数值大小有序排列后,位置居中的数值,当样本数为偶数时,取居中两个数的平均值作为中位数。
见教材第9章第1节P215。
2. (易)标准差小,说明分布集中程度低,离散程度小。
【答案】错误【解析】标准差值小,说明分布集中程度高,离散程度小,均值对总体的代表性好。
见教材第9章第1节P215。
抽样统计分析的基本知识引言在统计学中,抽样是一种常用的数据分析方法,通过从总体中选择一部分样本数据进行分析,从而得出关于总体的结论。
抽样统计分析为我们提供了一种有效的方式来推断总体特征,并进行决策或预测。
本文将介绍抽样统计分析的基本知识,包括抽样方法、样本量的确定和抽样误差的控制等内容。
一、抽样方法抽样方法是确定如何从总体中选取样本的方式。
常见的抽样方法有以下几种:1. 简单随机抽样简单随机抽样是指从总体中按照概率相等的方式选择样本,每个样本的选取是相互独立的。
简单随机抽样常用的方式有抽签、随机数表等。
简单随机抽样的优点在于样本的代表性较高,能够减小抽样误差。
然而,简单随机抽样的缺点在于实施起来可能比较复杂,且对总体的特征了解较少的情况下可能效果不佳。
2. 系统抽样系统抽样是从总体中选取样本的方法之一,通过确定一个固定的抽样间距,从总体中选取每隔固定间距的样本。
系统抽样的优点在于实施简单,抽样结果仍具有一定的代表性。
不过,需要注意的是如果总体呈现出周期性或有规律的特点,系统抽样可能引入系统误差,导致样本的代表性出现偏差。
3. 整群抽样整群抽样是将总体划分为若干个互不重叠的群体,然后从这些群体中随机选择部分群体作为样本。
整群抽样的优点在于可以减少抽样的成本,提高调查的效率。
然而,整群抽样可能引入群体间的差异性,因此在分析时需要考虑群体间的相似性程度。
4. 分层抽样分层抽样是将总体划分为互不重叠的若干个层次,然后从每个层次中分别进行抽样。
分层抽样的优点在于可以针对不同层次的特点进行分析,提高样本的代表性。
然而,在进行分层抽样时需要事先对总体的特征有一定了解,并且分层的选择要合理。
5. 整体抽样整体抽样是指直接选取总体中的全部元素作为样本。
整体抽样的优点在于样本的代表性最高,不会引入抽样误差。
然而,整体抽样的缺点在于样本量较大,造成调查成本的增加。
二、样本量的确定样本量的确定是保证抽样结果具有一定代表性的重要因素。
分层随机抽样市体育协会组织了“健步走”活动,活动共有10 000余人参加,按参加者年龄分老年组、青年组和少年组。
活动后市电视台拟从参加比赛的人群中抽取10人进行采访。
【问题1】上述问题中总体有什么特征?【问题2】抽取样本时采用抽签法合适吗?【问题3】你认为怎样抽取样本更合理?1.分层随机抽样(1)分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)应用:抽取样本.1.本质:对于含有差异明显几个层的总体随机抽样的一种方法,即按照一定比例进行抽样.2.混淆:不要与简单随机抽样混淆.3.简单随机抽样和分层随机抽样的区别和联系(1)区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将总体分成几层,在各层中按比例分别抽取样本.(2)联系:①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再将它放回,即不放回抽样. 2.分层随机抽样中的总体平均数与样本平均数1层 2层 层个体数 M N 层样本量 m n 层个体 变量值 X 1,X 2,…,X MY 1,Y 2,…,Y N层样本 的个体 变量值x 1,x 2,…,x m y 1,y 2,…,y n层总体 平均数X =X 1+X 2+…+X M M =1M∑i =1MX iY =Y 1+Y 2+…+Y N N =1N∑i =1NY i层样本 平均数x =x 1+x 2+…+x m m =1m ∑i =1mx iy =y 1+y 2+…+y n n =1n∑i =1ny i总体平 均数W =∑i =1M X i +∑i =1NY iM +N样本平 均数w =∑i =1mx i +∑i =1ny im +n3.获取数据的途径 获取数据的基本途径有: (1)通过调查获取数据; (2)通过试验获取数据; (3)通过观察获取数据; (4)通过查询获取数据.1.分层随机抽样时,样本是在各层中分别抽取吗?2.分层随机抽样中,个体数量较少的层抽取的样本量较少,这是公平的吗?3.观察法是获取样本数据的途径吗?4.在比例分配的分层随机抽样中,可以直接用样本平均数w估计总体平均数W,是吗?提示:1.是;2.是;3.是;4.是.阅读教材P181问题3,如果要抽取一个有代表性的样本,男、女生的抽取比例大致是多少?提示:326∶386=163∶193.1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )A.简单随机抽样B.抽签法C.随机数法D.分层随机抽样【解析】选D.从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员______人.【解析】20160=18,设管理人员为x人,则x32=18,得x=4.答案:4基础类型一获取数据的途径(数学抽象)1.“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据【解析】选C.“中国天眼”主要是通过观察获取数据.2.下列哪些数据一般是通过试验获取的( )A.2021年济宁市的降雨量B.2021年全国新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方【解析】选D.某种特效中成药的配方的数据一般通过试验获得.3.下列调查所抽取的样本具有代表性的是( )A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温B.在农村调查市民的平均寿命C.利用一块试验水稻田的产量估计水稻的实际产量D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验【解析】选D.A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命不能代表市民的平均寿命;C项中试验田的产量与水稻的实际产量相差可能较大,只有D项正确.1.获取数据的基本途径:观察、查询、调查、试验.2.根据调查问题的特点设计抽样调查的不同方案,应遵循的原则:(1)要考虑如何保证调查内容的真实性;(2)要考虑如何合理地获取样本,以确保其典型性、代表性.基础类型二分层随机抽样的概念(数学抽象)【典例】1.分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行( ) A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【解析】选C.为了保证每个个体等可能的被抽取,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.2.下列问题中,适合用分层随机抽样抽取样本的是( )A.学校从10个优秀节目中抽取3个参加县元旦晚会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.某学校有男、女学生各500名,为了解学生的期末复习情况,拟抽取100名学生进行调查D .某啤酒厂质检员从生产流水线上,抽取样本检查产品质量【解析】选B.A 中总体所含个体无差异且个数较少,适合用简单随机抽样;C 中总体虽然分男、女两个层,但是要了解期末复习情况,没有必要采取分层随机抽样;D 中总体所含个体无差异,不适合用分层随机抽样;B 中总体所含个体差异明显,并且要了解购买能力,与收入关系密切,适合用分层随机抽样.分层随机抽样的特点(1)适用于总体由差异明显的几部分组成的情况; (2)更充分地反映了总体的情况;(3)等概率抽样,每个个体被抽到的概率都相等.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A .抽签法抽样 B .按性别分层随机抽样 C .按年龄段分层随机抽样 D .随机数法抽样【解析】选C.该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女差异不大,所以按年龄段分层随机抽样具有代表性,比较合理.【加固训练】为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( ) A .每层等可能抽取 B .每层抽取的个体数相等C .每层抽取的个体数可以不一样多,但必须满足抽取n i =n·N i N (i =1,2,…,k)个个体(其中i 是层的序号,k 是总层数,n 为抽取的样本容量,N i 是第i 层中的个体数,N 是总体容量)D .只要抽取的样本容量一定,每层抽取的个体数没有限制【解析】选C.分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样. A 中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A 不正确; B 中,由于每层的个体数不一定相等,每层抽取同样多的个体数,显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B 也不正确;C 中,对于第i 层的每个个体,它被抽到的可能性与层数i 无关,即对于每个个体来说,被抽取为样本的可能性是相同的,故C 正确;D 显然不正确.综合类型 分层随机抽样的应用(数据分析)比例分配的计算【典例】我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人 C .112人 D .120人【解析】选 B.由题意可知,这是一个分层随机抽样的问题,其中北乡可抽取的人数为300×8 1008 100+7 488+6 912 =300×8 10022 500=108.分层随机抽样中按比例分配计算时,用到的两个关系式(1)样本量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.分层随机抽样的实际应用【典例】某政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.(1)若上级机关为了了解政府机构改革的意见,要从中抽取20人了解情况,应用何种方法抽取,请具体实施操作;(2)若要从工人中抽取2人作为工人代表,应用何种方法抽取.【解析】(1)由于机构改革关系到各人的不同利益,故采用分层随机抽样的方法为妥. 抽取过程如下:①将在编人员按副处级以上干部、一般干部、工人分成三层;②因为10020 =5,105 =2,705 =14,205 =4,所以从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.③由于副处级以上干部与工人人数都较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.④将这20人合在一起,构成样本.(2)要从工人中抽取2人作为工人代表,应用抽签法抽取最合适.分层随机抽样的步骤【加固训练】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解析】由题意知,该抽样为比例分配的分层随机抽样,抽取步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500 =15 ,则在不到35岁的职工中抽取125×15 =25(人);在35岁至49岁的职工中抽取280×15 =56(人);在50岁及50岁以上的职工中抽取95×15=19(人).(3)在各层按随机数法抽取样本. (4)汇总每层抽样,组成样本.用样本平均数估计总体平均数【典例】某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位:h),数据如下.甲 6 6.5 7 7.5 8 乙 6 7 8 9 10 11 12 丙34.567.5910.51213.5(1)(2)估计这个学校高一的学生中,一周的锻炼时间超过10个小时的百分比; (3)估计这个学校高一年级学生一周的平均锻炼时间.【解析】(1)由题干中的表格可知,按分层随机抽样的方法从甲、乙、丙3个班中分别抽取5个,7个,8个学生.故三个班学生人数之比为5∶7∶8.(2)由题意知,抽取的20个学生中,一周的锻炼时间超过10小时的有5人,故一周的锻炼时间超过10个小时的百分比为520=25%.(3)从甲班抽取的5名学生的总时间为6+6.5+7+7.5+8=35. 从乙班抽取的7名学生的总时间为6+7+8+9+10+11+12=63.从丙班抽取的8名学生的总时间为3+4.5+6+7.5+9+10.5+12+13.5=66. 则35+63+665+7+8 =16420=8.2.即这个学校高一年级学生一周的平均锻炼时间为8.2小时.在分层随机抽样中,如果第一层的样本量为m ,平均值为x ;第二层的样本量为n ,平均值为y ,则样本的平均值为mx +ny m +n.1.某学校为了解三年级、六年级、九年级这三个年级之间的学生的课业负担情况,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A .抽签法B .简单随机抽样 C.分层随机抽样D .随机数法【解析】选C.根据年级不同产生差异及按人数比例抽取易知应为分层随机抽样. 2.为了报考理想的大学,小明需要获取近年来我国各大学会计专业录取人数的相关数据,他获取这些数据的途径最好是( ) A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据【解析】选D.因为近年来我国各大学会计专业录取人数的相关数据有存储,所以小明获取这些数据的途径最好是通过查询获得数据.3.为调查某快餐店各分店的经营状况,某统计机构用分层随机抽样的方法,从A ,B ,C 三个城市中抽取若干家某快餐店分店组成样本进行深入研究,有关数据见下表:(单位:个)城市 某快餐店数量抽取数量A 26 2B 13 x C39y则样本量为( )A.4 B.6 C.10 D.12【解析】选B.设所求的样本量为n,由题意得n26+13+39=226,解得n=6.4.从总体容量为N的一批零件中用分层抽样抽取一个容量为30的样本,若每个零件被抽取的可能性为0.25,则N等于______.【解析】分层抽样是等可能抽样,故总体容量为30÷0.25=120.答案:1205.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为______.【解析】ω=2020+30×3+3020+30×8=6.答案:6。