抽样技术作业题
- 格式:doc
- 大小:34.50 KB
- 文档页数:1
应用抽样技术练习题一、选择题1. 下列哪种抽样方法属于非概率抽样?A. 简单随机抽样B. 分层抽样C. 方便抽样D. 系统抽样2. 在简单随机抽样中,每个个体被抽中的概率是:A. 不相等B. 相等C. 逐渐增大D. 逐渐减小A. 总体标准差B. 抽样误差C. 置信水平A. 确定总体B. 划分层次C. 确定各层样本量5. 系统抽样中,抽样间隔的计算公式是:A. N/nB. N/(n+1)C. n/ND. (N1)/n二、填空题1. 抽样技术分为两大类:______抽样和______抽样。
2. 在______抽样中,每个个体被抽中的概率是相等的。
3. 抽样误差的大小与样本量成______比,与总体标准差成______比。
4. 在分层抽样中,各层的样本量应与各层的______成比例。
5. 系统抽样的第一步是确定______。
三、简答题1. 简述简单随机抽样的步骤。
2. 何为抽样误差?它受哪些因素影响?3. 简述分层抽样的优点。
4. 系统抽样与简单随机抽样有何区别?5. 如何确定样本量?四、计算题1. 某企业有员工1000人,采用简单随机抽样方法抽取50人进行调查。
计算每个员工被抽中的概率。
2. 某地区居民收入总体标准差为500元,要求抽样误差不超过50元,置信水平为95%。
计算所需样本量。
3. 某学校有学生2000人,分为四个年级,每个年级人数分别为400、450、500和650人。
现采用分层抽样方法抽取200人进行调查,求每个年级应抽取的样本量。
4. 某生产线共有1000个产品,采用系统抽样方法抽取100个产品进行质量检验。
计算抽样间隔。
5. 某企业对员工满意度进行调查,总体标准差为10%,要求抽样误差不超过2%,置信水平为90%。
计算所需样本量。
五、判断题1. 在抽样调查中,总体的大小对于抽样误差没有影响。
()2. 非概率抽样不能提供总体参数的估计。
()3. 在系统抽样中,第一个样本单元可以随机选择。
一、选择题1、分层抽样的特点是()A、层内差异小,层间差异大B、层间差异小,层内差异大C、层间差异小D、层内差异大2、下面的表达式中错误的是()A、∑fh=1B、∑nh=n C、∑Wh=1D、∑Nh=13、各省电脑体育彩票中奖号码的产生属于()A、随意抽样B、判断抽样C、随机抽样D、定额抽样4、抽样调查的根本功能是()A、获取样本资料B、计算样本指标C、推断总体数量特征D、节约费用5、最优分配(Vopt )、比例分配(Vprop)的分层随机抽样与相同样本量的简单随机抽样(Vsrs)的精度之间的关系式为()A、Vopt ≤Vprop≤VsrsB、Vprop≤Vopt≤VsrsC、Vprop ≥Vopt≥VsrsD、Vsrs≤Vprop≤Vopt6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试,则()A、抽样单位是每一名学生B、调查单位一定是每一名学生C、调查单位可以是班级D、调查单位是学校7、在分层抽样中,当样本容量n固定时,能够使得估计量的方差V(yst)达到最小的分配方式是()A、比例分配B、等额分配C、随机分配D、Neyman分配8、概率抽样与非概率抽样的根本区别是()A、是否能确保总体中的每个单位都有完全相同的概率被抽中B、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中C、是否能减少调查性误差D、是否能计算和控制抽样误差9、在抽样的总误差中,属于一致性的误差有()A、变量误差与估计量偏差B、估计量偏差与抽样误差C、变量误差与抽样误差D、非抽样误差与估计量偏差10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是()A、将总体分成几部分,然后按事先确定的规则在各部分抽取B、每个个体单元被抽到的可能性都相等C、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定D、三者没有共同点11、下面哪种样本量分配方式属于比例分配?()n nn A 、h =B 、h =N hNnN hShchch∑N h =1LhShC 、n h N Sn W S=L h h D 、h =L h h n n N S∑hh∑W hShh =1h =112、整群抽样中的群的划分标准为()A 、群的划分尽可能使群间的差异小,群内的差异大B 、群的划分尽可能使群间的差异大,群内的差异小C 、群的划分尽可能使群间的差异大,群内的差异大D 、群的划分尽可能使群间的差异小,群内的差异小13、群规模大小相等时,总体均值的简单估计量为()ˆ1A.Y =nM ˆB.Y =∑∑yi =1j =1nM ijn M 1y ij ∑∑n (M -1)i =1j =1ˆ1n M C.Y =∑∑y ij ni =1j =1ˆ1D.Y =N∑∑yi =1j =1nM ij14、关于多阶段抽样的阶段数,下列说法最恰当的是()A 、越多越好B 、越少越好C 、权衡各种因素决定D 、根据主观经验判断15、在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用()A 、系统抽样B 、简单随机抽样C 、不等概率抽样D 、非概率抽样16、将总体共120个单元随机分为10路纵队(共12排),然后任取其中一排,得到12个样本单元,此抽样方法属于()A 、简单随机抽样B 、分层抽样C 、整群抽样D 、系统抽样17、样本包含非同质单位而未被发现时,总体均值估计量的方差()A 、会被高估B 、会被低估C 、可能被高估,也可能被低估D 、会发生变化18、优良估计量的标准是()A 、无偏性、充分性和一致性B 、无偏性、一致性和有效性C 、无误差性、一致性和有效性D 、无误差性、无偏性和有效性19、在放回式PPS 抽样中,记第i 个样本单元y i的抽取概率为p i,则总体总值Yˆ的表达式为()的无偏估计YPPSny 1n y i N A 、∑B 、N∑i C 、n i =1pini =1pi1n p i yi D 、∑∑n i =1yii =1n 20、能使V (y lr )=1-f22(S Y +β2S X -2βS YX )达到极小值的β值为()n2S Y ⋅SXS YXS YXS YXA 、B 、2C 、2D 、SYXS XS YSX21、与简单随机抽样进行比较,样本设计效果系数Deff >1表明()A 、所考虑的抽样设计比简单随机抽样效率低B 、所考虑的抽样设计比简单随机抽样效率高C 、所考虑的抽样设计与简单随机抽样效率相同D 、以上皆对22、下列误差中属于非一致性的有()A 、估计量偏差B 、偶然性误差C 、抽样标准误D 、抽样框偏差23、抽样标准误差的大小与下列哪个因素无关()A 、样本容量B 、抽样方式、方法C 、概率保证程度D 、估计量24、抽样标准误差与抽样极限误差之间的关系是()A 、∆=ˆ)SE (θθˆ)ˆ)tSE (θSE (θˆB 、∆=tSE (θ)C 、∆=D 、∆=θt25、某大学理学院共有六个系,为调查该学院学生通过英语六级的状况,首先采用正比于各系人数规模的有放回PPS 抽样,从六个系中抽取了两个系,然后在这两个系中分别随机抽取10名学生进行调查。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。
在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。
按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。
另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。
〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。
因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。
”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。
”1.2 答(1)(2)(3)皆否。
理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。
第四章抽样技术概述班级:姓名:成绩一、填空题:(21分)1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。
2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。
3、抽样调查是以()数据推断的()数据。
4、抽样调查产生的(),可以计算并控制,5、从全及总体中抽取样本单位有()和()两种方法。
6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。
7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。
8、影响抽样误差的主要因素有()、()、()、()。
9、利用样本统计量估计总体参数,通常运用()和()两种方法。
10、点估计是直接用()估计总体参数的推断方法。
点估计不考虑()及()。
11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。
12、影响样本容量大小的因素主要有五种:()、()、()、()、()。
13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。
我们称这一区间为()。
14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。
若误差范围扩大一倍,则抽样单位数为原来的()。
二、单项选择题:(14分)1、随机抽样的基本要求是严格遵守()A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。
2、抽样调查的主要目的是()A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。
3、在抽样调查中()A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、没有登记性误差,只有代表性误差。
第四章抽样技术一、名词解释1、抽样调查2、总体和样本3、样本容量4、重复抽样5、不重复抽样6、抽样极限误差7、点估计8、区间估计二、填空1、抽样调查是从研究的中抽取部分单位作为进行观察研究,并根据这部分单位的调查结果来推断,以达到认识总体的一种统计调查方法。
2、抽样调查分为和两类。
抽样调查遵循。
3、是用主观的(非随机的)方法从总体中抽选单位进行调查,它是一种快速、简便且省钱的抽选样本的方法。
但非概率抽样具有很大的风险,因为主观选定的样本很难保证其对总体的代表性。
所以一般情况下不用来对总体进行推断。
主要包括随意抽样,,。
4、概率抽样有两条基本准则:第一,单位是随机抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
概率抽样方法主要有、、分层随机抽样、、、。
常用的为前四种。
5、是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。
从中按随机原则抽取出来的部分单位所组成的集合体就称为样本。
6、从总体中抽取样本单位有与两种方法。
7、抽样框又称为抽样框架、抽样结构,是指对可以选择作为样本的总体单位列出名册成排序编号,以确定总体的和。
设计抽样框式进行抽样调查的前提,常见的抽样框有、等。
8、抽样误差是指指标数值与指标数值之差,即抽样估计值与被估计的未知的真实总体参数值之差。
9、在抽取多个样本时,就其中每个样本来说,都有其相应的抽样误差,而这些抽样误差的平均数,就是,用以反映抽样误差的一般水平。
10、一般来说,在实际应用时,常常采用的方法从总体各单位中抽取样本单位,进行调查;在计算上,为了计算简便,通常可以采用条件下抽样平均误差的计算公式进行计算。
11、概率分布的中心极限定理证明:(1)大量的客观事物总体现象是总体或近似于总体。
(2)在大样本的条件下,的分布是或近似地是正态分布,抽样成数的分布是或近似地是正态分布。
(3)抽样平均数的平均数总体平均数,抽样成数的平均数总体成数。
12、概率度t越大,估计的可靠性越,样本统计量与总体参数之间正负离差的变动范围也就越。
课时分层作业(三十八) 分层抽样(建议用时:40分钟)一、选择题1.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为100、200、300、400件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丁种型号的产品中抽取( )A .24件B .18件C .12件D .6件A [设应从丁种型号的产品中抽取x 件,由分层抽样的基本性质可得x 400=60100+200+300+400,解得x =24.故选A .]2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,各年龄段分别抽取的人数为( )A .7,5,8B .9,5,6C .6,5,9D .8,5,7B [由于样本量与总体个体数之比为20100=15,故各年龄段抽取的人数依次为45×15=9,25×15=5,20-9-5=6.故选B]3. 下列实验中最适合用分层抽样法抽样的是( ) A .从一箱3 000个零件中抽取5个入样 B .从一箱3 000个零件中抽取600个入样 C .从一箱30个零件中抽取5个入样D .从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个入样D [C 中总体个体无明显差异且个数较少,适合用简单随机抽样;A 和B 中总体中个体无明显差异且个数较多,适合用随机数表法;D 中总体个体差异明显,适合用分层抽样.故选D .]4. 为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A ,B ,C 三所中学抽取60名教师进行调查,已知A ,B ,C 三所学校中分别有180,270,90名教师,则从C 学校中应抽取的人数为( )A .10B .15C .20D .30A [根据分层抽样的特征,从C 学校中应抽取的人数为90180+270+90×60=10.]5.当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题.已知甲、乙、丙三个社区分别有低收入家庭360户、270户、180户,若第一批经济适用房中有90套住房用于解决这三个社区中90户低收入家庭的住房问题,先采用分层抽样的方法决定各社区户数,则应从甲社区中抽取低收入家庭的户数为( )A .40B .30C .20D .36A [抽样比为90360+270+180=19,则应从甲社区中抽取低收入家庭的户数为360×19=40.]二、填空题6.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为________.分层抽样、简单随机抽样 [由调查①可知个体差异明显,故宜用分层随机抽样;调查②中个体较少,且个体没有明显差异,故宜用简单随机抽样. ]7.防疫站对学生进行身体健康调查,采用分层抽样法抽取,泗县一中高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有_________.760 [设学校有女生x 人,∵ 对全校男女学生共1 600名进行健康调查, 用分层抽样法抽取一个容量为200的样本, ∴ 每个个体被抽到的概率是2001 600=18, 根据抽样过程中每个个体被抽到的概率相等, ∵女生比男生少抽了10人,且共抽200人, ∴女生要抽取95人,∴女生共有95÷18=760.]8.某单位共有老年人120人,中年人360人,青年人n 人,为调查身体健康状况,需要从中抽取一个容量为m 的样本,用分层抽样的方法进行抽样调查,样本中的中年人为6人,则n 和m 的值可能是下列四个选项中的哪组________.(选填序号)①n =360,m =14;②n =420,m =15;③n =540,m =18;④n =660,m =198. ①② [某单位共有老年人120人,中年人360人,青年人n 人,样本中的中年人为6人,则老年人为120×6360=2,青年人为6360n =n 60,2+6+n 60=m ⇒8+n 60=m ,代入序号计算,③④不符合,故①②能成立.]三、解答题9.举例说明简单随机抽样和分层抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等.[解] 举例:袋中有160个小球,其中红球48个,篮球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为20160=18.(2)使用分层抽样:四种球的个数比为3∶4∶1∶2.红球应抽310×20=6个;篮球应抽410×20=8个;白球应抽110×20=2个;黄球应抽210×20=4个.因为648=864=216=432=18,所以按颜色区分,每个球被抽到的概率也都是18.所以简单随机抽样和分层抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等.10.某单位2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 总计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1 200 小计1603204801 0402 000(1)(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? [解] (1)用分层抽样,并按老年4人,中年12人,青年24人抽取. (2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.1.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )A .10人B .15人C .20人D .25人C [由年龄分布情况图可得40岁以下年龄段应抽取40×50%=20人.故选C .] 2.一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的可能性都是27,则男运动员应抽取( )A .18人B .16人C .14人D .12人B [∵田径队共有运动员98人,其中女运动员有42人,∴男运动员有56人, ∵每名运动员被抽到的可能性都是27,∴男运动员应抽取56×27=16(人),故选B .]3.甲、乙两套设备生产的同类产品共4 800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.1 800 [由题知共有产品4 800名,抽取样本为80,则抽取的概率为P =804 800=160,因样本中有50件产品由甲设备生产,则乙设备生产有30件,则乙设备在总体中有30×60=1 800.]4.小玲家的鱼塘里养了2 500条鲢鱼,按经验,鲢鱼的成活率约为80%.现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次进行统计,得到的数据如下表:3 600 [平均每条鱼的质量为 20×1.6+10×2.2+10×1.820+10+10=1.8()kg因为成活的鱼的总数约为2 500×80%=2 000(条) 所以总质量约是2 000×1.8=3 600()kg ]5. 某企业三月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是多少件?[解] 设样本容量为x ,则x3 000×1 300=130,∴x =300.∴A 产品和C 产品在样本中共有300-130=170(件). 设C 产品的样本容量为y , 则y +y +10=170,∴y =80.∴C 产品的数量为3 000300×80=800(件).。
欢迎共阅《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。
设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。
如果deff<1,则所考虑的抽样率低。
deff n '。
2答:2)每3偏。
(3查数据质量和估计结果的负面影响非常大。
非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。
4、不等概率抽样答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。
不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。
不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。
5、最优分配答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。
6、比率估计答:比率估计(radioestimator)又称比估计,在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有偏的。
7、试述分别比估计和联合比估计的比较因为这8如9答:但10区共有N=1000户,调查了n=100户,得y=12.5吨,2s=1252,有40户用水超过了规定的标准。
要求计算:该住宅区总的用水量及95%的置信区间;若要求估计的相对误差不超过10%,应抽多少户作为样本?以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,n100f0.1N1000===,2y=12.5s1252=,估计该住宅区总的用水量Y为:估计该住宅区总的用水量Y的方差和标准差为:因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:即,我们可以以95%的把握认为该住宅总的用水量在5921吨~19079吨之间。
简单随机抽样习题及解答一、名词解释简单随机抽样抽样比设计效应二、单选题1、假设根据抽样方差公式确定的初始样本量为400,有效回答率为0.8,那么实际样本量应为:()A 320B 800C 400D 480答案:B2、已知某方案的设计效应为0.8,若计算得简单随机抽样的必要样本量为300,则该方案所需样本量为()A 375B 540C 240D 360答案:C3、假设根据抽样方差公式确定的初始样本量为400,如现在要将抽样相对误差降低20%,则样本量应为:()A 256B 320C 500D 625答案:D三、多选题1、简单随机抽样的抽样原则有()A 随机抽样原则B 抽样单元入样概率已知C 抽样单元入样概率相等D 随意抽取原则答案:ABC2、影响样本容量的因素有:A 总体大小B 抽样误差C 总体方差D 置信水平答案:ABCD3、简单随机抽样的实施方法有()A 随机数法B 抽签法C 计算机抽取D 判断抽取答案:ABC四、简答题1、简述样本容量的确定步骤2、简述预估计总体方差的方法五、计算1、某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。
2、某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。
采用简单随机抽样抽选了100户,得ý=12.5,s2=12.52。
估计该居民区的总用水量95%的置信区间。
若要求估计的相对误差不超过20%,试问应抽多少户做样本?(1)该区居民的平均用水量的置信区间:该区居民的用水总量的95%置信区间:(1181,1319)(2)35.96)5.122.052.1296.1()(220=⨯⨯==Y r S u n α 9643.95100≈=+=Nn n n 3. 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。
抽样技术习题答案抽样技术习题答案在统计学中,抽样技术是一种重要的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样技术的正确应用对于得出准确的结论和推断至关重要。
本文将通过一些抽样技术的习题来探讨相关答案,并解释其背后的原理。
1. 简单随机抽样假设有一个总体包含1000个元素,我们希望从中抽取一个简单随机样本,样本容量为100。
那么,我们可以使用随机数表或随机数生成器来选择100个随机数,然后根据这些随机数在总体中选择相应的元素。
2. 系统抽样假设我们有一个总体包含10000个元素,我们希望从中抽取一个系统样本,样本容量为200。
首先,我们计算出总体的抽样框架,即总体中每隔多少个元素抽取一个样本元素。
在这个例子中,总体容量除以样本容量得到的商为50,所以我们每隔50个元素抽取一个样本元素。
3. 分层抽样假设我们有一个总体分为三个层次,每个层次的容量分别为1000、2000和3000。
我们希望从每个层次中抽取相应的样本容量进行研究。
首先,我们计算每个层次的抽样比例,即样本容量除以总体容量。
然后,根据这些比例从每个层次中抽取相应的样本。
4. 整群抽样假设我们有一个总体包含50个群组,每个群组包含100个元素。
我们希望从每个群组中抽取一个样本,样本容量为20。
首先,我们计算每个群组的抽样比例,即样本容量除以群组容量。
然后,根据这些比例从每个群组中抽取相应的样本。
5. 效应量抽样效应量抽样是一种根据总体中的变异程度和所需的抽样误差来确定样本容量的方法。
假设我们想要研究某个总体的均值,我们需要根据总体的标准差、显著性水平和抽样误差来确定样本容量。
以上是一些常见的抽样技术及其应用。
通过正确选择和应用适当的抽样技术,我们可以获得可靠的数据,并进行准确的统计分析和推断。
然而,需要注意的是,抽样技术并不是万能的,它们都有自己的限制和假设条件。
因此,在使用抽样技术时,我们需要仔细考虑样本的代表性、样本容量和抽样误差等因素,以确保研究结果的可靠性和有效性。
抽样技术作业题二
在美国汽车是大多家庭必备的交通工具,私人汽车拥有量居世界前列,汽车的档次、价位、性能、品牌各有不同。
为调查国内各种品牌汽车的性能,美国调查部门于1997年在全国的私人拥有的汽车中抽取了一批样本进行调查,现取部分数据列示如下,其中变量意义分别为:变量变量全称中文意思取值单位mpg mikes per gallon 每加仑油所行的英里英里engine Engine displacement 发动机的排水量英寸3 horse horsepower 该车的马力马力weight weight 车辆的重量磅
accel time to accelerate from
0 to 60 mph(sec)
从0加速到60英里所
需的时间
秒
year Model year 品牌出现的年数年
origin country of origin 产地1表示American,美国;2表示European,欧洲;3表示Japanese,日本;
cylinder number of cylinders 气缸的个数3、4、5、8四个值,分别
表示气缸的个数。
个
题目要求:
1、将这406个数据看作总体,请运用SPSS从中随机抽取n=40的样本,并估计美国国内私人车辆重量的95%的置信区间。
(SPSS抽样后可能破坏数据的完整性,抽样前请备份数据)
2、结合数理统计与SPSS软件,将406个数据作为样本,分析美国、欧洲和日本产的小汽车在重量上(两两比较)是否有显著差异(查阅SPSS相关教程,compare means→one-way ANOVA)。
二、研究某小区家庭用于文化方面(报刊、电视、网络等)的支出,N=200,现抽取一
而全部家庭的总支出已知平均为1600元,利用简单估计、比率估计和回归估计的方法估计家庭平均文化支出区间(置信水平95.45%),并比较三种估计方法的效率。
(运用SPSS计算)。