应用抽样技术课后习题答案
- 格式:ppt
- 大小:581.50 KB
- 文档页数:48
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术第⼆章参考答案第⼆章习题判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y (千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量⾄少应为多少解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()?(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民⽤电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,)由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量⾄少应为862某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。
第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。
在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。
按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。
另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。
〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。
因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。
”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。
”1.2 答(1)(2)(3)皆否。
理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样理论与应用习题答案
《抽样理论与应用习题答案》
抽样理论与应用是统计学中非常重要的一个领域,它涉及到了如何从一个大的总体中抽取样本,并利用样本数据对总体进行推断和预测。
在实际应用中,我们经常会遇到各种各样的抽样问题,因此掌握抽样理论与应用的知识是非常重要的。
以下是一些关于抽样理论与应用的习题答案,希望能够帮助大家更好地理解这一领域的知识。
1. 什么是简单随机抽样?简单随机抽样是指从总体中随机地抽取样本,且每个样本具有相同的概率被选中。
2. 为什么简单随机抽样是一种有效的抽样方法?简单随机抽样能够保证样本的代表性,因为每个样本被选中的概率都是相同的,不会出现抽样偏差。
3. 什么是分层抽样?分层抽样是将总体按照某种特征分成若干层,然后从每一层中分别进行简单随机抽样,最终将各层的样本合并成总体样本。
4. 为什么要使用分层抽样?分层抽样能够保证每一层的样本都能够得到充分的代表性,从而提高总体样本的代表性。
5. 什么是整群抽样?整群抽样是将总体按照某种特征分成若干群,然后随机地选择若干群作为样本。
6. 为什么要使用整群抽样?整群抽样能够减少抽样的复杂度,同时也能够保证样本的代表性。
以上是一些关于抽样理论与应用的习题答案,希望能够帮助大家更好地理解这一领域的知识。
在实际应用中,我们需要根据具体情况选择合适的抽样方法,
并且在进行抽样时要注意保证样本的代表性,以便能够对总体进行准确的推断和预测。
第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(1)b ;(2)b ;(3)d ;(4)c ;(5)c 。
2.7(1)抽样分布:(2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263(5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7]第三章3.1 判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2 (1)5.51==∑iYNY25.6)(122=-=∑Y Y Niσ33.8)(1122=--=∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9)()()5.55.775.55.545.361=+++++=∑y E ()∑=+++++=33.8)5.485.05.2485.4(612s E3.3(1) 1682=∑i y 1182662=∑i y03276.0301750/3011=-=-n f 760.5630/1682==y127.8261302^067.503011826611)(11212212=-⨯-=⎪⎭⎫ ⎝⎛--=--=∑∑==y n y n y y n s n i in i i ()07.27271.82603276.012=⨯=-=s nf y v ()203.5)(==y v y se198.10203.596.1)(=⨯=⨯=∆y se t95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。
第二章习题2.1判定以下抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,假设r=0或r>64那么舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,假设余数为0那么抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原那么抽取样本。
第二,每个单元被抽中的概率是的,或者是能够计算的。
第三,当用样本对总体目标进行估量时,要考虑到该样本被抽中的概率。
因此〔1〕中只有1~64是可能被抽中的,故不是等概的。
〔2〕不是等概的【缘故】〔3〕是等概的。
y 的定义和性质有哪些不同?机抽取了300户进行,现得到其日用电平均值=y 9.5〔千瓦时〕,=2s 206.试估量该市居民用电量的95%置信区间。
要是盼瞧相对误差限不超过10%,那么样本量至少应为多少?解:由可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为〔394035.95,555964.05〕 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,那么样本量至少应为8622.4某大学10000名本科生,现欲估量爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估量该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代进数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面〔报刊、电视、网络、书籍等〕的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估量该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
第一章1.1判断题:(1)对;(2)对;(3)对;(4)对;(5)错;(6)错;(7)错;(8) 错;(9)错;(10)对•;(11)对。
1.2试分析以下几种抽样属于何种抽样(概率或非概率):(1)概率抽样;(2)非概率抽样;(3)非概率抽样;(4)非概率抽样;(5)非概率抽样;(6)非概率抽样。
1.3选择题:(1) c; (2) c; (3) b; (4) co第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8) 错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(2)期望为5,方差为4/3(3)抽样标准误=I,= 1.155(4)抽样极限误差= 1.96*1.155 = 2.263(5)置信区间=(5.67-2.263, 5.67+2.263) = (3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3,7]第三章3.1判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2p = — == 0.267 n 30 m=g=°°g30-1⑴歹=土£匕=5.5『=§£(匕_区)2=6.2552 =-^—y(K-r)2 =8.33 N-\- 1(2)样本:(2,5) (2,6) (2,9) (5,6) (5,9) (6,9)此=空(3.5 + 4 + 5.5 + 5.5 + 7 + 7.5)= 5.5 8何)=?Z(4.5 + 8 + 24.5 + 0.5 + 84-4.5) = 8.333.3⑴ £叫=1682 Yy,.2 =118266 上£ =上四登= 0.03276 乙’n 30y = 1682/30 = 56.0672 1 -.2 1 fv -2) H8266-30x50.067A2s =—>()',—)') =—7 L H ~ny = ------------------------------ —— ------------ = 826.271 〃一1旨)30-1*时=上匚2 =0.03276x826.271 = 27.07 nse(项)=0(顼)=5.203△ =,x se(项)=1.96 x 5.203 = 10.19895%置信度下置信区间为(56.067-10.198, 56.067+10.198) = (45.869,66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95% 对应的『= 1.96,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87〜66.27元之间。