第四章 抽样与抽样分布习题及答案
- 格式:doc
- 大小:31.50 KB
- 文档页数:2
第四章抽样估计一、判断题1.抽样估计的目的是用以说明总体特征。
2.抽样分布就是样本分布。
3.既定总体在当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布惟一确定。
4.样本容量就是样本个数。
5.在抽样中,样本容量是越大越好。
6.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。
7.当估计量有偏时,人们应该弃之不用。
8.对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。
9.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。
10.非抽样误差会随着样本容量的扩大而下降。
二、单项选择题1.想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则( )。
A.观测单位是学校B.观测单位是班级C.观测单位是学生 D.观测单位可以是学校、也可班级或学生2.下列误差中属于非一致性的有( )。
A.估计量偏差 B.偶然性误差 C.抽样标准误D.非抽样误差3.抽样估计中最常用的分布理论是( )。
A.t分布理论B.二项分布理论 C.正态分布理论D.超几何分布理论4.抽样标准误大小与下列哪个因素无关?( )A.样本容量B.抽样方式、方法 C.概率保证程度 D.估计量5.下列关于抽样标准误的叙述哪个是错误的?( )A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小三、计算分析题1. 某小组5个工人的每周工资分别为520、540、560、580、600元,现从中用简单随机抽样形式(不重复抽样)随机抽取2个工人周工资构成样本。
要求:(1)计算总体平均工资的标准差;(2)列出全部可能的样本平均工资;(3)计算样本平均工资的平均数,并检验其是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)用抽样平均误差的公式计算并验证是否等于(4)的结果。
抽样分布习题及答案抽样分布习题及答案抽样分布是统计学中一个重要的概念,它描述了从总体中抽取样本后,样本统计量的分布情况。
在实际应用中,我们经常需要利用抽样分布来进行统计推断,因此对于抽样分布的理解和掌握是十分必要的。
本文将介绍一些常见的抽样分布习题,并提供相应的答案。
1. 问题:某公司有1000名员工,其中400人是女性。
现从中随机抽取100人,求抽取样本中女性人数的抽样分布。
解答:在这个问题中,我们可以将女性的出现看作是一个二项分布的实验,成功的概率为0.4。
因此,抽取样本中女性人数的抽样分布是一个二项分布。
根据二项分布的性质,我们可以计算出不同女性人数的概率。
2. 问题:某电商平台有1000个用户,他们的购买金额服从均值为100元,标准差为20元的正态分布。
现从中随机抽取50个用户,求抽取样本的平均购买金额的抽样分布。
解答:在这个问题中,样本的平均购买金额的抽样分布是一个服从均值为100元,标准差为20/√50元的正态分布。
根据正态分布的性质,我们可以计算出不同平均购买金额的概率。
3. 问题:某城市的居民年收入服从均值为50000元,标准差为10000元的正态分布。
现从中随机抽取200个居民,求抽取样本的平均年收入的抽样分布。
解答:在这个问题中,样本的平均年收入的抽样分布是一个服从均值为50000元,标准差为10000/√200元的正态分布。
根据正态分布的性质,我们可以计算出不同平均年收入的概率。
4. 问题:某医院每天接诊的患者数服从均值为50人,标准差为10人的泊松分布。
现从中随机抽取30天,求抽取样本的平均每天接诊的患者数的抽样分布。
解答:在这个问题中,样本的平均每天接诊的患者数的抽样分布是一个服从均值为50人,标准差为10/√30人的正态分布。
根据正态分布的性质,我们可以计算出不同平均每天接诊的患者数的概率。
通过以上几个习题的解答,我们可以看到不同问题中抽样分布的情况是不同的,需要根据具体的问题来确定抽样分布的类型和参数。
第四章抽样分布与参数估计思考与练习一、单项选择题1.抽样平均误差与极限误差间的关系是( d )。
a. 抽样平均误差大于极限误差b. 抽样平均误差等于极限误差c. 抽样平均误差小于极限误差d. 抽样平均误差可能大于、等于或小于极限误差2.在其它条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量( a )。
a. 扩大为原来的4倍b. 扩大为原来的2倍c. 缩小为原来的二分之一d. 缩小为原来的四分之一3.类型抽样影响抽样平均误差的方差是( b )。
a. 组间方差b. 组内方差c. 总方差d. 允许误差4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的( b )。
a.无偏性b.一致性c.有效性d.充分性二、多项选择题1.影响抽样平均误差的因素有( a b c d )。
a.总体标志变异程度b.样本容量c.抽样方式d.抽样的组织形式e.样本指标值的大小2.抽样估计的抽样平均误差(a c e)。
a.是不可避免要产生的b.是可以通过改进调查方法消除的c.是可以事先计算的d.只有调查结束之后才能计算e.其大小是可以控制的3.确定样本容量时,可用以下方法取得近似的总体方差估计值(a b c )。
a.参考以往调查的经验资料b.以试点调查的样本方差来估计c.在做成数估计时,用成数方差最大值0.25来代替d.假定总体不存在标志变异,方差为零三、计算题1.某市居民家庭人均年收入是服从μ=4 000元,σ=1 200元的正态分布,求该市居民家庭人均年收入:(1)在5 000~7 000元之间的概率;(2)超过8 000元的概率。
解:(1)1200,4000==σμ。
{}()()0.197055935.020325.09876.00062.08333.02}8333.0{1}5.2{2}5.2{1}8333.0{}5.2{}5.28333.0{}70005000{}70005000{=+-+=⎪⎪⎭⎫ ⎝⎛<+<--⎪⎪⎭⎫ ⎝⎛<+<-=<-<=<<=-<=-<-=<<z prob z prob z prob z prob z prob z prob z prob z x prob x prob σμσμσμ (2) {}{}{}00035.0333.32333.311333.31}333.3{}8000{}8000{=⎥⎥⎦⎤⎢⎢⎣⎡<+<--=<-=>=->=-=>z prob z prob z prob z prob z x prob x prob σμσμ2.某小组5个工人的周工资分别为140、160、180、200、220元,现在用重复抽样的方法从中抽出2个工人的工资构成样本。
生物数学—-数理统计习题(前半部分)一、抽样与抽样分布1.设X 1,X 2,···,X n 为样本,¯X n =1n n i =1X i ,S 2n =1n n i =1(X i −¯X )2,X n +1为第n +1次的观测样本,试证:¯X n +1=¯X n +1n +1(X n +1−¯X n )2.设x 1,x 2,···,x n 及u 1,u 2,···,u n 为两个样本观测值,它们有如下关系:u i =x i −a b,b =0,a 都为常数,求样本平均值¯u 与¯x ,样本方差S 2u 与S 2x 之间的关系。
3.证明如下等式:(1)n i =1(X i −¯X )=0;(2)n i =1(X i −C )2=n i =1(X i −¯X )2+n (¯X −C )2;(3)n i =1(X i −¯X )2=n i =1X 2i −n ¯X,进而有S 2n =¯X 2−¯X 2,其中¯X 2=1n n i =1X 2i 。
4.若从总体中抽取容量为13的一个样本:−2.1,3.2,0,−0.1,1.2,−4,2.22,2.01,1.2,−0.1,3.21,−2.1,0试写出这个样本的次序统计量,中位数和极差。
5.设X ∼N (µ,σ2),求样本均值¯X与总体期望µ的偏差不超过1.96σ2n的概率。
6.在总体N (52,633)中随机抽一容量为36的样本,求样本均值¯X 落在50.8和53.8之间的概率。
7.求总体N (20,3)的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。
8.设X 1,X 2,···,X 10为N (0,0.09)的一个样本,求P (10i =1X 2i >1.44)。
抽样分布习题答案抽样分布习题答案随着统计学的发展,抽样分布成为了统计推断的重要基础。
在统计学中,我们经常需要从总体中抽取一部分样本,然后通过对样本的分析来推断总体的特征。
而抽样分布则是描述样本统计量的分布情况的概率分布。
在这篇文章中,我们将回答一些关于抽样分布的习题,帮助读者更好地理解和应用这一概念。
1. 假设某个总体的均值为μ,标准差为σ,从该总体中抽取样本容量为n的简单随机样本。
则样本均值的抽样分布的均值为多少?标准差为多少?答案:样本均值的抽样分布的均值为总体均值μ,标准差为总体标准差σ除以样本容量n的平方根,即σ/√n。
这意味着随着样本容量的增加,样本均值的抽样分布的标准差将减小,从而更加接近总体均值。
2. 假设某个总体服从正态分布,均值为μ,标准差为σ。
从该总体中抽取样本容量为n的简单随机样本,计算样本均值。
当n足够大时,样本均值的抽样分布将近似服从什么分布?答案:当样本容量n足够大时,样本均值的抽样分布将近似服从正态分布。
这是由于中心极限定理的适用,即当样本容量足够大时,样本均值的抽样分布将趋于正态分布,无论总体的分布形态如何。
3. 假设某个总体服从正态分布,均值为μ,标准差为σ。
从该总体中抽取样本容量为n的简单随机样本,计算样本标准差。
当n足够大时,样本标准差的抽样分布将近似服从什么分布?答案:当样本容量n足够大时,样本标准差的抽样分布将近似服从正态分布。
这是由于当样本容量足够大时,样本标准差的抽样分布可以通过中心极限定理近似为正态分布。
4. 假设某个总体的比例为p,从该总体中抽取样本容量为n的简单随机样本,计算样本比例。
样本比例的抽样分布的均值和标准差分别为多少?答案:样本比例的抽样分布的均值为总体比例p,标准差为√(p(1-p)/n)。
这意味着当样本容量足够大时,样本比例的抽样分布将近似服从正态分布,均值为总体比例p,标准差为√(p(1-p)/n)。
通过以上习题的解答,我们可以看到抽样分布在统计推断中的重要性。
(完整版)抽样调查习题及答案第四章习题抽样调查⼀、填空题1. 抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2. 采⽤不重复抽样⽅法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3. 只要使⽤⾮全⾯调查的⽅法,即使遵守随机原则,抽样误差也不可避免会产⽣。
4. 参数估计有两种形式:⼀是点估计,⼆是区间估计。
5. 判别估计量优良性的三个准则是:⽆偏性、⼀致性和有效性。
6. 我们采⽤“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差⼤⼩的尺度。
7. 常⽤的抽样⽅法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8. 对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩⼩⼀半,抽样单位数必须为原来的4倍。
若Δ扩⼤⼀倍,则抽样单位数为原来的1/4。
9. 如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10. 在同样的精度要求下,不重复抽样⽐重复抽样需要的样本容量少,整群抽样⽐个体抽样需要的样本容量多。
⼆、判断题1. 抽样误差是抽样调查中⽆法避免的误差。
(√)2. 抽样误差的产⽣是由于破坏了随机原则所造成的。
(×)3. 重复抽样条件下的抽样平均误差总是⼤于不重复抽样条件下的抽样平均误差。
(√)4. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增⼤到9倍。
(√)5. 抽样调查所遵循的基本原则是可靠性原则。
(×)6. 样本指标是⼀个客观存在的常数。
(×)7. 全⾯调查只有登记性误差⽽没有代表性误差,抽样调查只有代表性误差⽽没有登记性误差。
(×)8. 抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1. ⽤简单随机抽样(重复)⽅法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩⼤为原来的(C)A. 2倍B. 3倍C. 4倍D. 5倍2. 事先将全及总体各单位按某⼀标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织⽅式叫做(D)A. 分层抽样B. 简单随机抽样C. 整群抽样D. 等距抽样3. 计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A. 最⼩⼀个B. 最⼤⼀个C. 中间⼀个D. 平均值4. 抽样误差是指(D)A. 计算过程中产⽣的误差B. 调查中产⽣的登记性误差C. 调查中产⽣的系统性误差D. 随机性的代表性误差5. 抽样成数是⼀个(A)A. 结构相对数B. ⽐例相对数C. ⽐较相对数D. 强度相对数6. 成数和成数⽅差的关系是(C)A.成数越接近于0,成数⽅差越⼤B.成数越接近于1,成数⽅差越⼤C.成数越接近于0.5,成数⽅差越⼤D.成数越接近于0.25,成数⽅差越⼤7. 整群抽样是对被抽中的群作全⾯调查,所以整群抽样是(B)A. 全⾯调查B. ⾮全⾯调查C. ⼀次性调查D. 经常性调查8. 对400名⼤学⽣抽取19%进⾏不重复抽样调查,其中优等⽣⽐重为20%,概率保证程度为95.45%,则优等⽣⽐重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9. 根据5%抽样资料表明,甲产品合格率为60%,⼄产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A. 甲产品⼤B. ⼄产品⼤C. 相等D. ⽆法判断10. 抽样调查结果表明,甲企业职⼯平均⼯资⽅差为25,⼄企业为100,⼜知⼄企业⼯⼈数⽐甲企业⼯⼈数多3倍,则随机抽样误差(B)A. 甲企业较⼤B. ⼄企业较⼤C. 不能作出结论D. 相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A. 是不可避免要产⽣的B. 是可以通过改进调查⽅法来避免的C. 是可以计算出来的D. 只能在调查结果之后才能计算E. 其⼤⼩是可以控制的2. 重复抽样的特点是(AC)A. 各次抽选相互影响B. 各次抽选互不影响C. 每次抽选时,总体单位数始终不变D 每次抽选时,总体单位数逐渐减少E. 各单位被抽中的机会在各次抽选中相等3. 抽样调查所需的样本容量取决于(ABE)A. 总体中各单位标志间的变异程度B. 允许误差C. 样本个数D. 置信度E. 抽样⽅法4. 分层抽样误差的⼤⼩取决于(BCD)A. 各组样本容量占总体⽐重的分配状况B. 各组间的标志变异程度C. 样本容量的⼤⼩D. 各组内标志值的变异程度E. 总体标志值的变异程度5. 在抽样调查中(ACD)A. 全及指标是唯⼀确定的B. 样本指标是唯⼀确定的C. 全及总体是唯⼀确定的D. 样本指标是随机变量E. 全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职⼯3000⼈,现从中随机抽取60⼈调查其⼯资收⼊情况,得到有关资料如下:(1)试以0.95的置信度估计该公司⼯⼈的⽉平均⼯资所在范围。
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100(3)条形图(略)2.2 (1)频数分布表如下:按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (A班分散,且平均成绩较A班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
抽样分布习题及答案1. 题目:从一个容器中随机取出30个样本,每个样本的体积服从正态分布,均值为150,标准差为10。
计算样本均值的抽样分布的标准差。
解答:我们知道,样本均值的抽样分布的标准差(也称为标准误差)可以通过总体标准差除以样本容量的平方根来计算。
标准误差 = 总体标准差/ √样本容量在本题中,总体标准差为10,样本容量为30,代入公式可得:标准误差= 10 / √30 ≈ 1.83因此,样本均值的抽样分布的标准差约为1.83。
2. 题目:某电视台进行了一项调查,随机抽取了500名观众,其中有380人表示喜欢该电视节目。
根据该样本数据,计算其样本比例的抽样分布的标准差。
解答:样本比例的抽样分布的标准差可以通过以下公式计算:标准误差= √((样本比例 × (1 - 样本比例)) / 样本容量)在本题中,样本比例为380/500 = 0.76,样本容量为500,代入公式可得:标准误差= √((0.76 × (1 - 0.76)) / 500) ≈ 0.018因此,样本比例的抽样分布的标准差约为0.018。
3. 题目:某商品的包装袋上注明每袋重量服从正态分布,均值为500克,标准差为10克。
为了确定该注明是否准确,随机抽取了100袋该商品,计算抽取样本的平均重量的抽样分布的标准差。
解答:抽取样本的平均重量的抽样分布的标准差可以通过总体标准差除以样本容量的平方根来计算。
标准误差 = 总体标准差/ √样本容量在本题中,总体标准差为10克,样本容量为100,代入公式可得:标准误差= 10 / √100 = 1因此,抽取样本的平均重量的抽样分布的标准差为1克。
4. 题目:某超市进行了一次促销活动,随机抽取了50个顾客进行调查,得知他们购买的平均金额为200元,标准差为50元。
计算该样本的平均金额的抽样分布的标准差。
解答:样本的平均金额的抽样分布的标准差可以通过总体标准差除以样本容量的平方根来计算。
《统计学概论》习题解答第二章 统计数据的搜集、整理与显示10. 某银行网点连续40天客户人数如下表,根据上表进行适当分组,编制频数分布数列并绘制直方图470 250 290 470 380 340 300 380 430 400 460 360 450 370 370 360 450 440 350 420 350 290 460 340 300 370 440 260 380 440 420360370440420360370370490390(1)资料排序:440 430 420 420 420 400 390 380 380 380 370 370 370 370 370 370 360 360 360 360(2)分组类型—连续组距式分组; (3)组距:(4)组限: 250、290、330、370、410、450、490某银行网点40天接待客户分布表40322.31240lg d +=()户40602.1322.31240≈⨯+=()人240250490=-=R24681012250 290 330 370 410 450 490 530某银行网点40天接待客户分布直方图客户第三章 统计分布的数值特征【7】某大型集团公司下属35个企业工人工资变量数列如下表所示:月 工 资(元) 企 业 数 比 重(%)∑⋅ffx分 组 组中值x (个) ∑f f600以下 550 5 10 55.0 600—700 650 8 25 162.5 700—800 750 10 30 225.0 800—900 850 7 20 170.0 900以上 950 5 15 142.5 合 计—35100755.0试计算该企业平均工资。
(注:比重——各组工人人数在工人总数中所占的比重) 【解】 该集团公司职工的平均工资为755元/人。
【8】某地甲、乙两个农贸市场三种主要水果价格及销售额资料见下表品 种 价 格(元/千克)甲 市 场乙 市 场销售额(万元)销量 比重 销售额 (万元)销量 比重 (万千克) (%)(千克) (%) xmx m f =∑f fmx m f =∑f f甲 2.0 80 40 44.5 60 300 000 30.0 乙 3.0 90 30 33.3 120 400 000 40.0 丙 2.5 50 20 22.2 75 300 000 30.0 合 计—22090100.02551 000 000100.0试计算比较该地区哪个农贸市场水果平均价格高?并说明原因。