当前位置:文档之家› 第4章 总体参数估计

第4章 总体参数估计

第4章   总体参数估计
第4章   总体参数估计

◎第4章参数估计

※一、单一总体的参数估计※

●(一)估计的含义

●估计:人人都做过。如:

?上课时,你会估计一下老师提问你的概率有多大?

?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。

●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征:

(1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。

(2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。

(3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。

(4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。

※估计的类型包括:

1、 点估计:只有一个取值。

就是总体平均数μ的点估计值。

2、区间估计:给出取值范围(值域)。见PPT

▲两种估计类型哪一种更科学?

※ 区间估计的优点在于:它在给出估计区间时,

还可以给予一个“可信程度”。例如:销售经理想

估计一下明年的出口总值,甲估计是53万美元,乙估计

是50—56万美元之间,并可以确切地说“有95%的把握”。

显然后者的可信程度大于前者。那么,50—56万美元之

间的范围是如何计算的?“有95%的把握”是什么意思?

【引例】:某食品进出口公司向东南亚出口一批花生制品,管

理人员从中抽取50包作为样本,计算其平均数为250克。另

外,合同规定总体标准差为6克。

如果问这批花生制品的平均重量,可用样本平均数作为总

体平均数的最佳估计量:250克。但这是远远不够的,在许多

时候,管理人员还想了解“这个估计值的平均误差是多少?”

“总体平均数可能落入样本平均数上、下多大范围内?”“ 这

个估计值的可靠程度是多少?”

〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6

〖2〗抽样平均误差:8485.0506===

n x σσ

〖3〗若用250克这个估计值估计总体

平均数,其平均误差为0.8485。

〖4〗若用区间表示估计的值域:这批花生制品的总体平均重

量是250±0.8485克之间。

〖5〗总体平均数在250±0.8485克之间的可信度为68.3%。

总体平均数在250±2×0.8485克之间的可信度为95.5%。

总体平均数在250±3×0.8485克之间的可信度为99.7%。

●(二)区间估计中几个常用概念

1、置信度(置信系数):它是指与一个估计区间相

联系的概率,它表示该区间将包括总体参数的可能

程度。用1-α表示。置信度越大,估计区间内所

包含总体参数的可信度越高。(68.3%、95.45%、99.7%

都是置信度)

2、置信区间:与一个“置信度”相联系的估计值

(如250±2x σ)

※250±2x σ:表示有95.45%的样本平均数构

造的区间将包含总体平均数。※

※250±3x σ:表示有99.73%的样本平均数构

造的区间将包含总体平均数。※

3、置信限:与置信区间相联系的界限,包括上限

和下限。如上题中下限:250-x σ,上限:250+x σ

▲思考题:置信度与置信区间有何关系? (三)总体平均数的区间估计 1、大样本条件下的区间估计

●(1)、总体标准差σ已知条件下,对总体平均数

的区间估计

▲案例1:在【引例】中:食品进出口公司出口一批花生制品,

管理人员抽取50包为样本,其平均数为250克。合同规定总

体标准差为6克。问:(1)如果置信区间为:250±2x

σ、250±1.96x

σ,总体参数这一范围的把握程度有多大?(2)若用90%的置信系数,则该批食品平均重量是多少?

解:(1)a 、250±2×0.8485,与z=2对应的置信度是:

0.4772×2=95.44%;

b 、250±1.96×0.8485,与z=1.96对应的置信度是:

0.4750×2=95%。

(2

与90%对应的Z 值是,Z=(1.64+1.65)/2=1.645,置信区间:

250±1.645*0.8485,即该批食品的平均重量在248.6—

251.396克之间的把握程度是90%。

●课堂练习教材P144,1、2

▲案例2:某茶叶进出口公司,准备处理一批库存2年的茶叶,出库之前要进行一次检验。检验数据如下;样本容量为64包,样本平均数为每包2公斤,入库记录表明总体标准差为0.2公斤。经理要求在95%的可信度下,估计一下这批茶叶的平均重量在多大范围内?

答:这批茶叶平均重量在1.951—2.049公斤,其可信程度为95%。

●(2)、总体标准差σ未知条件下的区间估计

※总体标准差σ未知条件下,一般用样本标准差S代替总体标准差σ。

▲案例:某项抽样调查中获得如下资料: N可以视为无限总体,n=81,样本平均数为500,样本标准差为90,求:总体平均数可信度为90%的置信区间。

答:此项调查中,总体平均数的可信度为90%的置信区间是在483.55—516.45之间。

▲习题1:一次等级考试,因急于评估试题质量,教师先随机抽取36份试卷批改,平均分是72分,标准差13.2分,系主任要求在90%的可信度下,对全体考生的平均成绩做一个区间估计。解:

▲习题2:某土产畜产公司收购一批烟草,抽取30箱为样本,平均重量为20公斤,标准差为3公斤。求:(1)置信度为95%时,这批烟草的平均重量;(2)置信度为80%时,这批烟草的平均重量。

解:(1

(2)

◆ 课后作业:教材P145,3

2、小样本条件下的区间估计

●使用t 分布的条件:当样本容量n <30,且总体

标准差σ未知时,用样本标准差S 代替总体标准

差σ。

▲例1:从大学一年级学生中随机抽取12名学生,其阅读能

力得分为28,32,36,22,34,30,33,25,31

,33,29,

26。试评估一下大学一年级学生阅读能力的总体平均分数。

要求置信度分别是95%和99%。

解:步骤:(1)计算样本平均数:

(2

(3(4)确认自由度:df=12-1=11,误差概率:

α=1-0.95=0.05/2=0.025,查表,t=2.201

(5)估计总体平均数置信区间:

解释:有95%的把握程度说大学一年级学生阅读能力平均分数在27.311—32.523分之间。

当α=1-0.99=0.01/2=0.005,查表,t=3.1058

29.917-3.1058×1.184=26.24;29.917+3.1058×1.184=33.59。

▲习题2:一批出口商品出库之前从中抽取14箱,其平均重量为40.5公斤,标准差0.5公斤。主管人员要求在98%的置信系数下,对这批商品的平均重量做个区间估计。

信系数为98%时,这批商品的平均重量是40.146—40.584公斤。

▲习题3:某公司共有技术开发和中层管理人员600名,公司十分关心他们的身体健康现状,责成有关部门进行了一次睡眠状况抽样调查,获得资料如下表:(单位:小时)

员工每周睡眠员工每周睡眠员工每周睡眠员工每周睡眠

序号时间序号时间序号时间序号时间

1 50 6 48 11 54 16 50

2 40 7 47 12 56 17 51

3 30 8 45 13 50 18 47

4 38 9 43 14 48 19 48

5 42 10 47 15 48 20 54

试以95%的置信系数对600名技术开发和中层管理人员平均每周的睡眠状况作一个区间估计。

●课堂练习:教材P145,4、5

※小样本比例的区间估计可参照平均数的区间估计。

不同条件下总体平均数的区间估(P140)

◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆

●(四)、总体比率的区间估计

※中心极限定理证明:P不接近0或1,且n很大时,其抽

样分布趋近于正态分布。比例抽样分布的平均误差为:

π是总体比率;P 是样本比率。

若π未知,可用P 。

▲案例1:为适应清理整顿要求,某地审计局要对本地公司进行查账,主管负责人估计查账对象中有40%的人会响应这一要求,如果向一个包括45个单位的随机样本寄去要求查账的通知单,审计局希望通过这一样本估计一下置信度为95%时,包含总体实际比例的区间有多大。

解:

▲习题1:某西部人才咨询部门收到大批申请去西部工作的信函,人力资源管理部门想了解被录用的比例,从中抽取500人,发现只有76人被录用。现要求使用95%的可信度,对总体比例做一个区间估计。

▲习题2:某私营企业为提高业务人员的业务能力,在拟订一项培训计划之前,对一个由300名员工组成的随机样本进行测试,结果发现参加测试人员中只有75人达到要求。主管人员要求在置信度为99%的条件下,作一个区间估计。

▲习题3:为了研究我国真丝制品的销路,在纽约举办的我国纺织品展销会上,对1000名成人进行了抽样调查,其中有600人我国的喜欢真丝制品。试以95%的置信系数确定纽约市民成人喜欢真丝制品的比率的置信区间。

●课堂练习:教材P145,6、7(1)

※二、两个总体的参数估计※

(一)什么是来自两个总体的独立样本?

▲案例:假定某零售集团公司有两个连锁超市:一个位于市中心闹市区,另一个位于市郊的居民小区。销售经理发现,在其中一个超市畅销的W商品在另一超市却可能滞销。销售经理认为出现这种情况的原因,主要在于这两个地区的消费者群体的自身差异。例如包括消费者群体的可支配收入差异、受教育程度差异、年龄差异、以及工作性质等方面的差异。因此,销售经理想估计一下两个超市的消费者群体的平均可支配收入差异有多大。

设总体A:为位于市郊居民小区的消费者群体;

设总体B:为位于市中心闹市区的消费者群体;

μA=总体A的平均数(指市郊居民小区消费者群体的人

均可支配收入)

μB=总体B的平均数(指市中心闹市区消费者群体的

人均可支配收入)

于是,这两个不同总体的平均数之差可以表示为:

μA-μB

为了估计这两个不同总体的平均数之差μA-μB,现在从总体A中抽取一个简单随机样本n1,从总体B中抽取另一个简单随机样本n2。由于这两个简单随机样本都是独立抽取的,

因此我们称其为“独立简单随机样本”,简称“独立样本”。由两个独立样本分别计算出两个样本平均数为:

x1:n1名市郊居民小区消费者群体的人均可支配收入

x2:n2名市中心闹市区消费者群体的人均可支配收入

因为1x是μA的点估计值,2x是μB的点估计值,因此,两个

总体平均数之差的点估计值表示为:x

1-

x

2

假定根据上述两个独立随机样本计算的有关数据如下表:

连锁超市随机样本

个数

人均可支配

收入

样本

标准差

市郊居民小区A 市中心闹市区B 64

81

x1=2100元

x2=1800元

S1=950元

S2=780元

将上述数据代入公式求得两个总体平均可支配收入之差的一

个点估计值为:x1-x2=2100-1800 = 300(元)

◆(二)两个总体均值之差的估计:独立样本

▲1、x1-x2抽样分布的性质与区间估计在上例中,两个总体平均可支配收入之差为300元是唯一的吗?显然不是,是随机的。因为两个样本都是随机的,正如所有的点估计值一样,300元之差也只是两个总体平均可支配收入之差的很多可能的点估计值中的其中之一。假如选择了另外一个由64位市中心闹市区消费者,和另外

一个由81位市郊居民小区消费者构成的两个随机样本,这两个样本平均数之差就完全有可能不等于300元。由此可见,

x 1-x 2的抽样分布,其实就是两个样本所有可能的样本平均数之差的一个概率分布。 数理统计理论证明,当两个总体均服从正态分布时,x 1-x 2也服从正态分布,即使两个总体不服从正态分布,只要被抽出的两个随机样本互相独立,并且样本容量足够大(n ≥

30),根据中心极限定理,样本平均数之差x 1-x 2的抽样分布同样逼近正态分布,x 1-x 2的抽样分布具有如下性质:

x 1-x 2抽样分布的平均数:E (x 1-x 2)=μ1-μ2 x 1-

1- 2 1-2▲2、大样本且σ1和σ2已知条件下

两个总体均值(μ1-μ2)的区间估计

在大样本(n 1≥30,n 2≥30)条件下,并且σ1

和σ2已知时,两个总体平均数之差的区间估计可用如下公式计算(置信度为1-α):

(x 1-x 2)±z α/2σx 1-x 2 或

两个总体平均数之差的估计区间为: (x 1-x 2)±z α

案例:在本章的引例中,假定从以往资料中获知总体A

的标准差为520元,总体B 的标准差为430元,统计数据见下表:

连 锁

超 市

随机样本 个数 人均可支配 收入 总体 标准差 市郊居民小区A 市中心闹市区B n 1=64 n 2=81 x 1=2100元 x 2=1800元 σ1=520元 σ2=430元

以95%的置信度建立两个总体平均数之差的估计区间。

解:将表中有关数据代入公式,1-α=95%

(x 1-x 2)±z

n 1≥30,n 2≥30, z=1.96) =(2100-1800)±1.96×81430645202

2+ =300±1.96×80.67

下限=300-158.29 = 141.71(元)

下限=300 + 158.29 = 458.11(元)

计算结果表明,有95%的可信度认为两个总体平均

数之差在141.71(元)到458.11(元)之间。

▲3、大样本且σ1和σ2未知时下μ1-μ

2 的区间估计

中心极限定理证明:无论总体呈现何种分布,只要样本容量足够大,其抽样分布的形态都趋近于正态分布。因此,当n 1≥30、n 2≥30,σ1和σ2未知时,可以用样本标准差代替总体标准差作为σx 1-x 2的估计值。

两个总体平均数之差的估计区间为:

(x 1-x 2)±z a/2S x 1-x 2

连锁超市 随机样本

个数 人均可支配 收入 样本 标准差

市郊居民小区A

市中心闹市区B 64

81

x 1=2100元 x 2=1800元 S 1=950元 S 2=780元 以前题为例,将上表数据分别代入公式 (x 1-x 2)±z a/2

222

121n s n s +(z=1.96)

=(2100-1800)±1.96×81780649502

2+ =300±1.96×147

下限=300-288.12 = 11.88(元)

下限=300 + 288.12 = 588.12(元)

计算结果表明,有95%的可信度认为两个总体平均数之差在11.88(元)到588.12(元)之间。

习题:P145,9(1) (x 1-x 2)±z a/2222

121n s n s +(z=1.96) (25-23)±1.96×1002010016+

2±1.176 (0.824—3.176)

TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT

(三)、小样本条件下μ1-μ2的区间估计

两个总体小样本条件下的区间估计,需要作两个假设:

(1)两个总体都服从正态分布。

(2)两个总体方差相等(σ12=σ22)。 中心极限定理证明:x 1-x 2的期望值是μ1-μ2。由于方差相等的假设,公式可修改如下:

σ

x1-x2

如果总体方差σ2已知,可以用以上公式进行两个总体均值之差的区间估计。但是,通常情况下总体方差σ2是未知的,

于是必须使用两个样本方差来对总体方差σ2

进行估计。由于以上公

式的假设前提是两个总体方差相等σ12=σ22,因此,这里不必再分别估计σ12和σ22。在实际应用时,往往将来自两个总体的两个样本数据加以组合,从而得到σ2的最优估计值

合并,是因为单独使用两个样本数据的任何一个都不太合适。σ2的合并估计值是两个样本方差的加权平均,也叫共同方差,记做S2。共同方差的公式如下:

S2

使用σ2的合并估计值S2,就可以将公式

σ

x1

-x2

修改为公式:

σ

x1-x2

依据前面理论,可以用t分布来推算两个总体平均数之差的区间估计。由于来自总体1的样本对应n1-1

个自由度,

来自总体2的样本对应n 2-1个自由度,因而,此

t 分布对应的自由度为n 1+n 2-2,当自由度为(n 1+n 2-2),置

信系数为1-α时,两个总体平均数之差的 估计区间为: (x 1-x 2)±t

▲案例:某银行想了解下属两个支行的平均帐户余额之差的情况。抽样结果两个支行的客户帐户余额的独立随机样本资料如下:

支行

名称 客户 帐户数 样本 平均余额 样本 标准差

NC BL 12 10 x 1=1000元 x 2=920元 S 1=150元

S 2=120元

求出两个支行平均帐户余额之差的90%的置信区间。假设两个支行的帐户余额都服从正态分布且方差相等。利用以上公式得到总体方差的合并估计值为:

S 2=2)1()1(21222211-+-+-n n S n s n =2

101212091501122-+?+?=18855 σx 1-x 2的相应估计值为: S x 1-x 2=??? ??+21112n n S =79.5810112118555=??

? ??+?

t分布之自由度为n1+n2-2=12+10-2=20。α=0.10 t a/2=t0.05=1.7247。于是可得区间估计为:

x

1-x

2±t a/2S x1-x2

1 000-920±1.7247×58.79

80±101.4 (-21.4元,181.4元)在90%的置信度下,两个支行平均帐户余额之差的区间估计为-21.4元至181.4元之间。该区间包含负值的事实意味着两个均值之差的实际值μ1-μ2可能是负的。因此μ2可能比μ1大,这意味着尽管抽样表明BL支行有较大的样本余额均值,NC支行的总体均值反而有可能更大些。置信区间包含0的事实可以这样解释:我们没有足够的证据得出两个支行的总体平均帐户余额有差异的结论。

本节介绍的样本方法中使用t分布是基于假设两个总体都服从正态概论分布且σ12=σ22的。事实上,该方法是稳健的统计方法,就是说它对上假设相对不敏感。比如当σ12≠σ22时,该方法在n1和n2比较接近时也可以得到较好结果。

习题1:P158,8;P158,9(2)、(4)

P158,8。当1-α=90%时,df=14+7-2=19;tα/2=1.7291

S2=2)1

(

)1

(

2

1

2

2 2

2

1

1

-

+-

+ -

n n

S n

s

n

=2

7

14102

6

8.

96

13

+?

+

?

=98.4421

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

第九章参数估计习题

第九章参数估计 第一节点估计 点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性) 第二节区间估计 抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大样本总体均值的区间估计 第三节其他类型的置信区间 σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区间估计 第四节抽样平均误差 简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均抽样误差·系统抽样的抽样平均误差 第五节样本容量的确定 影响样本容量的因素·抽样条件与样本容量的确定 一、填空 1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和()。 2.对总体均值求置信区间的方法是:从()起向两侧展开一定倍数()的抽样平均误差(),并估计 很可能就包含在这个区间之内。 3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年占比重的0.95 置信区间为()。 4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的()。 二、单项选择 1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是()估计。 A 有效 B 一致 C 无偏 D 精确 2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个()的估计量。 A 有效 B 一致 C 无偏 D 精确 3.估计量的()指统计量的抽样分布集中在真实参数周围的程度。 A 有效性 B 一致性 C 无偏性 D 精确性 4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍

第六章 从本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数 (μ,2 σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个体(即N n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

第八章 参数估计

第八章参数估计 一、思考题 1.什么是参数估计?参数估计有何特点? 2.评价估计量优劣的准则是什么? 3.什么是点估计、区间估计?二者有何联系和区别? 4.确定必要的抽样数目有何意义?必要抽样数目受哪些因素影响? 二、练习题 (一)填空题 1.参数估计的方法有_________和_________。 2.若样本方差(s n21-)的期望值等于总体方差(σ2),则称s n21-为σ2的____________估计量 3.总体参数的估计区间是由_________和_________组成。 4.允许误差是指与的最大绝对误差范围。 5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是 ______,允许误差是______。 6.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量。 x=5,7.设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值 =2.58) 则总体均值的置信水平为99%的置信区间_____________。(Z 0.005 (二)判断题 1( )参数估计就是用样本统计量去估计总体的参数。 2( )随机抽样是参数估计的前提。 3( )参数估计的抽样误差可以计算和控制。 4( )估计量的数学期望等于相应的总体参数值,则该估计量就被称为相应总体参数的无偏估计量。 5( )区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。

6( )样本统计量n x x s ∑-=22)(是总体参数2σ的无偏估计量。 7( )估计量的有效性是指估计量的方差比其它估计的方差小。 8( )点估计是以样本估计量的实际值直接作为相应总体参数的估计值。 9( )抽样估计的置信水平就是指在抽样指标与总体参数构造的置信区间中, 包含总体参数真值的区间所占的比重。 10( )样本容量一定时,置信区间的宽度随置信水平的增大而减小。 (三)单选题 1.极限误差是指样本统计量和总体参数之间( )。 A.抽样误差的平均数 B.抽样误差的标准差 C.抽样误差的可靠程度 D.抽样误差的最大可能范围 2.参数估计的主要目的是( )。 A.计算和控制抽样误差 B. 为了深入开展调查研究 C.根据样本统计量的数值来推断总体参数的数值 D. 为了应用概率论 3.参数是指基于( )计算的指标值。 A.样本 B.某一个样本 C.多个样本 D.总体 4.总体参数很多,就某一参数(如均值)而言,它的取值( )。 A.是唯一的 B.不是唯一的 C.随样本的变化而变化 D.随抽样组织形式的变化而变化 5.样本统计量很多,就某一统计量(如均值)而言,它的取值( )。 A.是唯一的 B.随样本的变化而变化 C.由总体确定 D.由抽样的组织形式唯一确定 6.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ已知,这时将会需要查阅( )。 A.正态分布表 B.标准正态分布表 C.t 分布表 D.2χ分布表 7.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ未知,这时将会需要查阅( )。

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

第4章 参数估计思考与练习参考答案

第4章 参数估计 思考与练习参考答案 一、最佳选择题 1.关于以0为中心的t 分布,错误的是( E ) A. t 分布的概率密度图是一簇曲线 B. t 分布的概率密度图是单峰分布 C. 当ν→∞时,t 分布→Z 分布 D. t 分布的概率密度图以0为中心,左右对称 E. ν相同时,t 值越大,P 值越大 2.某指标的均数为X ,标准差为S ,由公式() 1.96, 1.96X S X S -+计算出来的区间常称为( B )。 A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间 D. 95%置信区间 E. 90%置信区间 3.样本频率p 与总体概率π均已知时,计算样本频率p 的抽样误差的公式为( C )。 4.在已知均数为μ, 标准差为 σ 的正态总体中随机抽样, X μ->( B )的概率为5%。 A.1.96σ B.1.96X σ C.0.05/2,t S ν D.0.05/2,X t S ν E.0.05/2,X t νσ 5. ( C )小,表示用样本均数估计总体均数的精确度高。 A. CV B. S C. X σ D. R E. 四分位数间距 6. 95%置信区间的含义为( C ): A. 此区间包含总体参数的概率是95% B. 此区间包含总体参数的可能性是95% C. “此区间包含总体参数”这句话可信的程度是95% D. 此区间包含样本统计量的概率是95% E. 此区间包含样本统计量的可能性是95%

二、思考题 1. 简述标准误与标准差的区别。 答: 区别在于: (1)标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确知道总体参数(如总体均数)的程度。 (2)标准误小于标准差。 (3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不 随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小。 2. 什么叫抽样分布的中心极限定理? 答: 样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理(central limit theorem)。 当有足够的样本含量(如30 n≥)时,从任何总体中抽取随机样本的样本均数近似地服从正态分布。样本含量越大,X抽样分布越接近于正态分布。 正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布,那么对于所有n值,抽样分布均为正态分布。如果总体为非正态分布,X仅在n值较大情况下近似服从正态分布。一般说,30 n≥时的X抽样分布近似为正态分布;但是,如 果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的n值,抽样分布也将为非正态。 3. 简述置信区间与医学参考值范围的区别。 答: 置信区问与医学参考值范围的区别见练习表4-1。 练习表4-1 置信区间与医学参考值范围的区别 区别置信区间参考值范围 含义 用途计算公式总体参数的波动范围,即按事先给定的概 率100(1-α)%所确定的包含未知总体参 数的一个波动范围 估计未知总体均数所在范围 σ未知: /2,X X t S αν ± σ已知或σ未知但n≥30,有 /2X X Z α σ ±或 /2X X Z S α ± 个体值的波动范围,即按事先给定的 范围100(1-α)%所确定的“正常人” 的解剖、生理、生化指标的波动范 围 供判断观察个体某项指标是否“正常” 时参考(辅助诊断) 正态分布: /2 X Z S α ± 偏峰分布:P X~P100-X

统计学 第四版 第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2.143 (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(115.8,124.2) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ??? 或2 ,s x N n μ?? ??? 置信区间为: x z x z αα ?-? +? ? (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36 解:

统计学05总体参数的估计

统计学 —从数据到结论 第五章总体参数地估计 估计就是根据你拥有地信息来对现实世界进行某种判断. 你可以根据< ><>一个人<>地衣着、言谈和举止判断其身份 你可以根据一个人<>地脸色,猜出其心情和身体状况 统计中地估计也不例外,它是完全根据数据做出地. 如果我们想知道北京人认可某饮料地比例,人们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料地比例来估计真实地比例.文档来自于网络搜索 从不同地样本得到地结论也不会完全一样.虽然真实地比例在这种抽样过程中永远也不知道;但可以知道估计出来地比例和真实地比例大致差多少.文档来自于网络搜索 从数据得到关于现实世界地结论地过程就叫做统计推断( ). 上面调查例子是估计总体参数(某种意见地比例)地一个过程. 估计()是统计推断地重要内容之一. 统计推断地另一个主要内容是下一章要引进地假设检验( ). § 用估计量估计总体参数 人们往往先假定某数据来自一个特定地总体族(比如正态分布族). 而要确定是总体族地哪个成员则需要知道总体参数值(比如总体均值和总体方差). 人们于是可以用相应地样本统计量(比如样本均值和样本方差)来估计相应地总体参数 § 用估计量估计总体参数 一些常见地涉及总体地参数包括总体均值()、总体标准差()或方差()和(试验中)成功概率等(总体中含有某种特征地个体之比例).文档来自于网络搜索 正态分布族中地成员被(总体)均值和标准差完全确定; 分布族地成员被概率(或比例)完全决定. 因此如果能够对这些参数进行估计,总体分布也就估计出来了. § 用估计量估计总体参数 估计地根据为总体抽取地样本. 样本地(不包含未知总体参数地)函数称为统计量;而用于估计地统计量称为估计量(). 由于一个统计量对于不同地样本取值不同,所以,估计量也是随机变量,并有其分布. 如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量地一个实现()或取值,也称为一个估计值().文档来自于网络搜索 § 用估计量估计总体参数 这里介绍两种估计,一种是点估计( ),即用估计量地实现值来近似相应地总体参数.文档来自于网络搜索 另一种是区间估计( );它是包括估计量在内(有时是以估计量为中心)地一个区间;该区间被认为很可能包含总体参数.文档来自于网络搜索 点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对. § 点估计 用什么样地估计量来估计参数呢? 实际上没有硬性限制.任何统计量,只要人们觉得合适就可以当成估计量. 当然,统计学家想出了许多标准来衡量一个估计量地好坏.每个标准一般都仅反映估计量地某个方面. 这样就出现了按照这些标准定义地各种名目地估计量(如无偏估计量等).

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

参数估计习题

第八章 参数估计习题 一、 填空题: 1.设总体),(~2σμN X ,n X X X ,,,21 是来自X 的一个样本,参数2,σμ都是未知的, 则μ的矩估计量为 。2 σ的矩估计量为 。 2.设总体),(~2σμN X ,其中2 σ未知,μ已知,n X X X ,,,21 是来自X 的一个样本, 做样本函数如下①∑=-n i i X n 12)(1μ,②2 1])([∑=-n i i X σμ,③∑=-n i i X X n 12)(1,④ ∑=--n i i X X n 12 )(11,⑤∑=+--n i i i X X n 121)() 1(21,这些样本函数中,是统计量的有 , 统计量中是的无偏估计量的有 。 3.设某总体X 的密度函数为?? ???<<-=其他 ,00, )(2 );(2ααα αx x x f ,对容量为n 的样本, 参数α的矩估计量为 。 4.假设总体)81.0,(~μξN ,n X X X ,,,21 是来自ξ的样本,测得样本均值5=x ,则置 信度是0.99的μ的置信区间是 5.设n X X X ,,,21 是来自总体X 的样本,对总体方差进行估计时,常用的无偏估计量是 。 6.设总体X 在区间],0[θ上服从均匀分布,则未知参数θ的矩法估计量为 。 二、选择题: 1.设n X X X ,,,21 是来自总体X 的样本,2 )(,)(σμ==x D x E ,并且和是未知参数,下面结论中是错误的[ ]。 (A )X =1?μ 是μ的无偏估计; (B )12?X =μ是μ的无偏估计; (C )21??μμ比有效; (C )21 )(1∑=-n i i X n μ是2σ的 极大似然估计量。

参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计 知识引入 1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。 之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是一堆12 月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。 在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。上述抽样就没有保证这种随机性。 在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。 第一节抽样和常用抽样方法 一、简单随机抽样 抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的一些基本概念在绪论中均已介绍。一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。 一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。 1、抽签法:是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。 2、随机数表法:所谓随机数表或乱码表,是由一些任意的数毫无规律地排列而的数表。教材附表17即是一万个数字的随机数表。 随机数表的用法

《统计学》课后练习题答案

第一章统计学及基本概念 1 第二章数据的收集与整理 4 第三章统计表与统计图7 第四章数据的描述性分析 9 第五章参数估计 12 第六章假设检验 17 第七章方差分析 21 第八章非参数检验24 第九章相关与回归分析27 第十章多元统计分析 31 第十一章时间序列分析35 第十二章指数38 第十二章指数38 第十三章统计决策42 第十四章统计质量管理45 第一章统计学及基本概念 1.1 统计的涵义(统计工作、统计资料和统计学) 1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学) 1.3 统计学的发展史(学派与主要代表人物) 1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数) 1.5 变量:连续与离散;确定与随机 1.6 总体、样本与个体 1.7 标志、指标及指标体系 1.8 统计计算工具 习题 一、单项选择题 1. 推断统计学研究()。(知识点:1.2 答案:D) A.统计数据收集的方法B.数据加工处理的方法 C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法 2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派 3. 下列数据中哪个是定比尺度衡量的数据()。(知识点:1.4 答案:B) A.性别B.年龄C.籍贯D.民族 4. 统计对现象总体数量特征的认识是()。(知识点:1.6 答案:C) A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体 5. 调查10个企业职工的工资水平情况,则统计总体是()。(知识点:1.6 答案:C) A.10个企业 B.10个企业职工的全部工资 C.10个企业的全部职工 D.10个企业每个职工的工资

第4章 参数估计

第四章参数估计 一、单项选择题 1.矩估计法要求总体X的()要存在。 A.一阶原点矩E(X) B.二阶中心矩E[X-E(X)]2 C.K阶原点矩E(X K) D.K阶中心矩E[X-E(X)]K 2.一阶原点矩就是指随机变量X的() A.众数 B.数学期望 C.方差 D.标准差 3.二阶中心矩就是指随机变量X的() A.标准差 B.方差 C.数学期望 D.中位数 4.K阶中心矩是以()为中心而定义的。 A.K阶原点矩 B.二阶原点矩 C.二阶中心矩 D.一阶原点矩 5.根据大数定律,当样本容量n充分大时,样本矩依概率收敛于() A.K阶原点矩 B.总体矩 C.二阶中心矩 D.一阶原点矩 6.估计量的无偏性是指() A.某个样本估计值与总体参数之间没有偏差 B.某个样本估计量与总体参数之间没有偏差 C.样本估计量所有可能取值的数学期望等于总体参数的真实值 B.以上答案都不正确 7.进行总体均值区间估计时,抽样极限误差必须满足的条件是() A.正态总体、总体方差已知 B.正态总体、总体方差未知且大样本 C.正态总体、总体方差未知且小样本 D.总体分布未知或非正态总体、总体方差未知且大样本 8.随着自由度的增大,t分布逐渐趋于() A.卡方分布 B.F分布 C.正态分布 D.标准正态分布 9.总体比率的区间估计的抽样极限误差(允许误差)计算公式为( ) A. B. C. D. 10.构造统计量服从() A. B. C. D. 11.两个样本方差比服从() A. B. C. D. 二、多项选择题 1.下列中,属于参数估计的点估计法的是() A.矩估计法 B.最大似然估计法 C.区间估计法 D.顺序统计量法 E.最小二乘估计法

统计学参数估计练习题

统计学参数估计练习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

参数估计习题

第5章参数估计练习题 一.选择题 1.估计量的含义是指() A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 3.95%的置信水平是指() A.总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4.根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6.当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. 随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 7.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性D. 充分性 8、对一总体均值进行估计,得到95%的置信区间为(24, 38),则该总体均值的点估计为() A.24 B. 48 C. 31 D. 无法确定 9. 在总体均值和总体比例的区间估计中,边际误差由() A.置信水平决定 B. 统计量的抽样标准差确定

第章统计学参数估计练习题

第7 章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用______ _去估计________ _ 。 2?点估计就是用______________ 的某个取值直接作为总体参数的 ____________ 。 3?区间估计是在____________ 的基础上,给出总体参数估计的一个区间范围,该区间通常 由样本统计量加减 __________ 得到。 4. ____________ 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为,也成为 ____________ 。 5 ?当样本量给定时,置信区间的宽度随着置信系数的增大而_____________ ;当置信水平固定时,置信区间的宽度随着样本量的增大而 ____________ 。 6. 评价估计量的标准包含无偏性、________ __ 和 _______ __ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可 靠程度,就会 ____________ 置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程 度,就要 ___________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、____________ 和___________ 的影响。 9. ___________________________________________________ 估计方差未知的正态总体均值置信区间用公式__________________________________________ ;当样本容量大于等于30时,可以用近似公式 ____________ 。 10. 估计正态总体方差的置信区间时,用___________ 分布,公式为 __________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C. 一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2. 估计量的含义是指()。 A. 用来估计总体参数的统计量的名称

第八章(第一节极大似然估计)

第八章参数估计 第一节参数的点估计 二、极大似然估计法 极大似然估计最早是由高斯于1821年提出,但一般将之归功于英国统计学家Fisher,R.A,因为Fisher,R.A在1922年证明了极大似然估计的性质,并使得该方法得到了广泛的应用。 这里介绍估计的另一种常用方法-极大似然估计法。 先看一个简单的例子: 某位同学与一位猎人一起外出打猎,一只野兔从前方窜过.只听到一声枪响,野兔应声倒下.如果要你推测,是谁打中的呢?你会如何想呢? 你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命

中的概率.看来这一枪有极大的可能是猎人射中的. 这个推断很符合人们的经验事实,这里的“极大的可能”就是“极大似然”之意。 这个例子所作的推断已经体现了极大似然法的基本思想. 极大似然法的基本思想在社会思维意识中常有所体现。例如某地发生了一个疑难案件,警察欲破案或民众推测嫌疑人,一般是将重点集中在作案可能性较大的可疑人身上。 为了说明极大似然估计的原理,我们先来考察一个简单的估计问题。 设袋中装有许多白球和黑球。只知两种球的数目之比为3:1,试判断是白球多还是黑球多。 显然,从袋中任取一球为黑球的

概率p 是41或者43,如果是41 ,则袋中 白球多,如果是4 3 ,就是黑球多。现 在我们从袋中有放回的任取3只球,那么黑球数目X 服从二项分布: x x x p p C p x X P --==33 )1(};{, 3,2,1,0=x ; 4 3 ,41=p 其中p 为取到黑球的概率. 从常识上可以接受这样的判断: (1)若取出的3只中有0只黑球, 3只白球,则我们以较大的把握认为袋中白球多, 应认为是从黑球概率 为4 1 =p 的总体中取来的. (2)若取出的3只中有1只黑球, 2只白球,则我们以较大的把握认为

第八章 参数估计习题

第八章 参数估计习题 一、 填空题 1.设总体),(~2σμN X ,n X X X ,,,21 是来自X 的一个样本,参数2,σμ都是 未知的,则μ的矩估计量为 。2 σ的矩估计量 为 。 2.设总体),(~2σμN X ,其中2 σ未知,μ已知,n X X X ,,,21 是来自X 的一 个样本,做样本函数如下①∑=-n i i X n 1 2)(1μ,② 21 ])([∑=-n i i X σμ,③ ∑=-n i i X X n 12)(1,④∑=--n i i X X n 12 )(11,⑤∑=+--n i i i X X n 121)() 1(21,这些样本函数中,是统计量的有 。 3.假设随机变量)1,(~μξN ,n X X X ,,,21 是来自ξ的样本,如果关于置信度是0.95的μ 的置信区间是(9.02,10.98),则样本容量______=n 4.设某总体X 的密度函数为?? ???<<-=其他 ,00, )(2 );(2 ααααx x x f ,对容量为n 的样 本,参数α的矩估计量为 。 5.假设总体)81.0,(~μξN ,n X X X ,,,21 是来自ξ的样本,测得样本均值5=x , 则置信度是0.99的μ的置信区间是 6.设n X X X ,,,21 是来自总体X 的样本,对总体方差进行估计时,常用的无偏估计量是 。 7.设总体X 在区间],0[θ上服从均匀分布,则未知参数θ的矩法估计量 为 。

二、选择题 1.设n X X X ,,,21 是来自总体X 的样本,2)(,)(σμ==x D x E ,并且和是未知参数,下面结论中是错误的[ ]。 (A )X =1?μ 是μ的无偏估计; (B )12?X =μ是μ的无偏估计; (C )21??μμ 比有效; (C )21 )(1∑=-n i i X n μ是2σ的 极大似然估计量。 2 在区间估计中αθθθ-=<<1)??(2 1P 的正确含义是[ ] (A)θ以α-1的概率落在区间)?,?(2 1θθ内; (B)θ落在区间)?,?(21θθ以外的概率为α; (C)θ不落在区间)?,?(21θθ以外的概率为α; (D)随机区间)?,?(2 1θθ包含θ的概率为α-1。 3.设n X X X ,,,21 独立同分布,2 )(σ =x D ,∑==n i i X n X 1 1, ∑=--=n i i X X n S 1 22 )(11,则[ ] (A) S 是2 σ的无偏估计; (B) S 是σ的极大似然估计; (C) S 是σ的相合(一致)估计; (D) 2 S 与X 相互独立。 4. 假设总体X 的期望值μ的置信度是0.95,置信区间上、下限分别为样本函数 ),,,(21n X X X b 与),,,(21n X X X a ,则该区间的意义是[ ] (A) 95.0)(=<

相关主题
文本预览