当前位置:文档之家› 人大统计学作业答案

人大统计学作业答案

人大统计学作业答案
人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p ,

则对于任意实数α,有=

=)(αX

P ()。

A.)(X F

B.)(x p

C.0

D.以上都不对 【答案】C

80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为()。 A.40 B.9.10 C.25.6 D.17.6

【答案】B

81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。

②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值

()σπμ21

=

f 。 ③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。 ④当x 趋于无穷时,曲线以x 轴为其渐近线。

由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。

82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什

么?

【答案】不能肯定A 是不可能事件。

不可能事件是指在同一组条件下每次试验都一定不出现的事件。而0)(=A P ,并不能肯定A 就是不可能事件。例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。

83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布?

【答案】常见的随机变量分为离散型随机变量和连续型随机变量。

离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。

连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、t 分布、F 分布。

84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60,

%90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概

率为_____;至少有一个人不及格的概率为_____。

【答案】0.378;0.012;0.988;0.622,(37.8%)(

1.2%)(98.8%)(

62.2%)

85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心

由_____决定,曲线的陡峭程度由_____决定。

【答案】均值()μ;方差()2

σ或者标准差()σ

86、【104315】(填空题)当二项分布的20>n ,25.0

_____,该分布的均值为_____,方差为_____。

【答案】泊松分布;np ;)1(p np -

87、【104322】(计算题)某车间有20台机床,在给定的一天每一台机床不运行的概率都

是0.05,机床之间相互独立。问在给定的一天内,至少有两台机床不运行的概率是多少?(结果保留三位小数)

【答案】设x 表示在给定的一天内不运行的机床台数, 则),(~p n B X ,20=n ,05.0=p 解法一:

[]

264

.03774.03585.01)

95.0()05.0()95.0()05.0(1)1()0(1)2(1)2(19

1120200020=--=--==+=-=<-=≥c c x p x p x p x p

解法二:

因为20=n ,05.0=p ,51≤=np ,可以用泊松分布近似计算二项分布 1==np λ,则有:

3679.0!01!

)0(1

0==≈=--e e x x p x

λ

λ

3679.0!11!

)1(1

1==≈

=--e e

x x p x

λ

λ

则264.0)1()0(1)2(1)2(==-=-=<-=≥x p x p x p x p

88、【150764】(计算题)某厂生产的螺栓的长度服从均值为10cm ,标准差为0.05的正态

分布。按质量标准规定,长度在9.9~10.1cm 范围内的螺栓为合格品。试求该厂螺栓的不合格率是多少。(查概率表知,()()97725.022=Φ=

【答案】螺栓的长度)

05.0,10(~N X

,则

)1,0(~05.010

N X Z -=

,合格的概率为

9545.0197725.021)2(2)2()2(}05

.010

1.1005.01005.0109.9{

}1.109.9{=-?=-Φ=-Φ-Φ=-≤-≤-=≤≤X P X P

0455

.09545.01=-故不合格率为。

第六章 参数估计

89、【104324】(单项选择题)在估计某一总体均值时,随机抽取n 个单元作样本,用样

本均值作估计量,在构造置信区间时,发现置信区间太宽,其主要原因是()。 A.样本容量太小

B.估计量缺乏有效性

C.选择的估计量有偏

D.抽取样本时破坏了随机性 【答案】A

90、【104325】(单项选择题)根据某地区关于工人工资的样本资料,估计出的该地区工

人平均工资95%的置信区间为[700,1500],则下列说法最准确的是()。 A.该地区平均工资有95%的可能性落入该置信区间 B.该地区只有5%的可能性落到该置信区间之外 C.该置信区间有95%的概率包含该地区的平均工资 D.该置信区间的误差不会超过5%

【答案】C

91、【104326】(单项选择题)点估计的缺点是()。 A.不能给出总体参数的准确估计 B.不能给出总体参数的有效估计

C.不能给出点估计值与总体参数真实值接近程度的度量

D.不能给出总体参数的准确区间 【答案】C

92、【104327】(单项选择题)总体参数的置信区间是由样本统计量的点估计值加减()

得到的。

A.样本统计量的抽样标准差

B.总体标准差

C.边际误差

D.置信水平的临界值

【答案】C

93、【104328】(单项选择题)估计量是指()。 A.用来估计总体参数的统计量的名称

B.用来估计总体参数的统计量的具体数值

C.总体参数的名称

D.总体参数的具体数值 【答案】A

94、【104329】(单项选择题)若n X X X ,,21为抽自),(~2σμN X

的一个样本,总体方差2

σ未知,则μ的α-1的置信区间为()。

A.n

t x σα

2

±

B.n t x σ

α

±

C.

n s t x n 1-±α D.n

s t x n 12-±α

【答案】D

95、【104330】(单项选择题)总体均值的置信区间等于样本均值加减边际误差,其中的

边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差

B.样本标准差

C.样本方差

D.总体标准差

【答案】A

96、【104332】(单项选择题)当置信水平一定时,置信区间的宽度()。

A.随着样本容量的增大而减小

B.随着样本容量的增大而增大

C.与样本容量的大小无关

D.与样本容量的平方根成正比

【答案】A

97、【104333】(单项选择题)95%的置信水平是指()。

A.总体参数落在一个特定的样本所构造的区间内的概率为95%

B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95%

C.总体参数落在一个特定的样本所构造的区间内的概率为5%

D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5%

【答案】B

98、【104334】(单项选择题)估计一个正态总体的方差使用的分布是()。

A.正态分布

B.t分布

C.2χ分布

D.F分布

【答案】C

99、【104335】(单项选择题)当正态总体的方差未知时,且为小样本条件下,估计总体均值使用的是分布是()。

A.正态分布

B.t分布

C.2χ分布

D.F分布

【答案】B

100、【104338】(单项选择题)对于非正态总体,在大样本条件下,估计总体均值使用的是分布是()。

A.正态分布

B.t分布

C.2χ分布

D.F分布

【答案】A

101、【104339】(单项选择题)使用正态分布估计总体均值时,要求()。

A.总体为正态分布

B.总体为非正态分布

C.总体为正态分布但方差未知

D.总体为正态分布且方差已知

【答案】D

102、【145018】(单项选择题)当正态总体的方差已知时,且为小样本条件下,估计总体

均值使用的分布是()。 A.正态分布 B.t 分布

C.2

χ分布 D.F 分布

【答案】A

103、【150769】(单项选择题)当正态总体的方差未知时,且为大样本条件下,估计总体

均值使用的分布是()。 A.正态分布 B.t 分布

C.2

χ分布 D.F 分布

【答案】A

104、【104348】(简答题)参数估计的方法有哪些?

【答案】参数估计的方法有点估计和区间估计两种。

点估计就是用样本统计量的某个取值直接作为总体参数的估计值。

区间估计是在点估计的基础上,给出总体参数的估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。

105、【104349】(简答题)点估计的方法通常有哪些?

【答案】点估计就是直接以样本统计量的某个取值作为总体参数的估计值,包括矩法

和极大似然法。

矩法估计的基本思想:在总体各阶矩存在的条件下,用样本的各阶矩去估计总体相应的各阶矩,用样本矩的相应函数估计总体矩的函数。

极大似然估计的基本思想是:设总体含有待估参数θ,它可以取很多值,我们要在θ的一切可能取值之中选出一个使样本观测值出现的概率最大的那个θ值作为θ的估计(记为θ?

),并称θ?

为θ的极大似然估计。

106、【104343】(填空题)在对总体均值进行估计时,把要估计的总体均值称之为_____,

把用来估计总体均值的样本均值称作_____,把样本均值的具体观察值称为_____。 【答案】待估参数;估计量;估计值

107、【104344】(填空题)一个由50=n 的随机样本,算得样本均值32=x ,总体标准差为

6.总体均值μ的95%置信区间为_____。

【答案】66.132±

108、【104345】(填空题)如果估计量1?

θ与2?

θ相比满足_____,我们称1?

θ是比2?

θ更有效的

一个估计量。

【答案】)?

()?(21θθD D <

109、【104346】(填空题)如果估计量θ?满足_____,我们称θ?

是无偏的一个估计量。

【答案】μθ=)?

(E ,μ是总体均值。

110、【122755】(计算题)一家调查公司进行一项调查,其目的是为了了解某市电信营业

厅大客户对该电信的服务满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量比两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量比两年前好的比率进行区间估计。(查概率表可知,96

.12

05.0=Z ) 【答案】解:

这是一个求某一属性所占比率的区间估计问题。已知,

96.1,302

==αz n 根据抽样结果计算出的样

本比率为

%30309

?==p

。计算得

%)40.46%,60.13(30%)

301(%3096.1%30)?1(??2

=-??±==-±n p p z p

α

111、【145012】(计算题)根据以往经验,居民家庭人口数服从正态分布,其方差为2.1。

现从某地区随机抽取60户居民家庭,测得样本的平均家庭人口数为3.75人,试以95%的可靠程度构造该地区平均居民家庭人口数的置信区间。(结果保留两位小数)(查概率表可知,96

.12

05.0=Z ) 【答案】解:

已知家庭人口数)

1.2,(~μN X

96

.1,05.095.01)(60)(75.32

===-==αααz n x ,,户,人(可查正态分布表),

则总体均值μ的置信区间为:

)

12.4,38.3()60

1.296

.175.3,60

1.296

.175.3(),(2

2

=+-=+-n

z x n

z x σ

σ

α

α

即以95%的可靠程度估计该地区平均居民家庭人口数在3.38人至4.12人之间。

第七章 假设检验

112、【104354】(单项选择题)假设检验按原假设和备择假设的形式可分为()。 A.左侧检验和右侧检验 B.正向检验和反向检验 C.双侧检验和单侧检验 D.正态检验和非正态检验 【答案】C

113、【104355】(单项选择题)双侧检验的特点是()。 A.它有两个接受域 B.它有两个临界值 C.它有一个拒绝域

D.它可能有两个接受域 【答案】B

114、【104356】(单项选择题)当()k n k F MSE MSA

F --<=

,1α时,则()。

A.拒绝原假设

B.不能拒绝原假设

C.接受原假设

D.不能确定 【答案】C

115、【104357】(单项选择题)所谓α错误指的是()。 A.原假设为假,接受原假设 B.原假设为假,接受替换假设 C.原假设为真,拒绝替换假设 D.原假设为真,拒绝原假设 【答案】D

116、【104358】(单项选择题)所谓β错误指的是()。 A.原假设为假,接受原假设 B.原假设为假,接受替换假设 C.原假设为真,拒绝替换假设 D.原假设为真,拒绝原假设 【答案】A

117、【104359】(单项选择题)若假设形式为0100:,:μμμμ<≥H H ,当随机抽取一个样

本,其均值大于0μ

,则()。

A.肯定不拒绝原假设,但有可能犯第Ⅰ类错误

B.有可能不拒绝原假设,但有可能犯第Ⅰ类错误

C.有可能不拒绝原假设,但有可能犯第Ⅱ类错误

D.肯定不拒绝原假设,但有可能犯第Ⅱ类错误

【答案】D

118、【104360】(单项选择题)假定总体服从正态分布,下列适用t 检验统计量的场合是

()。

A.样本为大样本,且总体方差已知

B.样本为小样本,且总体方差已知

C.样本为小样本,且总体方差未知

D.样本为大样本,且总体方差未知

【答案】C

119、【104361】(单项选择题)某一贫困地区所估计的营养不良人数高达20%,然而有人

认为实际上比这个比例还要高,要检验说法是否正确,则假设形式为()。

A.2.0:,2.0:10>≤μμH H

B.2.0:,2.0:10≠=μμH H

C.3.0:,3.0:10<≥μμH H

D.3.0:,3.0:10>≤μμH H 【答案】A

120、【104363】(单项选择题)在双侧检验中,如果将两侧的面积之和定义为P 值,则对

于给定的显著性水平α,拒绝原假设的条件是()。

A.2α=P

B.

C.

>P D.α

【答案】D

121、【104364】(单项选择题)在假设检验中,如果所计算出的P 值越小,则说明()。 A.不利于原假设的证据越强 B.不利于原假设的证据越弱 C.不利于备择假设的证据越强 D.不利于备择假设的证据越弱 【答案】A

122、【104365】(单项选择题)对于给定的显著性水平α,拒绝原假设的准则是()。 A.α=P B.α

P D.0==αP

【答案】B

123、【104374】(简答题)假设检验依据的基本原理是什么?

【答案】假设检验依据的基本原理是小概率原理。所谓小概率原理是指,若一个事件

发生的概率很小,在一次试验中就几乎是不可能发生的。根据这一原理,如果在试验中很小概率的事件发生了,我们就有理由怀疑原来的假设是否成立,从而拒绝原假设。

124、【104375】(简答题)什么是假设检验中的显著性水平?

【答案】 利用样本信息对原假设进行推断有犯错误的可能。假设检验中的显著性水平

是指:当原假设为正确时却把它拒绝了的概率,实际就是统计决策中所面临的风险。显著性水平用α表示。

125、【104376】(简答题)为什么在点估计的基础上还要引进区间估计?区间估计中各相

关要素的含义和作用是什么?

【答案】 点估计的方法就是用一个确定的值去估计未知参数,表面看起来很精确,实际上把握程度不高。因为估计量是来自一个随机抽取的样本,总是带有随机性或偶然性,样本估计量θ?

恰好等于θ的可能性是很小的;而且点估计并未给出估计精度和可信程度。但估计θ在某一小区间内,并给出估计的精度和可靠度,则把握程度就高多了。这种估计总体参数在某一区间内的方法称作区间估计。如果用数学语言来描述区间估计,则应该是这样的:设n

X X X ,,21是抽自密度为

)

,(θx f 的一个样本,对于给定的10<<α,如能求得统计量θ

和,使

α

θθθ-=≤≤1)(P ,则称)(θθ、为θ的置信度为α-1的置信区间,它表达了区间估计的准确性或

精确性;θ

和θ均为样本估计量的函数,分别称作置信下限和置信上限;α-1称作置信度或信度或置信概率或置信水平或概率保证程度,它是区间估计可靠性的概率;α称为显著性水平,它表达了区间估计不可靠的概率。总之,区间估计可以克服点估计的不足,因而实际应用意义较大。

126、【104377】(简答题)某市调查职工平均每天用于家务劳动的时间。该市统计局主持

这项调查的人认为职工用于家务劳动的时间不超过2小时。随机抽取400名职工进行调查的结果为:8.1=x 小时,44.12

=S 。问:调查结果是否支持调查主持人的看法?(05.0=α) 【答案】解一:

2

:2

:10<≥μμH H ,

05.0=α当225=n 时相等与ααz t 。故645.1==ααz t ,

5.22252.12

8.10-=-=-=

n s x t μ,

拒绝域

α

t t -≤,645.15.2-<-,

拒绝0H

,即可以接受调查主持人的看法。 解二:

由于225=n 为大样本,可用z 统计量。

2:,2:10>≤μμH H

5

.22252.128.10-=-=-=n s x z μ 645.1=αz ,α

z Z -<

落入接受域,即调查结果支持该调查人的看法。

127、【104378】(简答题)简述假设检验的基本步骤。

【答案】(1)建立原假设和备择假设。

(2)确定检验统计量,并确定该统计量的分布情况,然后依据样本信息计算该检验统计量的实际值。

(3)设定检验的显著性水平并确定临界值。

(4)将检验统计量的实际值与临界值进行比较,做出是否拒绝原假设的决策。

128、【104369】(填空题)通常把α错误称为一类错误或_____;把β错误称为二类错误

或_____。

【答案】弃真错误;取伪错误

129、【104370】(填空题)假设检验中确定的显著性水平越高,原假设为真而被拒绝的概

率就_____。

【答案】越高

130、【104371】(填空题)检验一个正态总体的方差时所使用的分布是_____。

【答案】2

χ分布

131、【104372】(填空题)研究者想收集证据予以支持的假设通常称为_____。 【答案】备择假设

132、【122756】(计算题)有一个组织在其成员中提倡通过自修提高水平,目前正考虑帮

助成员中还未曾高中毕业者通过自修达到高中毕业的水平。该组织的会长认为成员中未读完高中的人等于25%,并且想通过适当的假设检验来支持这一看法。他从该组织成员中抽选200人

组成一个随机样本,发现其中有42人没有高中毕业。试问这些数据是否支持这个会长的看法?(05.0=α,查概率表可知,

96

.12

=Z a )

【答案】解:

25.021.020042

?0===p p 25.0:,25.0:10≠=p H p H

306

.1)

1(?000-=--=

n p p p p Z

96

.12

±=a

Z

由于

2

a

Z Z <,故接受

H ,可以认为调查结果支持了该会长的看法。

第八章 列联分析

133、【104382】(填空题)列联表经常用到的品质相关系数有_____、列联相关系数、V 相

关系数。

【答案】?相关系数

134、【145090】(计算题)根据下表,请检查含氟牙膏是否同儿童的龋齿有关。(05.0=α,

查概率表可知,()8415.3105.02

=x )

表6-2 使用含氟牙膏与一般牙膏儿童的龋患率 牙膏类型 患龋齿人数 未患龋齿人数 调查人数 龋患率(%)

含氟牙膏 70(76.67) 130(123.33) 200 35.00 一般牙膏 45(38.33) 55(61.67) 100 45.00 合计

115

185

300

38.33

【答案】0H :使用含氟牙膏和一般牙膏儿童龋患率相等

1

H :使用含氟牙膏和一般牙膏儿童龋患率不等

()()()()82

.267

.6167.615533.3833.384533.12333.12313067.7667.767022222

=-+

-+-+-=χ

8415.3)1(82.205.02

2

=<=χχ,按05.0=α水准,不拒绝0H ,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。

第九章 方差分析

135、【104384】(单项选择题)∑∑==-=r i n j i ij j

X X SSE 112

)(反映了()的差异程度。

A.不同因素水平之间

B.由不同因素水平造成的各个总体之间

C.由不同因素水平造成的总体内部

D.由于抽样误差引起的总体内部 【答案】D

136、【104385】(单项选择题)在无交互作用的双因素方差分析中,因素A 有r 个水平,

因素B 有s 个水平,则对于检验因素A 的A F 统计量()。

A.

SSE SSA

F A =

B.

)

1)(1()

1(---=

s r SSE r SSA F A

C.)

1()1(--=

s SSB r SSA F A

D.它服从自由度为)1,1(--s r 的F 分布 【答案】B

137、【104386】(单项选择题)在单因素方差分析中,F 统计量分子、分母的自由度分

别为()。 A.r ,n

B.1-r ,1-n

C.1-n ,1-r

D.1-r ,r n -

【答案】D

138、【104387】(单项选择题)在单因素方差分析中,若5,10,10,10====r n SSE SSA ,则

F 值为()。 A.5

B.1.25

C.1.5

D.2

【答案】B

139、【104388】(单项选择题)方差分析的主要目的是判断()。 A.各总体是否存在方差

B.各样本数据之间是否有显著差异

C.分类型自变量对数值型因变量是否显著

D.分类型因变量对数值型自变量是否显著 【答案】C

140、【104389】(单项选择题)方差分析是检验()。 A.多个总体方差是否相等的统计方法 B.多个总体均值是否相等的统计方法 C.多个样本方差是否相等的统计方法 D.多个样本均值是否相等的统计方法 【答案】B

141、【104390】(单项选择题)在方差分析中,所要检验的对象称为()。 A.因子 B.方差

C.处理

D.观测值

【答案】A

142、【104391】(单项选择题)在方差分析中,假定每个总体都服从()。 A.正态分布 B.非正态分布 C.任意分布 D.F 分布

【答案】A

143、【104392】(单项选择题)在方差分析中,用于检验的统计量是()。

A.2

χ统计量 B.t 统计量 C.z 统计量 D.F 统计量 【答案】D

144、【104401】(简答题)什么是方差分析?

【答案】方差分析是研究分类自变量对数值因变量的影响。虽然希望研究均值,但在

判断均值之间是否有差异时借助的是方差这个统计量,还表示通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。

145、【145008】(简答题)简述应用方差分析的条件。

【答案】应用方差分析要求符合两个条件:

(1)各个水平的观察数据,要能看作是从服从正态分布的总体中随机抽取的样本。 (2)各组观察数据是从具有相同方差的相互独立的总体中抽得的。

146、【104395】(填空题)在单因素方差分析中,总离差平方和Q 、组间离差平方和2Q 与

误差平方和

1

Q 之间的关系式为_____。

【答案】21Q Q Q +=

147、【104396】(填空题)在无交互作用的双因素方差分析中,总离差平方和SST 可以分

解为SSA 、_____和_____三项。 【答案】SSB ,SSE

148、【104397】(填空题)在无交互作用的双因素方差分析中,若因素A 有5个水平,因

素B 有4个水平,则SST 的自由度为_____,SSA 的自由度为_____,SSE 的自由度为_____。 【答案】19;4;12

149、【104398】(填空题)在方差分析中,自变量的不同水平之间的误差称为_____。 【答案】系统误差

150、【104403】(计算题)为研究食品的包装和销售地区对销售量是否有影响,在三个不

同地区中用三种不同包装方法进行销售,表三是一周的销售量数据:

表三

取显著性水平05.0=α,检验不同地区和不同包装方法对该食品的销售量是否有显著影响。

【答案】解:首先提出如下假设:

因素A :

3210:μμμ==H ,地区对销售量没有影响

3

211,,:μμμH 不全相等,地区对销售量有影响 因素B :

3

210:μμμ==H ,包装对销售量没有影响

3

211,,:μμμH 不全相等,包装对销售量有影响

由于

9443

.60727.0=<=αF F A =0.0727,所以接受原假设

H ,这说明地区对销售量没有显著影响。 由于9443

.61273.3=<=αF F B =3.1273,所以接受原假设

H ,这说明包装对销售量没有显著影响。

直接用P-value 进行分析,结论也是一样的。

151、【193498】(计算题)某厂商想了解销售地点和销售时间对销售量的影响。它在六个

试验点)

6,,2,1( =i A i 进行销售,并记录了五个时期()5,,2,1 =j B j 的销售量,对记录的数据处理后

得到表一,试在05.0=α下分析不同地点和不同时间对销售量的影响是否显著(不存在交互作用)

(查概率表可知:

71

.2)20,5(05.0=F ,

87

.2)20,4(05.0=F )。

表一

方差来源 平方和 自由度 因素A 145.9 5 因素B 50.0 4 误差 46.3 20 总和 242.2 29

【答案】解:

假设因素A (销售地点)的第i 个水平对销售量的效应为

)

6,,2,1( =i i α。设因素B (销售时间)

的第j 个水平对销售量的效应为)

5,,2,1( =j j β。则建立假设:

??

?=======0)6,,2,1(:0:1165432101不全为 i H H i ααααααα ?????======0

)5,,2,1(:0:125432102不全为 j H H j ββββββ

根据已知数据3

21,,,Q Q Q Q 和各自的自由度

可计算

18.29512

1==

Q S ,5.124222==Q S ,315.22032

3==Q S ,

6.12315.218

.29==

A F ,

4.531

5.25

.12==

B F

则将结果列入方差分析表,见表二。 查表得:71

.2)20,5(05.0=F ,

87

.2)20,4(05.0=F

因为71.2)20,5(6.1205.0=>=F F A ,所以拒绝01

H ,认为销售地点对销售量有显著影响。

因为

87

.2)20,4(4.505.0=>=F F B ,所以拒绝

02

H ,认为销售时间对销售量有显著影响。

表二

方差来源 平方和 自由度 方差 F 值 因素A 145.9 5 29.18 12.6 因素B 50.0 4 12.5 5.4 误差 46.3 20 2.315 总和 242.2 29

第十章 相关与回归

152、【104404】(单项选择题)在回归直线bx

a y +=?中,若0<

b ,则x 与y 之间的相关系

数()。

A.10<

B.01<<-r

C.1-

D.1->r

【答案】B

153、【104406】(单项选择题)若x 与y 之间存在负相关关系,则下列回归方程中肯定错误

的是()。

A.x y 63.020?-=

B.x y 39.164?+-=

C.x y 65.089?-=

D.x y 15150?-= 【答案】B

154、【104407】(单项选择题)拟合优度2

R 的值越小,则回归方程()。

A.拟合程度越低

B.拟合程度越高

C.拟合程度有可能高,也有可能低

D.用回归方程进行预测越准确 【答案】A

155、【104408】(单项选择题)回归平方和指的是()。

A.∑-2)(Y Y I

B.∑-2

)?

(i I Y Y C.∑-2)?(Y Y

D.∑-2

)(X X I

【答案】C

156、【104409】(单项选择题)如果变量x 与变量y 之间没有线性相关关系,则下列不正

确的是()。

A.估计标准误差0

=y S B.回归系数0=b C.相关系数0=r

D.判定系数02

=R 【答案】A

157、【104410】(单项选择题)在相关分析中,正确的是()。 A.相关系数既可测定直线相关,又可测定曲线相关 B.相关系数可以测定直线相关,但不可测定曲线相关 C.相关系数可以测定曲线相关,但不可测定直线相关 D.相关系数既不能测定直线相关,又不能测定曲线相关 【答案】B

158、【104411】(单项选择题)受教育程度与收入水平之间的相关系数为0.6835,则这种

相关属于()。 A.显著相关 B.高度相关 C.正相关 D.负相关

【答案】C

159、【104412】(单项选择题)相关系数的取值范围可表示为()。 A.10≤≤r B.11≤≤-r

C.1

D.+∞<<-∞r 【答案】B

160、【104416】(单项选择题)当回归直线bx

a y +=?与x 轴平行时,则x 与y 之间的简单相

关系数()。

A.10<

B.1-=r

C.1+=r

D.0=r

【答案】D 161、【104417】(单项选择题)现根据样本数据建立的单位产品成本(元)对产量(千件)

的一元线性回归方程为x y 8.470?-=,以下说法错误的是()。 A.产量每增加1千件,单位成本平均降低4.8元 B.产量为1千件时,单位成本为65.2元

C.产量每增加1千件,单位成本平均增加4.8元

D.单位成本与产量之间存在着负相关

【答案】C

1、【104134】(单项选择题)某市分行下属三个支行的职工人数分别为2200人、3000人、

1800人,这三个数字是()。

A.标志

B.指标

C.变量

D.变量值

【答案】D

2、【104137】(单项选择题)统计一词的三种涵义是()。 A.统计活动、统计资料、统计学 B.统计活动、统计调查、统计学 C.统计调查、统计整理、统计分析 D.统计指标、统计资料、统计学 【答案】A

3、【104143】(单项选择题)一项调查表明,北京市大学生每学期在网上购物的平均花费

是500元,他们选择在网上购物的主要原因是“价格实惠”,则“大学生在网上购物的原因”是()。 A.分类型变量 B.顺序型变量 C.数值型变量 D.定距变量

【答案】A

4、【104147】(单项选择题)一家研究机构从IT 从业者中随机抽取800人作为样本进行调

查,其中%70回答他们的月收入在5000元以上,则月收入是()。 A.分类型变量 B.顺序型变量 C.数值型变量 D.定距变量

【答案】C

5、【104149】(单项选择题)一家研究机构从IT 从业者中随机抽取800人作为样本进行调

查,其中%40的人回答他们的消费支付方式是信用卡,则消费支付方式是()。 A.分类型变量 B.顺序型变量

C.数值型变量

D.定距变量

【答案】A

6、【104156】(单项选择题)绝对不可能发生的事件发生的概率是()。

A.0

B.1.0

C.5.0

D.1

【答案】A

7、【104160】(单项选择题)必然会发生的事件发生的概率是()。

A.0

B.1.0

C.5.0

D.1

【答案】D

8、【104161】(单项选择题)抛掷一枚均匀的硬币,出现正面的概率是()。

A.0

B.1.0

C.5.0

D.1

【答案】C

9、【104176】(简答题)统计数据可以划分为哪几种类型?分别举例说明。

【答案】统计数据按照所采用计量尺度的不同可划分为三种类型。一种是数值型数据,是指用数字尺度测量的观察值。例如,每天进出海关的旅游人数,某地流动人口的数量等。数值型数据的表现就是具体的数值,统计处理中的大多数都是数值型数据;另一种是分类型数据,是指对数字进行分类的结果,例如人口按性别分为男、女两类,受教育程度也可以按不同类别来区分;再一种是顺序型数据,是指数据不仅是分类的,而且类别是有序的,例如满意度调查中的选项有“非常满意”,“比较满意”,“比较不满意”,“非常不满意”,等。在这三类数据中,数值型数据由于说明了事物的数量特征,因此可归为定量数据,分类型数据和顺序型数据由于定义了事物所属的类别,说明了事物的品质特征,因而可统称为定性数据。

10、【104173】(填空题)参数是描述_____特征的概括性数字度量。

【答案】总体

11、【104174】(填空题)统计量是描述_____特征的概括性数字度量。

【答案】样本

12、【145091】(填空题)根据计量尺度的不同,可将数据划分为三种类型:_____、_____和_____。

【答案】数值型数据;分类型数据;顺序型数据

第二章数据的搜集

13、【104177】(单项选择题)下列哪一项不是数据的直接来源()。

A.普查

B.二手数据

C.统计报表

D.抽样调查

【答案】B

14、【104178】(单项选择题)数据的间接来源有()。

A.普查

B.实验数据

C.二手数据

D.抽样调查

【答案】C

15、【104180】(填空题)数据的误差包括:_____、_____、_____。

【答案】抽样误差、未响应误差、响应误差

16、【104181】(填空题)抽样误差的影响因素有:_____、_____。

【答案】样本量的大小、总体的变异性

17、【104182】(填空题)抽样误差是由于抽样的随机性引起的样本结果与_____之间的误差。

【答案】总体真值

第三章数据的描述(一)——数据的直观显示

18、【104184】(单项选择题)统计表的形式应该是()。

A.上下不封顶,左右不开口

B.上下要封顶,左右要开口

C.上下要封顶,左右不开口

D.上下不封顶,左右要开口

【答案】B

19、【104186】(单项选择题)直方图一般可用于表示()。

A.累计次数的分布

B.次数分布的特征

C.变量之间的函数关系

D.数据之间的相关性

【答案】B

20、【104187】(单项选择题)直方图相比,茎叶图()原始数据的信息。

A.没保留

B.保留了

C.掩盖了

D.浪费了

【答案】B

21、【104188】(单项选择题)10家公司在电视广告上的花费如下(百万元):7.55,72,

2.65,30,28,

3.55,24,20,35,38。下列图示法不宜用于描述这些数据的是()。

A.茎叶图

B.散点图

C.饼图

D.直方图

【答案】C 22、【122753】(单项选择题)对某地区人口按年龄分组如下:4岁以下、8~4岁、……、

79~65岁、89~80岁、99~90岁、100岁以上。第一组与最后一组的组中值分别为()。

A.5.1岁和5.104岁

B.2岁和5.104岁

C.2岁和105岁

D.5.1岁和105岁 【答案】B

23、【104194】(简答题)怎样理解在统计分组过程中的“互斥”、“不重不漏”、“上组限不

在组内”、“下限不包括在内”的原则?

【答案】在统计分组中的“互斥”原则,就是指各组中不应相互包含。所谓“不重”就是指一项数据只能归入其中的一组,而不能同时归入两个或两个以上的组。所谓“不漏”就是指各组别能够穷尽,即在所分的全部组别中,每项数据都能分在其中的一组而没有遗漏。为了解决“不重”问题,在统计分组中习惯上规定,对于越大越好的数值,采用“上组限不在组内”的原则,即当采用重叠组限时,某一变量值恰与组限同值,应将其归入下限组,而不是上限组;对于越小越好的数值,则采用“下限不包括在内”的原则,即当采用重叠组限时,某一变量值恰与组限同值,则应将其归入上限组,而不是下限组。为了解决“不漏”的问题,在分组时可以采用开口组,这样可以将极端值包括在分组中,不被遗漏。

24、【104190】(填空题)重叠组限对于越大越好的变量按“_____”的原则归组,而对于越

小越好的变量则应按照“_____”的原则归组。 【答案】上限不包括在内;下限不包括在内

25、【104191】(填空题)统计表一般由_____、行标题、_____和数据资料构成。 【答案】表头,列标题

26、【104192】(填空题)盒形图由一组数据的最大值、_____、上四分位数、_____、最

小值五个特征数值组成。

【答案】中位数,下四分位数

27、【104199】(计算题)某班级30名学生统计学成绩被分为四个等级:A .优;B .良;

C .中;

D .差。结果如下:

B C B A B D B C C B C D B C A B B C B A B A B B D C C B C A B

D

A

A

C

D

C

A

B

D

(1)根据数据,计算分类频数,编制频数分布表;

(2)按AB C D 顺序计算累积频数,编制向上累积频数分布表和向下累计频数分布表。

28

根据上表指出:

(1)上表变量数列属于哪一种变量数列;

(2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。

【答案】(1)该数列是等距式变量数列。

(2)变量是日产量,变量值是50-100,下限是,、、、、9080706050上限是,、、、、10090807060次数是

111625199、、、、;

(3)组距是10,组中值分别是 9585756555、、、、,频率分别是13.75%31.25%.20%23.75%11.25%

、、。

29、【30

(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。

统计学原理作业(1)答案

《统计学原理》作业一 一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.总体的同质性是指总体中的各个单位在所有标志上都相同。(×)4.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 6.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 7.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√) 8.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 9.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) 10.总体单位是标志的承担者,标志是依附于总体单位的。(√) 二、单项选择 1.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2.构成统计总体的各个单位称为(A )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3.对某城市工业企业未安装设备状况进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4.标志是说明总体单位特征的名称(C)。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值5.总体的变异性是指( B )。 A.总体之间有差异B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化D、总体单位之间有差异 6.工业企业的设备台数、产品产值是(D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7.几位学生的某门课成绩分别是57分、68分、78分、89分、96分,“学生成绩”是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9.下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

【精选】统计学第一次作业 答案

《统计学》第一次作业 一、单选题(共10个) 1.统计工作的成果是( C )。 A. 统计学 B. 统计工作 C. 统计资料 D. 统计分析和预测 2. 社会经济统计的研究对象是( C )。 A. 抽象的数量关系 B. 社会经济现象的规律性 C. 社会经济现象的数量特征和数量关系 D. 社会经济统计认识过程的规律和方法 3. 对某地区的全部产业依据产业构成分为第一产业、第二产业和第三产业,这里所使用的计量尺度是( A )。 A. 定类尺度 B. 定序尺度 C. 定距尺度 D. 定比尺度 4.某城市工业企业未安装设备普查,总体单位是( D )。 A. 工业企业全部未安装设备 B. 工业企业每一台未安装设备 C. 每个工业企业的未安装设备 D. 每一个工业企业 5.统计总体的同质性是指( B )。 A. 总体各单位具有某一共同的品质标志或数量标志 B. 总体各单位具有某一共同的品质标志属性或数量标志值 C. 总体各单位具有若干互不相同的品质标志或数量标志 D. 总体各单位具有若干互不相同的品质标志属性或数量标志值 6.下列调查中,调查单位与填报单位一致的是(D ) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 7.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( D)

A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 8.重点调查中重点单位是指(A ) A. 标志总量在总体中占有很大比重的单位 B. 具有典型意义或代表性的单位 C. 那些具有反映事物属性差异的品质标志的单位 D. 能用以推算总体标志总量的单位 9.书籍某分组数列最后一组是500以上,该组频数为10,又知其相邻组为400-450,则最后一组的频数密度为( A) A. 0.2 B. 0.3 C. 0.4 D. 0.5 10.在组距分组中,确定组限时(B ) A. 第一组的下限应等于最小变量值 B. 第一组的下限应小于最小变量值 C. 第一组的下限应大于最小就量值 D. 最后一组的上限应小于最大变量值 二、多选题(共5个) 1. 按照统计数据的收集方法,可将统计数据分为( AC )。 A. 观测数据 B. 截面数据 C. 实验数据 D. 间数列数据 2. 定比尺度的特点是( ACDE) A. 它有一个绝对固定的零点 B. 它没有绝对零点 C. 它具有定类、定序、定距尺度的全部特性 D. 它所计量的结果不会出现“0”值 E. 它可以计算两个测度值之间的比值 3.下列标志中,属于品质标志的有( BD )。 A. 工资 B. 所有制 C. 耕地面积 D. 产品质量

统计学原理第二次作业及答案

统计学原理第二次作业及答案 题目 总指数的基本形式是() 选择一项: a. 个体指数 b. 平均指数 c. 综合指数 d. 平均指标指数 正确答案是:综合指数 题目 重点调查所选的重点单位,必须是在调查对象中() 选择一项: a. 具有较大标志值的那一部分调查单位 b. 具有代表性的调查单位 c. 按随机原则选出的调查单位 d. 填报调查数据的填报单位 正确答案是:具有较大标志值的那一部分调查单位 题目 连续变量数列、其末组为开口组,下限为1000,其相邻组的组中值为950,则末组的组中值为()(单选) 选择一项: a. 1025 b. 1050 c. 1100 d. 1150 正确答案是:1050

题目 零售物价指数为103%,商品零售量指数为106%,则商品零售额指数为()(单选)选择一项: a. 109% b. 110% c. 103% d. 109.18% 正确答案是:109.18% 题目 下列不属于强度相对指标的指标有() 选择一项: a. 平均单位成本 b. 人口出生率 c. 人口死亡率 d. 人口密度 正确答案是:平均单位成本 题目 时间序列由两个基本要素构成()(多选) 选择一项或多项: a. 时间,即现象所属的时间 b. 指标数值,即表现现象特点的各项指标数值 c. 指标名称 d. 计量单位 e. 计算公式 正确答案是:时间,即现象所属的时间, 指标数值,即表现现象特点的各项指标数值

题目 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: a. 性别 b. 年龄 c. 职业 d. 月收入 e. 职称 正确答案是:性别, 职业, 职称 题目 在时间序列中,各指标值相加后无意义的有()(多选)选择一项或多项: a. 时期数列 b. 时点数列 c. 绝对数时间序列 d. 相对数时间序列 e. 平均数时间序列 正确答案是:时点数列, 相对数时间序列, 平均数时间序列 题目 我国财政收入,比上年增加2787亿元,这是()(单选)选择一项: a. 发展水平 b. 增长量 c. 发展速度 d. 增长速度

完整版上海交大统计学原理第二次作业及答案

1.同时抛两枚不同的硬币,恰有一枚正面朝上的概率是()(单选) 选择一项: 炒a. 1 炒b. 1/8 O c. 1/4 同d. 1/2 2.对于连续型数据的分组()选择一项: a.水平法 b.累计法 c.推算法 d.直接法 ) 4.各变量值与其算术平均数的离差值和等于(选择一 项: a.最小值 C b.取大值 c.各变量值的算术平均数 d.零 ) 5.下列统计指数,不属于数量指标指数的有(选择一 项: a.零售价格指数

b. 产量指数 诃c?收购量指数 因d.工资总额指数 6. 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: * a.性别 □ b.年龄 "c.职业 d.月收入 门e.职称 7. 我国2003年国内生产总值比上年增长了9.1%,这个指标是() (单选)选择一项: U a.发展速度 拥b.增长速度 目c.发展水平 d.增长量 8. 统计指数区分数量指标指数与质量指标指数,是依据()(单选) 选择一项: 炒a.对比基期的不同 °b.对象范围的大小 ⑥c.统计指标的性质不同 d.同度量因素的固定与否 9. 我国财政收入,2003年比上年增加2787亿元,这是()(单选)选择一项: 炒a.发展水平 b.增长量

炒a.两个数列的平均数代表性相同 °b.平均数的代表性甲数列高于乙数列 同c.平均数的代表性乙数列高于甲数列 口d.平均数的代表性无法判断 11.全年12个月的季节比率之和应是()(单选) 选择一项: 」a.标准差系数 b.平均差系数 ‘ c.全距 * d.平均差

」a.是不同情况下同一指标对比的比率 □ b.反映现象的强度、密度和普遍程度 巫c. 一般有正指标与逆指标之分 門d.是两个性质不同而有密切联系的总量指标对比的结果 "e. 一般是以有名数表示的,但也有采用千分数等形式表示的 15.下列现象的相关密切程度最高的是()(单选)选择一项: a. 某商店的职工人数与商品销售额之间的相关系数0.87 * b.流通费用水平与利润率之间的相关关系为-0.94 口c.商品销售额与利润率之间的相关系数为0.51 口d.商品销售额与流通费用水平的相关系数为-0.81 16在实验中,两个事件有一个发生时,另一个就不发生,称这两个事件()(单选)选择一项: ⑥a.互斥事件 口b.必然事件 c. 独立事件 d. 不可能事件 17. 两组数据的均值不等,但标准差相等,则()(单选) 选择一项:

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学第二次作业答案讲课教案

《统计学》第二次作业 注:本次作业主要针对4、6、8章相关知识点。 一、单选题(共11个) 1. 直接反映总体规模大小的指标是( C )。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 2.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和( C )。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 3.下列相对数中,属于不同时期对比的指标有( B )。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 4. 2010年某市下岗职工已安置了13.7万人,安置率达80.6%,安置率是( D )。 A、总量指标 B、变异指标 C、平均指标 D、相对指标 5.根据同一资料计算的数值平均数通常是各不相同的,他们之间的关系是( D )。 A. 算术平均数≥几何平均数≥调和平均数 B. 几何平均数≥调和平均数≥算术平均数 C. 调和平均数≥算术平均数≥几何平均数 D. 没有关系 6.指数是表明现象变动的( B ) A. 绝对数 B. 相对数 C. 平均数 D. 抽样数 7.编制数量指标指数一般是采用( A )作为同度量因素。 A. 基期质量指标 B. 报告期质量指标 C. 基期数量指标 D. 报告期数量指标 8.价格下降后,花同样多的钱可以多购买基期商品的10%,则物价指数为( B ) A. 90% B. 90.9% C. 110% D. 111.1% 9.消费价格指数反映了( D ) A. 城乡商品零售价格的变动趋势 B. 城乡居民购买生活消费品价格的变动趋势 C. 城乡居民购买服务项目价格的变动趋势 D. 城乡居民购买生活消费品和服务项目价格的变动趋势 10.变量x与y之间的负相关是指( C ) A. x数值增大时y也随之增大 B. x数值减少时y也随之减少 C. x数值增大(或减少)y随之减少(或增大) D. y的取值几乎不受x取值的影响 11.如果相关系数为0,表明两个变量之间( C ) A. 相关程度很低 B. 不存在任何关系 C. 不存在线性相关关系 D. 存在非线性相关关系 二、多选题(共7个) 1.时期指标的特点是指标的数值( ADE )。

西南财大版统计学原理统计学作业练习题及答案。

第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表: 要求:(1)计算样本平均数和抽样平均误差。(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。 2.采用简单随机重复抽样方法,在2 000件产品中抽查200件,其中合格品190件。 要求:(1)计算合格品率及其抽样平均误差。(2)以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从 5 000个产品中抽取进行调查.其结果如下: 要求:试根据上述资料:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。(3)根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。 4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下: 抽查结果统计表 要求:(1)以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。(2)以同样的概率保证估计该批茶叶合格率范围。

5.某工厂生产一种新型灯泡5000只,随后抽取100只作耐用时间测试。结果表明,平均寿命为4500小时,标准差300小时,试在90%的概率保证下,估计该新式灯泡平均寿命时间,假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试。 6.调查一批机械零件合格率。根据过去资料,合格品率曾有过99%、97%、95%三种情况,现在要求误差不超过1%,要求估计的把握程度为95%,问需要抽查多少零件?(提示:总体方差取最大值) 7.某部门对职工进行家庭经济情况调查,取得年度项抽样资料如下,试以90%的概率保证程度,估计该部门职工的家庭月收入。 抽查结果统计表 8.某市有职工10万人,其中:职员4万人,工人6万人,现进行职工收入抽样调查,并划分职员与工人两类进行选样,要先按不同类型抽查40名职员与60名工人,结果如下:要求这次调查的极限误差不超过2元,概率保证程度 95.45%,试按类型抽样组织计算必要的抽样数目。 如果按简单随机抽样组织,试问:(1)同样的?和t,需按抽取多少样本单位数。(2)同样的样本单位数和概率保证程度,则会有多大的极限抽样误差。(3)同样的样本单位数和?应有多大的概率保证程度。 9.从某县的100个村中抽出10村进行各村的全户调查设平均每户饲养家禽35头,每村平均数的方差为16。 要求:(1)以90%的概率估计全县平均每户饲养家禽数。(2)如果极限误差 2.412 ?= x 则其概率保证程度如何?

统计学课程作业及答案

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数

答案:C 第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题

统计学原理作业1答案

统计学原理作业1答案 统计学原理作业1 第一章~第三章 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(×) 2、 统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 、全面调查包括普查和统计报表。(?) 3 4、统计分组的关键是确定组限和组距。(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此这是一种连续性调查方法。(?) 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本 情况。这种调查属于非全面调查。(?) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收水平是数量标志。(?) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生产的 基本情况,这种调查是重点调查。(?) 10、我国人口普查的总体单位和调查单位都是第一个人,而填报单位是户。(?) 二、单项选题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位 是(C) A、每个工业企业 B、670家工业企业 C、每一件产品 D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查时限 ) 为(B A、一日 B、一个月 C、一年 D、一年零一个月

3、在全国人口普查中(B) A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、人国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两上变量是(D) A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是(D) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D) A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A) A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品的销售额 D、每季统计进口贸易额 8、全面调查与非全面调查的划分是以(C) A、时间是否连续来划分的 B、最后取得的资料是否全面完全来划分 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小来划分 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组 三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者,因此(A,D) A、在国有企业这个总体下,每个国有企业就是总体单位 B、在工业总产值这个总体下,单位总产值就是总体单位 C、在全国总人口这个总体下,一个省的总人口就是总体单位

统计学原理第三章习题答案

一. 判断题部分 1 : 对统计资料进行分组的目的就是为了区分各组单位之间质的不同。 (×) 2: 统计分组的关键问题是确定组距和组数。 ( × ) 3: 组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平 均分配次数。 ( × ) 3 : 分配数列的实质是把总体单位总量按照总体所分的组进行分配。 ( ∨ ) 4: 次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标 志值在总体中所起的作用程度。 ( ∨ ) 5: 某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。 (×) 6: 连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重 叠的方法确定组限。 ( ∨ ) 7: 对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所 以这种分组会使资料的真实性受到损害。 ( ∨ ) 8: 任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于 或 100%。( × ) 9: 按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都 可称为次数分布。 ( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。 ( 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位 的差异。( ∨ ) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作第三章 统计资料整理 ×)

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越 小。( × ) .单项选择题部分 2: 在组距分组时,对于连续型变量,相邻两组的组限( A )。 A 、 必须是重叠的 B 、必须是间断的 C 、可以是重叠的,也可以是间断的 D 、必须取整数 3: 下列分组中属于按 品质标志分组 的是( B )。 A 、学生按考试分数分组 B 、产品按品种分组 C 、企业按计划完成程度分组 D 、家庭按年收入分组 4 : 有一个学生考试成绩为70分,在统计分组中,这个变量值应归入 ( B )。 A 、60---70 分这一组 B 、 70---80 分这一组 C 、60— 70或 70—80两组都可以 D 、作为上限的那一组 5: 某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的 分组属于( B )。 A 、简单分组 B 、复合分组 C 、分析分组 D 、结构分组 6: 简单分组和复合分组的区别在于( B )。 A 、选择的分组标志的性质不同 B 、选择的分组标志多少不同 1: 统计整理的关键在( B A 、对调查资料进行审核 C 、对调查资料进行汇总 )。 B 、 对调查资料进行统计分组 D 、编制统计表

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学作业答案归纳

统计学作业答案归纳 1、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准差 是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样本容量 应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254.006.396.12 2 22205.02=?=?=E s z n 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信 的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客 户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在 95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比率进 行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%3030 9?==p 。

总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t

《统计学原理》形考作业参考答案

《统计学原理》作业(一) (第一~第三章) 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(√) 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。( × ) 3、全面调查包括普查和统计报表。(× ) 4、统计分组的关键是确定组限和组距(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此它是一种连续性调查方法。(×) 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(√) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。(√) 10、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。(√) 二、单项选择题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是(C ) A、每个工业企业;B、670家工业企业;C、每一件产品;D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查期限为(B)。 A、一日 B、一个月 C、一年 D、一年零一个月 3、在全国人口普查中(B)。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是(D)。 A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是( D ) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D)。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A)。 A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品销售额 D、每季统计进出口贸易额 8、全面调查与非全面调查的划分是以( C ) A、时间是否连续来划分的 B、最后取得的资料是否完全来划分的 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小划分的 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组B、产品按品种分组C、家庭按年收入水平分组D、人口按年龄分组 三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者。因此(A、D) A、在国营企业这个总体下,每个国营企业就是总体单位; B、在工业总产值这个总体下,单位总产值就是总体单位; C、在全国总人口这个总体下,一个省的总人口就是总体单位; D、在全部工业产品这个总体下,每一个工业产品就是总体单位; E、在全部固定资产这一总体下,每个固定资产的价值就是总体单位。 2、在对工业企业生产设备的调查中(B、C、E) A、全部工业企业是调查对象;B、工业企业的全部生产设备是调查对象; C、每台生产设备是调查单位;D、每台生产设备是填报单位;E、每个工业企业是填报单位 3、对连续变量与离散变量,组限的划分在技术上有不同要求,如果对企业按工人人数分组,正确的方法应是

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

统计学课后作业答案

统计学课后作业答案

4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图:

为分组情况下的概率密度曲线:分组: 1、确定组数: () lg25 lg() 1.398 111 5.64 lg(2)lg20.30103 n K=+=+=+=,取k=6 2、确定组距:组距=( 最大值- 最小值)÷组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄(Binned) 分组后的均值与方差:

Kurtosis 1.302 分组后的直方图: 组中值 50.00 45.00 40.00 35.00 30.00 25.00 20.00 15.00 10.00 F r e q u e n c y 10 8 6 4 2 Mean =23.30 Std. Dev. =7.024 N =25 4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大? 成年组 幼儿组 平均 172.1 平均 71.3 标准差 4.201851 标准差 2.496664 离散系数 0.024415 离散系数 0.035016 幼儿组的身高差异大。 7.6利用下面的信息,构建总体均值μ的置信区间: 1) 总体服从正态分布,且已知σ = 500,n = 15, =8900,置信水平为95%。 解: N=15,为小样本正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2) 2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。 解:为大样本总体非正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 2 α() 28.109,44.10192.336.10525 10 96.136.1052=±=?±=±n z x σ αx x 2 α() 28.109,44.10192.336.10525 1096.136.1052=±=?±=±n z x σ α

相关主题
文本预览
相关文档 最新文档