统计学课后题答案第四版中国人民大学出版社

  • 格式:doc
  • 大小:410.00 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):

1521241291161001039295127104

10511911411587103118142135125

117108105110107137120136117108

9788123115119138112146113126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;

(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

解:(1)要求对销售收入的数据进行分组,

全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;

为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;

按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;

在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。

整理得到频数分布表如下:

40个企业按产品销售收入分组表

(2)按题目要求分组并进行统计,得到分组表如下:

某管理局下属40个企分组表

按销售收入分组(万元)企业数(个)频率(%)

先进企业良好企业一般企业落后企业11

11

9

9

27.5

27.5

22.5

22.5

合计40100.0

●7.1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 样本均值的抽样标准差x σ等于多少? 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差

x σσ5=0.7906

(2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =

α/2

σ

Z =1.96×0.7906=1.5496。 ●7.2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

假定总体标准差为15元,求样本均值的抽样标准误差; 在95%的置信水平下,求允许误差;

如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为

x σ=

σ15

(2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =

α/2

σ

Z =1.96×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为

±α/2

σ

x Z ±4.2=124.2115.8

可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 7.3(1)已知σ=85414,n=100,x =104560,α=0.05,

z

2

05.0=1.96

由于总体标准差已知,所以总体均值μ的95%的置信区间为:

n

x z σ

α

±

=104560±1.96*

=100

85414104560±16741.144即(87818.856,121301.144)

7.4(1)已知n=100,x =81,s=12, α=0.1,

z

2

1.0=1.645

由于n=100为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=81±1.645*

=100

1281±1.974,即(79.026,82.974)

(2)已知α=0.05,

z

2

05.0=1.96

由于n=100为大样本,所以总体均值μ的95%的置信区间为:

n

s x z 2

α±=81±1.96*

=100

1281±2.352,即(78.648,83.352)

(3)已知α=0.01,

z

01.0=2.58

由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n

s x z 2

α±=81±2.58*

=100

1281±3.096,即(77.94,84.096)

7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)

(18t

2

05.0-=2.365 根据样本数据计算得:x =10,s=3.46

总体均值μ的95%的置信区间为:

n

s x t 2

α±=10±2.365*

=8

3.4610±2.89,即(7.11,12.89)

7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)

(116t

05.0-=2.131 根据样本数据计算得:x =9.375,s=4.113

从家里到单位平均距离的95%的置信区间为:

n

s x t 2

α±=9.375±2.131*

=14

4.1139.375±2.191,即(7.18,11.57)

7.10 (1)已知:n=36,x =149.5,α=0.05,

z

2

05.0=1.96

由于n=36为大样本,所以零件平均长度的95%的置信区间为:

n

s x z 2

α±=149.5±1.96*

=36

1.93149.5±0.63,即(148.87,150.13)

(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为μ、方差为

σ

2

的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值