统计学课后题答案第四版中国人民大学出版社
- 格式:doc
- 大小:410.00 KB
- 文档页数:8
●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
1521241291161001039295127104
10511911411587103118142135125
117108105110107137120136117108
9788123115119138112146113126
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
解:(1)要求对销售收入的数据进行分组,
全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;
为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;
按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;
在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:
40个企业按产品销售收入分组表
(2)按题目要求分组并进行统计,得到分组表如下:
某管理局下属40个企分组表
按销售收入分组(万元)企业数(个)频率(%)
先进企业良好企业一般企业落后企业11
11
9
9
27.5
27.5
22.5
22.5
合计40100.0
●7.1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 样本均值的抽样标准差x σ等于多少? 在95%的置信水平下,允许误差是多少?
解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差
x σσ5=0.7906
(2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =
α/2
σ
Z =1.96×0.7906=1.5496。 ●7.2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
假定总体标准差为15元,求样本均值的抽样标准误差; 在95%的置信水平下,求允许误差;
如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为
x σ=
σ15
(2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =
α/2
σ
Z =1.96×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为
±α/2
σ
x Z ±4.2=124.2115.8
可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 7.3(1)已知σ=85414,n=100,x =104560,α=0.05,
z
2
05.0=1.96
由于总体标准差已知,所以总体均值μ的95%的置信区间为:
n
x z σ
α
±
=104560±1.96*
=100
85414104560±16741.144即(87818.856,121301.144)
7.4(1)已知n=100,x =81,s=12, α=0.1,
z
2
1.0=1.645
由于n=100为大样本,所以总体均值μ的90%的置信区间为:
n
s x z 2
α±=81±1.645*
=100
1281±1.974,即(79.026,82.974)
(2)已知α=0.05,
z
2
05.0=1.96
由于n=100为大样本,所以总体均值μ的95%的置信区间为:
n
s x z 2
α±=81±1.96*
=100
1281±2.352,即(78.648,83.352)
(3)已知α=0.01,
z
01.0=2.58
由于n=100为大样本,所以总体均值μ的99%的置信区间为:
n
s x z 2
α±=81±2.58*
=100
1281±3.096,即(77.94,84.096)
7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)
(18t
2
05.0-=2.365 根据样本数据计算得:x =10,s=3.46
总体均值μ的95%的置信区间为:
n
s x t 2
α±=10±2.365*
=8
3.4610±2.89,即(7.11,12.89)
7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)
(116t
05.0-=2.131 根据样本数据计算得:x =9.375,s=4.113
从家里到单位平均距离的95%的置信区间为:
n
s x t 2
α±=9.375±2.131*
=14
4.1139.375±2.191,即(7.18,11.57)
7.10 (1)已知:n=36,x =149.5,α=0.05,
z
2
05.0=1.96
由于n=36为大样本,所以零件平均长度的95%的置信区间为:
n
s x z 2
α±=149.5±1.96*
=36
1.93149.5±0.63,即(148.87,150.13)
(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为μ、方差为
σ
2
的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值