统计学上机作业(1)
一、利用软件计算
1、
宾馆未露面者人数进行统计频数分析,分析结果对确定超员预定客房数有何帮助?(数据参见课件)
因而得出结论该宾馆可以增加订房数,以使得宾馆的到充分运用。
2、
文件名:DATA11-02
文件说明:1973年某市测量120名12岁男孩身高资料。
变量说明:height: 12岁男孩身高
绘制身高分布的直方图,求出该市12岁男孩身高平均值95%和99%的置信区间,说明置信系数与区间宽度之间的关系。
(1)当平均值是95%时:
(2)当平均值是99%时
有置信区间的:
当置信度为95%时,为(141.996,144.100),当置信度为99%时,为(141.657,144.439)说明置信度越大估计精度越差。
3、
文件名:DATA09-03
文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。
变量说明:ID:Employee Code(雇员代码) GENDER:性别 BDATE:Date of Birth(出生日期)
EDUC:Educational Level (years)(受教育年份) JOBCAT:Employment Category(工作地位)SALARY:Current Salary(当前工资) SALBEGIN:Beginning Salary(起始工资)JOBTIME:Months since Hire(雇佣月份) PREVEXP:Previous Experience (months)(以前工作经历) MINORITY:Minority Classification(特殊群体) AGE:年龄
A、请分别求出该银行中男雇员、女雇员工资平均值的95%的置信区间。
Case Processing Summary
Cases
Valid Missing Total
Gender N Percent N Percent N P ercent
Current
Salary
Female 216 100.0% 0 .0% 216 100.0%
Male 258 100.0% 0 .0% 258 100.0%
Descriptives
Gender Statistic S td. Error
Current
Salary
Female Mean $26,031.9
2
$514.26
95% Confidenc Lower
Bound
$25,018.2
9
e Interval for Mean
Upper Bound $27,045.5
5
5% Trimmed
Mean $25,248.3
Median $24,300.0
Variance 57123688.
268
Std.
Deviation
$7,558.02
Minimum $15,750
Maximum $58,125
Range $42,375
Interquartil
e Range
$7,012.50
S kewness 1.863 .166
Kurtosis 4.641 .330
Male Mean $41,441.7
8
$1,213.97
95% Confidenc e Interval for Mean Lower
Bound
$39,051.1
9
Upper Bound
$43,832.37
5% Trimmed Mean
$39,445.87
Median
$32,850.00
Variance
380219336.303
Std. Deviation
$19,499.21
Minimum
$19,650
Maximum
$135,000
Range
$115,350
Interquartil e Range
$22,675.00
S kewness
1.639 .152
Kurtosis
2.780 .302
所以得女职工工资均值的置信度为95%的置信区间为:(25,018.29,27,045.55) 男职工工资均值的置信度为95%的置信区间为:(39,051.19,43,832.37) B 、请计算出男女平均工资差异的95%的置信区间,并对差异程度做出解释。
Group Statistics
Gender
N
Mean
Std. Deviation Std. Error Mean
Current Salary
Male 258 $41,441.7$19,499.2$1,213.97
8
1
Female
216 $26,031.92
$7,558.02 $514.26
Independent Samples Test
Levene's
Test for Equality of Variances
t-test for Equality of
Means
F
Sig.
t
df
Sig.
(2-tailed) Mean Difference Std. Error
Difference 95% Confidenc e Interval
of the Difference
Lower U pper
Current Salary
Equal variances assumed 119.669
.000
10.945
472
.000 $15,409.86
$1,407.91 $12,643.32 $18,176.4
Equal variances
not assumed
11.688
344.262
.000 $15,409.86
$1,318.40 $12,816.73 $18,003.0
由图的置信区间为: (12,643.32,12,816.73)
C 、请求出雇员当前工资与起始工资平均值的95%的置信区间。、
Paired Samples Statistics
Mean
N
Std. Deviation Std. Error Mean
Pair 1
Current Salary $34,419.57 474 $17,075.66 $784.31
Beginning Salary
$17,016.0
9 474 $7,870.64 $361.51
Paired Samples Correlations
N Correlation S ig.
Pair 1
Current
Salary &
Beginning
Salary
474 .880 .000 Paired Samples Test
Paired Difference
s t df S ig.
(2-tailed)
Mean Std.
Deviation Std. Error
Mean
95%
Confidenc
e Interval
of the
Difference
Lower Upper
Pair 1
Current Salary - Beginning
Salary $17,403.4
8
$10,814.6
2
$496.73 $16,427.4
1
$18,379.5
6
35.036 473 .000
由结果的置信区间为:(16,427.41,18,379.56)
4、
文件名:DATA10-04
文件说明:29名13岁男生的身高、体重、肺活量数据。
变量说明:no:编号;height: 身高; weight: 体重; vcp : 肺活量.
请求出身高大于等于155cm(≥155cm)与身高小于155cm(<155cm)的两组男生体重与肺活量平均值的95%的置信区间。
由图的置信区间为:对于体重来说为(3.3231,10.1288)
对于肺活量来说(0.07110,0.70534)
5、
文件名:DATA11-03
文件说明:10位高血压患者在施以体育疗法前后测定舒张压的数据。
变量说明:number:编号pretreat:治疗前舒张压(mmHg) posttreat:治疗后舒张压(mmHg) 请求出治疗前与治疗后患者血压平均值差异的95%的置信区间。说明体育疗法对高血压有无治疗效果。
由t值为5.639不在区间(10.180,23.820)内,所以认为体育疗法对高血压有治疗效果。
6、
文件名:DATA11-04
文件说明:经过严格挑选12名排球运动员用新训练方法进行训练,训练前后分别测试6项技术指标的数据。
变量说明:NUMBER:编号;BHAND:前手形控制;AHAND:后手形控制;BCFC1:前睁眼力控制;ACFC1:后睁眼力控制;BCFC2:前闭眼力控制;
ACFC2:后闭眼力控制;BACUR:前准确性;AACUR:后准确性;BFOCL:前左用力感;AFOCL:后左用力感;BFOCR:前右用力感;ADOCR:后右用力感
请计算出训练前后手形控制、睁眼力控制、闭眼力控制、准确性平均值差异95%的置信区间。对新训练方法的效果做出说明。
(1)
训练前后手形控制平均值差异95%的置信区间是(-1.5111,-0.7389)t=-6.413不在区间内所以认为新训练方法的有效果。
(2)
训练前后睁眼力控制平均值差异95%的置信区间是(-4.412,-1.421)t=-4.293在区间内所以认为新训练方法的无效果。
(3)
训练前后闭眼力控制平均值差异95%的置信区间是(-5.600,-3.400),t=-9.000不在区间内所以认为新训练方法的有效果。
(4)
训练前后准确性平均值差异95%的置信区间是(-6.099,-3.567),t=-8.403不在区间内所以认为新训练方法的有效果。
7、
文件名:DATA18-27
文件说明:150名三岁女童身高数据。
请计算出身高在85cm-100cm之间的三岁女童所占的比例,第10%,30%,70%分位数。
Statistics
第10%,30%,70%分位数分别为:86.540,90.130,94.970。
Hight (cm)
Hight (cm)
1 .7 .7 7.3 85.2
1 .7 .7 8.0 85.7
1 .7 .7 8.7 86.2
1 .7 .7 9.3 86.4
1 .7 .7 10.0 86.5
1 .7 .7 10.7 86.9
1 .7 .7 11.3 87.1
1 .7 .7 12.0 87.2
1 .7 .7 12.7 87.3
1 .7 .7 13.3 87.4
1 .7 .7 14.0 87.6
1 .7 .7 14.7 87.9
1 .7 .7 15.3 88.0
1 .7 .7 16.0 88.1
1 .7 .7 16.7 88.2
2 1.
3 1.3 18.0 88.4
1 .7 .7 18.7 88.5
1 .7 .7 19.3 88.7
1 .7 .7 20.0 88.9
2 1.
3 1.3 21.3 89.0
2 1.
3 1.3 22.7 89.1
1 .7 .7 23.3 89.2
3 2.0 2.0 25.3 89.3
1 .7 .7 26.0 89.4
1 .7 .7 26.7 89.7
1 .7 .7 27.3 89.8
3 2.0 2.0 29.3 90.0
1 .7 .7 30.0 90.1
1 .7 .7 30.7 90.2
2 1.
3 1.3 32.0 90.3
1 .7 .7 32.7 90.4
1 .7 .7 33.3 90.5
1 .7 .7 34.0 90.6
1 .7 .7 34.7 90.7
2 1.
3 1.3 36.0 90.8
3 2.0 2.0 38.0 91.1
1 .7 .7 38.7 91.3
1 .7 .7 39.3 91.4
3 2.0 2.0 41.3 91.7
1 .7 .7 42.0 91.8
1 .7 .7 42.7 91.9
1 .7 .7 43.3 92.1
1 .7 .7 44.0 92.3
1 .7 .7 44.7 92.4
2 1.
3 1.3 46.0 92.5
1 .7 .7 46.7 92.6
2 1.
3 1.3 48.0 92.7
3 2.0 2.0 50.0 92.8
2 1.
3 1.3 51.3 92.9
1 .7 .7 52.0 93.0
1 .7 .7 52.7 93.1
2 1.
3 1.3 54.0 93.2
1 .7 .7 54.7 93.3
1 .7 .7 55.3 93.4
1 .7 .7 56.0 93.5
3 2.0 2.0 58.0 93.6
1 .7 .7 58.7 93.7
1 .7 .7 59.3 93.8
1 .7 .7 60.0 93.9
1 .7 .7 60.7 94.0
1 .7 .7 61.3 94.2
3 2.0 2.0 63.3 94.3
3 2.0 2.0 65.3 94.4
1 .7 .7 66.0 94.5
1 .7 .7 66.7 94.6
2 1.
3 1.3 68.0 94.7
2 1.
3 1.3 69.3 94.8
1 .7 .7 70.0 94.9
1 .7 .7 70.7 95.0
4 2.7 2.7 73.3 95.1
1 .7 .7 74.0 95.5
2 1.
3 1.3 75.3 95.6
1 .7 .7 76.0 95.8
1 .7 .7 76.7 96.0
2 1.
3 1.3 78.0 96.2
1 .7 .7 78.7 96.3
1 .7 .7 79.3 96.4
1 .7 .7 80.0 96.5
1 .7 .7 80.7 96.6
1 .7 .7 81.3 96.7
1 .7 .7 82.0 96.8
2 1.
3 1.3 83.3 97.0
1 .7 .7 84.0 97.1
1 .7 .7 84.7 97.2
由表格的85cm的累积百分比为6.7%,100cm的累积百分比94.7%,所以身高在85cm-100cm之间的三岁女童所占的比例为94.7%-6.7%=88%。
第10%,30%,70%分位数分别为:86.540,90.130,94.970。
8、
文件名:University of Florida graduate salaries
文件说明:University of Florida毕业生的起始工资、专业的数据。
变量说明:graduate: 毕业生编号; gender: 性别; college: 所在学院;
salary: 起始工资; degree: 学位; graddate: 毕业时间.
A、请问各学院(④企业管理、⑦工程)(①农业学、⑤林业学)间毕业生工资平均值差异的95%的置信区间。
(1)
Group Statistics
Independent Samples Test
Sig=0.744〉0.025所以两者方差无差异。由于sig=0.000<0.025所以对于均值来说两者有差异。
企业管理、工程间毕业生工资平均值差异的95%的置信区间是(-6926.450,-6922.484)。
(2)
Group Statistics
Independent Samples Test
由于sig=0702〉0.025所以两者方差无差异,sig=0.380〉0.025,所以接受原假设,认为两者均值无差异。农业学、林业学间毕业生工资平均值差异的95%的置信区间(-5914.738,-50749.169)。
B、构造企业管理毕业生中男、女平均工资差异的95%的置信区间,并做出解释。
Group Statistics
Independent Samples Test
由于sig=0.854在区间(2.5%,97.5%)之间,所以两者方差无差异。Sig=0.000<0.025所以拒绝原假设,认为两者有明显差异。
男、女平均工资差异的95%的置信区间是(1433.850,3080.142)。
C、说明平均工资高的专业与低的专业之间的差距。
解:
由第(1)知均值最大的是工程类专业,均值最小的是林业学专业。所以比较两者既可。
Group Statistics
Independent Samples Test
由于sig=0.744〉0.25所以两者方差无差异,对于均值sig=0.000<0.025所以拒绝原假设,认为两者有差异。工程类专业的工资比林业学的最少高5199.181,最多高6926.450。
9
日本的管理人员和工人比美国的同行目的性更明确?为了对这个问题的一个方面进行研究,研究人员对日本和美国的中年企业经理进行了调查。从东京和大阪两地选出100名经理组成日本样本,而美国样本则由不得221名来自贝尔系统的管理人员组成。对每一名管理人员均进行萨尔诺夫(Sarnoff Survey of Attitudes Toward Life,SSATL)籍以测量向上流动的动力。SSATL分数汇总于下表(较高分数代表较强的向上流动动力)。
美国管理人员日本管理人员
样本容量
平均SSATL分数标准差211
65.75
11.07
100
79.83
6.41
(1)对美国和日本管理人员求平均SSATL分数之差的95%置信区间。