当前位置:文档之家› 统计学上机作业1

统计学上机作业1

统计学上机作业(1)

一、利用软件计算

1、

宾馆未露面者人数进行统计频数分析,分析结果对确定超员预定客房数有何帮助?(数据参见课件)

因而得出结论该宾馆可以增加订房数,以使得宾馆的到充分运用。

2、

文件名:DATA11-02

文件说明:1973年某市测量120名12岁男孩身高资料。

变量说明:height: 12岁男孩身高

绘制身高分布的直方图,求出该市12岁男孩身高平均值95%和99%的置信区间,说明置信系数与区间宽度之间的关系。

(1)当平均值是95%时:

(2)当平均值是99%时

有置信区间的:

当置信度为95%时,为(141.996,144.100),当置信度为99%时,为(141.657,144.439)说明置信度越大估计精度越差。

3、

文件名:DATA09-03

文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。

变量说明:ID:Employee Code(雇员代码) GENDER:性别 BDATE:Date of Birth(出生日期)

EDUC:Educational Level (years)(受教育年份) JOBCAT:Employment Category(工作地位)SALARY:Current Salary(当前工资) SALBEGIN:Beginning Salary(起始工资)JOBTIME:Months since Hire(雇佣月份) PREVEXP:Previous Experience (months)(以前工作经历) MINORITY:Minority Classification(特殊群体) AGE:年龄

A、请分别求出该银行中男雇员、女雇员工资平均值的95%的置信区间。

Case Processing Summary

Cases

Valid Missing Total

Gender N Percent N Percent N P ercent

Current

Salary

Female 216 100.0% 0 .0% 216 100.0%

Male 258 100.0% 0 .0% 258 100.0%

Descriptives

Gender Statistic S td. Error

Current

Salary

Female Mean $26,031.9

2

$514.26

95% Confidenc Lower

Bound

$25,018.2

9

e Interval for Mean

Upper Bound $27,045.5

5

5% Trimmed

Mean $25,248.3

Median $24,300.0

Variance 57123688.

268

Std.

Deviation

$7,558.02

Minimum $15,750

Maximum $58,125

Range $42,375

Interquartil

e Range

$7,012.50

S kewness 1.863 .166

Kurtosis 4.641 .330

Male Mean $41,441.7

8

$1,213.97

95% Confidenc e Interval for Mean Lower

Bound

$39,051.1

9

Upper Bound

$43,832.37

5% Trimmed Mean

$39,445.87

Median

$32,850.00

Variance

380219336.303

Std. Deviation

$19,499.21

Minimum

$19,650

Maximum

$135,000

Range

$115,350

Interquartil e Range

$22,675.00

S kewness

1.639 .152

Kurtosis

2.780 .302

所以得女职工工资均值的置信度为95%的置信区间为:(25,018.29,27,045.55) 男职工工资均值的置信度为95%的置信区间为:(39,051.19,43,832.37) B 、请计算出男女平均工资差异的95%的置信区间,并对差异程度做出解释。

Group Statistics

Gender

N

Mean

Std. Deviation Std. Error Mean

Current Salary

Male 258 $41,441.7$19,499.2$1,213.97

8

1

Female

216 $26,031.92

$7,558.02 $514.26

Independent Samples Test

Levene's

Test for Equality of Variances

t-test for Equality of

Means

F

Sig.

t

df

Sig.

(2-tailed) Mean Difference Std. Error

Difference 95% Confidenc e Interval

of the Difference

Lower U pper

Current Salary

Equal variances assumed 119.669

.000

10.945

472

.000 $15,409.86

$1,407.91 $12,643.32 $18,176.4

Equal variances

not assumed

11.688

344.262

.000 $15,409.86

$1,318.40 $12,816.73 $18,003.0

由图的置信区间为: (12,643.32,12,816.73)

C 、请求出雇员当前工资与起始工资平均值的95%的置信区间。、

Paired Samples Statistics

Mean

N

Std. Deviation Std. Error Mean

Pair 1

Current Salary $34,419.57 474 $17,075.66 $784.31

Beginning Salary

$17,016.0

9 474 $7,870.64 $361.51

Paired Samples Correlations

N Correlation S ig.

Pair 1

Current

Salary &

Beginning

Salary

474 .880 .000 Paired Samples Test

Paired Difference

s t df S ig.

(2-tailed)

Mean Std.

Deviation Std. Error

Mean

95%

Confidenc

e Interval

of the

Difference

Lower Upper

Pair 1

Current Salary - Beginning

Salary $17,403.4

8

$10,814.6

2

$496.73 $16,427.4

1

$18,379.5

6

35.036 473 .000

由结果的置信区间为:(16,427.41,18,379.56)

4、

文件名:DATA10-04

文件说明:29名13岁男生的身高、体重、肺活量数据。

变量说明:no:编号;height: 身高; weight: 体重; vcp : 肺活量.

请求出身高大于等于155cm(≥155cm)与身高小于155cm(<155cm)的两组男生体重与肺活量平均值的95%的置信区间。

由图的置信区间为:对于体重来说为(3.3231,10.1288)

对于肺活量来说(0.07110,0.70534)

5、

文件名:DATA11-03

文件说明:10位高血压患者在施以体育疗法前后测定舒张压的数据。

变量说明:number:编号pretreat:治疗前舒张压(mmHg) posttreat:治疗后舒张压(mmHg) 请求出治疗前与治疗后患者血压平均值差异的95%的置信区间。说明体育疗法对高血压有无治疗效果。

由t值为5.639不在区间(10.180,23.820)内,所以认为体育疗法对高血压有治疗效果。

6、

文件名:DATA11-04

文件说明:经过严格挑选12名排球运动员用新训练方法进行训练,训练前后分别测试6项技术指标的数据。

变量说明:NUMBER:编号;BHAND:前手形控制;AHAND:后手形控制;BCFC1:前睁眼力控制;ACFC1:后睁眼力控制;BCFC2:前闭眼力控制;

ACFC2:后闭眼力控制;BACUR:前准确性;AACUR:后准确性;BFOCL:前左用力感;AFOCL:后左用力感;BFOCR:前右用力感;ADOCR:后右用力感

请计算出训练前后手形控制、睁眼力控制、闭眼力控制、准确性平均值差异95%的置信区间。对新训练方法的效果做出说明。

(1)

训练前后手形控制平均值差异95%的置信区间是(-1.5111,-0.7389)t=-6.413不在区间内所以认为新训练方法的有效果。

(2)

训练前后睁眼力控制平均值差异95%的置信区间是(-4.412,-1.421)t=-4.293在区间内所以认为新训练方法的无效果。

(3)

训练前后闭眼力控制平均值差异95%的置信区间是(-5.600,-3.400),t=-9.000不在区间内所以认为新训练方法的有效果。

(4)

训练前后准确性平均值差异95%的置信区间是(-6.099,-3.567),t=-8.403不在区间内所以认为新训练方法的有效果。

7、

文件名:DATA18-27

文件说明:150名三岁女童身高数据。

请计算出身高在85cm-100cm之间的三岁女童所占的比例,第10%,30%,70%分位数。

Statistics

第10%,30%,70%分位数分别为:86.540,90.130,94.970。

Hight (cm)

Hight (cm)

1 .7 .7 7.3 85.2

1 .7 .7 8.0 85.7

1 .7 .7 8.7 86.2

1 .7 .7 9.3 86.4

1 .7 .7 10.0 86.5

1 .7 .7 10.7 86.9

1 .7 .7 11.3 87.1

1 .7 .7 12.0 87.2

1 .7 .7 12.7 87.3

1 .7 .7 13.3 87.4

1 .7 .7 14.0 87.6

1 .7 .7 14.7 87.9

1 .7 .7 15.3 88.0

1 .7 .7 16.0 88.1

1 .7 .7 16.7 88.2

2 1.

3 1.3 18.0 88.4

1 .7 .7 18.7 88.5

1 .7 .7 19.3 88.7

1 .7 .7 20.0 88.9

2 1.

3 1.3 21.3 89.0

2 1.

3 1.3 22.7 89.1

1 .7 .7 23.3 89.2

3 2.0 2.0 25.3 89.3

1 .7 .7 26.0 89.4

1 .7 .7 26.7 89.7

1 .7 .7 27.3 89.8

3 2.0 2.0 29.3 90.0

1 .7 .7 30.0 90.1

1 .7 .7 30.7 90.2

2 1.

3 1.3 32.0 90.3

1 .7 .7 32.7 90.4

1 .7 .7 33.3 90.5

1 .7 .7 34.0 90.6

1 .7 .7 34.7 90.7

2 1.

3 1.3 36.0 90.8

3 2.0 2.0 38.0 91.1

1 .7 .7 38.7 91.3

1 .7 .7 39.3 91.4

3 2.0 2.0 41.3 91.7

1 .7 .7 42.0 91.8

1 .7 .7 42.7 91.9

1 .7 .7 43.3 92.1

1 .7 .7 44.0 92.3

1 .7 .7 44.7 92.4

2 1.

3 1.3 46.0 92.5

1 .7 .7 46.7 92.6

2 1.

3 1.3 48.0 92.7

3 2.0 2.0 50.0 92.8

2 1.

3 1.3 51.3 92.9

1 .7 .7 52.0 93.0

1 .7 .7 52.7 93.1

2 1.

3 1.3 54.0 93.2

1 .7 .7 54.7 93.3

1 .7 .7 55.3 93.4

1 .7 .7 56.0 93.5

3 2.0 2.0 58.0 93.6

1 .7 .7 58.7 93.7

1 .7 .7 59.3 93.8

1 .7 .7 60.0 93.9

1 .7 .7 60.7 94.0

1 .7 .7 61.3 94.2

3 2.0 2.0 63.3 94.3

3 2.0 2.0 65.3 94.4

1 .7 .7 66.0 94.5

1 .7 .7 66.7 94.6

2 1.

3 1.3 68.0 94.7

2 1.

3 1.3 69.3 94.8

1 .7 .7 70.0 94.9

1 .7 .7 70.7 95.0

4 2.7 2.7 73.3 95.1

1 .7 .7 74.0 95.5

2 1.

3 1.3 75.3 95.6

1 .7 .7 76.0 95.8

1 .7 .7 76.7 96.0

2 1.

3 1.3 78.0 96.2

1 .7 .7 78.7 96.3

1 .7 .7 79.3 96.4

1 .7 .7 80.0 96.5

1 .7 .7 80.7 96.6

1 .7 .7 81.3 96.7

1 .7 .7 82.0 96.8

2 1.

3 1.3 83.3 97.0

1 .7 .7 84.0 97.1

1 .7 .7 84.7 97.2

由表格的85cm的累积百分比为6.7%,100cm的累积百分比94.7%,所以身高在85cm-100cm之间的三岁女童所占的比例为94.7%-6.7%=88%。

第10%,30%,70%分位数分别为:86.540,90.130,94.970。

8、

文件名:University of Florida graduate salaries

文件说明:University of Florida毕业生的起始工资、专业的数据。

变量说明:graduate: 毕业生编号; gender: 性别; college: 所在学院;

salary: 起始工资; degree: 学位; graddate: 毕业时间.

A、请问各学院(④企业管理、⑦工程)(①农业学、⑤林业学)间毕业生工资平均值差异的95%的置信区间。

(1)

Group Statistics

Independent Samples Test

Sig=0.744〉0.025所以两者方差无差异。由于sig=0.000<0.025所以对于均值来说两者有差异。

企业管理、工程间毕业生工资平均值差异的95%的置信区间是(-6926.450,-6922.484)。

(2)

Group Statistics

Independent Samples Test

由于sig=0702〉0.025所以两者方差无差异,sig=0.380〉0.025,所以接受原假设,认为两者均值无差异。农业学、林业学间毕业生工资平均值差异的95%的置信区间(-5914.738,-50749.169)。

B、构造企业管理毕业生中男、女平均工资差异的95%的置信区间,并做出解释。

Group Statistics

Independent Samples Test

由于sig=0.854在区间(2.5%,97.5%)之间,所以两者方差无差异。Sig=0.000<0.025所以拒绝原假设,认为两者有明显差异。

男、女平均工资差异的95%的置信区间是(1433.850,3080.142)。

C、说明平均工资高的专业与低的专业之间的差距。

解:

由第(1)知均值最大的是工程类专业,均值最小的是林业学专业。所以比较两者既可。

Group Statistics

Independent Samples Test

由于sig=0.744〉0.25所以两者方差无差异,对于均值sig=0.000<0.025所以拒绝原假设,认为两者有差异。工程类专业的工资比林业学的最少高5199.181,最多高6926.450。

9

日本的管理人员和工人比美国的同行目的性更明确?为了对这个问题的一个方面进行研究,研究人员对日本和美国的中年企业经理进行了调查。从东京和大阪两地选出100名经理组成日本样本,而美国样本则由不得221名来自贝尔系统的管理人员组成。对每一名管理人员均进行萨尔诺夫(Sarnoff Survey of Attitudes Toward Life,SSATL)籍以测量向上流动的动力。SSATL分数汇总于下表(较高分数代表较强的向上流动动力)。

美国管理人员日本管理人员

样本容量

平均SSATL分数标准差211

65.75

11.07

100

79.83

6.41

(1)对美国和日本管理人员求平均SSATL分数之差的95%置信区间。

相关主题
文本预览
相关文档 最新文档