当前位置:文档之家› spss练习题及简 答

spss练习题及简 答

spss练习题及简 答
spss练习题及简 答

SPSS练习题

1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。先排序data---sort cases再合并data---merge files

2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。转换Data---transpose,输题目

3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。选取数据data---select cases

4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。排序data---sort cases一个一个选,加

5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。计算transform---count按个输,把所有课程选取,define设区间,再排序

6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptive statistics---descriptives,全选,options。先拆分data---split file 按性别拆分,analyze---descriptive statistics---descriptives全选所有课程options---mean

7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。数据分组Transform---recode---下面一个,输名字,change,old,range,new value---add 挨个输,从小加到大,等距

8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。(计算transform---count或)选取data---select cases

9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。Analyze--- descriptive statistics---frequencies

10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。An DS d Analyze---Descriptive Statistics---Descriptives,选择存款金额到Variable(s)中。按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variable

list.然后按continue,ok

11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。

Transform compute课程平均分=mean() analyze->compare means->independent-samples T;选择若干变量作为检验变量到test variables框(课程平均分);选择代表不同总体的变量(sex)作为分组变量到grouping variable框;.定义分组变量的分组情况Define Groups...:(填1,2)。1.两总体方差是否相等F检验:F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaual variances assumend。2.两总体均值的检验:.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。

配对差异:analyze->compare means->paired-samples T…paired variables框中每科与不同科目配对很麻烦略

12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为

75,现从雇员中随机随出11人参加考试,得分如下:80、81、72、60、78、65、56、79、

77、87、76,请问该经理的宣称是否可信?

步骤:采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:Analyze->compare means->one-samples T test;指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t 统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。

13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图,

并利用LSD方法进行多重比较检验。单因素方差分析对比图为options中的descriptives

LSD为post…中的P值大于a接受所以无关

14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相

差是否显著?(example1.sav)(显著性水平为5%)

表1:急性心肌梗塞患者治疗后24小时生死情况

·提出假设

H0:是否接受治疗的急性心肌梗塞患者的病死率相差不显著

H1:是否接受治疗的急性心肌梗塞患者的病死率相差显著

·操作步骤:

1、打开数据文件:file-open-data-example1.sav

2、对count变量进行weight cases处理:data-weight cases

选中weight cases by;在Frequencies variable中加入变量count。

3、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3-1:

用descriptive-cross tab过程,column填status, row填group。

在cell选项中,选中percentages,以计算频数百分比。

·统计表格及分析:

表3-1 是否接受治疗与生存状况的相关性检验成果表(Chi-Square Tests)

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 6.040(b) 1 .014

Linear-by-Linear Association 6.015 1 .014

有效个案数240

表3-1是相关性卡方检验成果表。表中依次列出了Pearson卡方系数、线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp. Sig. (2-sided))。

表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。

表3-2 急性心肌梗塞患者是否治疗与生死情况的列联表

状况(status) 总数

生存死亡

分组(group)) 用单参注射液Count 185 10 195

% within 分组(group) 94.9% 5.1% 100.0% 未用单参注射液Count 38 7 45

% within ·分组(group) 84.4% 15.6% 100.0%

总数Count 223 17 240

% within ·分组(group) 92.9% 7.1% 100.0%

·结论:

根据表3-1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。

15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?(example2.sav)(显著性水平为5%)

表2:两化疗组的缓解率比较

同上小于拒绝显著

16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?(example3.sav)(显著性水平为5%)同上小于拒绝显著

表3:我国南北方鼻咽癌患者病理组织学分类构成

17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。

1、打开数据文件:file-open-data-child.sav

2、均值比较与检验:Analyze-Compare means-means

3、在independent V ar. 中选性别,dependent V ar. 中选体重和身高

4、在option子框中选择median/mean/Std. Deviation

1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。

2、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。

3、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。

18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?(显著性水平为5%)

·提出假设:

1、H0:身高与体重受到年龄的影响不显著

H1:身高与体重受到年龄的影响显著

2、H0:身高与体重受到性别的影响不显著

H1:身高与体重受到性别的影响显著

·操作步骤:

1、打开数据文件:file-open-data-child.sav

2、均值比较与检验:analysis-compare means-means

3、在independent V ar. 中选性别和年龄,dependent V ar. 中选体重和身高

4、在option子框中选择median/mean/ Std. Deviation

在statistic for first layer 区域内勾上ANOV A table and eta复选框

·统计表格及分析:

表7-1 体重、身高与年龄的方差分析表

Sum of Squares df Mean

Square F Sig.

体重(x4,kg) * 年龄(age) Between Groups 286.215 2 143.107 23.518 .000

Within Groups 565.918 93 6.085

Total 852.133 95

身高(x5,cm) * 年龄(age) Between Groups 1757.707 2 878.853 52.567 .000

Within Groups 1554.855 93 16.719

Total 3312.562 95

在表7-1中,分别列出了平方和(Sum of Squares)、自由度(df)、均方差(Mean Square)、

F值以及F值的显著性水平(Sig.)。F对应的概率值P(sig)<α(α=0.05);故拒绝原假设,接受备择假设,即身高与体重受到年龄的影响显著。

表7-2 体重、身高与性别的方差分析表

Square

体重(x4,kg) * 性别(x2) Between Groups 1 .839 .093 .762 Within Groups 94 9.056

Total

95 身高(x5,cm) * 性别(x2) Between Groups 1 .105 .003 .956

Within Groups 94 35.239

Total

95

在表7-2中,F 对应的概率值P(sig)>α(α=0.05);故接受原假设,即身高与体重受到性别的影响不显著。

19、文件example.sav 中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受专业训练后同学们的铁饼成绩有无显著提高?(显著性水平为5%)

统计表格及分析:

表8-1 配对样本的相关性分析表

H 0: 铁饼(训练前)和 铁饼(训练后)的数据之间不存在线性关系 H 1: 铁饼(训练前)和 铁饼(训练后)的数据之间存在线性关系

表8-1列出了配对样本的个数(N )、相关系数(Correlation )、显著性概率(Sig.)。显著性概率趋近于0,远小于0.05,所以认为铁饼(训练前)和 铁饼(训练后)的数据之间存在线性关系。

表8-2 配对样本T 检验的成果表

Paired Differences

t

df

Sig.

(2-tailed)

Mean Std.

Deviation

Std. Error Mean 95% Confidence Interval of the Difference

Lower

Upper

Pair 1

铁饼(训练前) - 铁饼(训练后)

-.2417

.4323

.0882

-.4242

-.0591 -2.739

23

.012

表8-2中为铁饼(训练前)和 铁饼(训练后)的数据的T 检验结果。表中前4项分别

为配对样本数据差异的均值(Mean )、标准离差(Std. Deviation )、均值的标准差(Std. Error

Mean)以及95%置信区间。后3项为t值(t)、自由度(df)和双尾显著性概率(Sig. (2-tailed))。

表中双尾显著性概率为0.012,远小于0.05,故拒绝原假设,接受备择假设,认为配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩提高显著。

·结论:

铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系。且配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩有显著提高。

20、文件example.sav中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩(英文+中文)之间有无显著差异?(显著性水平为5%)做法:先计算出总成绩,计算方法:Transform菜单栏下的Compute V ariable选项

总成绩计算出来之后,选择Analyze选项下Compare Means选项下“两独立样本T检验”

选项卡

将总成绩放入Test V ariable一栏中,性别放入Grouping V ariable一栏中并为其定义。

点Ok即可得出结果。

结果分析:方差齐次性,采用F检验,0.235,大于0.05,所以认为男女生总成绩两样本的的方差是没有显著性差异的;

校正t检验的显著性水平Sig(2-tailed)为0.951,大于0.05,所以男女生总成绩之间没有显著性差异。

21、根据以往的资料,学生中文的平均成绩为80分。文件example.sav中列出了某学校四个年级学生的中文成绩,问学生中文成绩有无显著的下降?(显著性水平为5%)

·提出假设:

H0 :μ=50(μ-50=0);即学生中文成绩无显著的下降。

H1:μ≠50(μ-50≠0);即学生中文成绩有显著的下降。

·操作步骤:

1、打开数据文件:file-open-data-example.sav

2、单一样本的均值检验:analysis-compare means-One Sample T Test

3、在test value 中输入80,在test V ariable中选“中文”。

4、在options中输入显著性水平5%

·统计表格及分析:

表9-1 数据统计量表

N Mean Std. Deviation Std. Error Mean

中文24 78.54 11.159 2.278 表9-1为单样本数据的统计量表,列出了变量“中文”对应的数据个数(N)、均值(mean)、标准离差(Std. Deviation)、均值的标准差(Std. Error Mean)。

表9-2 单样本均值检验成果表

表9-2为单样本均值检验的成果表。表中分别为t值(t)、自由度(df)和双尾显著性概率(Sig. (2-tailed))均值差(Mean Difference)以及均值差的95%置信区间。

表中的显著性概率为0.528,远大于0.05;因此,可以认为该样本数据的均值与总体均值之间没有显著差异。故接受原假设,即学生中文成绩无显著的下降。

·结论:

样本数据的均值与总体均值之间没有显著差异,即学生中文成绩无显著的下降。

22、文件example.sav中列出了某学校四个年级同学的英文成绩,问学生英文成绩是否受到年级因素的影响?(显著性水平为5%)

H0 :μ1 =μ2 =μ3;即学生英文成绩不受年纪影响。

H1:μ1、μ2、μ3不完全相等;即学生英文成绩受年纪影响。

·操作步骤:

1、打开数据文件:file-open-data-example.sav

2、单因方差分析检验:Analysis→Compare Means→One-Way ANOV A

3、在“dependent list”列表中输入变量名“英语”;在“factor”文本框中输入变量名“年

纪”。

4、在options中输入显著性水平5%

·统计表格及分析:

表10-1 数据方差分析表

Sum of

Squares df Mean Square F Sig.

Between Groups 105.000 3 35.000 .283 .837 Within Groups 2475.000 20 123.750

Total 2580.000 23

表10-1中分别列出了方差来源、平方和(Sum of Squares)、自由度(df)、均方差(Mean Square)、F值以及F值的显著性水平(Sig.)。由于表中的显著性水平为0.837,远大于0.05;

故接受原假设,即认为学生英文成绩不受年级影响。

23、已知10名20岁男青年身高与臂长的数据,请计算其相关系数,身高与臂长间存在显著的相关关系吗?(显著性水平为5%)(example4.sav)

表4青年身高与臂长的数据

·提

H0 :身高与臂长间不存在显著的相关关系。

H1: 身高与臂长间存在显著的相关关系。

·操作步骤:

1、打开数据文件:file-open-data-example4.sav

2、相关性检验:Correlation-Bivariate

3、选择Pearson(积距相关);在option子框中选择means/Sd.

·统计表格及分析:

表11-1 描述统计量表

Mean Std. Deviation N

身高(cm)172.50 10.341 10

臂长(cm)45.40 2.951 10

表11-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。

表11-2 相关分析成果表

身高(cm)臂长(cm)身高(cm)Pearson Correlation 1 .823(**)

Sig. (1-tailed) .002

N 10 10 臂长(cm)Pearson Correlation .823(**) 1

Sig. (1-tailed) .002

N 10 10

** Correlation is significant at the 0.01 level (1-tailed)

表11-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著

性检验概率(Sig. (1-tailed))和数据组数(N)。脚注内容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,显著性概率为0.002,远小于0.05,故拒绝原假设,接受备择假设;可以认为身高和臂长的数据有较强的相关性。

·结论:

根据相关性分析结果,可知身高与臂长间存在显著的相关关系,其相关系数为0.823,属于强相关。

24、已知学生铁饼与标枪的数据,请计算其相关系数?(example.sav)

·提出假设:

H0 :学生铁饼与标枪成绩之间不存在显著关系。

H1: 学生铁饼与标枪成绩之间存在显著关系。

·操作步骤:

1、打开数据文件:file-open-data-example.sav

2、相关性检验:Correlation-Bivariate

3、选择Pearson(积距相关);在option子框中选择means/Sd.

·统计表格及分析:

表12-1 描述统计量表

表11-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。

表12-2 相关分析成果表

标枪(m)铁饼(训练前)标枪(m)Pearson Correlation 1 .644(**)

Sig. (1-tailed) .000

N 24 24 铁饼(训练前)Pearson Correlation .644(**) 1

Sig. (1-tailed) .000

N 24 24

** Correlation is significant at the 0.01 level (1-tailed).

表12-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig. (1-tailed))和数据组数(N)。脚注内容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,显著性概率趋近于0,故拒绝原假设,接受备择假设,即学生铁饼与标枪成绩之间存在显著关系。

·结论:

学生的铁饼与标枪的数据有较强的相关性,其相关系数为0.644。

25、已调查97名儿童的生长发育数据,其中有左眼视力(x9)、右眼视力(x10),并已建立数据文件child.sav。试问左眼视力(x9)与右眼视力(x10)间有无相关关系?(显著性水平为5%)

·提出假设:

H0 :μ1-μ2=0,即左眼视力与右眼视力间不存在显著的相关关系。

H1: μ1-μ2≠0,即左眼视力与右眼视力间存在显著的相关关系。

·操作步骤:

1、打开数据文件:file-open-data-child.sav

2、相关性检验:Correlation-Bivariate

3、选择Pearson(积距相关);在option子框中选择means/Sd.

4、在options中输入显著性水平5%

·统计表格及分析:

表13-1 描述统计量表

Mean Std. Deviation N

左眼视力(x9) 1.039 .2946 96

右眼视力(x10) 1.033 .2933 96

表13-1为描述统计量表。表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。

表13-2 相关分析成果表

左眼视力(x9) 右眼视力(x10)

左眼视力(x9) Pearson Correlation 1 .779(**)

Sig. (1-tailed) .000

N 96 96

右眼视力(x10)Pearson Correlation .779(**) 1

Sig. (1-tailed) .000

N 96 96 ** Correlation is significant at the 0.01 level (1-tailed).

表13-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig. (1-tailed))和数据组数(N)。脚注内容显示相关分析结果在0.01的水平上显著。另外,从表中可以看出,显著性概率趋近于0,远小于0.05,故拒绝原假设,接受备择假设;可以认为儿童左眼视力与右眼视力有较强的相关性。

·结论:

儿童左眼视力与右眼视力有较强的相关性,其相关系数为0.779。

26、某地29名13岁男童身高(x1,cm),体重(x2,kg)及肺活量(y,L)的实测数据文件是:example5.sav。试计算其简单相关系数,当体重(x2)被控制(即固定)时,计算身高(x1)与肺活量(y)的偏相关系数r31.2,并作假设检验

·提出假设:

H0 :身高与肺活量的偏相关系数与零无显著差异。

H1:身高与肺活量的偏相关系数与零有显著差异。

·操作步骤:

1、打开数据文件:file-open-data-example5.sav

2、偏相关计算:Analyze-Correlate-Partial

3、把参与分析的变量”身高”、”肺活量”选择到V ariables;将控制变量”体重”选择到Controlling for。

在option中的statistics中选择Zero-order Correlations,表示输出零阶偏相关系数。

·统计表格及分析:

表14-1 偏相关因素的偏相关分析成果表

Control Variables 身高(cm) 肺活量(L) 体重(kg) -none-(a) 身高(cm) Correlation 1.000 .588 .742

Significance

. .001 .000

(2-tailed)

df 0 27 27

肺活量(L) Correlation .588 1.000 .736

Significance

.001 . .000

(2-tailed)

df 27 0 27

体重(kg) Correlation .742 .736 1.000

Significance

.000 .000 .

(2-tailed)

df 27 27 0 体重(kg) 身高(cm) Correlation 1.000 .093

Significance

. .639

(2-tailed)

df 0 26

肺活量(L) Correlation .093 1.000

Significance

.639 .

(2-tailed)

df 26 0

a Cells contain zero-order (Pearson) correlations.

由上表可以知道一系列简单相关系数和当体重被控制时,身高与肺活量的偏相关系数。检验统计量的概率P值为0.639,大于给定的显著性水平0.05;故接受原假设,认为身高与肺活量的偏相关系数与零无显著差异。

·结论:

1、男童身高与体重的简单相关系数为0.742;肺活量与身高的简单相关系数为0.588;体重与肺活量的简单相关系数为0.736。

2、身高与肺活量的偏相关系数为0.093,P=0.639。身高与肺活量的偏相关系数与零无显著差异,即身高与肺活量无显著的的偏相关。

27、世界各国的统计数据表明:妇女生育率与人均国民生产总值之间呈现出对数关系。请依据example6.sav中所提供的数据写出其回归方程与多元相关系数,在显著水平为5%时显著吗?[Analyze]→[Regression]→[Linear]

28、文件example7.sav中列出了我国分地区家庭年人均食品支出、人均收入与粮食单价的数据。请建立人均食品支出与人均收入间的一元线性回归方程,,同时建立人均食品支出与人均收入和粮食单价间的二元线性回归方程。

·操作步骤:

1、打开数据文件:file-open-data-example7.sav

2、线性回归:Analyze-Regression-Linear

3、一元线性回归方程:在dependent中输入变量“人均食品支出”;在independent中输入变量“人均收入”。--

4、二元线性回归方程:在dependent中输入变量“人均食品支出”;在independent中输入变量“人均收入”和“粮食单价”。

·统计表格及分析:

表15-1 相关系数矩阵

人均食品支出人均收入

Pearson Correlation 人均食品支出 1.000 .923

人均收入.923 1.000 Sig. (1-tailed) 人均食品支出. .000

人均收入.000 .

N 人均食品支出30 30

人均收入30 30

·提出假设:

H0 :人均食品支出和变量人均收入之间无显著关系。

H1:人均食品支出和变量人均收入之间有显著关系。

表15-1为相关系数矩阵。表中第二行为相关系数矩阵;第三行为不相关的显著性水平。变量人均食品支出和变量人均收入的相关系数为0.923,说明两者关系紧密。单尾显著性检验的概率值趋近于0,所以拒绝两变量没有相关性的假设,接受备择假设,即人均食品支出和人均收入之间有显著关系。

表15-2 数据方差分析表

Model Sum of

Squares df Mean Square F Sig.

1 Regression 878382.334 1 878382.334 161.149 .000(a)

Residual 152621.132 28 5450.755

Total 1031003.467 29

表15-2为方差分析表。利用该表作回归系数的显著性检验。表中列出了回归项(Regression)、残差项(Residual)的平方和(Sum of Squares)、自由度(df)、均方(Mean Square)F值和显著性概率(Sig.)。由于表中的显著性概率趋近于0,小于0.05;所以拒绝原假设,即认为回归系数不为零,回归方程是有意义的。

表15-3 一元线性回归方程系数表

表15-3中列出了变量人均收入和常数项的非标准化系数(Unstandardized Coefficients),标准化系数(Standardized Coefficients)、t值、显著性水平(Sig.)和自变量待定系数取值与常数项的95%置信区间。自变量还列出了各种相关性指标和线性统计量。

表中变量人均收入的显著性水平概率(sig.)趋近于0,所以变量的待定系数取值(B)是可靠的。所以人均食品支出与人均收入间的一元线性回归方程:Y=-53.086+0.422X

·同上方法,可进行二元线性回归方程计算。

表15-4 二元线性回归方程系数表

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig.

95% Confidence

Interval for B Correlations

Collinearity

Statistics B

Std.

Error Beta

Lower

Bound

Upper

Bound

Zero-

order Partial Part

Tolera

nce VIF

1 (Con

stant) -85.196

63.90

3

-1.333 .194 -216.314 45.922

人均

收入

.360 .040 .787 9.084 .000 .279 .442 .923 .868 .608 .596 1.678

粮食价格

187.621

76.27

5

.213 2.460 .021 31.117 344.124 .714 .428 .165 .596 1.678 表中变量“人均收入”和“粮食价格”的显著性水平概率(sig.)都小于0.05,故认为

其待定系数取值是可靠的。所以,人均食品支出与人均收入和粮食单价间的二元线性回归方

程二元方程:Y=-85.196+0.36X1+187.621X2

·结论:

1、人均食品支出与人均收入间的一元线性回归方程:Y=-53.086+0.422X

2、人均食品支出与人均收入和粮食单价间的二元线性回归方程二元方程:

Y=-85.196+0.36X1+187.621X2

29、钩虫病复查阳性率y和治疗次数x有如下关系:

表5:阳性率(y)和治疗次数(x)

Model B Std.

Error

Lower

Bound

Upper

Bound

Zero-

order Partial Part

Tolera

nce VIF

1 (Cons

tant)

-53.086 67.963 -.781 .441 -192.303 86.131

人均

收入

.422 .033 .923 12.694 .000 .354 .490 .923 .923 .923 1.000 1.000

请用曲线估计法作多种曲线拟合,并请指出那种拟合效果最好?为什么?(curve1.sav)[Analyze]→[Regression]→[CurveEstimation]

30、已知数据文件:hemoglo.sav。试分别建立Ca、Mg、Fe、Mn与Cu对hemog1的直线回归方程,并列出直线回归方程及其P值。注意方程如何写?

·操作步骤:

1、打开数据文件:file-open-data-hemoglo.sav

2、线性回归分析:Analyze-Regression-Linear

3、在independent中依次输入变量ca、Mg、Fe、Mn与Cu;

在dependent中输入变量hemog1。

·统计表格及分析:

表16-1 线性回归方程系数表1

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig. B

Std.

Error Beta

1 (Constant) 9.211 2.643 3.486 .002

钙(Ca) .022 .044 .097 .508 .616

表16-2 线性回归方程系数表2

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig. B

Std.

Error Beta

1 (Constant) 3.579 1.963 1.823 .079

镁(Mg) .203 .057 .569 3.598 .001

表16-3 线性回归方程系数表3

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig. B

Std.

Error Beta

1 (Constant) -.657 1.276 -.515 .611

铁(Fe) .029 .003 .863 8.894 .000

表16-4 线性回归方程系数表4

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig. B

Std.

Error Beta

1 (Constant) 11.158 .525 21.257 .000

锰(Mn) -50.364 28.441 -.323 -1.771 .088

表16-5 线性回归方程系数表5

Model Unstandardized

Coefficients

Standardized

Coefficients t Sig. B

Std.

Error Beta

1 (Constant) 8.250 1.764 4.676 .000

铜(Cu) 2.073 1.558 .248 1.331 .194

以上分别为Ca、Mg、Fe、Mn与Cu对hemog1的直线回归方程系数表。列出了变量人均收入和常数项的非标准化系数(Unstandardized Coefficients),标准化系数(Standardized Coefficients)、t值、显著性水平(Sig.)和自变量待定系数取值与常数项的95%置信区间。自变量还列出了各种相关性指标和线性统计量。

根据以上数据可以求出Ca、Mg、Fe、Mn与Cu对hemog1的直线回归方程。

·结论:

31、对数据文件:hemoglo.sav。进一步调用逐步回归法(Stepwise)、强迫剔除法(Remove)、向后逐步回归法(Backward)与向前逐步回归法(Forward)建立Ca、Mg、Fe、Mn与Cu 对hemog1的多元线性回归方程。

·题目分析:

题目中要求用不同的回归方法,建立不同变量之间的多元线性回归方程,显然需要进行回归分析。特别要注意不同的回归发法的各自的剔除变量的要求。

·操作步骤:

1、打开数据文件:file -open -data -hemoglo.sav

2、线性回归分析:Analyze -Regression -Linear

用enter 强行进入做事前分析。

表17-1 系数表

Model

Unstandardized Coefficients

Standardized Coefficients

t Sig.

B Std. Error

Beta

1

(Constant) 1.380 1.549 .890 .382 钙(Ca) -.069 .028 -.304 -2.500 .020 镁(Mg) .028 .053 .079 .534 .599 铁(Fe)

.028 .004 .821 6.730 .000 锰(Mn) -16.577 16.414 -.106 -1.010 .323 铜(Cu)

1.715

1.143

.205

1.501

.147

由表17-1 可知,除了Ca 和Fe 外的变量的回归系数显著性t 检验的概率p 值都大于显著性水平0.05。因此接受原假设,即这些变量与血红蛋白无显著的线性关系,不应引入方程,可剔除这些变量,仅保留Ca 和Fe 变量。

3、逐步回归法(Stepwise ):逐步回归法是对向前逐步回归法的改进,它既有引入变量,

也有剔除变量。

·统计表格及分析:

表17-2 变量输入输出表 由17-117-2。

spss练习题

spss练习题 1、设有13例健康人,11例克山病人的血磷测定值(mg%)如下表所示,问克山 病人的血磷是否高于健康者, 健康者 1.67 1.98 1.98 2.33 2.34 2.50 3.60 3.73 4.14 4.17 4.57 4.82 5.78 患者 2.60 3.24 3.73 3.73 4.32 4.73 5.18 5.58 5.78 6.40 6.53 1、计算二组的均数、中位数、标准差、方差、P5 P95的值 2、请判断二组数据的分布 2、请进行统计学检验 2. 频数表资料,或等级资料,的两样本比较 20名正常人和32名铅作业工人尿棕色素定性检查结果见下表。问铅作业工人 尿棕色素是否高于正常人, 人数秩和秩次结果平均秩次正常人铅作业工人合计范围正常人铅作 业工人 ,1, ,6, ,5, (2) (3) (4) (7)=(2)(6) (8)=(3)(6) - 18 8 26 1-26 13.5 243 108 , 2 10 12 27-38 32.5 65 325 ++ 0 7 7 39-45 42.0 0 294 +++ 0 3 3 46-48 47.0 0 141 ++++ 0 4 4 49-52 50.5 0 202 合计n=20 n=32 52 - - T=308 T=1070 1212 3 .肺结核及结核性胸膜炎各5例的血沉(一小时)值如下表,问两者的差别显 著否, 肺结核 12 20 30 8 15 结核性胸膜炎 80 50 30 30 70

(请注意,两组病人的个体差异差别大否即方差齐否,试用一般的t检验与将各原始数据化成常用对数(定值部可取三位小数)后作t检验。将结果比较一下,是否一致,此资料应采取哪一种方法处理为妥, 4(为了研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例, 2分别测定其抗凝血酶活力(mm),结果如下: 新药组:126 125 136 128 123 138 142 116 110 108 115 140 对照组:162 172 177 170 175 152 157 159 160 162 5、某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围神经麻痹的疗效,资料见表4-7,问三种疗法的有效率有无差别, 表4-7 三种疗法的有效率比较 疗法有效无效合计有效率% 物理疗法组 20 1 21 95.24 药物治疗组 16 2 18 88.89 外用膏药组 12 3 15 80.00 合计 48 6 54 88.89 6( 某单位研究三种不同穴位的镇痛效果,资料如表4-16。试检验针刺不同穴位的镇痛效果有无差别, 表4-16 针刺不同穴位的镇痛效果 各穴位的观察频数镇痛效果合谷足三里扶突 + 38 53 47 ++ 44 29 23 +++ 12 28 19 ++++ 24 16 33

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地职业 , 年龄 N Valid282282282 Missing00~ 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市] 200 边远郊区82 Total282 职业 ( Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24 商业服务业54 文教卫生18】公交建筑业15 经营性公司】 18 学校15

一般农户 35 种粮棉专业 户 4(种果菜专业 户 10 工商运专业户 ~ 34 退役人员17 金融机构35 现役军人3: Total282 、 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4/ 20~35岁146 35~50岁: 91 50岁以上41 Total282

《 分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

统计分析与SPSS的应用第五版课后练习答案第9章

《统计分析与SPSS 的应用(第五版)》(薛薇) 课后练习答案 第9章SPSS 的线性回归分析 1利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量, 利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程 成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条 分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore 和phy 两门成绩体系散点图 步骤:图形 旧对话框 散点图 简单散点图 定义 将fore 导入Y 轴,将phy 导入X 轴,将 sex 导入设置标记 确定。 00..00- O O O O O O O O 60.00- □ 8 □ □ ooo° cP O O OOD o O O 40 W- O O ° 0 °o O 0 o o o ° ° 0 o O O O 20.00- 0 ° 0 40.00 50.00 60.00 70.00 00.00 90.00 1M.OO

接下来在SPSS俞出查看器中,双击上图,打开图表编辑 '■-j female male

閒|匿恚層器-' * ;| !凹jW Array 在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线 性应用。

40.00 50 00 6G.Q0 70.00 00 00 90.00 1Q0.00 分析:如上图所示,通过散点图,被解释变量 y (即:fore )与解释变量phy 有一定 的线性关系。但回归直线的拟合效果都不是很好。 2、请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提, 回归分析则是相关分析的深入和继续。 相关分析需要依 靠回归分析来表现变量之间数量相关的具体形式, 而回归分析则需要依靠相关分析来表现变 量之间数量变化的相关程度。 只有当变量之间存在高度相关时, 进行回归分析寻求其相关的 具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之 前,就进行回归分析,很容易造成“虚假回归” 。与此同时,相关分析只研究变量之间相关 的方向和程度,不能推断变量之间相互关系的具体形式, 也无法从一个变量的变化来推测另 一个变量的变化情况,因此,在具体应用过程中, 只有把相关分析和回归分析结合起来,才 能达到研究和分析的目的。 线性回归分析是相关性回归分析的一种, 研究的是一个变量的增加或减少会不会引起另一个 变量的增加或减少。 3、请说明为什么需要对线性回归方程进行统计检验? 一般需要对哪些方面进行检验? 检验其可信程度并找 出哪些变量的影响显著、哪些不显著。 主要包括回归方程的拟合优度检验、 显著性检验、回归系数的显著性检验、 残差分析等。 线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释 变量和解释变量之间确实存在显著的线性关系。 00.00^ sex O female O male ■- female ^male Ft 2 ^140-)-0182 female: R 2 . ' = 0.208 male: R 2 ^n-0.16S 20.00- 60.00- 40.00- O O Q O

SPSS软件在医学科研中的应用-Logistic回归分析

SPSS软件在医学科研中的应用计算机实习(SPSS10.0) 何平平 北大医学部流行病与卫生统计学系

实习六Logistic回归分析

(一)Logistic回归分析的任务 影响因素分析在流行病学研究中,logistic回归常用于疾病 的危险 因素分析,logistic回归分析可以提供一个重要的指标: OR。 (二)Logistic回归分析的基本原理 1.变量特点因变量:二分类变量,若令因变量为y,则常 用y=1表 示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。

2.Logistic模型 Log P 1 P = ? +? 1 x 1 + ? 2 x 2 + ...... + ? m x m P=P(y=1|x),为发病概率;1-P=P(y=0|x),为不发病概率。?0为常数项,?1 ,?2 ….. ?m分别为m个自变量的回归系数。 模型估计方法:最大似然法(Maximum Likelihood Method)。构造似然函数(L ikelihood function )L= P(y=1|x) P(y=0|x),通过迭代法估计一组参数(?0,?1 ,?2 ….. ?m)使L达到最大。

3.自变量的相对重要性分析 衡量变量相对重要性的指标 (1)Wald值:(?i /SE(?i ))2,近似?2分布,用于检验自变量的显著性。 (2)对自变量作显著性检验的概率P值。当Wald值越大,P值越小时,自变量的影响就越大。 4.自变量的筛选与多元线性回归分析类似,有Forward法(实际上是逐 步向前法)、Backward法(默认方法为Enter,即所有自变量一次全部进入方程)。

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

SPSS习题1 答案

习题一(与第三章内容配套) 1.数据文件:《公司职工》 1)按照以下标准,给指定的变量观察值分组: (1)变量:educ(受教育年限) 中学:educ≤12;大学: 12<educ≤16;研究生:educ≥17 (2)变量:age(年龄) 青年:age<40;中年:40≤age<60;老年:age≥60 (3)变量:salary(当前薪金) 低收入:salary≤20000;中收入:20000<salary≤40000;高收入:salary>40000 2)统计老、中、青年各组的人数及占全体职工的比率。 3)统计不同性别的职工中,高、中、低收入的人数,及占全体职工人数的比率。 4)在不同的受教育组中,按性别(gender)统计的不同职务(jobcat)的人数及占全体职工人数的比率。 5)同3),但还要统计每一组的平均当前薪金(salary)、最大当前薪金和最小当前薪金。 2.数据文件:《学生考试成绩》 1)按以下要求,将成绩score分为五等:优:score≥90;良:80≤score<90;中:70≤score<80;及格:60≤score<70;不及格:score<60。 2)按照以上五个等级,统计每一个等级的人数及占总体的比率: (1)总体取全体参加考试的学生; (2)总体取每一个班级; (3)总体取男生及女生。 3)求全体参加考试学生的总平均成绩、每一班的平均成绩以及男、女生的平均成绩。 4)全体学生成绩的中位数是多少?男、女生成绩的中位数分别是多少?成绩在60分(含)以上的学生占全体学生的比率是多少?80%的学生成绩不低于多少分?每一班的最高分与最低分分别是多少? 5)在每一个班级中,分男、女生统计不同成绩等级的学生人数及每一等级的平均分、最高分与最低分。 答案: 1. 1)

SPSS软件练习试题

Spss第 4 次作业 第1题 (1)【实验目的】 学会用spss进行相关分析 (2)【实验内容】 1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果 这些数据能否说明企业的客户满意度与综合竞争力存在较强的正相关关系?为什么? (3)【操作步骤】 1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“综合竞争得分”导入“Y 轴”→将“客户满意度得分”导入“X轴”→确定; 2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用; 3.分析→回归→线性→添加客户满意度得分到因变量,综合竞争力的分到自变量→确定 (4)【输出结果】

输入/除去的变量a 模型输入的变量除去的变量方法 1 综合竞争力得分b. 输入 a. 因变量:客户满意度得分 b. 已输入所请求的所有变量。 模型摘要 模型R R 方调整后 R 方标准估算的误差 1 .864a.747 .728 23.344 a. 预测变量:(常量), 综合竞争力得分 ANOVA a 模型平方和自由度均方 F 显著性1 回归20915.714 1 20915.714 38.381 .000b 残差7084.286 13 544.945 总计28000.000 14 a. 因变量:客户满意度得分 b. 预测变量:(常量), 综合竞争力得分

(5)【结果分析】 拟合线性直线的方程为:y=10.86+0.86x, 相关系数r为0.864,当显著性水平α为0.01时拒绝原假设,表明两个变量(企业的客户满意度与综合竞争力)之前具有较强的线性关系,相关性显著。 第2题 (1)【实验目的】 学会用spss进行相关分析 (2)【实验任务】 绘制散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。 (3)【操作步骤】 1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“1950年每百万男子中死 于肺癌的人数”导入“Y轴”→将“1930年人均香烟消耗量”导入“X轴”→确定;

最新spss统计练习题及答案

SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单?

SPSS实际操作练习题

实习一SPSS基本操作 第1题:请把下面的频数表资料录入到SPSS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加 入Variable框━点击Statistics按钮━选中Mean和 Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第2题某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆 固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。

卫生统计学习题软件分析教程习题SPSS03

第三篇常用推断方法 二、综合分析题 1.略 2.略 3.为了解某校本科学生体质合格率的性别差异,随机抽查了本科男生 110人和女生 130 人,其中男生有 100 人合格,女生有 70 人合格,请问该校本科男女生体质合格率是否不同? 表3-1某校本科学生体质合格率 体质状况合格不合格合计 男100 10 110 女70 60 130 合计170 160 240 【操作】 (1)数据准备 1)定义变量:性别(Value定义:1=男,2=女)、结果(Value定义:0=合格,1=不合格)、频数。输入数据,如图3-1所示。 图3-1 SPSS的Date View窗口 2)频数加权:点击Data菜单下的Weigh Cases选项,弹出Weigh Cases对话框,如图3-2,选择Weigh cases by,选中变量“频数”将其送入Frequency Variable框中,如图3-3所示,单击OK。

图3-2 Data→Weigh Cases 图3-3 Weigh Cases对话框 (2)统计分析 1)点击Analyze菜单下的Descriptive Statistics子菜单,选择Crosstabs选项,如图3-4所示,系统弹出Crosstabs主对话框,选择变量“性别”将其送入Row(s)框内,选择变量“体质状况”将其送入Column(s)框中,如图3-5所示。

图3-4Analyze→DescriptiveStatistics→Crosstabs 图3-5 Crosstabs主对话框 2)单击右侧的Statistics,弹出Statistics子对话框,选择Chi-square,如图3-6所示,单击Continue返回。 图3-6 Statistics子对话框图9-13 Cells子对话框

spss统计练习题及答案

SPSS 统计练习题及答案 一、选择题(选择类) (A )1、在数据中插入变量的操作要用到的菜单是: A In sert Variable; B In sert Case; C Go to Case; D Weight Cases (C )2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases ; B Select Cases ; C Compute ; D Categorize Variables (C )3、Transpose 菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A ) 4、用One-Way ANOVAS 行大、中、小城市 16岁男性青年平均身高的比较,结果给出 sig=,说明: A. 按照显著性水平,拒绝 H,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; D. 说明城市不是身高的一个影响因素 (B ) 5、下面的例子可以用 Paired-Sampies T Test 过程进行分析的是: A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D 性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files 菜单用于合并数据库有两种情况:如果两数据库变量相同,是 —变量—的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推 断时能进行卡方检验的菜单是 Crosstabs ____ 。 8 One-Sampies T Test 过程用于进行_样本所在总体均数 _______ 与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures :重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结 果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test :卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的 比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是 25%,或者是否符合我们所给出的一个比例(如分别为 10% 四、简答题(问答类) 11、 用SPSS 对数据进行分析的基本流程是什么 答:(1 )、将数据输入SPSS 并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等) (3 )、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、 对数据进行方差分析时, Uni variate 菜单和Multivariate 答:当因变量只有一个时,使用 Uni variate 菜单,当因变量不止一 个时,使用 13、 简述SPSS 打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单 File==>Open==>Data 或直接单击快捷工具栏上的打开按钮; (2) 、使用数据库查询打开:选择菜单 File==>Open Database==>New Query ,根据向导打开数据; (3) 、使用文本向导读入文本文件:选择菜单 F ile==>Read Text Data 14、 指定数据按某个变量进行排序需要用到哪个菜单 _观测对象—的合并;如果不同,则是 30% 40%和 20%)。 ,以确定应采用的检验方法; 菜单最大的区别是什么 Multivariate 菜

SPSS练习题及解答

实习一SP SS基本操作 第2题-----会做:请把下面的频数表资料录入到SP SS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加入Variable框━点击Statistics按钮━选中Mean和Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第3题—会做:某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。 2、Analyze━Descriptive Statistics━Frequences━将变量值加入Variable框━点击Statistics按钮━选中Mean━Continue━点击OK 实习二定量资料的统计分析 第1题--会做:从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(m m o l/L)的测量结果如下,试对其进行正态性检验。 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 解答:样本量大,近似于正态。 1、输入数据(1列,101行)。 2、Analyze━Descriptive Statistics━Explore━Dependent List中加入血清总胆固醇━点击Plots按钮━选中normality plots with tests━Continue━ OK 3、结果分析:T est of norminaty表中P=0.994,大于0.05,服从正态分布。 (会做)第2题:某医院分别用A、B两种血红蛋白测定仪器检测了16名健康男青年的血红蛋白含量(g/L),检测结果见下表。问:两种血红蛋白测定仪器的检测结果是否有差别。 编号仪器A仪器B (1)(2)(3) 1 113 140 2 125 150 3 126 138 4 130 120 5 150 140 6 145 145 7 135 135 8 105 115 9 128 135 10 135 130 11 100 120 12 130 133 13 110 147 14 115 125 15 120 114 16 155 165 解答:配对t检验。 1、输入两列数据:A列(113,125,…155);B列(140,125,…165); 2、Analyze━Compare Means━Paired-Samples T Test━同时将A和B均选入Paired Variabkes框━OK 3、结果分析:由Paired Samples Test表的Sig可见小于0.05,有差别。

spss练习题

Spss课程练习题 1、某年纪有80名学生,男女生各40人,分成2各班级,下面表1中是某次一门课程的成绩,请分性别、班级计算平均数、标准差等结果。表1 常用统计量:Analyze-Compare Means -Means 计算变量进dependent List分组变量进Independent List 2、10名学生的两门其中考试成绩见表2,请按总成绩的40%计算总分。表2 数据变换:Transform -Compute 3、将表1中的数据合并,即不再分组,试整理成频数分布表,绘制出频数分布图,计算出常用的统计量。频数分布:Analyze -Descriptive Staistics -Frequencies 4、正常人的脉搏平均数为72次/分。现测得15名患者的脉搏:71,55,76,68,72,69,56,70,79,67,58,77,63,66,78 试问这15名患者的脉搏与正常人的脉搏是否有差异? 单样本T检验:Analyze -Compare Means -One-sample T Test 5、收集了20名学生的自信心值,见表3,试问该指标是否与性别有关?表3 独立样本T检验:Analyze -Compare Means -Independent-sample T Test 6、将条件相近的学生配成对,再随机分成两组,采用两种不同的训练方法进行训练,训练一周后,测得两组学生跳高成绩如表4,试问两种训练方法的效果是否相同?表4

注:x1、x2表示两组学生的跳高成绩,单位厘米(cm) 配对样本T检验:Analyze -Compare Means -Paried-sample T Test 7、为了探讨不同教法对英语教学效果的影响,将一个班级随机分成3组,接受3种不同的教法,英语成绩见表5,试问不同的教法之间是否存在着差异。表5 单因素方差分析:因变量:英语成绩;自变量:教法;3种不同的水平:3种不同的教法 Analyze -Compare Means -One-Way ANOV A 8、4名工人操作3台机器,1天的日产量数据见表6,试问机器之间、工人之间在日产量上是否有差异表6 双因素方差分析(无交互作用):因变量,日产量;自变量,机器,有3个水平;工人,有4个水平Analyze -General Linlear Model -Univariate 9、一研究着选择了两种类型的文章(因素A):不熟悉(A1)、熟悉(A2),使用3种生字密度(因素B):5:1(B1)、10:1(B2)、20:1(B3),将24名五年级学生随机分为6组,测得数据见表7,试问文章类型之间、生字密度之间有无差异。表7 双因素方差分析(有交互作用):Analyze -General Linlear Model -Univariate 10、为研究学生的平时作文成绩x与高考作文成绩y的关系,随机抽取10名考生,数据见表8,试进行相关分析。表8 简单相关分析:Analyze -Correlate -Bivariate 11、一般来说物理成绩受数学成绩的影响较大,今收集到20名学生的物理、数学成绩,试建立用数学成绩预测物理成绩的回归方程。成绩见表9。表9 一元线性回归分析:Analyze -Regression -Linear

spss期末考试上机复习题(含答案)75709

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 83 78

2 3 4 5 6 69 87 93 78 59 65 88 91 72 59 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

SPSS练习题

长春中医药大学研究生统计学复习题 1、某中药厂用旧设备生产的六味地黄丸,丸重的均数8.9克,更新了设备后,从所生产的产品中随机抽取9丸,其重量为: 9.2, 10,9.6, 9.8, 8.6 ,10.3 ,9.9, 9.1, 8.9。 问设备更新前后药丸的平均重量是否有变化?(假设资料服从正态分布 ) (1)统计量值 (2)概率值p (3)统计结论 A.p<0 .05有显著性差异 . B.p>0 .05无显著性差异 . -----【标准答案】----- 【1】 3.118 【2】 0.014 【3】 a 或 A 2、对6份血清分别用原方法(检测时间 20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1 .问两法所得结果有无差别? (假设丙转氨酶不服从正态分布 ) 表 8-1 12 份血清用原法和新法测血清谷-丙转氨酶的比较 1 2 3 4 5 6 原法 60 142 195 80 242 220 新法 80 152 243 82 240 220

(1)统计量值 (2)概率值p (3)统计结论 A. p< 0.05有显著性差异. B. p> 0.05无显著性差异. -----【标准答案】----- 【1】 -1.625 【2】 0.104 【3】 b 或 B 3、随机抽样对吸烟与不吸烟人群是否患气管炎病进行调查,其结果如下,试检验吸烟与不吸烟患病率是否相同。 不同人群患病不患病合计 吸烟人群 50 250 300 不吸烟人群 5 195 200 合计 55 445 500 (1)统计量值 (2)概率p值 (3)统计结论 A. p< 0.05有显著性差异. B. p> 0.05无显著性差异. -----【标准答案】-----

SPSS练习题

SPSS练习题 1. 10名15岁中学生身高体重数据如下: 表1 10名15岁中学生身高体重数据 编号12345678910 性别男男男男男女女女女女 身高(cm)166.0169.0170.0165.1172.0159.4161.3158.0158.6169.0体重(kg)57.058.551.058.055.044.745.444.342.851.5 体重指数(BMI)=体重(kg) / 身高(m)2,即体重(kg)除以身高(m)的平方。回答下列问题: (1)男生体重指数的均数为19.74 (kg/m2);标准差为:1.54 (kg/m2) (2)女生体重指数的均数为17.57 (kg/m2);标准差为:0.38 (kg/m2) 2. 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组Ⅱ型糖尿病患者的ACE基因型分布有无差别? 表2 DN组与无DN组2型糖尿病患者ACE基因型分布的比较组别DD ID II合计 DN组42(37.8)48(43.3)21(18.9)111 无DN组30(21.7)72(52.2)36(26.1)138 合计72(28.9)120(48.2)57(22.9)249 3. 将14只大白鼠随机分为两组,一组做成白血病模型组,一组为正常鼠,然后测量两组鼠脾脏DNA含量(mg/g),问正常鼠和白血病鼠脾脏中DNA含量是否不同? 表3 白血病模型鼠和正常鼠脾脏中DNA含量(mg/g) 白血病组12.313.213.715.215.415.816.9 正常组10.811.612.312.713.513.514.8 4.用四种不同的饲料喂养大白鼠,每组4只,然后测其肝重占体重的比值(肝/体重比值,%),数据如下。试比较四组均数间有无差异? 表4 四组资料的肝重占体重比值(%)的测定结果 A饲料B饲料C饲料D饲料 2.62 2.82 2.91 3.92 2.23 2.76 3.02 3.00 2.36 2.43 3.28 3.32 2.40 2.73 3.18 3.04 5.某医院用三种疗法治疗慢性喉炎,治疗结果如下。试比较其疗效。

相关主题
文本预览
相关文档 最新文档