当前位置:文档之家› 统计学spss操作步骤及答题格式

统计学spss操作步骤及答题格式

根据往届资料及课堂笔记整理,仅供参考!

一、资料类型

定量资料:如血糖、身高、体重

等级资料:如大便潜血(-, +, ++, +++)、疗效(无效、好转、显效、痊愈) 分类资料:如证型诊断(气虚型、血瘀型、痰湿型)、治疗分组(一般针灸法、祖传针灸法) 二分类资料:如治疗效果(有效、无效)

二、实验设计

考察内容:随机分组,随机数表的利用 例:L2-2,L2-3,L2-4

需要说明所抄随机数的起始位置(行*,列*),也可以使用SPSS 软件生成随机数 先分组,再对不均衡的分组进行调整。

三、统计描述

频数分布表和频数分布图,例L3-1。

集中趋势指标:均数、几何均数、中位数、众数

离散趋势指标:极差、四分位数、标准差、变异系数

1 2

3

4、多组(K ≥3

5、计数资料:

6

7、双变量相关:相关系数

统计描述

例:随机测得某地20名正常人血糖结果如下,编制频数分布表,绘制频数分布图。

1. 分析→描述统计→频率→统计量

N Valid 20

Missing 0

Mean 均数475.3500

Std. Error of Mean 均数的标准误13.76748

Median 中位数485.5000

Mode 众数334.00a

Std. Deviation 标准差61.57005

Variance 方差3790.871

Skewness 偏度系数-.321

Std. Error of Skewness .512

Kurtosis 峰度系数.054

Std. Error of Kurtosis .992

Range 极差,全距251.00

Minimum 最小值334.00

Maximum 最大值585.

Sum 合计9507.00

Percentiles 25 435.5000

50 485.5000

75 523.5000

a. Multiple modes exist. The smallest value is shown

2. 分析→描述统计→探索→绘制带检验的正态图

Tests of Normality

Kolmogorov-Smirnov a(大样本)Shapiro-Wilk(n≤30,小样本)

Statistic df Sig. Statistic df Sig.

.099 20 .200*.982 20 .958

VAR

0001

a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.

一、统计量

n=20,均数x_=475.35 ,中位数M=485.50,众数M o= 334.00,

P25= 435.50 , P75=523.50 , X max=585.00, X min=224.00,R=251.00,方差S2=3790.87,标准差S=61.57

二、正态检验

①假设:H0:数据分布与正态分布无差异,

H1:数据分布与正态分布有差异,α=0.05,双侧检验。

单样本t检验(计量资料)

例:已知野生人参中M物质的含量服从正态分布,总体均值为63.5,今9次测得一批人工培植人参中M物质的含量为40.0、41.0、41.5、41.8、42.4、43.1、43.5、43.8、44.2,推断这批人工培植人参中M物质

┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉

配对样本t检验(计量资料)

例:为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,每对中的两只随机分到试验组和对照组,两组都接种肿瘤,试验组在接种肿瘤三天后注射30%的三棱莪术液0.5ml,对照

两独立样本t检验(计量资料)

例:某医师研究转铁蛋白测定对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒

性肝炎患者血清转铁蛋白含量的结果如下:

正常人:265.4、271.5、284.6、291.3、254.8、275.9、281.7、268.6、264.1、273.2、270.8、260.5

患者:256.9、235.9、215.4、251.8、224.7、228.3、231.1、253.0、221.7、218.8、233.8、230.9、240.7、260.7、224.4

方差分析(多组计量资料的检验)

例:研究单味中药对小白鼠细胞免疫机能的影响,把39只小白鼠随机分为四组,雌雄尽量各半,用药15

F=2.601,P= 0.067> 0.05,拒绝1,接受H0

结论:各组满足方差齐性。

四、多重比较:LSD

对照组:x_=12.33 ,S=2.291,Sx_=0.764

淫羊藿组:x_=32.40 ,S=4.115,Sx_=1.301

党参组:x_=20.00 ,S=2.404,Sx_=0.760

黄芪组:x_=20.40 ,S=2.366,Sx_=0.748

①对照组与淫羊藿组比较:

P <0.05

结论:对照组药物与淫羊藿对E-SCF的影响不同;

②对照组与党参组比较:

P <0.05

结论:对照组药物与对E-SCF的影响不同;

③对照组与黄芪组比较:

P <0.05

结论:对照组药物与黄芪对E-SCF的影响不同;

④淫羊藿组与党参组比较:

P <0.05

结论:淫羊藿与党参对E-SCF的影响不同;

⑤淫羊藿组与黄芪组比较:

P <0.05

结论:淫羊藿与黄芪对E-SCF的影响不同;

⑥党参组与黄芪组比较:

P=0.761 >0.05。结论:党参与黄芪对E-SCF的影响相同。

四格表的卡方检验(计数资料)——在样本容量n≥40,且四个格子中最小的理论值≥5时例:某中医院收治376例胃脘痛患者,随机分成两组,分别用新研制的中药胃金丹和西药治

疗效

Total

有效无效

组别胃金丹组Count 271 5 276

Expected Count 253.2 22.8 276.0 西药组Count 74 26 100

Expected Count 91.8 8.2 100.0 Total Count 345 31 376

Exp

cted Coun

345.0 31.0 376.0

Chi-Square Tests

Value df Asymp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Pearson Chi-Square 56.772a 1 .000

1≤T<5Continuity Correction b53.619 1 .000

Likelihood Ratio 49.468 1 .000

N<40 或T<1Fisher's E

act Test

.000 .000 Linear-by-Linear

Association

56.621 1 .000

N of Valid Cases 376

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.24.

b. Computed only for a 2x2 table

Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Contingency Coefficient .362 .000

N of Valid Cases 376

有效观测数≥40,所有理论频数>5,采用Pearson X2结果;

若存在1≤理论频数<5,则采用Continuity Correction X2

①假设:H0:胃金丹组与西药组疗效无差异;

H1:胃金丹组与西药组疗效有差异,α=0.05,双侧检验

②T11= 253.2 T12= 22.8 n= 376

T21= 91.8 T22= 8.2

③pearsonχ2 检验

χ2=56.772 df= P <0.05,拒绝H0,接受H1

结论:认为西药治愈率不同,pearson列联系数C=0.362

附:若是要写科研结论,则比较两组药物的治疗有效率。

四格表校正卡方检验(计数资料)——当n≥40,且存在一个格子的理论值<5但≥1时。

为观察某中草药预防流感的效果,试验组服药,28人有25人未发病;对照组不服药,30人有24人未发病。试判断该中草药有无预防流感的作用。

解题步骤:

数据→加权个案→把“例数”移入频率变量进行加权

进行X2检验,得出Pearson X2及P值。

分析→描述统计→交叉表

把“组别”移入“行”,把“疗效”移入“列”

统计量→卡方

单元格→观察值,期望值

组别* 疗效Crosstabulation

疗效

Total

未发病发病

组别服药Count 25 3 28

Expected Count 23.7 4.3 28.0 未服药Count 24 6 30

Expected Count 25.3 4.7 30.0 Total Count 49 9 58

Expected Count 49.0 9.0 58.0

Chi-Square Tests

Value df Asymp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Pearson Chi-Square .953a 1 .329

Continuity Correction b.376 1 .540

Likelihood Ratio .971 1 .324

Fisher's Exact Test .473 .272 Linear-by-Linear

Association

.936 1 .333

N of Valid Cases 58

a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.34.

b. Computed only for a 2x2 table

Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Contingency Coefficient .127 .329

N of Valid Cases 58

四格表确切概率法(计数资料)——当n<40或存在一个格子的理论值<1时

例:研究中药制剂红花散改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将37

配对四格表(计数资料)

把205份标本的每一份分别接种甲、乙两种培养基,甲、乙均生长的36份,甲生长、乙不生长的34份,甲不生长、乙生长的0份,甲、乙均不生长的135份,比较两种培养基的效果是否相同。

解题步骤:

数据→加权个案→把“例数”移入频率变量进行加权

分析→非参数检验→旧对话框→ 2个相关样本

检验类型: McNemar

甲 & 乙

甲乙

生长不生长

生长36 34

不生长0 135

Test Statistics a

甲 & 乙

N 205

Chi-Square b32.029

Asymp. Sig. .000

a. McNemar Test

b. Continuity Corrected

R×C列联表卡方检验(计数资料)

进行X2检验,得出Pearson X2及P值。

分析→描述统计→交叉表

把“组别”移入“行”,把“疗效”移入“列”

统计量→卡方

单元格→观察值,期望值

组别* 疗效Crosstabulation

疗效

Total

有效无效

组别新复方Count 35 5 40

Expected Count 24.8 15.2 40.0 降压方Count 20 10 30

Expected Count 18.6 11.4 30.0 安慰剂Count 7 23 30

Expected Count 18.6 11.4 30.0 Total Count 62 38 100

Expected Count 62.0 38.0 100.0

Chi-Square Tests

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 30.355a 2 .000 Likelihood Ratio 31.884 2 .000 Linear-by-Linear

Association

28.942 1 .000

N of Valid Cases 100

a. 0 cells (.0%) have expected count less than 5. The minimum expected

count is 11.40.

Symmetric Measures

Value Approx. Sig. Nominal by Nominal Contingency Coefficient .483 .000 N of Valid Cases 100

单样本卡方检验(计数资料或等级资料)

以书上P111的例7-7为例

解题步骤:

1、输入数据

2、数据→加权个案→把“人数”移入频率变量进行加权

3、分析→非参数检验→旧对话框→卡方

把“满意度”移入检验变量列表,期望值选择“所有类别相等”

注:在例7-8中,则需要在期望值下面选择“值”,然后手动添加2,再添加1

4、点击“确定”,根据卡方值以及相应的P值做出结论。

答题步骤:

1、H0:五种态度的比例相同

H1:五种态度的比例不同

2、2 =120,P值<0.05,故拒绝H0,可以认为五种态度的比例不同。

配对秩和检验(计量资料)

例:对12份血清分别用原法(检测时间20分钟)和新法(检测时间10分钟)检测谷-丙转

一、对差值进行正态检验 P=0.033< 0.05

结论:差值d 不服从正态分布 二、配对秩和检验

①假设:H0:原法与新法的效果无差异;

H1:原法与新法的效果有差异,α=0.05,双侧检验。

②T (+)=13 T (-)=42 Z=-1.482

P=0.138> 0.05 , 拒绝H1,接受H0.

③结论:尚不能认为两法检测谷-丙转氨酶的结果不同。

两独立样本秩和检验(计量资料)

例:为了考察中药葛根对心脏的影响,使用3g/100mL 和5g/100mL 葛根的剂量,测定大鼠用

药后一分钟心肌收缩的抑制率(用药后心肌的收缩量/用药前心肌的收缩量),比较这两种葛根

Positive Ranks 2b

6.50 13.00

Ties 2c

Total

12

a. 原法 < 新法

b. 原法 > 新法

c. 原法 = 新法

Test Statistics a

原法 - 新法

Z

-1.482b

Asymp. Sig. (2-tailed)

.138

a. Wilcoxon Signed Ranks Test

b. Based on positive ranks.

一、对两样本进行正态检验

第一种剂量正态性检验的P 值=0.007 <0.05, 第二种剂量正态性检验的P 值 = 0.314 >0.05 结论:两葛根剂量心肌收缩抑制率不全服从正态分布。 二、两独立样本秩和检验

①假设:H0:两种葛根剂量心肌收缩抑制率的总体分布位置相同;

H1:两种葛根剂量心肌收缩抑制率的总体分布位置不同,α=0.05,双侧检验。

②T 3= 43.00 , T 5=48.00 Z=-0.857

P=0.391> 0.05 , 拒绝H1,接受H0.

④ 论:尚不能认为两种葛根剂量对大鼠用药后一分钟心肌收缩的抑制率不同。

多组独立样本秩和检验(计量资料)

例:比较A 、B 、C 三种中药的灭钉螺作用,各作5批观察,每批对200只活钉螺用药后清点

抑制率

3g/100 ml 组 .344 7 .012 .728 7 .007 5g/100 ml 组

.313

6

.067

.889

6

.314

a. Lilliefors Significance Correction

2. 分析→ 非参数检验 →旧对话框 → 2个独立样本

把“抑制率”移入检验变量列表,把“葛根剂量”移入分组变量并定义组1、2

检验类型选择Mann-Whitney U

Ranks

葛根剂量 N Mean Rank

Sum of Ranks

抑制率

3g/100 ml 组 7 6.14 43.00 5g/100 ml 组 6 8.00

48.00

Total

13

Test Statistics b

抑制率 Mann-Whitney U

15.000 Wilcoxon W 43.000 Z

-.857 Asymp. Sig. (2-tailed) .391 Exact Sig. [2*(1-tailed Sig.)] .445a

a. Not

corrected for ties.

b. Grouping Variable: 葛根剂量

等级资料两独立样本秩和检验(等级资料的多独立样本秩和检验与计量资料类似,仅仅

是多了一步“加权个案”,此处省略不写)

婴儿一般肝炎与重症肝炎患者血清胆红质数据如表4-11所示,两组血清胆红质是否不同。

2. 分析→ 非参数检验 →旧对话框 → k 个独立样本

把“死亡率”移入检验变量列表,把“药物”移入分组变量并定义范围1-3

检验类型选择Kruskal-Wallis H

Ranks

药物 N

Mean Rank 死亡率

A 5 12.60

B 5 7.60

C 5 3.80

Total

15

Test Statistics a,b

死亡率 Chi-square 9.740

df

2 Asymp. Sig.

.008

a. Kruskal Wallis Test

b. Grouping Variable: 药物

表4-11 婴儿不同肝炎患者血清胆红质(mg%)数据 肝炎 血清胆红质 <1 1~

5~ 10~ 15~ 20~ 25~

一般组 4 11 15 0 0 0 0 重症组

2

10

1

4

2

Ranks

组别N Mean Rank Sum of Ranks

血清胆红质一般组30 16.00 480.00 重症组19 39.21 745.00 Total 49

Test Statistics a

血清胆红质

Mann-Whitney U 15.000

Wilcoxon W 480.000

Z -5.722

Asymp. Sig.

(2-tailed)

.000

a. Grouping Variable: 组别

这是等级资料,是单向有序列联表且样本容量较小,不宜用Ridit分析。

建立假设检验,H0:两总体分布相同,H1:两总体分布不同。

由上面的检验统计量可知,双侧P<0.05,以 =0.05水准拒绝H0,两总体分布不同。并可以认为重症肝炎患者血清胆红质高于一般肝炎患者

Kappa检验(等级资料,双向有序属性相同列联表)

以书上P118例7-13为例

解题步骤:

1、输入数据

2、数据→加权个案→把“例数”移入频率变量进行加权

3、分析→描述统计→交叉表

把“对比组”移入“行”,把“核素组”移入“列”

统计量→Kappa

单元格→观察值,期望值

根据得到的Kappa统计量的大小做出结论。≥0.75说明一致程度相当满意,≥0.4说明一致程度尚可。

答题步骤:

1、H0:两方法检验结果不一致

H1:两方法检验结果一致

2、Kappa统计量为0.6809>0.4,说明两方法测定结果的一致程度尚可。

Pearson、Spearman相关分析(计量资料)

例:测得某地10名三岁儿童的体重与体表面积如下,进行相关分析。

解题步骤:

1、对体重、体表面积进行正态性检验,符合正态性;(此处与上面操作类似,略去)

2、进行直线相关分析,得出P值。

分析→相关→双变量→Pearson ,Spearman

两变量均服从正态分布,积差相关→Pearson;至少一个不服从正态分布→秩相关→Spearman

Correlations

体重体表面积

体重Pearson Correlation 1 .918**

S

.000

g. (2-tailed)

N 10 10

面积Pearson Correlation .918** 1

Sig. (2-tailed) .000

N 10 10

**. Correlation is significant at the 0.01 level (2-tailed).

等级资料直线相关分析

例:12名急性白血病患儿的血小板数与出血症状资料见表,分析两者之间有无直线关系:

一元线性回归分析及预测

回归分析一般只需要检验因变量的正态性,如果因变量不符合正态性,要做数据转换,比如对因变量开根号后作为新的因变量,考试时可以略去这步。

相关主题
文本预览
相关文档 最新文档