(完整word版)医学统计学spss19.0上机操作
- 格式:pdf
- 大小:11.30 MB
- 文档页数:60
统计描述P.291. Analyze→Description Statistics →Frequencies →Statistic →Percentile,Quartiles2. Analyze→Description Statistics →Explore →Plot Normality plots with testsN Valid 20Missing 0Mean 均数475.3500Std. Error of Mean 均数的标准误13.76748 Median 中位数485.5000Mode 众数334.00aStd. Deviation 标准差61.57005 Variance 方差3790.871 Skewness 偏度系数-.321Std. Error of Skewness .512 Kurtosis 峰度系数.054Std. Error of Kurtosis .992 Range 极差,全距251.00 Minimum 最小值334.00 Maximum 最大值585.Sum 合计9507.00 Percentiles 25 435.500050 485.500075 523.5000a. Multiple modes exist. The smallest value is shownTests of NormalityKolmogorov-Smirnov a(大样本)Shapiro-Wilk(≤30,小样本)Statistic df Sig. Statistic df Sig..099 20 .200*.982 20 .958VAR0001a. Lilliefors Significance Correction*. This is a lower bound of the true significance.┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉一、计量资料单样本t检验P.56 例4-7:已知人参中M物质的含量服从正态分布,u=63.5,今9次测得一批人工培植人参中M物质的含量为40.0、41.0、41.5、41.8、42.4、43.1、43.5、43.8、44.2,推断这批人工培植人参中M物质的含┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉┉配对t检验P.57例4-8:为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,每对中的两只随机分到试验组和对照组,两组都接种肿瘤,试验组在接种肿瘤三天后注射30%的三棱莪术液0.5,正态分布资料两样本均数比较的t检验P.60例4-9:某医师研究转铁蛋白测定对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量的结果如下:正常人:265.4、271.5、284.6、291.3、254.8、275.9、281.7、268.6、264.1、273.2、270.8、260.5患者:256.9、235.9、215.4、251.8、224.7、228.3、231.1、253.0、221.7、218.8、233.8、230.9、240.7、260.7、224.4本例为完全随机设计资料,推断转铁蛋白测定对病毒性肝炎诊断的意义。
SPSS上机考试---统计操作两样本定量资料的比较1.两独立样本的t检验数据输入格式:第一列输入组别(group)111122222222第二列输入对应的数据(y)步骤一:正态性检验analyze—descriptive statistics—explore—dependent list框输入y数据,同时factor list框输入group数据—plots框下选择normality plots with test—continue—ok得到正态检验结果,sig>0.1时数据符合正态性。
常用w检验即Shapiro-Wilk 检验结果步骤二:方差齐性检验并同时计算t检验结果Analyze—compare means—independent-sample T test—test variable框里输入数据y,同时grouping variable框里输入group,并define group,分别定义group1为1,group2为2—continue—ok F值为方差齐性检验的结果,当方差齐时,看第一列的输出结果,当方差不齐时看第二列的输出结果(校正的t检验)2.配对资料的t检验数据输入格式:第一列输入pair如第13456……对,第二列输入control(对照组)的资料,第三列输入实验组的数据资料,第四列输入差值d(可用spss计算得到)步骤一;差值的计算,transform—compute—target variable框里输入d—numeric expression框里输入control减去实验组—ok 步骤二:对d进行正态性检验步骤三:配对t检验有两种方法方法一:配对t检验analyze—compare means—paired-sample T test—paired variable框里输入control减去实验组数据—ok方法二:d与0比较的单样本的t检验analyze—compare means—one-sample T test—test variable框里输入d,同时testvalue 框里输入0—ok两种方法完全等价3.两独立样本的秩和检验数据输入格式:同两独立样本的t检验步骤一:正态性检验,不满足正正态性,p<0.1则用秩和检验步骤二:计算统计量(wilcoxon秩和检验)Analyze—nonparametric test—2 independent samples—test variable list框里输入y数据,grouping variable框里输入group同时define group框里分别定义group1和group2为1和2 —continue 同时test type下选择Mann-Whitney U—ok4.配对资料的符号秩和检验数据输入格式:同配对t检验步骤一:计算差值transform—compute—target variable框里输入d—numeric expression框里输入control减去实验组—ok 步骤二:对d进行正态性检验步骤三:计算统计量analyze—nonparamatric test—2-related samples—test pair list框里同时输入两组变量,同时test type下选择wilcoxon—ok第1 页第2页多组定量资料的比较1.多组定量资料的方差分析和均数的两两比较前提条件:相互独立的随机样本,均服从正态分布,方差齐性。
例题0801随机设计的方差分析(1)正态性检验(2)方差分析第一步1第二步第三步第四步例题8-2 随机区组设计资料的方差分析例题8-3拉丁方设计资料的方差分析18-01 析因分析点击“添加”点击选项第九章行列表资料的假设检验(卡方检验)一、四格表的卡方检验例题9-1两个样本率的比较(不需要校正)第一种做法:数据可以还原成最初数据,然后输入。
1 输入数据2 操作步骤点击确定就ok啦。
第二种做法:1数据输入:变量视图数据视图2 操作点击数据---选中下拉框中的加权个案点击加权个案---选中Frequence加权个案----点击确定以下操作同第一种做法。
例题9-2两个样本率的比较(需要连续性校正)操作方法同例题9-1注意:结果输出, 出现理论频数小于5的格子,故读取的结果是continuity correction连续校正一行例题9-3 交叉分类2×2表关联性分析。
1 数据输入同9-1,2,对Frequence进行加权处理即:点击加权个案---选中Frequence加权个案----点击确定2 可以进行分析了点击确定即可。
数据输入和分析结果见“给同学们文件夹”配对四格表的卡方检验例题9-4配对四格表资料的观察结果有无差异的检验1 变量视图和数据视图如下:2 对Frequence进行加权处理3点击分析——统计描述——交叉表例题9-5配对四格表资料的关联性分析变量视图和数据视图如下:对Frequence进行加权处理以下操作同9-1,2,3,点击分析——统计描述——交叉表-点击确定即可。
二、行列表资料的卡方检验(四格表的扩展,操作相似)例题9-6 多个样本率的比较(p153页)方法参照9-1,1数据输入及处理:变量视图和数据视图2 对Frequence进行加权处理即:点击数据——加权个案---选中Frequence加权个案----点击确定3以下操作同9-1,2,3,点击分析——统计描述——交叉表点击确定即可。
SPSS 19.0 教程简介SPSS(即 Statistical Product and Service Solutions)是一款用于统计分析和数据挖掘的软件工具,由IBM开发和推出。
SPSS 19.0是SPSS软件系列中的一款主要版本,引入了许多新特性和改进,以帮助用户更有效地进行数据分析和建模。
本教程旨在介绍SPSS 19.0的基本功能和操作方法,帮助读者快速入门并熟练使用这个强大的统计软件。
安装和启动要使用SPSS 19.0,首先需要安装软件并启动它。
1.下载SPSS 19.0安装文件,双击运行安装程序。
2.在安装向导中,按照提示进行安装,选择安装路径和相关选项。
3.完成安装后,在开始菜单或桌面上找到SPSS 19.0的快捷方式,并双击打开软件。
数据导入和清理在进行数据分析之前,通常需要将数据导入到SPSS 19.0中并进行必要的清理和预处理。
导入数据SPSS 19.0支持导入多种不同格式的数据文件,包括Excel、CSV、文本文件等。
1.点击菜单中的“文件(File)”,选择“导入(Import)”,然后选择需要导入的文件格式。
2.在导入向导中,选择要导入的文件路径,并设置相关导入选项,如分隔符、变量类型等。
3.点击“完成(Finish)”导入数据到SPSS 19.0。
数据清理在导入数据后,可能需要对数据进行清理和预处理,以去除异常值、缺失值等。
1.使用菜单中的“数据(Data)”选项,选择“选择(Select Cases)”进行数据筛选。
2.在选择向导中,设置筛选条件,如根据某一变量的取值进行筛选。
3.点击“OK”应用筛选结果。
数据分析SPSS 19.0提供了广泛的数据分析功能,包括描述统计分析、推断统计分析、回归分析、聚类分析等。
描述统计分析描述统计分析用于对数据进行表达、总结和可视化。
其中常用的方法包括频率分析、交叉表分析、均值分析等。
1.使用菜单中的“分析(Analyse)”选项,选择“描述性统计(Descriptive Statistics)”进行描述统计分析。
一、用两种定义变量的方法绘制直方图某学院两个专业,各抽取24名学生,他们某门课考试成绩资料如下:甲专业乙专业成绩(分)学生数成绩(分)学生数60以下7 60-70 960-70 11 70-90 1270-90 6 90以上 3合计24 合计24方法1:SPSS操作步骤:⑴定义“成绩”、“学生数”和“专业”三个变量。
⑵在定义变量窗口对“专业”做变量值标签,令1=甲专业,2=乙专业。
⑶在录入数据窗口依次录入表中数据。
⑷选择数据下拉菜单中的加权个案子菜单,频率变量选学生数。
⑸选择分析下拉菜单中的描述统计子菜单,选择频率模块。
操作结果图如下:方法2:SPSS操作步骤:⑴定义“成绩”、“专业学生数”两个变量。
⑵在录入数据窗口依次录入表中数据。
⑶根据已存在的变量产生新变量。
选择转换下拉菜单中的计算变量,计算总人数。
总人数=甲专业学生数+乙专业学生数。
⑷选择数据下拉菜单中的加权个案子菜单,频率变量选总人数。
⑸选择分析下拉菜单中的描述统计子菜单,选择频率模块。
操作结果图如下:二、一个总体均值的区间估计和两个总体均值差的假设检验某学院两个专业,各抽取24名学生,他们某门课考试成绩资料如下:甲专业乙专业成绩(分)学生数成绩(分)学生数60以下7 60-70 960-70 11 70-90 1270-90 6 90以上 3合计24 合计241、以95%的概率保证程度推断该学院所有学生该门课考试成绩为多少?2、以95%的概率保证程度推断两个专业学生的平均成绩是否有显著性差异。
第一问SPSS操作步骤:⑴定义“成绩”、“专业学生数”两个变量。
⑵在录入数据窗口依次录入表中数据。
⑶根据已存在的变量产生新变量。
选择转换下拉菜单中的计算变量,计算总人数。
总人数=甲专业学生数+乙专业学生数。
⑷选择数据下拉菜单中的加权个案子菜单,频率变量选总人数。
⑸选择分析下拉菜单中的描述统计子菜单,选择探索模块。
操作结果图如下:分析:由题可知这是一个总体方差未知时均值的区间估计,由表可知所有学生的考试成绩的置信区间为(67.9428,74.7655),所以95%的把握认为该学院所有学生该门课考试成绩为(67.9428,74.7655)。
SPSS中文版工具统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。
现代的数据分析工作如果离开统计软件几乎是无法正常开展。
在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。
常见的统计软件有SAS,SPSS,MINITAB,EXCEL等。
这些统计软件的功能和作用大同小异,各自有所侧重。
其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。
特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。
SPSS在各类院校以及科研机构中更为流行。
SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。
自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows大同小异,在本试验课程中我们选择PASW Statistics 18.0作为统计分析应用试验活动的工具。
1.SPSS的运行模式SPSS主要有三种运行模式:(1)批处理模式这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。
(2)完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。
用户无须学会编程,简单易用。
(3)程序运行模式这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。
这种模式要求掌握SPSS的语句或脚本语言。
本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。
2.SPSS的启动(1)在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS 12.0 for Windows”即可启动SPSS软件,进入SPSS for Windows对话框,如图1.1,图1.2所示。
《医学统计学》SPSS 上机实验讲义绪论:学点统计学,迎接挑战1.什么是统计学:the science and art of dealing with variation in data through collection,classification and analysis in such a way as to obtain reliable results。
即:统计学是一套收集数据和分析信息的方法和原则,以帮助人们在面对不确定性时制定决策。
由此看来:1)它是处理资料中变异性的科学和艺术。
2)它的目的在于取得可靠的结果。
3)它是在搜集、归类、分析和解释大量数据的过程中完成其使命的。
2.学习统计学可以:1)在从事医药方面的科学研究时,从设计、分析到解释全面借助统计学。
2)在医学论文所应用的统计学知识中70%是最基本的概念和经典的统计方法,出现的错误也最多。
为此,作为读者也学提高识别统计学错误的本领,否则就不能正确对待出版物中的结果和结论,人云亦云,贻误自身工作。
3)在工作中,正确理解与运用医学指标的正常参考范围、总结自己的治疗经验、证实自己提出的诊断方法不亚于现有方法、考证民间验方的优劣等。
3.学什么:学统计学的基本概念,学统计学独特的思维方式,学常用的统计方法和电脑软件的使用。
至于复杂的统计理论和技术,专业性比较强,需要时可通过协作解决问题。
实验安排实验一:1)SPSS统计软件的概述及数据文件的建立与修改 (13)实验二:1)统计图 (13)2)计量资料统计描述实验三:1)t检验 (14)实验四:1)单因素方差分析2)测验13)多因素方差分析 (15)检验实验五:1)22)非参数检验 (16)3)测验2实验六:1)相关与回归 (17)2)上机考试上课时间:8:00-12:00上课地点:本部实验楼一、SPSS统计软件的概述及数据文件的建立与修改1.SPSS统计软件的概述:SPSS是社会科学用的统计软件包。
Spss操作要点详细版第一章导论——SPSS介绍学习目标:初步认识SPSS软件的内容一、SPSS界面说明SPSS for Windows是SPSS/PC的Windows版本,具有Windows软件的共同特点,其界面十分友好,打开SPSS程序就会出现图1-2界面。
标题栏菜单栏工具栏数据栏标签图1-2 SPSS 11.5 for Windows 界面该界面为SPSS 的数据编辑窗口,其组成部分及主要功能如下:1。
标题栏:功能与其它Windows软件一致。
2.菜单栏:由10个菜单项组成,每个菜单包括一系列功能。
各菜单的主要功能如下。
2.1 File:文件操作菜单。
单击Fil e,有图1-3下拉菜单,主要功能包括:·New:新建数据编辑窗口、语句窗口、结果输出窗口等;·Open和Open Database:打开数据编辑窗口、语句窗口、结果输出窗口等;·Read Text Data:读入文本文件;·Save和Save As:保存文件;·Display Data Info:显示数据的基本信息;·Prin t和Print Preview:将数据管理窗口中的数据以表格的形式打印出来。
图1-3 File菜单项的下拉菜单图1-4 Edit菜单项的下拉菜单2.2 Edit:文件编辑菜单。
主要用于数据编辑,如图1-4,主要功能包括:·UndoRedo或modify cell values:撤消或恢复刚修改过的观测值;·cut,copy,paste:剪切、拷贝、粘贴指定的数据;·paste variables:粘贴指定的变量;·clear:清除所选的观测值或变量;·find:查找数据。
2.3 View:视图编辑菜单。
用于视图编辑,进行窗口外观控制。
包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。
例题0801随机设计的方差分析(1)正态性检验
(2)方差分析第一步 1
第三步
例题8-2 随机区组设计资料的方差分析
例题8-3拉丁方设计资料的方差分析
18-01 析因分析
点击“添加”
点击选项
第九章行列表资料的假设检验(卡方检验)一、四格表的卡方检验
例题9-1两个样本率的比较(不需要校正)
第一种做法:数据可以还原成最初数据,然后输入。
1 输入数据
2 操作步骤
点击确定就ok啦。
第二种做法:
1数据输入:变量视图
数据视图
2 操作
点击数据---选中下拉框中的加权个案
点击加权个案---选中Frequence加权个案----点击确定以下操作同第一种做法。
例题9-2
两个样本率的比较(需要连续性校正)操作方法同例题9-1
注意:结果输出, 出现理论频数小于5的格子,故读取的结果是continuity correction连续校正一行
例题9-3 交叉分类2×2表关联性分析。
1 数据输入同9-1,2,对Frequence进行加权处理即:点击加权个案---选中Frequence加权个案----点击确定
2 可以进行分析了
点击确定即可。
数据输入和分析结果见“给同学们文件夹”配对四格表的卡方检验
例题9-4配对四格表资料的观察结果有无差异的检验
1 变量视图和数据视图如下:
2 对Frequence进行加权处理
3点击分析——统计描述——交叉表
例题9-5配对四格表资料的关联性分析变量视图和数据视图如下:
对Frequence进行加权处理
以下操作同9-1,2,3,点击分析——统计描述——交叉表-
点击确定即可。
二、行列表资料的卡方检验(四格表的扩展,操作相似)例题9-6 多个样本率的比较(p153页)
方法参照9-1,
1数据输入及处理:变量视图和数据视图
2 对Frequence进行加权处理即:
点击数据——加权个案---选中Frequence加权个案----点击确定3以下操作同9-1,2,3,点击分析——统计描述——交叉表
点击确定即可。
例题9-7 两组或多组构成比的比较(p153页)
数据输入和操作同上
1变量视图和数据视图如下:
2 对Frequence进行加权处理即:
点击数据——加权个案---选中Frequence加权个案----点击确定3以下操作同9-1,2,3,点击分析——统计描述——交叉表
例题9-8 行列表分类资料关联性分析(四格表资料关联性分析的扩展)操作相似。
(p154页)
三、频数分布拟合优度的卡方检验
例题9-11(p158页)
单变量的卡方检验
点解分析——非参数检验——旧对话框——卡方
选“所有类别相等”意思是该资料中的理论频数是(87+195+116+27)/4=106.5
9-12 poisson分布的拟合优度检验(p158页)
1变量视图和数据视图如下:
2点解分析——非参数检验——旧对话框——卡方
2点解分析——非参数检验——旧对话框——卡方
3 选定“值”并将表9-12中的期望频数依次添加到框中,点击确定即可。
四确切概率法(略)
例题9-13 (p159页)用软件操作时的方法与Pearson卡方检验一样,只不过在读取结果时读Fisher确切检验一行(要求条件是:样本例数少如四格表n<40时,或有期望频数<1;行列表资料有1/5以上的格子数期望频数<5时,行列表资料的卡方检验会有偏性时)
五OR值的卡方检验
例题9-14(p161页)病理-对照研究中成组设计资料的分析
1变量视图和数据视图如下:
9-15 匹配设计资料的分析(p162页)
第十章基于秩次的假设检验例题10-1配对设计资料的符号秩和检验
点击分析—非参数检验—2个相关样本
例题10-2单样本资料的符号秩和检验可以参照10-1的方法做。
二完全随机化两独立样本的秩和检验例题10-3 两组计量资料的秩和检验
点击确定即可。
10-4 两组等级资料的秩和检验(单向有序,比较的结果变量有序时用)
1 先对Frequence项进行加权处理。
点击数据——加权个案---选中Frequence加权个案----点击继续
2 具体操作:分析---非参数检验---旧对话框---两个独立样本
点击确定就ok啦。
三、完全随机设计多个独立样本的秩和检验
10-5 多组计量资料的秩和检验(略)
本资料参考两组计量资料的检验方法,是前者的扩展,只不过在非参数检验中选择k个独立样本选项,其他操作包括数据输入基本一样。
10-6 多组等级资料的秩和检验(p176页)
1 先对Frequence项进行加权处理。
点击数据——加权个案---选中Frequence加权个案----点击继续
2 具体操作
点击确定就ok啦。
例题10-8 随机化区组设计资料的秩和检验
第十四章临床测量误差与诊断试验评价一Kappa值一致性评价
例题14-3
1 先对变量x 进行加权,
2 点击分析——描述统计——交叉表——统计量选Kappa——继续——确定
二ROC曲线
某医师对经标准诊断的55名患者、45名正常人分别进行2种诊断试验检查,结果分别为test1、test2。
试绘制ROC曲线。
步骤:点击分析——ROC曲线图——(检验变量:选test1,test2;状态变量选diagnose;状态变量的值是 1 ,因为1表示诊断为阳性;输出:四项全选)——确定
三线性回归
例题11-1
步骤:线性回归模型成立需要满足4个条件,即线性(linear)、独立(independence)、正态(normal)、等方差(equal variance),分析的首先先判断两变量之间是否有线性趋势,。