spss卫生统计学实习课程2
- 格式:pdf
- 大小:316.93 KB
- 文档页数:41
《统计实习》SPSS实验报告实验报告二实验项目:描述性统计分析实验目的:1、掌握数据集中趋势和离中趋势的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验内容及步骤一、数据输入案例:对6名男生和6名女生的肺活量的统计,数据如下:1.打开SPSS软件,进行数据输入:通过打开数据的方式对XLS的数据进行输入其变量视图为:二、探索分析进行探索分析得出如下输出结果:浏览由上表可以看出,6例均为有效值,没有记录缺失值得情况。
由上表可以看出,男女之间肺活量的差异,男生明显优于女生,范围更广,偏度大。
男男 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 342.00 1 . 892.00 2 . 02Stem width: 1000Each leaf: 1 case(s)女女 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 233.00 1 . 568 1.00 2 . 0Stem width: 1000Each leaf: 1 case(s)三、频率分析进行频率分析得出如下输出结果:由上图可知,分析变量名:肺活量。
可见样本量N为6例,缺失值0例, 1500以下的33%,1500-2000男生33%女生50%,2000以上女生16.7%,男生33%。
四、描述分析进行描述分析得出如下输出结果:由上图可知,分析变量名:工资,可见样本量N为6例,极小值为男1342女1213,极大值为男2200女2077,说明12人中肺活量最少的为女生是1213,最多的为男生有2200,均值为1810.50/1621.33,.标准差为327.735/325.408,离散程度不算大。
五、交叉分析实验报告三实验项目:均值比较实验目的:.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
实验内容及步骤(一)描述统计案例:某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
---------------------------------------------------------------最新资料推荐------------------------------------------------------
spss医学统计学实验指导
医学统计学实验指导(供本科各医学专业用)编写说明为了加深学生对《医学统计学》课堂教学内容的理解及提高实际应用能力,我们编写了这本《医学统计学实验指导》。
在课堂学习的基础上,安排一定的时间实习,使理论联系实际,以达到医学统计学教学目的。
本教材作为《医学统计学》的配套教材,主要供本科各医学专业使用。
主要通过利用 SPSS 统计软件开展电脑实验课,改变过去完全采用理论和课堂教学的形式,坚持重统计思想而轻死记公式、重缜密思考而轻单纯演算,强调理论联系实际。
重点培养学生如何收集所需数据、应该采用什么方法去整理和分析数据、以及怎样利用统计软件输出的结果得出结论、进行解释,注重培养学生应用统计知识去分析和解决实际问题的能力。
另外提供一定数量的习题作为巩固课堂知识和复习备考所需。
本教材在编写时参考并引用了有关教材的部分资料和图表,在此特作说明,并向原作者表示深深的谢意。
由于作者水平所限,缺点乃至错误难免,恳请同道专家及读者提出宝贵意见,谢谢!编者 2008 年 6 月目录实验一 SPSS 统计软件简介 - 1 - 实验二数值变
1 / 2
量资料的统计描述 - 6 - 实验三数值变量资料的统计分析 - 19 - 实验四分类变量的统计分析 - 25 - 实验五秩和(非参数)检验 - 40 - 实验六统计图 ...。
卫生统计学实习何平平北京大学公共卫生学院流行病与卫生统计学系Tel: 82801619实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。
统计学基础实验SPSS课程设计1. 简介本课程是针对初学者的统计学基础实验SPSS课程设计,通过使用SPSS软件掌握基础的统计分析方法和技巧,并能够对数据进行处理和分析。
本课程分为三个部分,包括SPSS基础知识入门、变量和数据类型、假设检验等。
2. SPSS基础知识入门2.1 SPSS的介绍SPSS是一个强大的数据分析软件,被广泛应用于社会科学、商业领域等各个领域。
其主要功能包括数据管理、数据分析、图形展示等。
在本节课程中,我们将介绍SPSS的基本界面、数据文件的导入和导出等。
2.2 SPSS的基本操作在SPSS中,您可以使用各种命令和选项来处理数据。
本节课程将介绍如何使用SPSS软件执行以下操作:•变量和数据文件的输入,包括数据输入、数据编辑、矩阵数据等。
•SPSS软件的数据管理和转换,包括数据删除、质量检查、数据清理等。
2.3 测试与练习本节课程的测试与练习将包括以下题型:•选择题:测试您对SPSS基本知识入门的理解程度;•矩阵数据输入:测试您使用SPSS软件进行数据输入的能力。
3. 变量和数据类型3.1 变量类型的介绍在数据分析中,您需要了解变量类型的概念。
本节课程将介绍四个主要的变量类型:离散型变量、连续型变量、名义型变量和顺序型变量。
您将学习如何在SPSS软件中设置和操作这些变量类型。
3.2 数据类型的介绍数据类型有整型、浮点型、日期型等。
本节课程将介绍如何使用SPSS软件进行数据类型设置和操作。
您将学习如何将数据转化为数字、批量数据输入和清理等相关操作。
3.3 测试与练习本节课程的测试与练习将包括以下题型:•选择题:测试您对变量类型和数据类型的理解程度;•数据清理相关操作:测试您在SPSS软件中的数据清理和处理能力。
4. 假设检验4.1 假设检验的基本概念假设检验是确定一个群体的一个参数是否符合某种理论预期的数学方法。
本节课程将介绍假设检验的基本概念,包括假设检验的流程和步骤。
4.2 假设检验的常见方法本节课程将介绍五类常见的假设检验方法:•一样本均数检验:用于测试一个样本均值是否符合预期的标准;•独立双样本均数检验:用于测试两个样本均值是否相同;•相关样本均数检验:用于测试两个相关样本均值是否相同;•一样本比例检验:用于测试一个样本的比例是否符合预期的标准;•独立双样本比例检验:用于测试两个样本的比例是否相同。
《医学统计学》SPSS 上机实验讲义绪论:学点统计学,迎接挑战1.什么是统计学:the science and art of dealing with variation in data through collection,classification and analysis in such a way as to obtain reliable results。
即:统计学是一套收集数据和分析信息的方法和原则,以帮助人们在面对不确定性时制定决策。
由此看来:1)它是处理资料中变异性的科学和艺术。
2)它的目的在于取得可靠的结果。
3)它是在搜集、归类、分析和解释大量数据的过程中完成其使命的。
2.学习统计学可以:1)在从事医药方面的科学研究时,从设计、分析到解释全面借助统计学。
2)在医学论文所应用的统计学知识中70%是最基本的概念和经典的统计方法,出现的错误也最多。
为此,作为读者也学提高识别统计学错误的本领,否则就不能正确对待出版物中的结果和结论,人云亦云,贻误自身工作。
3)在工作中,正确理解与运用医学指标的正常参考范围、总结自己的治疗经验、证实自己提出的诊断方法不亚于现有方法、考证民间验方的优劣等。
3.学什么:学统计学的基本概念,学统计学独特的思维方式,学常用的统计方法和电脑软件的使用。
至于复杂的统计理论和技术,专业性比较强,需要时可通过协作解决问题。
实验安排实验一:1)SPSS统计软件的概述及数据文件的建立与修改 (13)实验二:1)统计图 (13)2)计量资料统计描述实验三:1)t检验 (14)实验四:1)单因素方差分析2)测验13)多因素方差分析 (15)检验实验五:1)22)非参数检验 (16)3)测验2实验六:1)相关与回归 (17)2)上机考试上课时间:8:00-12:00上课地点:本部实验楼一、SPSS统计软件的概述及数据文件的建立与修改1.SPSS统计软件的概述:SPSS是社会科学用的统计软件包。
实习二
统计描述第164~180页
实习二统计描述
医学统计资料类型
¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述
统计描述包括两个方面:集中趋势的描述和离散趋势的描述
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表的用途
1.描述数值变量资料的分布特征
集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表的用途
2.描述数值变量资料的分布类型
正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述
(二)数值变量资料的频数分布图及正态曲线
直方图及近
似正态分布
直方图及
正偏态分
布
(二)数值变量资料的频数分布图及正态曲线
一、数值变量资料的统计描述
(三)集中趋势指标描述
1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:
µ;样本均数:一、数值变量资料的统计描述
一、数值变量资料的统计描述
(三)集中趋势指标描述
2.几何均数(geometric mean,G)
适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。
此资料的原始数据为正偏态分布,取对数后,对数值为正态分布,所以又称为对数正态分布。
一、数值变量资料的统计描述
(三)集中趋势指标描述
3.中位数(median,M)
适用于偏态分布资料,或者分布类型未知,或者有不确定数据时。
中位数是指将一组变量值从小到大排列,位次居中的变量值。
一、数值变量资料的统计描述
(三)集中趋势指标描述
4.注意事项
1.对于偏态分布资料,中位数不受两端特大值和特小值的影响,只和位置居中的观察值有关。
而均数受特大值和特小值的影响,会偏大或者偏小,所以对于偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势。
2.中位数适合于任何分布类型的资料,对于正态分布,理论上中位数等于均数。
一、数值变量资料的统计描述
(四)离散趋势指标描述
1.极差或者全距(range,R):表示一组变量值中最大值和最小值之差。
适合任何分布类型的资料。
R=最大值-最小值
计算简单,但是不能反映所有变量值的变异程度,易受最大值和最小值的影响,不稳定
一、数值变量资料的统计描述
(四)离散趋势指标描述
2.方差(variance):表示一组变量值的平均离散程度。
方差越大,离散或者变异程度越大。
适合描述近似正态分布资料的离散趋势。
一、数值变量资料的统计描述
(四)离散趋势指标描述
3.标准差(standard deviation):是方差的开方,和均数的单位一致,也表示一组变量值的平均离散程度。
适合描述近似正态分布资料的离散趋势。
(四)离散趋势指标描述一、数值变量资料的统计描述
4.四分位数间距(quartile,Q):P
75、P
25
分别表示第
75百分位数和第25百分位数。
Q=P75-P25
注:适合描述任何分布类型资料的离散趋势,主要用于偏态分布资料。
Continue”
中位数
最小值
最大值
严格来说,本
例的例数太
少,不适合计
算四分位数间
距。
在此仅为
举例
频数百分比有效百分比累计百分比
一、数值变量资料的统计描述
(七)正态分布和医学参考值范围的估计2.医学参考值范围的估计
(1)定义:同质总体中某研究指标大多数变量值的波动范围。
常取95%的医学参考值范围。
(2)计算:正态分布法
二、分类资料的统计描述
(一)相对数
1.构成比:某事物中各部分所占的比重。
构成比的性质:各部分之和为100%;某一部分的比重增加,则相应其它部分的比重减少。
二、分类资料的统计描述
(一)相对数
2.相对比:又称为比,是两个有关的指标之比。
3.率:某现象发生的频率或强度。
二、分类资料的统计描述
(一)相对数
4.应用相对数的注意事项
¾率和构成比的区别
率:某现象发生的频率或强度。
构成比:某事物中各部分所占的比重。
构成比不能反映事物发生的频率或强度,因为它未考虑人口基数的影响。
¾计算相对数的分母不宜过小。
¾率不能直接相加求平均。
二、分类资料的统计描述
(二)标准化法
1.意义:要正确对各组进行比较,必须先按照统一的标准对各组的人口构成进行校正,然后计算出校正后的标准化率再进行比较。
2.基本思想:采用统一的标准人口构成,以消除人口构成不同对总率的影响。
二、分类资料的统计描述
(二)标准化法
4.应用标准化法的注意事项:
¾选取的标准不同,标准化率的大小也不同,但选取同一标准的各组的标准化率的相对水平不变。
¾标准化率不能反映实际的发病或死亡水平,只是为了比较各组的标准化率的相对水平。