spss卫生统计学实习课程6
- 格式:pdf
- 大小:285.82 KB
- 文档页数:36
统计学实验SPSS实习报告实验报告二实验项目:描述性统计分析实验的目的:1。
掌握数据集中趋势和离中趋势分析方法2.熟悉掌握各个分析过程的基本步骤以及彼此之间的联系和区别.实验内容:(1)Frequencies过程(2)Descriptives过程(3)Expiore 过程(4)Croostabs过程一、数据和输入与保存频率[数据集1] E:\案例数据资料\数据集\第五章\5.1陕西省城市居民消费状况研究\数据集\陕西省城市居民消费状况研究.sav实验数据的统计量数目为21 实际检验统计量数目为21 全部检验。
统计量时间分组N 有效21缺失0该组检验是我根据软件数据,依据年限的不同分为了一共4组数据的时间分组数据,从而大大的减少了数据的分析复杂性。
最后得出的时间分组的表格如下。
时间分组频率百分比有效百分比累积百分比有效1980以下 3 14.3 14.3 14.31980到1990 10 47.6 47.6 61.91990到1995 5 23.8 23.8 85.71995以上 3 14.3 14.3 100.0合计21 100.0 100.0描述统计分析[数据集1] E:\案例数据资料\数据集\第五章\5.1陕西省城市居民消费状况研究\数据集\陕西省城市居民消费状况研究.sav[数据集1] E:\案例数据资料\数据集\第五章\5.1陕西省城市居民消费状况研究\数据集\陕西省城市居民消费状况研究.sav有表格可以看出数据数目一共21个有小数据21个,其中极小值为1.00极大值为4.00.均值为2.3810.我们是以时间分组的一组描述数据量,既可以得出下列的数据分析表格。
如下为数据的执行命令。
EXAMINE VARIABLES=时间分组/PLOT BOXPLOT STEMLEAF/COMPARE GROUPS/STATISTICS DESCRIPTIVES/CINTERVAL 95/MISSING LISTWISE/NOTOTAL.数据的游览分析[数据集1] E:\案例数据资料\数据集\第五章\5.1陕西省城市居民消费状况研究\数据集\陕西省城市居民消费状况研究.sav描述统计量标准误时间分组均值 2.3810 .20090均值的 95% 置信区间下限 1.9619上限 2.80005% 修整均值 2.3677中值 2.0000方差.848标准差.92066极小值 1.00极大值 4.00范围 3.00四分位距 1.00偏度.387 .501峰度-.456 .972 时间分组时间分组 Stem-and-Leaf PlotFrequency Stem & Leaf3.00 1 . 000.00 1 .10.00 2 . 0000000000.00 2 .5.00 3 . 00000.00 3 .3.00 4 . 000Stem width: 1.00Each leaf: 1 case(s)CROSSTABS/TABLES=时间分组 BY 消费性支出(元)/FORMAT=AVALUE TABLES/CELLS=COUNT/COUNT ROUND CELL.交叉表[数据集1] E:\案例数据资料\数据集\第五章\5.1陕西省城市居民消费状况研究\数据集\陕西省城市居民消费状况研究.sav计数最后实验总结:在该组的实验中,我们利用的是spss软件来实现的一系列的数据分析与统计,我们选择的是数据中以自己独立的时间分组来实现数据的整理以及一系列的数据处理,最后得出了上面的一系列内容,这次实验内容我学到了很多,也从中学习到了spss软件的实际操作。
《统计实习》SPSS实验报告实验报告二实验项目:描述性统计分析实验目的:1、掌握数据集中趋势和离中趋势的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验内容及步骤一、数据输入案例:对6名男生和6名女生的肺活量的统计,数据如下:1.打开SPSS软件,进行数据输入:通过打开数据的方式对XLS的数据进行输入其变量视图为:二、探索分析进行探索分析得出如下输出结果:浏览由上表可以看出,6例均为有效值,没有记录缺失值得情况。
由上表可以看出,男女之间肺活量的差异,男生明显优于女生,范围更广,偏度大。
男男 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 342.00 1 . 892.00 2 . 02Stem width: 1000Each leaf: 1 case(s)女女 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 233.00 1 . 568 1.00 2 . 0Stem width: 1000Each leaf: 1 case(s)三、频率分析进行频率分析得出如下输出结果:由上图可知,分析变量名:肺活量。
可见样本量N为6例,缺失值0例, 1500以下的33%,1500-2000男生33%女生50%,2000以上女生16.7%,男生33%。
四、描述分析进行描述分析得出如下输出结果:由上图可知,分析变量名:工资,可见样本量N为6例,极小值为男1342女1213,极大值为男2200女2077,说明12人中肺活量最少的为女生是1213,最多的为男生有2200,均值为1810.50/1621.33,.标准差为327.735/325.408,离散程度不算大。
五、交叉分析实验报告三实验项目:均值比较实验目的:.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
实验内容及步骤(一)描述统计案例:某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
---------------------------------------------------------------最新资料推荐------------------------------------------------------
spss医学统计学实验指导
医学统计学实验指导(供本科各医学专业用)编写说明为了加深学生对《医学统计学》课堂教学内容的理解及提高实际应用能力,我们编写了这本《医学统计学实验指导》。
在课堂学习的基础上,安排一定的时间实习,使理论联系实际,以达到医学统计学教学目的。
本教材作为《医学统计学》的配套教材,主要供本科各医学专业使用。
主要通过利用 SPSS 统计软件开展电脑实验课,改变过去完全采用理论和课堂教学的形式,坚持重统计思想而轻死记公式、重缜密思考而轻单纯演算,强调理论联系实际。
重点培养学生如何收集所需数据、应该采用什么方法去整理和分析数据、以及怎样利用统计软件输出的结果得出结论、进行解释,注重培养学生应用统计知识去分析和解决实际问题的能力。
另外提供一定数量的习题作为巩固课堂知识和复习备考所需。
本教材在编写时参考并引用了有关教材的部分资料和图表,在此特作说明,并向原作者表示深深的谢意。
由于作者水平所限,缺点乃至错误难免,恳请同道专家及读者提出宝贵意见,谢谢!编者 2008 年 6 月目录实验一 SPSS 统计软件简介 - 1 - 实验二数值变
1 / 2
量资料的统计描述 - 6 - 实验三数值变量资料的统计分析 - 19 - 实验四分类变量的统计分析 - 25 - 实验五秩和(非参数)检验 - 40 - 实验六统计图 ...。
《医学统计学》SPSS 上机实验讲义绪论:学点统计学,迎接挑战1.什么是统计学:the science and art of dealing with variation in data through collection,classification and analysis in such a way as to obtain reliable results。
即:统计学是一套收集数据和分析信息的方法和原则,以帮助人们在面对不确定性时制定决策。
由此看来:1)它是处理资料中变异性的科学和艺术。
2)它的目的在于取得可靠的结果。
3)它是在搜集、归类、分析和解释大量数据的过程中完成其使命的。
2.学习统计学可以:1)在从事医药方面的科学研究时,从设计、分析到解释全面借助统计学。
2)在医学论文所应用的统计学知识中70%是最基本的概念和经典的统计方法,出现的错误也最多。
为此,作为读者也学提高识别统计学错误的本领,否则就不能正确对待出版物中的结果和结论,人云亦云,贻误自身工作。
3)在工作中,正确理解与运用医学指标的正常参考范围、总结自己的治疗经验、证实自己提出的诊断方法不亚于现有方法、考证民间验方的优劣等。
3.学什么:学统计学的基本概念,学统计学独特的思维方式,学常用的统计方法和电脑软件的使用。
至于复杂的统计理论和技术,专业性比较强,需要时可通过协作解决问题。
实验安排实验一:1)SPSS统计软件的概述及数据文件的建立与修改 (13)实验二:1)统计图 (13)2)计量资料统计描述实验三:1)t检验 (14)实验四:1)单因素方差分析2)测验13)多因素方差分析 (15)检验实验五:1)22)非参数检验 (16)3)测验2实验六:1)相关与回归 (17)2)上机考试上课时间:8:00-12:00上课地点:本部实验楼一、SPSS统计软件的概述及数据文件的建立与修改1.SPSS统计软件的概述:SPSS是社会科学用的统计软件包。
卫生统计学实习何平平北京大学公共卫生学院流行病与卫生统计学系Tel: 82801619实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。
实习六
数值变量资料的统计推断(三)
第237~249页
一、直线回归(linear regression)
(一)定义:用直线方程表达X(自变量,independent variable)和Y (应变量,dependent variable)之间的数量关系。
ˆY a bX
=+
ˆY:是Y(实测值)的预测值(predicted value),是直线上点的纵坐标。
对于每一个X值,根据直线
回归方程都可以计算出相应的Y预测值。
直线回归的重要应用之一:预测(Prediction)
一、直线回归(linear regression)(二)b和a的意义
a:是回归直线在Y轴上的截距,即X=0时Y的预测值。
b:是回归直线的斜率,又称为回归系数。
表示当X改变一个单位时,Y的预测值平均改变|b|个单位。
二、直线相关(linear correlation)
(一)定义
描述具有直线关系的两个变量之间的相互关系。
r:相关系数,correlation coefficient
用来衡量有直线关系的两个变量之间相关的密切程度和方向。
-1≤r≤1
r>0,正相关;r=1为完全正相关
r<0,负相关;r=-1为完全负相关
|r|越大,两变量相关越密切(前提:r有统计学意义)
(二)相关类型正相关:0<r≤
1
二、直线相关(linear correlation)
负相关-1≤r
<0
二、直线相关(linear correlation )
(二)相关类型
零相关r
=0
二、直线相关(linear correlation )
(二)相关类型
零相关r =0
二、直线相关(linear correlation )
(二)相关类型
曲线相关
应变量Y 自变量X
三、SPSS13.0软件操作(直线回归与相关)
例11.绘制散点图
散点图显示:收
缩压与体重指数
之间有线性相关
趋势,因此可以
进一步做直线回
归与相关
应变量自变量
回归相关系数r
决定
系数r 2
调整r 2剩余自由度MS 回归及MS 剩余P 值
s b 标准化回归系数t 值
P 值
F 值
F =t 2
应变量自变量
统计保存(产生新变量,保存在当前数据库)
的均数个体Y值
例13.直线回归的预测及置信区间估计
总体回归系数的
95%置信区间
四、附录:SPSS13.0软件操作(Spearman等级相关)
Spearman等级相关是基于秩次的非参数相关分析。
主要适用于以下情况:
1.对于数值型变量,X及Y严重偏离正态分布;
2.等级资料的相关分析。
Spearman 等级相关系数
)。