卫生统计学--离散趋势的统计描述(衡量离散程度的指标、正态分布及应用、医学参考值范围)
- 格式:pdf
- 大小:11.35 MB
- 文档页数:40
离散趋势的统计描述
学习目标
Ø能说出离散趋势的常用描述指标
Ø能说出标准差、变异系数、四分位数间距的适用条件能选用恰当的指标描述数值变量
Ø极差与四分位数间距Ø方差与标准差
Ø变异系数
1.极差与四分位数间距
Ø极差——全距:R=最大值-最小值
Ø四分位数间距:Q=P75-P25P 75
P
25
最小值最大值
2.方差与标准差
12
--∑=n X X S )
(样本标准差12
2--∑=n X X S )(样本方差
标准差的意义
当几组资料均数相近、度量衡单位相同时,标准差大表示变量值的变异程度大。
X 对称分布的计量资料
S
3.变异系数
用于比较度量衡单位不同或均数相差悬殊的几组资料的变异程度。
%100⨯=X
S CV
指标共性区别
极差
①用于数值变量
②描述离散趋势
③数值越大,离散程度越大小样本
四分位数间距偏态分布
方差与标准差对称分布
变异系数单位不同或均数相差较大
小结。
卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。
3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。
(P55知识点4-2)3、离散趋势的描述。
(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。
2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。
2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。
3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。
2、标准误的概念。
[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。
5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。
[知识点7-2] P933、单侧检验与双侧检验区分。
[知识点7-3] P954、假设检验应该注意的问题。
[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。
统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
《卫生统计学》(本)学习指导刘仁权(Liurq@、64286391)一、课程总说明(一)课程介绍统计学是一门研究数据的收集、整理、分析的科学。
卫生统计学是一门运用统计学原理和方法研究医药卫生工作中数据的收集、整理、分析的科学。
卫生统计学是医学体系的重要分支,是医学院校学生的必修课程。
随着医学的发展,作为医学科学研究方法学的卫生统计学已逐渐为广大医药卫生工作者所认识、所接受,并广为应用。
通过本课程的学习,可以掌握卫生统计学的基本概念、基本理论和基本方法,掌握收集、整理和分析资料的基本知识和方法,可以培养运用这些知识,对医药卫生工作中的数据进行统计处理的能力。
(二)教材、光盘和计算器在本课程的学习中,指定教材和课件光盘都很重要,同学们一定要准备好指定教材和课件光盘,并准备一个计算器或使用计算机Windows附件中的计算器。
1.课件光盘:北京大学医学网络教育学院多媒体网络课件《卫生统计学》光盘2张,主讲:刘仁权。
光盘中是按教材《医学统计学》(第4版,主编:马斌荣)第一章至第十章内容详细讲解的全程授课视频录像。
2.现在指定教材:《医学统计学》(第6版)主申:马斌荣,主编:李康、贺佳;人民卫生出版社(2013年3月)。
本教材是卫生部“十二五”规划教材、全国高等医药教材建设研究会“十二五”规划教材,是“十二五”普通高等教育本科国家级规划教材。
说明:课件光盘是以前录制的,当时的教材是《医学统计学》(第4版),现在已经没有第4版教材出售了,同学们现在拿到的教材是第6版。
不过两版教材内容基本相同,只是换了例题的数据,但解题过程完全相同。
同学们要注意,本课程比较难,大家要认真观看我教学光盘中的讲课录像,安照光盘的顺序和内容,对照教材学习。
为了方便同学们学习,下面的表格是课件光盘、第6版教材内容的比较。
说明2:光盘中“第七章相对数及其应用”是独立的,可以象教材那样提前学习,不影响其他章节的学习。
3.计算器:准备一个计算器或使用计算机Windows附件中的计算器。
离散趋势的统计描述离散趋势是描述数据分布时考虑数据离散程度的统计量。
它反映了数据在离散分布上的分散程度,即数据点之间的差异性。
在统计学中,离散趋势的统计描述包括极差、方差、标准差、百分位数和四分位数等。
首先,极差(Range)是离散趋势中最简单的测量指标。
它是最大值与最小值的差值,反映了数据的全局分布范围。
然而,极差对极端值非常敏感,容易受到异常值的干扰,因此常常会受到极值的干扰。
其次,方差(Variance)是离散趋势的重要指标之一。
它是各个数据与均值偏差的平方的平均值。
方差的计算过程中涉及到每个数据点与均值的差异,因此可以有效地描述数据的分散性。
方差越大,数据的分布越分散;方差越小,数据的分布越集中。
然而,方差的单位和原数据的单位平方相同,不是直观易懂的量纲,因此通常使用标准差作为方差的平方根来度量。
标准差(Standard Deviation)是方差的平方根,也是离散趋势的常用度量。
标准差描述了数据相对于均值的分散程度,是离散趋势的最具代表性的统计量之一。
标准差越大,数据的分布越分散;标准差越小,数据的分布越集中。
标准差的单位与原数据的单位相同,而且在计算中是有限的和正数,因此更加直观和易于解释。
另外,百分位数(Percentile)和四分位数(Quartile)是描述离散趋势的重要统计量。
它们是将数据按照大小进行排序后,将数据分为若干个部分的量。
百分位数表示数据中有百分之p的数据小于或等于此数值,例如中位数就是50%分位数。
四分位数将数据分为四个部分,分别是上四分位数(数据小于最大小于或等于四分之一的数值)、中位数和下四分位数(数据小于四分之三的数值)。
四分位数的计算可以通过计算百分位数获得。
四分位数可以较好地描述数据的整体分布情况和数据的离散程度。
在实际应用中,离散趋势的统计描述可以根据具体问题选择合适的指标进行计算和分析。
极差可以用来初步了解数据分布的范围。
方差和标准差可以用来衡量数据的波动程度,分析数据集的稳定性和可靠性。
1.医学统计学(medical statistics)
:是描述、归纳、探索医学数据分布特征和解释数据规律的一门学科,是科研工作者运用概率论与数理统计原理,进行数据的获取、存储及管理和分析,评价人类健康水平,探索疾病发生与发展规律,进行预测评价的方法,是循证实践中数据挖掘不可或缺且起关键作用的一种技术手段。
2、变量(variable)【对应“常量”】
:根据研究目的,对研究对象的某个或某些特征(研究指标或项目)实施观测,这些特征称为变量。
3、P值:在H0成立的条件下,出现该实验结果或更极端情况的概率值。
医师资格考试xx-预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。
总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。
总体的指标为参数。
实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。
样本的指标为统计量。
由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。
抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。
某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。
二、变量的分类变量:观察单位的特征,分数值变量和分类变量。
第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。
2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。
对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。
3.中位数一组按大小顺序排列的观察值中位次居中的数值。
可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。
不能求均数和几何均数,但可求中位数。
百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。
二、描述计量资料的离散趋势的指标1.全距和四分位数间距。
2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。
均为数值越小,观察值的变异度越小。
3.变异系数多组间单位不同或均数相差较大的情况。
变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数。