当前位置：文档之家› 最新卫生统计学复习笔记

最新卫生统计学复习笔记

卫生统计学复习笔记

一、概述

1、卫生统计学的概念（熟练掌握）

统计学是研究数据的收集、整理和分析的一门科学，帮助人们分析所占有的信息，达到去伪存真、去粗取精、正确认识世界的一种重要手段。

卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

由此看出：统计学是处理资料中变异性的科学和艺术，是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”，但在实际工作中，许多人往往是忽略了设计、收集和归类（整理），到了分析数据时才想到统计学，此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。

卫生统计学的内容（了解）：

1）健康统计：医学人口统计、疾病统计和生长发育统计等；

2）卫生服务统计：包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。

2、卫生统计学的工作步骤（熟练掌握）

统计学对统计工作的全过程起指导作用，任何统计工作和统计研究的全过程都可分为以下四个步骤：

1)、设计：在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上，对将要进行的研究工作所做的全面设想。其内容包括：明确研究目的和研究假说，确定观察对象、观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环，也是指导以后工作的依据

2)、收集资料：遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面：①统计报表：是由国家统一设计，有关医疗卫生机构定期逐级上报，提供居民健康状况和医疗卫生机构工作的主要数据，是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表，职业病报表，医院工作报表等。②经常性工作记录：如卫生监测记录、健康检查记录等。③专题调查或实验。

3）、整理资料：收集来的资料在整理之前称为原始资料，原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳，使原始资料系统化、条理化，便于进一步计算统计指标和分析。其过程是：首先对原始资料进行准确性审查（逻辑审查与技术审查）和完整性审查；再拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；最后汇总归纳。

4）、分析资料：其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行

描述；后者是指如何抽样，以及如何用样本信息推断总体特征。进行资料分析时，需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。

统计工作的四个步骤紧密相连、不可分割，任何一步的缺陷，都将影响整个研究结果。

3、基本概念：

1）、同质与变异。严格地讲，同质是指被研究指标的影响因素完全相同。但在医学研究中，有些影响因素往往是难以控制的（如遗传、营养等），甚至是未知的。所以，在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时，要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同，而不易控制的遗传、营养等影响因素可以忽略。

同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上，客观世界充满了变异，生物医学领域更是如此。哪里有变异，哪里就需要统计学。若所研究的同质群体中所有个体一模一样，只需观察任一个体即可，无须进行统计研究。

2）、总体与样本

任何统计研究都必须首先确定观察单位，亦称个体。观察单位是统计研究中最基本的单位，可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。

总体是根据研究目的确定的同质观察单位的全体，或者说，是同质的所有观察单位某种观察值（变量值）的集合。例如欲研究山东省2002年7岁健康男孩的身高，那么，观察对象是山东省2002年的7岁健康男孩，观察单位是每个7岁健康男孩，变量是身高，变量值（观察值）是身高测量值，则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体和无限总体。有限总体是指在某特定的时间与空间范围内，同质研究对象的所有观察单位的某变量值的个数为有限个，如上例；无限总体是抽象的，无时间和空间的限制，观察单位数是无限的，如研究碘盐对缺碘性甲状腺病的防治效果，该总体的同质基础是缺碘性甲状腺病患者，同用碘盐防治；该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果，没有时间和空间范围的限制，因而观察单位数无限，该总体为无限总体。

在实际工作中，所要研究的总体无论是有限的还是无限的，通常都是采用抽样研究。样本是按照随机化原则，从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体（山东省2002年7岁健康男孩）中，按照随机化原则抽取100名7岁健康男孩，他们的身高值即为样本。从总体中抽取样本的过程为抽样，抽样方法有多种。抽样研究的目的是用样本信息推断总体特征。

统计学好比是总体与样本间的桥梁，能帮助人们设计与实施如何从总体中科学地抽取样本，使样本中的观察单位数（亦称样本含量）恰当，信息丰富，代表性好；能帮助人们挖掘样本中的信息，推断总体的规律性。

3）、资料与变量及其分类

总体确定之后，研究者应对每个观察单位的某项特征进行测量或观察，特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值或观察值，亦称为资料。

按变量的值是定量的还是定性的，可将变量分为以下类型，变量的类型不同，其分布规律亦不同，对它们采用的统计分析方法也不同。在处理资料之前，首先要分清变量类型。

1）数值变量：其变量值是定量的，表现为数值大小，可经测量取得数值，多有度量衡单位。如身高（cm）、体重（kg）、血压（mmHg kPa）、脉搏（次/min）和白细胞计数（×10 9 /L）等。这种由数值变量的测量值构成的资料称为数值变量资料，亦称为定量资料。大多数的数值变量为连续型变量，如身高、体重、血压等；而有的数值变量的测定值只能是正整数，如脉搏、白细胞计数等，在医学统计学中把它们也视为连续型变量。

2）分类变量：其变量值是定性的，表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类：

（1）无序分类变量是指所分类别或属性之间无程度和顺序的差别。它又可分为①二项分类，如性别（男、女），药物反应（阴性和阳性）等；②多项分类，如血型（O、A、B、AB），职业（工、农、商、学、兵）等。对于无序分类变量的分析，应先按类别分组，清点各组的观察单位数，编制分类变量的频数表，所得资料为无序分类资料，亦称计数资料。

（2）有序分类变量各类别之间有程度的差别。如尿糖化验结果按－、±、＋、＋＋、＋＋＋分类；疗效按治愈、显效、好转、无效分类。对于有序分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表，所得资料称为等级资料。

变量类型不是一成不变的，根据研究目的的需要，各类变量之间可以进行转化。例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时，可按二项分类资料分析；若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时，可按等级资料分析。有时亦可将分类资料数量化，如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。

4、随机事件与概率

医学研究的现象，大多数是随机现象，对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件，亦称偶然事件，简称事件。例如用相同治疗方案治疗一批某病的患者，治疗转归可能为治愈、好转、无效、死亡四种结果，对于一个刚入院的患者，治疗后究竟发生哪一种结果是不确定的，可能发生的每一种结果都是一个随机事件。

对于随机事件来说，在一次随机试验中，某个随机事件可能发生也可能不发生，但在一定数量的重复试验后，该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值，常用P表示。例如，投掷一枚均匀的硬币，随机事件A表示“正面向上”，用 n表示投掷次数；m表示随机事件A发生的次数；

f表示随机事件A发生的频率（f=m/n），0≤m≤n, 0≤f≤1。

用不同的投掷次数n作随机试验，结果如下：m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498,

501/1000=0.501, 10001/2000=0.5000，由此看出当投掷次数n足够大时,f=m/n→0.5，称P(A)=0.5，或简写为：P=0.5。当n足够大时，可以用f估计P。

随机事件概率的大小在0与1之间，即0

若随机事件A的概率P(A)≤a，习惯上，当a=0.05时，就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如，某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万，但大街上仍有行人，这是因为“被撞”事件是小概率事件，所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。“小概率”的标准a是人为规定的，对于可能引起严重后果的事件，如术中大出血等，可规定a=0.01，甚至更小。

误差是指测定结果与真实结果之间的差值。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值，即用测量技术所能达到的最完善的方法，测出的数值也和真实值存在差异，这种测量值和真实值的差异称为误差。

误差的分类

误差分为绝对误差和相对误差。也可以根据误差的来源分为系统误差（又称偏性）和随机误差（又称机会误差）。

1、绝对误差是测量值对真值偏离的绝对大小，因此它的单位与测量值的单位相同。

2、相对误差则是绝对误差与真值的比值，因此它是一个百分数。一般来说，相对误差更能反映测量的可信程度。相对误差等于测量值减去真值的差的绝对值除以真值，再乘以百分之一百。

3、系统误差是由一些固有的因素（如测量方法的缺陷）产生的，理论上总是可以通过一定的手段来消除。如天平的两臂应是等长的，可实际上是不可能完全相等的；天平配置的相同质量的砝码应是一样的，可实际上它们不可能达到一样。

4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差（也称为偶然误差和不定误差）。

第二节疾病统计常用指标

一、疾病统计的意义

疾病统计（morbidity statistics）从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律，为病因学研究，为防治疾病和评价防治工作效果提供科学依据。

二、疾病统计资料的来源

包括以下三个方面：

1.疾病报告和报表资料

2.医疗卫生工作记录

3.疾病调查资料

三、疾病和死因分类

疾病和死因的分类是按国际疾病和死因分类（international classification of diseases,简称ICD）, 目前正在使用的版本是ICD－10。见有关书籍。

四、常用疾病统计指标

1.反映疾病发生水平的指标

(1)发病率(incidence rate)

(2)患病率（prevalence rate）

2.反映疾病构成情况的指标

3.反映疾病危害程度和防治效果的指标

（1）某病死亡率：见死因别死亡率。

（2）某病病死率（case fatality）

（3）治愈率(cure rate)

（4）有效率

（5）生存率（survival rate）：指病人能活到某一时点的概率。常用于对慢性病的治疗效果或预后估计。（五）、残疾统计

1.残疾的定义及分级

残疾是指在心理、生理、人体结构上，某种组织、功能丧失或者不正常，全部或者部分丧失以正常方式从事某种活动能力的人。分为功能、形态残疾（impairment）、丧失功能残疾（ disability）和社会功能残疾（handicap）三个此次。

2.残疾的常用统计指标

（1）残疾患病率

（2）残疾构成

第一节医学人口统计常用指标

一、医学人口统计资料的来源

1.来源于人口普查资料

2.来源于人口抽样调查资料

3.来源于人口抽样资料，包括生命时间登记、人口迁移变动登记、户口登记等途径。

二、人口数与人口构成

（一）人口总数

人口总数（Population）一般指一个国家或某一特定时间的人口数，一般采用一年的中点，即7月1日零时为标准时刻统计。

（二）人口构成及其分析

1、基本人口学特征包括年龄、性别、文化、职业等，其中最常用的是性别和年龄，用以描述人口构成情况。

2、人口年龄构成指各年龄组人口在总人口中所占的比例。在人口年龄构成的基础上，可以导出许多有用的描述人口状况的指标，比如：

（1）人口系数

1）老年（人口）系数：

老年人口系数越大，表明人口中老年人口所占比重越大；在一定程度上反映人群的健康水平。

2）少年儿童（人口）系数

少年儿童人口系数越大，表明人口中少年人口所占比重越大，人口越年轻。该指标主要受生育水平的影响。（2）负担系数又称抚养比或抚养系数，是指人口中非劳动年龄人数与劳动年龄人数之比。负担系数包括三个指标：

总负担系数=

少年儿童负担系数=

老年负担系数=

（3）老少比：是划分人口类型的标准之一。

老少比=

3、性别比指男性人口与女性人口的比值，即

性别比=

4、人口金字塔是将人口的性别、年龄分组数据，以年龄（或出生年份）为纵轴，以人口数或年龄构成比为

横轴，按左侧为男、右侧为女绘制的直方图，其形如金字塔，故称为人口金字塔。

人口金字塔更形象直观地反映了人口的年龄构成，便于说明和分析人口现状、类型及发展趋势。

三、生育与计划生育统计

（一）、生育与计划生育统计资料的来源

有关原始资料包括人口、出生、死亡、结婚登记、育龄妇女资料等，可向有关部门索取，也可根据需要自行调查取得。

（二）生育与计划生育统计指标

1.反映生育水平的指标

（1）粗出生率（crude birth rate，简记为CBR）：

粗出生率=

上式中平均人口数的取值，若在人口普查年，可用普查所得的该地该年7月1 日零时的人口总数；在非人口普查年，则用上年末及本年末两个人口数的平均值。粗出生率的优点在于资料易获得，计算简单，但它的主要缺点是受人口的年龄、性别构成和婚姻状况的影响。粗出生率只能粗略地反映生育水平。

?总生育率（general fertility rate,简记为GFR）：指某地某年平均每千名妇女的活产数。

总生育率=

总生育率消除了总人口中年龄性别构成不同对生育水平的影响，较粗出生率能更确切地反映生育水平。但受育龄妇女内部年龄构成的影响。

（3）年龄别生育率（age-specific fertility rate,简记为ASFR）：又称年龄组生育率，其算式为：

某年龄组生育率=

年龄别生育率消除了育龄妇女内部年龄构成不同对生育水平的影响。

卫生统计学整理笔记

如何绘制频数表？求组距确定各组段的两个端点归组计数频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式算数应用条件：对称分布，尤其正态分布几何应用条件： 1.对数对称分布、等比资料 2.变量值中不能有0；不能同时有正值和负值；若全是负值，计算时可先把负号去掉，得出结果后再加上负号。中位数条件：所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清极差应用条件：所有分布、尤其偏态分布不足：不能全面的反映所有值的偏离程度不稳定、小样本小于大样本、样本小于总体四分位数间距应用条件所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清方差应用条件：对称分布，尤其正态分布变异系数应用 1.量纲不一致

散点图作用观察两组数据的总体趋势和明显偏离趋势的观察点判断两组数据的关联形式、方向和密切程度相关分类线性相关秩相关分类变量相关线性相关意义 r>0表示正相关，r=1表示完全正相关；r<0表示负相关，r=-1表示完全负相关。 |r|→0表示相关性越弱，|r|→1表示相关性越强。 r=0表示没有线性相关，不代表没有相关。如何判断线性相关画散点图计算线性相关系数假设检验如何进行秩相关编秩次计算秩相关系数假设检验回归分析：利用样本信息，找到变量间数量依存关系。线性回归分析：利用样本信息，找到变量间线性数量依存关系。决定系数：反映回归贡献的相对程度，即Y的变异被X解释的比例。如何进行分类变量的相关分析交叉表的制作，计算各种概率计算列联系数假设检验相关分析的条件线性相关系数：二元正态分布的定量变量秩相关系数：非二元正态分布的定量变量、有序分类变量列联系数：无序分类变量轶闻数据：由坊间流传或各种媒体报道的一些个案数据，由于其特殊性往往给公众留下突出和深刻的印象。特点：缺乏代表性，常诱导人们进行简单的推论，得到一些具有倾向性的结论。可得数据：为了某些特定目的已收集或积累的数据。如：各类监测数据、统计年鉴等。

卫生统计学名词解释

1.总体：总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 2.随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。 4.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 5．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。 2.概率是描述随机事件发生可能性大小的数值，常用P表示。随机事件概率的大小在0与1之间，P越接近1，表示某事件发生的可能性越大；P越接近0，表示某事件发生的可能性越小。习惯上将P≤0.05的事件，称为小概率事件，表示在一次实验或观察中该事件发生的可能性很小，可视为不发生。 6. 随机误差：随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 7．系统误差：系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8．随机变量：随机变量（random variable）是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。 9．参数：参数（paramater）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。 10．统计量：统计量（statistic）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 11.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2…个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。 12.算术均数（arithmetic mean）描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 13.几何均数（geometric mean）用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。 16.百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。抽样:从研究总体中抽取少量有代表性得个体,称为抽样。概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。变量:表现出个体变异性得任何特征或属性。随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量：a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量：a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学令狐文艳医学统计学方法第一节基本概念和基本步骤（非常重要）一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体：根据研究目的决定的同质研究对象的全体，确切地说，是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中，经常是从总体中随机抽取一定数量的个体，作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异，抽样研究中所抽取的样本，只包含总体中一部分个体，这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率，用P表示，在0～1之间，0和1为肯定不发生和肯定发生，介于之间为偶然事件，<0.05或0.01为小概率事件。

二、变量的分类变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称，适用于正态或近似正态分布。 2.几何均数适用于等比资料，尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布，经对数变换后（用原始数据的对数值lgX代替X）服从正态分布，观察值不能为0，同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布，特别是偏态分布资料的集中位置，以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值，将全部观察值分为两部分，有X％比小，剩下的比大，可用于计算正常值范围。二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用，适于正态分布，既考虑了离均差（观察值和总体均数之差），又考虑了观察值个数，方差使原来的单位变成了平方，所以开方为标准差。均为数值越小，观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学-第六版

一、名词解释：' ]6 H0 p3 ?' n- |3 a. { p0 l1 U4 ? 1、总体是根据研究目的确定的同质观察单位的全体。- I7 k$ _, J" @: Y, B" u 2、样本是从总体中随机抽取的部分观察单位。 3、总体参数是根据总体个体值统计算出来的描述总体的特征量。 4、样本统计量是根据样本个体值统计计算出来的描述样本的特征量。% v, |* O: j/ D0 ?2 C 5、变量：对某项变异特征进行测量和观察，得到的指标。 6、计量资料：对某个观察单位用定量的方法测定某项指标量的大小，所得的资料。 7、计数资料：将观察单位按某种属性或类别分组，所得的观察单位数。 8、等级资料：将观察单位按测量结果的某种属性的不同分组，所得的观察单位数。 9、概率：是描述随机事件发生的可能性大小的数值，用P表示。 10、小概率事件：习惯上将≤0.05（1分），称为小概率事件，表示在一次实验或观察中该事件发生的可能性很少，可视为不发生。 11、抽样误差：由抽样造成的样本统计量和总体参数的差别。& b n. D4 Q8 G& h7 q6 r' f 12、频数表：当变量值个数较多时，可将各变量值及其相应的频数列表。- h( F6 D: ^5 ~7 @; _ 13、中位数：一组按大小顺序排列的变量值，位次居中的观察值。 14、极差：又称全距，指所有观察值最大值与最小值的差值。 15、百分位数：是一种按大小顺序排列的变量值分为100份，理论上有x%的变量值比它小，有（100－x）%变量值比它大，对应x%位次的数值。 16、四分位数间距：变量值中上四分位数p75与下四分位数p25的差值。' H6 s7 r; o- n) f$ A2 D m 17、方差：各个变量值的离均差平方和样本例数之比，描述资料的离散趋势。 ?0 y5 c% r2 o y {8 ^7 w' A8 P 18、标准差：方差开方，是描述数据分布离散程度（或变量变化的变异程度）的指标。 19、变异系数：样本标准差与均数之比的百分数，描述资料的离散趋势。 20、标准正态分布：均数为0，标准差为1的正态分布。即N（0,1）6 K. w' E& { c4 R( L7 F* T4 C8 } 21、集中趋势：所有观察值向均数集中靠拢的趋势。 22、卫生统计学：以医学为指导，用统计学的原理和方法研究医学的一门应用科学。它包括三个方面的内容：①卫生统计学的基本原理和方法。②健康统计。③卫生服务统计。9 Y/ [. X1 P' H! o5 B 23、离散趋势：是指观察值的参差不齐或者分散性。- t, R& v; x+ e& P 24、医学参考值范围：也称正常值范围，医学上常把绝大多数正常人（排除了有关疾病和因素对所研究指标有影响的所谓正常人）某项结构、功能、代谢产物指标范围，称为指标的正常值范围。0 u3 r6 E: F& J6 R; U 25、自由度：随机变量能自由取值的个数。7 E; h+ X# k# ?. G5 N0 Y% N" _! r 二、是非题：6 I7 v e# K' d6 } 1、变量值之间呈倍数或等比关系的数据，宜用几何均数表示其平均水平。 2、百分位数应用中提到，分布中间的百分位数相当稳定具有较好的代表性，但靠近两端的的百分位数只有在样本例数足够多时才能比较稳定。 3、为了解数值变量分布规律，可将观察值编制频数表，绘制频数分布图，用于描述资料的分布特征以及分布类型。 4、如果少数几个数据比大部分数据大几百倍一般就不宜计算均数。; I5 z. F) |3 p J5 o 5、原始数据有零，就不能直接计算几何均数。7 s# L) J5 j- I, Z% ~( N9 n; y 6、制定正常值范围应选足够数量正常人作为调查对象，所谓正常人就是排除影响被研究指

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

8. 以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属下列那类资料： B A．计算 B．计数 C．计量 D．等级 E．都对 9. 实验设计中要求严格遵守四个基本原则，其目的是为了： D A．便于统计处理 B．严格控制随机误差的影响 C．便于进行试验 D．减少和抵消非实验因素的干扰 E．以上都不对 10. 两个样本作t检验，除样本都应呈正态分布以外，还应具备的条件是： B A．两样本均数接近 B．两S2数值接近 C．两样本均数相差较大 D．两S2相差较大 E．以上都不对 11. 同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠？A A．Sx B．S C．X D．CV

9住院医师规培考试卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中，共发现病人231例。其中男性158例占68.40%，女性73例占31.60%，提示（）* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时，其标准选择（）* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平，欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平，应采用（）* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料，经直线相关分析得相关系数r=0.9，对该资料拟合回归直线，则其回归系数b值（）*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是（）* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时，组内均方就是误差均方 ? E.完全随机设计的方差分析时，F=MS组间/MS组内 6、实验设计应遵循的基本原则是（）* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时，统计量T为较小的秩和，则正确的是（）* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学（statistics）是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 2.▲总体（population）用来表示大同小异的对象全体，例如一个国家的所有成年人；某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论，这个总体便称为目标总体（target population）；资料常来源于目标总体中的一个部分，它称为研究总体（study population）。需要谨慎的是，就研究总体所下的结论未必适用于目标总体。 3.▲样本（sample）是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样（sampling）。抽样研究的目的是用样本数据推断总体的特征。需要注意的是，统计学的结论从来就不是完全肯定或完全否定的，能不能成功地达到从样本推断总体的目的，关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质（homogeneity）是指同一总体中个体的主要性质相同。 5.▲变异（variation）是指同质的个体之间存在的差异。 6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化：只能由“高级”向“低级”转化，即由信息量多的向信息量少的类型转化，如：定量有序分类二值 7.▲参数（parameter）是反映总体特征的指标，参数的大小是客观存在的，是一个常数，不会发生变化，然而往往是未知的，需要通过样本资料来估计，如总

体均数μ，总体标准差σ。 8.▲统计量（statistic）又称样本统计量，是反映样本特征的指标，是由观察资料计算出来的，如样本均数 X，样本标准差S。统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别：概率是参数，频率是统计量；频率总是围绕概率上下波动。当某事件发生的概率≤0.05时，即P≤0.05，统计学习惯上称该事件为小概率事件。 10.▲误差：表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差，其中系统误差呈现倾向性偏大或偏小现象，是可以避免的；而随机误差，是非人为偶然因素所致，不可避免，但可通过增大样本量等措施使其减小。 11.因果与联系：存在联系未必有因果关系，需排除虚假关联、间接关联。大多数观察性研究，单靠统计学分析只能考察变量之间的联系，难以证明因果关系。

卫生统计学试题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析

附录：单项选择题参考答案

第一章绪论一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体(population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异(variation) 7. 概率(probability) 8. 抽样误差(sampling error) 二、单选题 1．在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3．统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5．按随机方法抽取的样本特点是: A.能消除系统误差 B.能消除随机测量误差 C.能消除抽样误差 D.能减少样本偏性 E.以上都对 6．统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 7．统计工作的基本步骤是： A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、搜集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 8．统计工作的关键步骤是: A.调查或实验设计 B.整理分组 C.收集资料 D.审核资料 E.分析资料

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式 A/B 有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度，即概率强度的似值表示相对于B的一个单位，A有多少位 A和B可以是绝对数、相对数和平均

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便，对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考一、353卫生综合参考书目： ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》二、配套精编复习资料山东大学353卫生综合《复习全程通》精都考研组编三、复习全程通内容简介《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验，由本团队组织目标院校本专业的高分研究生共同合作编写而成，全书考点知识面覆盖全面，权威细致，编排结构科学合理，是专门为本届考研的考生量身定制的必备专业课资料。通过本精编资料四大模块内容，结合考生每个阶段的复习，有助于考生深入了解目标院校以及专业考点重点，提高复习效率，拓展解题思路。 NO.1历年真题汇编通过目标院校原版真题，了解命题老师的出题思路，且分析考点重点，快速了解目标院校出题风格及命题思路，提高复习效率，拓展解题思路 NO.2教辅一本通本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析，通过本书的配套复习，分析专业考点侧重，通过大量典型考题让充分掌握本门科目重点，确保考场应对自如。 NO.3冲刺模拟套卷书在遵循专业课最新参考书目，结合历年考研真题规律，制定的模拟卷，并有详细的配套答案讲解，适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容本部分内容为购买全套资料的同学附赠的内容，主要是初试参考书目主编老师的教学讲义以及相关的扩充习题，此部分内容对于跨考的考生相对比较重要，通过讲义了解专业课基础复习侧重，达到专业知识点不缺不漏。四、解析备考辅导班：专业课一对一无忧全程班专业课一对一标准全程班山东大学在读研究生授课以上内容是【精都考研网】整理发布，每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269，抓紧时间加入了解你所不知道的考研信息。

卫生统计学复习笔记

卫生统计学复习笔记一、概述 1、卫生统计学的概念（熟练掌握）统计学是研究数据的收集、整理和分析的一门科学，帮助人们分析所占有的信息，达到去伪存真、去粗取精、正确认识世界的一种重要手段。卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。由此看出：统计学是处理资料中变异性的科学和艺术，是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”，但在实际工作中，许多人往往是忽略了设计、收集和归类（整理），到了分析数据时才想到统计学，此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。卫生统计学的内容（了解）： 1）健康统计：医学人口统计、疾病统计和生长发育统计等； 2）卫生服务统计：包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤（熟练掌握）统计学对统计工作的全过程起指导作用，任何统计工作和统计研究的全过程都可分为以下四个步骤： 1)、设计：在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上，对将要进行的研究工作所做的全面设想。其内容包括：明确研究目的和研究假说，确定观察对象、观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环，也是指导以后工作的依据 2)、收集资料：遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面：①统计报表：是由国家统一设计，有关医疗卫生机构定期逐级上报，提供居民健康状况和医疗卫生机构工作的主要数据，是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表，职业病报表，医院工作报表等。②经常性工作记录：如卫生监测记录、健康检查记录等。③专题调查或实验。 3）、整理资料：收集来的资料在整理之前称为原始资料，原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳，使原始资料系统化、条理化，便于进一步计算统计指标和分析。其过程是：首先对原始资料进行准确性审查（逻辑审查与技术审查）和完整性审查；再拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；最后汇总归纳。 4）、分析资料：其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行

卫生统计学重点整理资料东大

卫生统计学第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法，研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学，是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3)：设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4)： ⑴同质：在统计学中，若某些观察对象具有相同的特征或属性，我们就称之为同质，或具有同质性。 ⑵变异：同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体：同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本：从总体中随机抽取的具有代表性的部分观察单位的集合。样本中包含的观察单位个数成为样本含量。 ⑸参数：反映总体特征的指标，一般是未知的，常用希腊字母表示，如总体均数μ、总体率π等。 ⑹统计量：根据样本观察值计算出来的指标，常用拉丁字母表示，如样本均数?x 、样本率ρ等。 ⑺变量与资料：对每个观察单位进行观察或测量的某项特征或属性称为变量；变量值的集合成为资料。 ⑻定量资料：亦称计量资料，其变量值是定量的，表现为数值大小，一般有度、量、衡单位。 ⑼定性资料：亦称分类资料，其观察值是定性的，表现为互不相容的类别或属性，一般无度、量、衡单位。可细分为：①计数资料；②等级资料第二章调查研究设计

★1、调查研究的特点（P7）： ①不能人为施加干预措施；②不能随机分组； ③很难控制干扰因素；④一般不能下因果结论 2、常用抽样方法（名称、原理）： ⑴单纯随机抽样：先将调查总体的全部观察单位统一编号，然后采用随机数字表、统计软件或抽签方法之一随机抽取n（样本大小）个编号，由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样：又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分成n（样本大小）个部分，每一部分内含m个观察单位；然后从第一部分开始，从中随机抽出第i号观察单位，依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样：先按对观察指标影响较大的某项或某几项特征，将总体分成若干层，该特征的测定值在层内变异较小，层间变异较大，然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样：将总体划分为群（初级观察单位），各群由次级观察单位组成，随机抽取一部分群，调查抽中群的全部次级观察单位。第三章实验设计 ★1、实验设计的特点（注意与调查研究的特点的区别）： ⑴研究者可人为设置处理因素； ⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。 ★2、实验设计的三要素、四原则： ⑴基本要素：①处理因素②受试对象③实验效应 ⑵基本原则：①对照原则②随机原则③重复原则④均衡原则 4、实验设计的基本步骤： ⑴明确实验目的；⑵确定研究对象；⑶确定可比的实验组和对照组； ⑷确定把受试对象分配到各处理组中的原则；⑸确定样本含量； ⑹确定方法和指标；⑺偏倚及其控制 5、常用的实验设计方案：主要掌握完全随机设计和配对设计。第四章定量资料的统计描述 ★1、频数表的编制：①求极差②确定组数和组距（一般8~15组）

(完整版)卫生统计学知识点总结

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。指标频率型指标强度型指标相对比型指标两个有关联的指标A和B之比概念近似反映某一时间出现概率单位时间内某现象的发频率计算 A/B 公式无有可有、可无有无量纲取值【0,1】可大于1 无限制范围表示相对于B的一个单位，A有多少本质大样本时作为概率近似值频率强度，即概率强度的

文档之家

最新卫生统计学复习笔记

卫生统计学整理笔记

卫生统计学名词解释

《卫生统计学》考试重点复习资料

最新卫生统计学试题及答案(附解释)资料

卫生统计学考试重点总结复习

卫生统计学重点笔记之令狐文艳创作

卫生统计学-第六版

卫生统计学试题6含答案

9住院医师规培考试 卫生统计学方法与应用(下)

卫生统计学知识点(笔记)

卫生统计学试题库

卫生统计学知识点总结

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总

卫生统计学复习笔记

卫生统计学重点整理资料东大

(完整版)卫生统计学知识点总结

9住院医师规培考试卫生统计学方法与应用(下)