当前位置：文档之家› 医学统计学知识点总结

医学统计学知识点总结

医学统计学

1. 对定量资料进行统计描述时，如何选择适宜的指标？

定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合

平均水平均数个体的平均值对称分布

几何均数平均倍数取对数后对称分布

中位数位次居中的观察值①非对称分布；②半定量资料；③末端开

口资料；④分布不明

众数频数最多的观察值不拘分布形式，概略分析

调和均数基于倒数变换的平均值正偏峰分布资料

变异度全距观察值取值范围不拘分布形式，概略分析

标准差（方差）观察值平均离开均数的

程度

对称分布，特别是正态分布资料

四分位数间距居中半数观察值的全距

①非对称分布；②半定量资料；③末端开

口资料；④分布不明

变异系数标准差与均数的相对比①不同量纲的变量间比较；②量纲相同但

数量级相差悬殊的变量间比较

定性资料：阳性事件的概率，概率分布，强度和相对比。

2. 应用相对数时应注意哪些问题?

答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。

（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。

（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。

（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。

3. 常用统计图有哪些？分别适用于什么分析目的？

常用统计图的适用资料及实施方法

图形适用资料实施方法

条图组间数量对比用直条高度表示数量大小

直方图定量资料的分布用直条的面积表示各组段的频数或频率

百分条图构成比用直条分段的长度表示全体中各部分的构成比

饼图构成比用圆饼的扇形面积表示全体中各部分的构成比

线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系

半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标

系

散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数

第3章概率分布（连续随机变量的正态分布；离散随机变量的二项分布及Poisson分布）

1. 服从二项分布及Poisson分布的条件分别是什么？

二项分布成立的条件：①每次试验只能是互斥的两个结果之一；②每次试验的条件不变；③各次试验独立。

Poisson分布成立的条件：除二项分布成立的三个条件外，还要求试验次数n很大，而所关心的事件发生的概率很小。

2. 二项分布、Poisson分布分别有什么特征？

①二项分布、Poisson分布都是离散型分布。

②二项分布的形状取决于π与n的大小。π=0.5时，不论n大小，对称分布。π≠0.5时，图形呈偏态，随n增大而逐渐对称。当n足够大，π或1-π不太小，二项分布近似正态。

③Poisson分布μ越小，分布越偏。μ越大，分布越对称。当n足够大时，分布接近正态。

4、正态分布应用

①估计变量值的频数分布

②制定参考值范围

③质量控制

④正态分布是很多统计方法的基础

5. 正态分布特征

①以均数为中心，左右对称

②正态曲线在横轴上方均数处取得最高点

③正态分布有两个参数，即均数（位置参数）和标准差（变异度参数）（μ,σ2 ;标准 0,1）

④正态曲线下面积有一定规律

第4章参数估计

1. 标准误与标准差的区别

（1）标准差反映个体值散布的程度；标准误反映估计总体参数的精确程度。

（2）标准误小于标准差。

（3）样本含量越大，标准误越小，其样本均数更有可能接近于总体均数，随着样本含量的增大，标准差有可能增大，也有可能减小。

（4）用途不同。

标准差的用途：

①反映一组资料的离散程度

②计算变异系数

③结合均数与正态分布的规律，估计参考值范围

标准误的用途：

④衡量样本均数的可靠性

⑤与样本均数结合，估计总体均数的置信区间

⑥可用于进行均数的假设检验

标准误与标准差的区别与联系

3. 简述置信区间与医学参考值范围的区别。

区别置信区间参考值范围

含义

用途

计算公式总体参数的波动范围，即按事先给

定的概率100(1-α)%所确定的包

含未知总体参数的一个波动范围

估计未知总体均数所在范围

σ未知：

/2,X

X t S

αν

σ已知或σ未知但n≥30，有

/2X

X Z

或

/2X

X Z S

个体值的波动范围，即按事先给

定的范围100(1-α)%所确定

的“正常人”的解剖、生理、

生化指标的波动范围

供判断观察个体某项指标是否

“正常”时参考（辅助诊断）

正态分布：

X Z S

偏峰分布：P X~P100-X

4 何谓置信区间准确度与精确度？如何协调两者间的关系。

置信区间有准确度与精密度两个要素。

（1）准确度由置信度(1－α) 的大小确定，即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看，置信度愈接近于1愈好，

（2）精密度是置信区间宽度的一半，意指置信区间的两端点值离样本统计量（如X、p）

的距离。从精密度的角度看，置信区间宽度愈窄愈好。

（3）在抽样误差确定的情况下，两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度，可适当增加样本含量。

3、参考值范围估计的基本步骤

①从正常人的总体中进行随机抽样

②对选定的正常人进行准确的测定

③确定取单侧还是双侧范围

④确定范围常用95%。

⑤根据资料的分布类型选用恰当的界值估计方法

第5章假设检验

1．试述假设检验中α与P的联系与区别。

区别：（1）α值是事先确定的一个小的概率值。为一次检验中，甘愿冒的风险。

（2）P 值是在0H 成立的条件下，出现当前检验统计量以及更极端状况的概率。为一次检验中，实际冒的风险。

联系：以t 检验为例，P 、α都可以用t 分布尾部面积大小表示。P ≤α时，拒绝0H 假设，差异有统计学意义。

2. 试述假设检验与置信区间的联系与区别。

联系：区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。区别：置信区间用于说明量的大小，即推断总体参数的置信范围；

假设检验用于推断质的不同，即判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验？

需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异，则应选用双侧检验。若需要区分何者为优，，则应选用单侧检验。在没有特殊专业知识说明的情况下，一般采用双侧检验即可。 4. 试述两类错误的意义及其关系。

⑴Ⅰ类错误：如果检验假设0H 实际是正确的，由样本数据计算获得的检验统计量得出拒绝

0H 的结论，此时就犯了错误，统计学上将这种拒绝了正确的零假设0H （弃真）的错误称

为Ⅰ类错误。Ⅰ类错误的概率用 α表示。

⑵Ⅱ类错误：若检验假设0H 原本不正确（1H 正确），由样本数据计算获得的检验统计量得出不拒绝0H （纳伪）的结论，此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β 表示。

在假设检验时，应兼顾犯Ⅰ类错误的概率（α）和犯Ⅱ类错误的概率（β）。犯Ⅰ类错误的概率（α）和犯Ⅱ类错误的概率（β）成反比。如果把Ⅰ类错误的概率定得很小，势必增加犯Ⅱ类错误的概率，从而降低检验效能；反之，如果把Ⅱ类错误的概率定得很小，势必增加犯Ⅰ类错误的概率，从而降低了置信度。为了同时减小α和β，只有通过增加样本含量，减少抽样误差大小来实现。

5．试述检验功效的概念和主要影响因素。

答：拒绝不正确的0H 的概率，在统计学中称为检验功效(power of test)，记为1β-。检验功效的意义是：当两个总体参数间存在差异时(如备择假设1H ：0μμ≠成立时)，所使用的统计检验能够发现这种差异(拒绝零假设0H ：0μμ=)的概率，一般情况下要求检验功效应在0.8以上。

影响检验功效的四要素为总体参数的差异δ、总体标准差σ、检验水准α及样本量n 。

6．简述假设检验的基本思想。

假设检验是在H 0成立的前提下，从样本数据中寻找证据来拒绝0H 、接受1H 的一种“反证”方法。如果从样本数据中得到的证据不足，则只能不拒绝0H ，暂且认为0H 成立，即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝0H 是根据某个界值，即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端（即绝对值更大）的概率较小，比如小于等于0.05，则认为零假设的事件在某一次抽样研究中不会发生，此时有充分理由拒绝0H ，即有足够证据推断差异具有统计学意义。

7. 建设检验四步骤：

⑦ 建立检验假设H 0和备择假设H 1（判断是单侧检验还是双侧检验再作假设） ⑧ 确定检验水准

⑨ 选定检验方法和计算检验统计量 ⑩ 确定P 值和作出推断结论

第6章两样本定量资料的比较

1. 对于完全随机设计两样本定量资料的比较，如何选择统计方法？

答：完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性（样本量较大时n>50不必进行正态性检验）和方差齐性。如果资料来自正态总体且总体方差齐，采用t 检验；如果满足正态性但总体方差不齐，采用t ′检验；当两者都不满足时，才考虑选用秩和检验。当然，我们也可采用变量变换的方法使其满足t 或t ′检验的条件。

2.t 检验有几种，适用条件是什么？

t 检验是以t 分布为理论基础。小样本时，要求资料符合正态分布和方差齐性。一般有以下三种： ? 样本均数与总体均数的比较 ? 配对资料的比较 ? 两个样本均数的比较

此外，还有相关系数，回归系数的t检验。

3.两组定量独立样本的比较

（1）两独立样本的t检验（满足正态性和方差齐性）

（2）校正的t检验（正态但方差不齐）

（3）u检验（大样本，且方差齐）

（4）秩和检验(Wilcoxon)（小样本，不正不齐）{p值确定分为T值在范围内还是范围外（范

H假设}

围可查表知，在范围外则P≤ ，拒绝0

4.配对定量资料的比较(对差值进行正态检验即可，无方差分析)

（1）配对资料的t检验（差值服从正态）

（2）符号秩和检验（signed rank sum test）（不正）{p值确定类似于t检验}

第7章多组定量资料的比较

1. 方差分析的基本思想和应用条件是什么？

基本思想

将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的，将全部观测值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的变异可由某个因素的作用加以解释，通过比较不同变异来源的均方，借助F分布做出统计推断，从而推论各种研究因素对试验结果有无影响。

应用条件

①各样本是相互独立的随机样本，均服从正态分布；

②各样本的总体方差相等，即方差齐性。

2.方差分析的步骤

①建立假设检验和检验水准（H0：总体均数都相等）

②计算统计量F

③确定P值和作出推断结论

④作两两均数之间的比较（若P>0.05,可省略此步）

3. 多组定量资料比较时，统计处理的基本流程是什么？

多组定量资料比较时首先应考虑用方差分析。

（1）若方差齐性，且各样本均服从正态分布，选单因素方差分析。

（2）若方差不齐，或某样本不服从正态分布，选Kruskal-Wallis秩和检验，或通过某种形式的数据变换使其满足方差分析的条件。

若方差分析或秩和检验结果有统计学意义，则需选择合适的方法（如Bonferonni、LSD法等）进行两两比较。

4.方差分析的应用？

①多组定量资料比较，即两个或两个以上均数的比较

②方差齐性检验

③两个或多个研究因素的交互作用

④回归方程的线性假设检验

第8章定性资料的比较

1. 简述2

χ检验适用的数据类型，基本思想，检验步骤。

答：⑴卡方检验是应用较广的一种定性资料的假设检验方法，用于①检验两个或多个样本率（或构成比）之间有无差别，②交叉分类资料两属性间的关联性检验 ③频数分布的拟合优度

⑵χ2检验的基本思想：χ2

值反映的是实际频数与理论频数的吻合程度，在检验假设

H 0成立的情况下，实际频数与理论频数差别仅由随机误差所致，其χ2

值会比较小，反之亦

然，χ2

值越大，越有理由认为检验假设H 0不成立。

⑶检验步骤：

① 建立假设检验和检验水准（H 0 ：总体分布/某情况/某率相等） ② 计算统计量 2

③ 确定P 值和做出推断结论

④ 作两两之间的比较（若P>0.05,可省略此步）

2.四格表资料χ2

检验的条件有哪些？（注意T 为理论频数）

完全随机设计公式，χ2 = （ad-bc ）2

. n/{（a+b ）（c+d ）（a+c ）（b+d ）}

① 总例数n ≥40，且T ≥5，直接计算χ2

不用校正

② n ≥40，且1≤T ＜5，用连续性校正χ2检验

③ n ＜40或T ＜1，不能用χ2

检验，用直接计算概率的方法Fisher 确切概率法。

配对设计公式 χ2 = （b-c ）2

/(b+c) ② b+c ≥40，无需校正

② b+c ≤40，用连续校正公式

3. 两组二分类资料的设计类型有几类？其相应的检验方法是什么？

两组二分类资料的设计类型主要有2类，即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。

通用公式χ2 =（A-T ）2

/ T

完全随机设计公式 χ2 = （ad-bc ）2

. n/{（a+b ）（c+d ）（a+c ）（b+d ）}

配对设计公式 χ2 = （b-c ）2

/(b+c)

4. 什么资料适合用秩和检验进行检验？简述秩和检验步骤。

适用于总体分布未知资料，偏态分布资料，开口资料，等级资料。秩和检验步骤为：

① 建立假设10H H 和，并确定检验水准α；（H 0总体分布相等/配对秩和：中体中位数为0）

②根据不同的设计类型对资料进行编秩并计算秩和；

③根据计算的秩和直接查表或计算相应的统计量再查表，确定P值，作出统计推断。

6、行×列表资料χ2检验的注意事项

①要求不能有1/5以上的格子理论频数小于5，或不能有任意一个格子的理论频数小于1，否则易致分析的偏性。

②若结果拒绝检验假设，只能认为各总体率或构成比之间总的来说有差别，并非彼此间都有差别

③单向有序的行×列表资料，不宜作χ2检验。

6、两样本比较的秩和检验直接法基本思想

假定含量分别为N1和N2的两个样本，来自同一总体或分布相同的两个总体，则样本含量为N1的样本的T与平均秩和N1(N+1)/2一般相差不大，若相差悬殊，超出界值范围，表示随机抽得现有样本统计量T值的概率很小。

7.非参与参数检验的定义及两者区别

参数检验是总体的分布类型已知，对其中未知的参数进行估计和检验的统计方法。特点：依赖于特定的分布类型，比较的是参数。

非参数检验是不依赖于总体分布形式的统计方法。特点：不受总体参数的影响，比较的是分布或分布位置，而不是参数。

9.配对设计差值的秩和检验的编秩方法

①求差值

②将差值按绝对值大小从小到大编秩，并按差值的正负给秩次加上正负号。

③若差值绝对值相等，则取其平均秩次。

④编秩时若遇差值为0，则舍去不计。

10.两组比较的秩和检验的编秩方法

将两样本混合编秩次，若有“相同数据”，处于不同组，则取其平均秩次；在同一组，则无需取平均秩次。（数据 0 不舍去）

11. 配对设计差值的秩和检验的检验步骤

⑴建立假设检验，确定检验水准 H0 ：差值的总体中位数为零 H1 ：差值的总体中位数不为零

⑵计算检验统计量T值

①求差值

②编秩：将差值按绝对值大小从小到大编秩，并按差值的正负给秩次加上正负号。若差值绝对值相等，则取其平均秩次。编秩时若遇差值为0，则舍去不计。

③求秩和确定统计量T

⑶确定P值，作出统计学推断。n＜25，用查表法。n＞25，用正态近似法。

13.非参检验适用范围

①各种资料初步分析

②等级资料，如严重程度，优劣等级，成效大小等。

③资料分布类型不能确认或偏态分布。

④综合分析同质性较差的资料

⑤组内个别数据偏离较大，或组内相差悬殊。

第9章关联性分析第10章简单线性回归分析

1.Pearson积距相关系数r的特点

①相关系数ρ是一个无量纲的数值，且-1≤ρ≤1

②ρ＞0为正相关，ρ＜0为负相关。

③| ρ|越接近1，说明相关性越好；| ρ|越接近0，说明相关性越差。

2.线性回归分析的前提条件 LINE

①线性指反应变量Y与自变量X呈线性变化趋势。一般通过散点图来考察。

②独立性任意两个观察值相互独立。一个个体的取值不受另外一个个体的影响。

③正态性指给定X值时，Y的取值服从正态分布。

④等方差性指对应于不同的X值，Y值的总体变异相同。

Pearson秩相关（即等级相关）的应用条件

①双变量不服从正态分布的资料

②总体分布类型未知的资料

③数据本身有不确定值

④等级资料

直线回归及其回归方程有何用途

①描述Y对X的依存关系

②预测。由自变量X预测应变量Y。

③统计控制。通过控制自变量X的取值，从而使Y在一定范围内波动。

简述做直线相关与回归分析时的注意事项

①回归方程要有实际意义

②分析前先绘散点图，观察是否存在直线趋势或异常点

③直线回归的适用范围一般以自变量X的取值范围为限，不能随便外延。

直线相关与直线回归的区别与联系

区别

①资料要求不同。相关分析要求X，Y均服从正态分布，而回归分析时，要求Y服从正态分布。

②应用不同。相关是只说明两个变量间是否有关联。回归是由一个变量推算另外一个变量，说明依存变化的数量关系。

③相关系数与回归系数 r 与 b 不同。

A.意义不同：b表示X每增（减）一个单位，Y改变b个单位；r说明具有直线关系的两个变量关系的密切程度和方向。

B.取值范围不同 -∞＜b＜+∞，-1≤r≤+1

C.b有单位，r无单位。

联系

①同一组资料相关系数和回归系数的符号相同。

②同一资料相关系数和回归系数的假设检验等价。即 tr=tb ,P值相等。

③可以用回归解释相关。

简述简单线性回归分析的基本步骤。

①绘制散点图，考察是否有线性趋势及可疑的异常点；

②估计回归系数；

③对总体回归系数或回归方程进行假设检验；

④列出回归方程，绘制回归直线；

⑤统计应用。

回归分析中决定系数R2

①定义：考察在Y的变异中，由X所引起的变异占多大的比重。 R2=SS回归/SS总

②取值在0-1之间（因SS回归＜SS总）

③大小反映了自变量对回归效果的贡献，即在Y的总变异中回归关系所能解释的百分比。

④反映了回归模型的拟合效果，常作为拟合优度的指标。

⑤当X与Y均为随机变量时，决定系数R2等于相关系数（r）的平方。

第11章多重线性回归分析

μ=β0 +β1X1 + β2X2 +…+ βp X p

⑴β0：当所有自变量为0时反应变量Y的平均取值

⑵βi：（偏回归系数）方程中其他自变量不变时，Xi每增加（或减少）一个计量单位，反应变量Y平均改变βi 个单位。

⑶确定系数R2：反映回归方程的效果好坏。R2=SS回归/SS总说明自变量组X可以解释反应变量Y总变异的百分比。(增加自变量，R2只增不减)

⑷调整的确定系数R2ab =1 — MS残差/MS总（增加贡献很小的自变量，R2ab可能减小）

⑸复相关系数 R=确定系数开平方，表示随机变量Y与一组随机变量X之间线性相关的程度。

1. 多重线性回归分析的用途有哪些？

①定量地建立一个反应变量与多个解释变量之间的线性关系，

②筛选危险因素，

③通过较易测量的变量估计不易测量的变量，

④通过解释变量预测反应变量，

⑤通过反应变量控制解释变量。

4. 如何判断和处理多重共线性？

①如果自变量之间存在较强的相关，则存在多重共线性。

②通过分析自变量之间的相关系数＞0.9、计算方差膨胀因子＞10和容忍度＜0.25等指标判断是否存在多重共线性。

③最简单的处理办法是删除变量，即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。

④也可采用主成分回归方法。

5. 如何判断、分析自变量间的交互作用？

答：基于专业背景知识，构造可能的交互作用项，并检验交互作用项是否有统计学意义。

6. 多重线性回归模型的基本假定有哪些？如何判断资料是否满足这些假定？如果资料不

满足假定条件，常用的处理方法有哪些？

多重线性回归的前提条件（基本假定）是线性、独立性、正态性和等方差性，可以借助残差分析等方法判断资料是否满足条件。如果资料不满足前提条件，可以采用变量变换、引入交互作用项和更换回归方程等方法处理。

7、哑变量的设置：将有序变量或无序多分类变量转换成为多个二分类变量的过程。个数为变量类别数减1。

第12章实验设计

科研设计的四项基本原则及其意义

①对照原则通过对照鉴别处理因素与非处理因素的差异；消除或减少实验误差

②均衡原则要求各处理组非实验因素的条件均衡一致，以消除非实验因素对实验的影响。

③随机原则抽样随机，分配随机，实验顺序随机，以减少系统误差。

④重复原则要求一定的样本量。重复实验、重复取样、重复测量

实验设计三要素

①处理因素

②受试对象

③实验效应（客观性、精准性、灵敏度、特异性）

实验设计类型

①单因素设计（完全随机设计）：单组设计、成组设计、单因素多水平设计

配对设计、

②随机区组设计（配对设计的拓展）

③交叉设计（处理因素顺序）

④析因设计（K个因素与各水平组合）

⑤重复测量设计

第13章临床试验设计

1.临床试验通常分为哪四期，各期的主要目的分别是什么？

答：Ⅰ期临床试验：初步的临床药理学及人体安全性评价试验。观察人体对于新药的耐受程度和药代动力学，为制定给药方案提供依据。

Ⅱ期临床试验：治疗作用初步评价阶段。其目的是初步评价药物对目标适应证患者的治疗作用和安全性，也包括为Ⅲ期临床试验研究设计和给药剂量方案的确定提供依据。此阶段的研究设计可以根据具体的研究目的采用多种形式，包括随机盲法对照临床试验。治疗组不少于100例。

Ⅲ期临床试验：治疗作用确证阶段。其目的是进一步验证药物对目标适应证患者的治疗作用和安全性，评价利益与风险关系，最终为药物注册申请的审查提供充分的依据。试验一般应为具有足够样本量的随机盲法对照试验。治疗组不少于300例，对照组不少于100.

Ⅳ期临床试验：新药上市后由申请人进行的应用研究阶段。其目的是考察在广泛使用条件下的药物的疗效和不良反应、评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。

2.在临床试验开始之前，应做哪些必要的准备工作？

答：应当了解临床试验相关法规，了解临床试验相关指导原则，了解临床试验的伦理学原则，了解在哪里以及作哪些临床试验。

5. 临床试验设计的基本原则包括哪些？

答：临床试验必须遵循对照、随机、重复和均衡的原则。

6、统计检验类型

①差异性检验差别是否有统计学意义应确定检验水平

②非劣性检验是否不差于有效参比药应确定非劣差异下限

③等效性检验是否与有效参比药等效应确定等效界限

8、统计数据集

①意向性分析数据集未能观察全程的病历资料，用最后一次观察数据作为试验最终结果

②符合方案数据集符合方案，完成主要填写内容的病例，或服药量在80%~120%之间

③安全性数据集只服药一次并进行了至少一次安全性评估的患者。

第14章调查设计

调查按调查方法分为①普查②抽样调查③典型调查

调查问卷的评价

（1）效度评价反映调查对象真实情况的程度。

①表面效度字面上看能否反映调查目的。

②内容效度内容上看能否反映；是否包含足够条目反映。

③结构效度条目设置能否反映，

（2）信度评价同条件同对象重复测验结果的一致性

①重测信度不同时间点

②内部信度问卷内条目的相关程度

③测评者一致性不同测评者

调查设计类型

①横断面研究对同一时间点的各个因素的调查研究

优点：广泛探索多因素；得知疾病流行情况；若调查时间短，成本较低。

缺点：不能推断因果关系；只计算点患病率，不能计算发病率；不适合患病率很低的疾病。

②病例对照研究回顾性

优点：同时调查多个因素；节省人力物力；不存在医疗道德

缺点：不能获得因果关系；不能计算患病率及发病率；容易产生偏倚

③队列研究前瞻性

优点：可以估计发病和暴露因素的联系程度

缺点：费人力物力；每次只考察一个暴露因素；容易失访；难以实施盲法。

抽样方法

①单纯随机抽样：事先规定规则，将调查总体编号，然后借助抽签或随机数字抽样。估计误差简单，但编号并非易事。

②系统抽样：先将调查总体排序，随机抽一个单位为起点，然后依次每隔若干个单位抽取一个单位。简便和节省时间，但当总体呈某种趋势时，可能产生偏移。

③分层随机抽样：现将总体按主要特征（如年龄）分为若干层次，然后在隔层中进行随机抽样。抽样误差小，但操作麻烦。

④整群抽样：以群体为基本单位抽样。在大规模调查中，易于组织。

就抽样误差而言，整群抽样＞单纯随机抽样＞系统抽样＞分层随机抽样

⑤多阶段抽样：将整个抽样过程分成若干个阶段进行。

系统误差，也叫偏倚。常见的有选择性偏倚信息偏倚混杂偏倚。

第15章样本含量估计

样本含量估计的要素（条件）

①根据研究目的所建立检验假设。

②检验水准α，常取α=0.05。α越小，需要的n越大

③检验效能（1-β），常取β=0.2 。检验效能越高，需要的n越大。

④有关总体的一些信息。如，对于两样本均数比较，需知道两均数间差别δ、总体标准差σ。

2. 当假设检验的结果为“阴性”（P＞0.05）时，对样本含量和检验功效进行复核有何意义？

答：当假设检验的结果为“阴性”（P＞0.05）时，对样本含量和检验功效进行复核具有重要意义。通过对样本含量和检验功效进行复核(主要是计算检验功效)，可以检查样本含量和检验功效是否偏低，以便正确认识假设检验的结果，避免得出错误的研究结论。若检验功效偏低，则说明样本含量不足，应加大样本含量，重新进行实验。

第16章随机区组设计和析因设计资料的分析

1．随机区组设计与完全随机设计资料在设计和分析方面有何不同？

在设计上，与后者比，前者在设计阶段按照一定条件将受试对象配成区组，平衡了某些因素效应对处理因素效应的影响，更好地控制了其他因素对处理因素效应的影响，设计效率较高。

在分析上，随机区组设计资料的方差分析将总变异分解为3部分，将由区组因素导致的变异分离出来，使得误差更接近“随机误差”，假设检验的结果更敏感。

H如何写？请解释之。

2. 随机区组设计的Friedman检验，

答：各种处理的总体分布相同。Friedman检验的前提为在各区组内部变量值的秩次是随机的，因此由这些秩次算得各种处理总体的秩次值之和相等。

4．对于两因素的析因设计资料和随机区组设计资料，假定两个因素分别用A和B表示，可否先单独分析A因素，再单独分析B因素？为什么？

答：不可以。如果分别应用单因素的方法（方差分析方法、t检验或秩和检验等）分析A、B两因素，就会出现以下结果：①没有按照实验设计的方法选择分析资料，达不到设计时的目的，信息利用率低。②不能同时分析两个因素，即控制一个因素影响后分析另一个因素的实验效应。③对于析因设计资料，无法分析因素间的交互效应。

第17章重复测量设计和交叉设计资料

1. 交叉设计所收集的资料是否属于非独立资料？

答：交叉设计所收集的资料是属于非独立资料。

2. 能否从某个药物的交叉设计所观察资料的统计分析结果推断临床的实际疗效？

答：交叉设计的某个药物的效果平均是多阶段的平均疗效评价，而临床的实际疗效往往是针对某个阶段的疗效评价，所以有时交叉试验的评价结果与临床的实际疗效评价有一些差异。

3. 能否用析因设计的方差分析方法分析重复测量资料？为什么？

答：不能，因为重复测量的资料是不独立的，析因设计的方差分析要求资料是独立的。

18章 Logistic回归

优势odds = a / b = p/(1-p)

优势比OR = odds1 / odds0 =ad /cb 具有风险概率的含义，以0条件为参考类，1条件发生某事件的优势是0条件的OR倍。

Logistic P =β0 +β1X1 + β2X2 +…+ βp X p

Oddsx = exp（β0 +β1X1 + …）

P = exp（β0 +β1X1 + …） / {1 + exp（β0 +β1X1 + …） }

在单变量的Logistic回归Logistic P =β0 +β1X1中lnOR = β1 ，β0 为没有1条件下某事件发生的优势的对数。

多自变量Logistic回归Logistic P =β0 +β1X1 + β2X2 +…+ βpXp

中，回归系数βj 的含义，在其他条件不变的情况下，，自变量X每增加一个单位与未增加时的优势比的自然对数。（自变量X每增加一个单位所产生的优势比的自然对数）

哑变量回归系数的含义是各类别与参照类优势比的自然对数。

Logistic回归的应用

①校正混杂因素

②筛选影响因素

③疾病预测与预后。条件Logistic回归不能用于预测。

第19章生存分析

Cox模型 h(t) = h0(t)exp(βi X i)

生存资料包括三部分：可能的影响因素和协变量、生存结局和生存时间。

生存资料的特点如下

①同时考虑生存结局和生存时间。

②生存时间可能含删失数据。

③生存时间的分布和常见的统计分布有明显不同，如呈指数分布等。

生存资料的要求

①样本由随机抽样获得，且数量足够

②死亡例数不能太少（≥30）

③删失数据比例不能太大

④生存时间尽可能精确到天数

⑤缺项要尽量补齐

死亡概率、生存概率与生存率的关系

死亡概率指某时间段内死亡的可能性，记作q。

生存概率指某时间段内仍生存的概率，记为p ,p =1-q。

生存率为经历若干个时间段后仍生存的可能性，S = p1 * p2 *p3 ….

1. 生存分析的主要用途及其统计学方法有哪些？

（1）估计：即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。估计生存率常用寿命表法和Kaplan-Meier（K-M）法。

（2）比较：即比较不同受试对象生存数据的相应指标是否有差别。生存曲线比较常用log-rank检验和Breslow检验。

（3）影响因素分析：其目的是为了研究影响生存时间长短的因素，或在排除一些因素影响的情况下，研究某个或某些因素对生存率的影响。影响因素分析常用Cox回归。（4）生存预测：具有不同因素水平的个体生存预测估计。生存预测常用Cox回归。

2. 生存率估计的K-M法和寿命表法是如何利用删失数据的？

生存率估计的K-M法和寿命表法计算期初例数时，都利用了删失数据提供的这部分信息。

3. Cox回归与logistic回归都可作临床研究中的预后分析，两者的主要区别何在？Logistic回归模型

①可以作多因素预后分析，控制混杂因素效应；

②进行相对危险度估计；

③不能处理随访中常见的删失数据；

④仅考虑随访结局（生存或死亡、有效或无效），而未考虑出现该结局的时间长短。

Cox比例风险回归模型

（1）不仅可以从事件结局的好坏，而且可以从发生事件的时间长短进行分析比较。

（2）可以处理删失数据，能够更全面地作预后分析。

但当数据失访较少或结局事件发生数较少时，宜用logistic回归分析。

4. Cox回归中的RR表示什么？如何解释RR的大小？

RR = h（t）i/h(t)j =exp{β（Xi-Xj）} 与h0无关

Cox回归中的RR表示相对危险度（relative risk）或风险比（risk ratio），其含义是在

X每增加一个单位所引起的终点事件发生风险增加到的倍

其他协变量不变条件下，变量

数。

5.参数解释

βj 在其他协变量不变条件下，变量X j 每增加一个单位所引起的相对危险度的自然对数。RR =exp（βj ）在其他协变量不变条件下，变量X j 每增加一个单位所引起的相对危险度

当βj ＞ 0 时，exp（βj ）＞1，X j 为危险因素，反之为保护因素。当βj = 0 时，exp （βj ）=1，则为无关因素。

第25章Meta分析

1. Meta分析的基本步骤有哪些？

答：Meta分析的基本步骤包括：提出问题，制定研究计划；检索相关文献；选择符合要求的纳入文献；提取纳入文献的数据信息；纳入研究的质量评价；资料的统计学处理；敏感性分析；结果的分析和讨论。

2. Meta分析的目的和意义是什么？

答：通过meta分析能增加统计功效，评价研究结果的一致性，增强结论的可靠性和客观性，通过亚组分析，得出新结论，寻找新的假说和研究思路。

3. Meta分析时，固定效应模型和随机效应模型有什么不同？如果研究间有异质性，应如何处理？

Meta分析进行效应合并时的变异可能来源于两个部分，一是研究内变异，二是研究间变异。

采用固定效应模型只考虑研究内变异，即认为研究间的差别只是抽样引起，纳入meta 分析的各个独立研究来自一个相同的总体，各个独立研究的效应是效应合并值这一总体参数的估计值。

采用随机效应模型则同时考虑了研究内变异和研究间变异，即认为研究间的差异不仅仅是抽样引起的，纳入meta 分析的各个独立研究分别来自不同但互有关联的一些总体，每个研究有其相应的总体参数，meta分析的效应合并值是多个不同总体参数的加权平均。

Meta分析时，如果异质性检验的结果不拒绝H0，即研究间的差异没有统计学意义，可采用固定效应模型得到效应合并值。如果拒绝H0，则认为研究间存在异质性，此时应考察异质性来源，并通过敏感性分析或亚组分析等异质性处理方法，使之达到同质后，再采用固定效应模型。若经异质性分析和处理后，多个独立研究的结果仍然不具有同质性，可选择随机效应模型、meta回归及混合效应模型进行效应合并。如果异质性很大，应考虑这些研究结果的可合并性，或放弃meta分析，只对结果进行定性分析。

4. Meta分析有哪些常见的偏倚？

答：偏倚的类型主要包括文献发表偏倚、文献查找偏倚和文献筛选偏倚。

医学统计学知识点范文.doc

第一章绪论 1、统计学，是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象：具有不确定性结果的事物。 3、统计学作用：能够透过偶然现象来探测其规律性，使研究结论具有科学性。 4、统计分析要点：正确选用统计分析方法，结合专业知识作出科学的结论。 5、医学统计学基本内容：统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异同质，指根据研究目的所确定的观察单位其性质应大致相同。变异，指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。 (2) 变量与数据类型变量，是反映实验或观察对象生理、生化、解剖等特征的指标。变量的观测值，称为数据分为三种类型：定量数据，也称计量资料，指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。（如身高、体重、血压、温度等）定性数据，也称计数资料，指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。（进一步分为二分类和多分类，如性别分为男和女，血型分为A、B、O、AB等）有序数据，也称半定量数据或等级资料，指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果，具有半定量性质。统计方法的选用与数据类型有密切的关系。（3）总体与样本总体，指根据研究目的确定的所有同质观察单位的全体，包括所有定义范围内的个体变量值。样本，是从研究总体中随机抽取部分有代表性的观察单位，对变量进行观测得到的数据。抽样，是从研究总体中随机抽取部分有代表性的观察单位。参数，指描述总体特征的指标。统计量，指描述样本特征的指标。（4）误差误差，指观测值与真实值、统计量与参数之间的差别。可分为三种：系统误差，也称统计偏倚，是某种必然因素所致，不是偶然机遇造成的，误差的大小通常恒定，具有明确的方向性。随机测量误差，是偶然机遇所致，误差没有固定的大小和方向。抽样误差，是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。（5）概率概率，是描述某事件发生可能性大小的量度。必然事件，事件肯定发生，概率P(U)＝1；随机事件，事件可能发生，可能不发生，概率介于0≤P(A)≤ 1；不可能事件，事件肯定不发生，概率P(∮)＝0；小概率事件，事件发生的可能性很小，概率P(A)≤ 0.05、或P(A)≤ 0.01。医学科研中，P(A)≤0.05作为事物差别有统计意义，P(A)≤ 0.01作为事物差别有高度统

医学统计学章节重点归纳

医学统计学章节重点归纳第一节概述 1、主要内容：a、卫生统计学的基本原理和方法（研究设计和数据处理中的统计理论和方法）b、健康统计（医学人口统计、疾病统计和生长发育统计）c、卫生服务统计（卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题）。 2、卫生统计工作的步骤：设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面：统计报表、报告卡（单）、日常医疗卫生工作记录，专题研究或实验。 4、观察单位：是获得数据的最小单位，观察单位是根据研究目的确定的，观察单位可以是人、标本、家庭、国家等。 5、变异：是指客观事物的多样性和不确定性。 6、变量：观察单位的某种特征，称为变量。a、数值变量（定量变量）b、分类变量（定型变量或字符变量）。 7、总体：根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本：从总体中随机抽取部分观察单位，其变量值就构成样本，通过样本信息来推断总体特征。 9、概率：事件发生的可能性大小的量度，通常以符号P表示。 10、误差：测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征：集中趋势和离散趋势。 2、频数分布类型：正态分布型频数、正偏态分布型频数，负偏态分布型频数。 3、集中趋势指标：算术平均数（均数）、几何均数、中位数。指标使用条件计算公式算术平均数适用于正态或近似正态分布的数值变量资料几何均数①对数正态分布，即数据经过对数变换后呈正态分布的资料；②等比级数资料，即观察值之间呈倍数或近似倍数变化的资料。中位数①非正态分布资料（对数正态分布除外）；②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。为奇数 , 为偶数, 4、离散型趋势指标：极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin 计算简单，便于理解；只考虑最大值与最小值之差异，不能反映组内其它观察值的变异度，不稳定，受样本量影响很大。

医学统计知识点整理(1)

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★

变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值大小，带有度、量、衡单位。如身高（cm）、体重(kg)、血红蛋白（g）等。二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料，又称为计数资料。因为是按照变量的血型分类，血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是（） A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C 【解析】脉搏数有数值大小，有度量衡，所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料：将观察对象按观察对象的某种属性的不同程度分成等级后分组计数，分组汇总各组观察单位后得到的资料。特点：每一个观察单位没有确切值，各组之间有性质上的差别或程度上的不同举例：- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学总结

医学统计学总结一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。变异(variation):同质基础上得各观察单位间得差异。变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项特征进行测量或观察,这种特征称为变量变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体具有得基本特征就是:同质性样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时，如何选择适宜的指标定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平；均数个体的平均值· 对称分布几何均数平均倍数取对数后对称分布中位数[ 位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料；④分布不明众数频数最多的观察值不拘分布形式，概略分析 ? 调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距？居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料；④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较定性资料：阳性事件的概率，概率分布，强度和相对比。￥ 2. 应用相对数时应注意哪些问题答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的常用统计图的适用资料及实施方法 < 图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系、线图半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图} 双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形，叶片为个体值，叶长为频数第3章概率分布（连续随机变量的正态分布；离散随机变量的二项分布及Poisson分布）1. 服从二项分布及Poisson分布的条件分别是什么二项分布成立的条件：①每次试验只能是互斥的两个结果之一；②每次试验的条件不变；③各次试验独立。 Poisson分布成立的条件：除二项分布成立的三个条件外，还要求试验次数n很大，而所关心的事件发生的概率很小。、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时，不论n大小，对称分布。π≠时，图形呈偏态，随n增大而逐渐对称。当n足够大，π或1-π不太小，二项分布近似正态。 ③Poisson分布μ越小，分布越偏。μ越大，分布越对称。当n足够大时，分布接近正态。 4、正态分布应用 ①估计变量值的频数分布《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心，左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数，即均数（位置参数）和标准差（变异度参数）（μ,σ2 ;标准0,1）

医学统计学教学大纲

医学统计学教学大纲一、课程的性质、任务《医学统计学》是开展医学研究的重要手段，是认识和揭示医学领域里各种数量特征的科学分析方法，是使医学科研得以成功的一种重要辅助工具。科技的迅速发展，大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理，医学统计分析是医学生教育培训必修课程，特别是中、高级医学人才的培养，应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法，能正确处理医学信息和数据，在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法，才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具，在混沌中发现规律。统计学就是研究数据及其存在规律的科学。（本大纲规定教学时数为62学时，理论讲授38学时，实习或讨论24学时）二、课程教学目标本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后，再通过本课程的学习使学生理解和知道随着现代医学的发展，正确地运用统计学方法和理念，进行实验设计和实验数据处理，系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平，具有十分重要的实际意义。大纲中应当体现理论联系实际的原则，教学过程中完全采用医学中的实例，讲述基本概念及基本原理，注意贯彻启发式教学原则，把统计思维方法的训练作为课堂教学的内容，对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项，不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论，使学生熟悉统计的基本理论、掌握统计方法的应用，通过课后复习、完成作业，加深对基本理论和基本概念的理解，进一步掌握基本方法。理论讲授38学时，实习或讨论24学时【教学内容分作三级要求】第一级是学生必须掌握的内容，教师应于理论课详细讲授，亦为实习课与考试的重点。第二级是要求熟悉的内容，教师应选择性讲授，未讲授部分由学生自学。第三级为一般了解内容，供学有余力的学生自学，教师亦可选择性讲授，但不在考试范围内。三、教学内容和要求

健康管理师考试重点归纳总结

第一章健康管理概论健康管理是以现代健康概念（生理、心理和社会适应能力）和新的医学模式（生理、心理、社会）以及中医治未病为指导，通过采用现代医学和现代管理学的理论、技术、方法和手段，对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。其目的是以最小投入获取最大健康效益。健康管理的八大目标： 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进健康管理的特点：标准化足量化个体化系统化健康管理的三个基本步骤： 1.了解和掌握健康，开展健康信息收集和健康检查 2.关心和评价健康，开展健康风险评价和健康评估 3.干预和促进健康，开展健康风险干预和健康促进健康风险评估是手段，健康干预是关键，健康促进是目的健康管理的五个服务流程： 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务健康管理的六个基本策略： 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理生活方式管理的特点： 1.以个体为中心，强调个体的健康责任和作用

2.以预防为主，有效整合三级预防生活方式的四大干预技术：教育激励训练营销影响需求管理的四大主要因素： 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机（残疾补贴、请病假的能力等）需求管理的策略： 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约疾病管理的三个特点： 1.目标人群是患有特定疾病的个体 2.不以单个病例和（或）其单次就诊事件为中心，而关注个体或群体连续性的健康状况与生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要灾难性病伤管理的五大特点： 1.转诊及时 2.综合考虑各方面因素，制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍，能够有效应对可能出现的多种医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意残疾管理的八大目标： 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理《健康中国2030规划纲要》 1.强调预防为主，防患未然

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。 2，医学统计学的主要内容： 1）统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表，统计图 C：统计推断，如参数估计和假设检验。 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3，统计工作步骤： 1）设计明确研究目的和研究假说，确定观察对象与观察单位，样本含量和抽样方法，拟定研究方案，预期分析指标，误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B，统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表，二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料 a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断

4，同质（homogeneity）：指被研究指标的影响因素相同。变异(variation)：同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。 5，总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性。代表性是指样本来自同质总体，足够的样本含量和随机抽样的前提。

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

医学统计学重点总结

医学统计学第一章医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体。样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。第二章集中趋势的统计描述一算术均法(mean)简称为均数,适用于正态或近似正态分布资料（一）直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三中位数(M)与百分位数中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。百分位数:用符号X P 表示,x 即百分位公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。统计描述：用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。统计推断：在一定的置信度和概率保证下，用样本信息推断总体特征： ①参数估计：用样本的指标去推断总体相应的指标 ②假设检验：由样本的差异推断总体之间是否可能存在的差异同质：一个总体中有许多个体，他们之所以共同成为人们研究的对象，必定存在共性，我们说一些个体处于同一总体，就是指他们大同小异，具有同质性。总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。

预防医学与医学统计学总结

绪论进和维护健康，预防疾病、失能和早逝二．预防医学特点：1.工作对象包括个体及确定的群体，主要着眼于健康和无症状患者；2研究方法注重微观和宏观相结合，但更侧重于影响健康的因素与人群的关系；3.采取的对策更具积极的预防作用，具有较临床医学更大的人群健康效应。三．健康决定因素：指决定个体和人群健康状态的因素。包括：1、社会经济环境。2、物质环境3.个人因素。4卫生服务。四．三级预防策略：1.第一级预防：又称病因预防，即防止疾病的发生。2.第二级预防：在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作，以控制疾病的发展和恶化。3.第三级预防：对已患某些病者，采取及时的、有效的治疗措施，防止病情恶化，预防并发症和伤残，延长生命。第一章流行病学概论进健康的策略和措施的科学。流行病学定义涵：1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是：（1）揭示现象（2）找出原因（3）评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。二．流行病学基本原理：1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论（三级预防理论）5.数理模型。6.流行病学的几个基本原则：（1）群体原则（2）现场原则（3）对比原则（核心）（4）代表性原则三．流行病学的用途：1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史，提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。第二章疾病分布的存在方式及其发生、发展规律。二．疾病分布的测量指标：1.发病率：指在一定期间（一般为1年）特定群中某病新病例出现的频率。病频率的测量（日、周、旬、月），常用于疾病暴发或流行时的调查。例。患病率=发病率*病程。病的人数占所有易感接触者总数的百分率。 5.死亡率：指在一定时间期间（通常为1年），某人群中死于某病（或死于所有原因）的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率：表示一定时期，患某病的全部病人中因该病死亡者所占的比例。三．疾病的分布形式（“三间分布”） 1.地区分布：疾病的地方性：由于自然环境和社会因素的影响而使一些疾病无需从外地输入，只存在于某一地区，或在某一地区的发病率水平总是较高，这种现象称为疾病的地方性。 2.时间分布 3.人群分布：出生队列分析：将同一时期出生的人划归为一组称为一个出生队列，对其随访观察若干年，观察死亡等情况。 4.判断疾病地方性的依据：（1）该病在当地居住的各群组

医学统计学重点图表总结

描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料；④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料；④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数定性资料统计描述常用的统计指标及其适用场合指标计算公式适用场合频率 n/N 估计总体中某一结局发生的概率频率分布 n 1/N ，n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度阳性人数/总观察人时数估计总体中单位时间内某一结局发生的概率比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定？参考值范围（%）正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28－ S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1－ S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33－ S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学总结

医学统计学总结一。绪论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学. 2，医学统计学的主要内容： 1) 统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表,统计图 C：统计推断，如参数估计和假设检验. 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3，统计工作步骤: 1）设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法，拟定研究方案，预期分析指标,误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料 a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断 4，同质(homogeneity）：指被研究指标的影响因素相同。变异（variation）:同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别（男女）计数资料多分类不相容的多类属性血型(A，B，O，AB）有序多分类类间有程度差异的属性受教育程度（小学，中学，高中，大学…）等级资料5，总体（population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。统计量（statistics）描述样本变量值特征的指标（样本率,样本均数，样本标准差）。

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用锦州医学院教务处 2003年5月

《流行病学》教学大纲适用专业: 临床医学总学时：24，其中理论学时：18、实验学时：6 一、课程的性质和任务流行病学（Epidemiology）是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来，随着危害人类生命和健康疾病谱的变化，随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变，流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止，比较一致认可的流行病学定义为：流行病学是研究人群中疾病与健康状态的分布及其影响因素，制定和评价预防、控制和消灭疾病的对策和措施，并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病，又从疾病扩大、引伸到健康和与健康有关的事件；研究内容既包括了描述“分布”，分析“决定因素”，又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学，又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。通过本课程的教学使学生掌握流行病学的基本原理、方法和技能，拓宽学生的思路，开阔学生的视野，提高学生能够应用流行病学方法，在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力，为今后从事疾病预防和控制工作打下基础。二、相关课程的衔接本门课程的前继课程是：基础医学相关课程、计算机基础和医学统计学。三、教学的基本要求教学目的培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用，并了解相应的扩展知识和新进展知识，为学习预防医学各类卫生专业课程奠定流行病学理论基础，也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。教学要求 1、基本理论理论课教学要根据教学大纲的要求，重点突出教授基本理论和基本知识，详细讲授和解释，同时注意教授一定比例的扩展知识、新进展知识和实际应用知识，加强学生创新能力的培养，开拓思路、启发思维，调动学生的学习积极性。内容精练，条理清楚，合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学期末重点总结

误差：观测值与真实值、样本计量与总体参数之间的差别。相对数：两个有关的绝对数之比，也可以是两个有关联统计指标之比。相对比：相对比是A、B两个有关联指标值之比，用以描述两者的对比水平，说明A是B 的若干倍或百分之几。统计描述：描述及总结一组数据的重要特征，目的是使实验或观察得到的数据表达清楚并便于分析。统计推断：指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。同质：指根据研究目的所确定的观察单位其性质应大致相同。变量：反映实验或观察对象生理、生化、解剖等特征的指标，变量的观测值称为数据。定量数据：也称计量资料。变量的观测值是定量的，其特点是能够用数值大小衡量其水平的高低，一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。有序数据：也称半定量数据或等级资料。变量的观测值是定性的，但各类别（属性）之间有程度或顺序上的差别。总体：根据研究目的确定的所有同质观察单位的全体，它包括所有定义范围内的个体变量值。样本：从研究总体中抽取部分有代表性的观察单位，对变量进行观测得到的数据。参数：描述总体特征的指标称为参数。统计量：描述样本特征的指标称为统计量。概率：描述某事件发生可能性大小的度量。小概率事件：习惯上将P≤0.05的事件称为小概率事件。平均数：是描述一组观察值集中位置或平均水平的统计指标，常用的有算术均数、几何均数和中位数。率：率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。构成比：表示某事物内部各组成部分在整体中所占的比重，常以百分数表示，计算公式为区间估计：是指按预先给定的概率，计算出一个区间，使它能够包含未知的总体均数。线性相关的概念：研究两个变量之间是否具有直线相关关系。相关系数：是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。研究对象：根据研究目的而确定的观察总体，也可称为受试对象或实验对象。处理因素：根据研究目而欲施研究对象的干预措施。处理水平：处理因素在实验中所处的状态称为因素的水平（level），亦称处理水平。对照：指在实验中应设立对照组，其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化：是指每个受试对象有相同的概率或机会被分配到不同的处理组。重复：是指在相同实验条件下重复进行多次观察。统计学的基本内容：统计设计，数据整理，统计描述，统计判断数据类型：定量数据，定性数据，有序数据误差的类型：系统误差，随机测量误差，抽样误差配对样本t检验配对设计：同源配对，异源配对，自身配对方差分析的基本思想：将全部观测值的总变异按影响因素分解为相应的若干部分变异，在此基础上，计算假设检验的统计量F 值，实现对总体均数是否有差别的推断。非参数检验的适用范围：①总体分布类型未知或非正态分布数据；②有序或半定量资料；③数据两端无确定的数值。标准差与标准误的区别与联系：区别：标准差：意义，描述个体观察值变异程度的大小，标准差越小，均数对一组观察值的代表性越好。应用，与X拔结合，用以描述个体观察值的

医学统计学总结

医学统计学总结一.绪论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。 2，医学统计学的主要内容： 1）统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表，统计图 C：统计推断，如参数估计和假设检验。 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3，统计工作步骤： 1）设计明确研究目的和研究假说，确定观察对象与观察单位，样本含量和抽样方法，拟定研究方案，预期分析指标，误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B，统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表，二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料 a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断 4，同质（homogeneity）：指被研究指标的影响因素相同。变异(variation)：同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。 5，总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性。代表性是指样本来自同质总体，足够的样本含量和随机抽样的前提。统计量（statistics）描述样本变量值特征的指标（样本率，样本均数，样本标准差）。

医学统计学知识点梳理

第一章绪论一、名词解释 1.统计学：是一门关于收集、分析、解释和表达数据的科学。 2.设计(design)：根据研究的问题与目的，从统计学的角度对各步提前做出的周密计划和安排。是整个研究的基础，是关键的一步。 3.收集资料(data collection)：获得研究所需要的原始数据的过程。 4.整理资料(data storing)：对收集到的原始资料进行归类整理汇总的过程。 5.分析资料(data analysis)：对整理的资料进行统计分析，获取资料中有关信息的过程。 6.n同质（homogeneity）:对观察指标影响较大且可以控制的主要因素尽可能的相同。 7.n变异（variation）：同质基础上个体间的差异。 8.n.总体(population)：根据研究目的确定的，所有同质研究对象的某些指标的集合。 9.n样本(sample)：从总体中随机抽取的、数量足够的、能代表总体特征的部分研究对象某些指标的集合。 10.参数(parameter)：描述总体特征的指标称为参数。 11.统计量（statistic）：描述样本特征的指标 12.变异(variation)：对同质研究对象某指标值得波动性称为变异。 13.误差(error)：实际观察值与客观真实值之差 14.系统误差(systematic error)：在实际观测过程中，由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。 15.过失误差：由科研工作者的失误或过错造成的误差。 16.n.抽样误差（Sampling error）：由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称为抽样误差。 17.随机误差(random error)：在没有过失误差和系统误差的条件下仍存在大量偶然无法消除的不确定因素所引起的误差为随机误差。 18.n频率(frequency)：在相同条件下，独立重复实验n次，其中事件A出现了m次，那么事件A发生的频率记为f(A)=m/n,0≤f(A)≤1 19.变量(variable)：观察结果的取值不能事先确定的某一特征叫随机变量(random variable)简称变量 20.n概率（Probability）：描述随机事件发生可能性大小的度量(P)。取值范围:不可能事件0~1。估计方法:当n足够大时,用频率估计概率。小概率事件:P ≤0.05（5％）或P ≤0.01（1％）称为小概率事件(习惯)，统计学上认为不大可能发生。小概率原理即某事件发生的概率很小，可以视为只进行一次实验时，我们说这个事件是“不会发生的”，这句话在大多数情况下是正确的，但他一定有犯错误的时候。 21.资料(data)：变量全部或部分测量值构成资料 22.计量资料(measurement data)：每个研究对象的变量值为一数值，表现出有量的大小，由这样一组研究对象定量观测值所构成的资料为计量资料。 23.计数资料(enumeration data)：每个研究对象的变量值为互不相同的属性之一，由这样一组研究对象定性变量值组成的资料为技术资料。 24.等级资料(ranked data)：每个研究对象变量值为互不相容的属性之一，且这些属性间有程度的递进或递减关系，有这样一组研究对象变量值组成的资料为等级资料。 25.实验因素(study factor)：研究者根据研究目的在实验中需要观察并阐明其效应的因素