当前位置：文档之家› 医学统计学考试重点

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念

1.总体与样本

总体：所有同质观察单位某种观察值（即变量值）的全体

样本：是总体中抽取部分观察单位的观察值的集合

2.普查与抽样调查

普查：就是全面调查，即调查目标总体中全部观察对象

抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查

3.参数与统计量

参数：总体的某些数值特征

统计量：根据样本算得的某些数值特征

4.Ⅰ型与Ⅱ型错误

假设检验的结论

不

真实情况拒绝H

拒绝H

正确Ⅰ型错误(ɑ) 推

断正确(1ɑ)

不正确推断正确(1β) Ⅱ型

错误(β)

为真时却被拒绝，弃真错误

Ⅰ型错误（ɑ错误）: H

Ⅱ型错误（β错误）: H

为假时却被接受，取伪错误

5.随机化原则与安慰剂对照

随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）

安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应）

6.误差与标准误（区分率与均数）

㈠均数

抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S

=S/√n

㈡样本率

率的抽样误差:样本率p和总体率π的差异

率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

7.方差分析

方差分析：又称F检验，是通过对数据变异按设计类型的不同，分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

（方差分析的基本思想:把全部观察值间的变异按设计类型的不同，分解成两个或多个组成部分，然后将各部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义）

二、问题

1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点

㈠描述集中趋势的常用指标：

①均数（资料呈正态或近似正态）优点：反映一组同质观察值的平均水平，并可作为样本的代表值与其他样本资料进行比较；在描述正态分布的特征方面有重要意义；缺点：因均数易受到极端值的影响，故不适用于描述偏态分布资料的集中位置。

②几何均数（呈倍数关系的等比资料或对数正态分布（正偏态）资料）优点：能正确描述观察值数值相差极大甚至达到不同数量级的集中位置（如：血清抗体滴度、细菌计数、体内某些微量元素含量）；缺点：因为0不能取对数，所以数据中若有0则不宜直接使用几何均数。

③中位数（适合各种类型的资料尤其适用于：大样本偏态分布资料；资料有不确定数值；资料分布不明）优点：不受极端值影响，适用于各种类型资料；缺点：不能代表全体数据的水平。

㈡描述离散趋势的常用指标

①极差（可用于各种分布的资料）优点：是最简单的变异指标，可用于各

种分布的资料；缺点：只涉及两个极端值没有利用全部数据的信息，不能反映组内其他观察值的变异。

②四分位数间距(偏态分布、两端无确切值或分布不明资料)优点：能反映

去除两端各四分之一数据后中间一半观察值的变动范围；缺点：不能完全反映全体数据观察值的变动范围。

③方差标准差(正态)优点：反映总变异程度；缺点：数值大小易受平均水

平大小的影响。

④变异系数(观察指标单位不同；同单位资料，但均数相差悬殊)优点：消

除了因统计量单位不同、均数相差很大、数据分布的集中位置相差很远造成的影响；缺点：变异系数只是一个相对离散指标。

2. Poisson分布的性质

①总体均数μ与总体方差σ2相等时Poisson分布的重要特征；②当n很大，而π很小，且nπ=μ为常数时，Poisson分布可看做是二项分布的极限分布；

③当μ增大时，Poisson分布渐进正态分布；④Poisson分布具备可加性；⑤μ的大小决定了Poisson分布的图形特征。

3.检验的注意事项

①数据应该来自设计科学严密的实验或调查；②数据应该满足假设检验方法的前提条件；③正确理解假设检验中概率P值的含义；④结论不能绝对化；⑤统计学意义与实际意义。

4.直线回归与相关分析的区别与联系

㈠区别:①资料要求:直线相关性分析要求x 、y 服从双变量正态分布；直线

回归分析要求在给定某个x 值时y 值服从正态分布②应用:说明两变量间的相互

关系（互依关系）用直线相关分析；说明两变量的数量依存关系用直线回归分

析③意义:相关系数r 说明具有直线关系的两变量间相互关系的方向与密切程

度；回归系数b 表示x 每改变一个单位所引起的y 的平均该变量④计算公

式:r=lxy/√lxxlyy,b=lxy/lxx ⑤取值范围:﹣1≤r ≤1,﹣∞＜b ＜∞⑥单位:r

没有单位，b 有单位。

㈡联系：①对于服从双变量正态分布的同一组数据，即可做直线相关分析又

可做直线回归分析，计算出的b 与r 正负号一致；②相关系数与回归系数的假

设检验等价，即对于同一样本，tb=tr;③对于服从双变量正态分布的同一组资

料，其相关系数r 与回归系数b 可以相互换算：r=bSx/Sy;④用回归可以解释相

关。决定系数R2=SS 回/SS 总，为相关系数的平方。

5.应用相对数的注意事项

①不能以构成比代替率；②计算相对数的分母不宜过小，小则直接描述；③相

对数的比较应注意其可比性；④应分别将分子分母合计求平均率；⑤样本率或

构成比的比较应作假设检验。

6.率的标准化的基本思想和应用率的标准化的注意事项

率的标准化的基本思想:就是采用统一的标准构成，以消除年龄、性别病情轻

重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响，使算得的

标准化率具有可比性。

应用率的标准化的注意事项: ①选择的标准不同，计算出的标准化率也不相

同；②标准化率仅适用于相互间的比较，实际水平应采用未标准化率来反映；

③样本的标准化率是样本指标值，亦存在抽样误差，若要比较其代表的总体标

准化率是否不同，需作假设检验；④各年龄组若出现明显交叉，则不适合采用

标准化法，宜分层比较各年龄组率；⑤对于因其他条件不同，而非内部构成不

同引起的不可比性问题，标准化法难以解决。

8.标准误与标准差的区别与联系区别统计符号总体标准差用表示均数的标准误用x

表示样本标准差用S 表示其估计

值用S x 表示

计算公式 S=√ ∑(X-X )/(n-1) S x =S/√n

统计学意义标准差越小个体观察值标准误越小，反映

间变异程度越小抽样误差

越小

标准差均数的标准

误

用途描述个体值的变异程度描述均数的抽样误差大小

三、填空题

1.实验设计的三要素与四原则

三要素:受试对象、处理因素、实验效应

四原则:对照、随机化、盲法、重复

2．方差分析与两小样本t 检验的应用条件

方差分析的应用条件：独立；正态；方差齐性（当组数为2时，方差分析与两均数比较的t 检验是等价的,t=√F ）

两小样本t 检验的应用条件：正态；方差齐性（若方差不齐，则用t ’检验）

3.调查研究设计的基本内容主要包括哪些

①明确调查目的和指标；②确定调查对象和观察单位；③确定调查方法；④确定调查方式；⑤确定调查项目和调查表；⑥制定资料整理分析计划；⑦制定调查的组织计划。

4.变量变换的目的

①使资料转换为正态分布；②使资料达到方差齐性；③使曲线直线化。

5.完全随机设计与随机区组设计方差分析变异分解

完全随机设计:SS 总=SS 组间+SS 组内，v 总=v 组间+v 组内

随机区组设计:SS 总=SS 处理+SS 区组+SS 误差，v 总=v 处理+v 区组+v 误差

6.变异系数的适用条件

①观察指标单位不同，如身高、体重；②同单位资料，但均数相差悬殊。

7.正态分布、标准正态分布、二项分布与Poisson 分布的表示

正态分布：N （μ，σ2）

标准正态分布：N （0,1）

二项分布：x ~B(n,p)

Poisson 分布：x ~p(μ)

四、简答题

㈠配对设计资料的x 2检验（不独立样本）

① 制四格表（书P142）

② 建立检验假设，确定检验水准

Ho:B=C,即两种方法的检测结果相同

H1:B ≠C,即两种方法夫人检测结果不同

α=0.05

③ 计算x 2值和自由度

当b+c ≥40, x 2=(b-c) 2/b+c , v=1

当b+c ﹤40, x 2=(|b-c|-1) 2/b+c , v=1

④ 确定P 值，作出统计推断

查表得：界值x 2=3.84，故P ＞＜？0.05，按α=0.05水准，接受（）拒绝（），差异有/无统计学意义，可以认为两种方法的检测结果相/不同。

㈡完全随机设计的x 2检验（独立样本）

①制四格表（书P134）

联系 S x =S/√n

②建立检验假设，确定检验水准

Ho:π1=π2,即两种药物的有效率相同

H1:π1≠π2,即两种药物的有效率不同

α=0.05

③计算x 2值和自由度

（实际频数A，理论频数TRC=nRnC/n,v=(R-1)(C-1) ）

Ⅰ当n≧40且T≧5时,x 2=∑（A-T）2/T或x 2=(ad-bc)

2n/(a+b)(c+d)(a+c)(b+d),v=1；

Ⅱ当n≧40且1≦T<5时,用校正的X2值：x 2=∑（|A-T|-0.5）2/T，

v=1或x 2=(|ad-bc|-n/2) 2n/(a+b)(c+d)(a+c)(b+d)或用四格表的确

切概率法；

Ⅲ当n<40或T<1时，用四格表的确切概率法。

④确定P值，作出统计推断

查表得：界值x 2=3.84，故P＞＜？0.05，按α=0.05水准，接受（）拒绝（），差异有/无统计学意义，可以认为两种药物的有效率相/不同。

五、选择题

1.整群抽样与分层抽样的区别：书P15

2.抽样误差大小关系：书P16，整群抽样误差≥单纯随机抽样误差≥系统抽样误差≥分层抽样误差

3.t检验的应用条件：书P91

4.相关分析应用中应注意的问题：书P168

5.P407最佳选择题1、2

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（ A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍，该指标为（ A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t 检验时，自由度是（ D ）（A） n1+ n2 （B） n1+ n2 –1 （C） n1+ n2 +1 （D） n1+ n2 -2 10、标准误反映（ A ） A 抽样误差的大小 B总体参数的波动大小

医学统计知识点整理(1)

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★

变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值大小，带有度、量、衡单位。如身高（cm）、体重(kg)、血红蛋白（g）等。二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料，又称为计数资料。因为是按照变量的血型分类，血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是（） A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C 【解析】脉搏数有数值大小，有度量衡，所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料：将观察对象按观察对象的某种属性的不同程度分成等级后分组计数，分组汇总各组观察单位后得到的资料。特点：每一个观察单位没有确切值，各组之间有性质上的差别或程度上的不同举例：- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学总结

医学统计学总结一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。变异(variation):同质基础上得各观察单位间得差异。变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项特征进行测量或观察,这种特征称为变量变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体具有得基本特征就是:同质性样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

医学统计学基础理论和上机考试模拟复习题答案解析

“医学统计学”上机考试模拟题A卷 1．测得10例某指标值治疗前后情况如下：例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1．用参数方法比较治疗前后该指标值的差异有无统计学意义，结果填入下表：例数均数标准差治疗前治疗后差值（前－后） H0：治疗前后该指标值无差异。 H1：治疗前后该指标值有差异。统计量t=2.512 P=0.0332 统计结论：P<0.05，拒绝H0，认为在α=0.05水平上差异有统计学意义，即治疗前后该指标值有差异。 2．上题资料，用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0：治疗前后该指标值无差异。 H1：治疗前后该指标值有差异。统计量s=19.5 P=0.0547 统计结论：P>0.05，不拒绝H0，认为在α=0.05水平上差异无统计学意义，即治疗前后该指标值无差异。

3．测得10例正常儿童身高（cm）和体重（kg）如下：例号 1 2 3 4 5 6 7 8 9 10 身高（X）120 133 126 130 121 122 131 128 110 124 体重（Y）20 27 23 25 25 18 22 25 15 22 （1）求身高和体重的相关系数，并作显著性检验。相关系数r =0.81211 H0：p=0 H1：p≠0 P= 0.0043 统计结论：P<0.05，拒绝H0，认为在α=0.05水平上差异有统计学意义，即认为身高和体重存在正相关。（2）求身高推算体重的直线回归方程，并作显著性检验。直线回归方程：y=-32.964+0.443*x H0：β=0 H1：β≠0 P=0.0043 统计结论：P<0.05，拒绝H0，认为在α=0.05水平上差异有统计学意义，即认为身高和体重之间存在直线回归关系。三．10名氟作业工人在工作前后测定尿氟（mg/L）排出量结果如下：编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1．计算工后比工前尿氟排出量增加值的均数，标准差，标准误，变异系数和中位数。均数0.91，标准差0.635，标准误 0.201,变异系数 69.78,中位数 0.900 2．检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0：氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1：氟作业工人在工作前后尿氟排出量的差异有有统计学意义统计量t=4.532 P=0.0014

研究生医学统计学上机试题

医学科研中的统计学方法上机试题时间：2014-12-15 共4题，共100分 1．某医院病理科研究人体两肾的重量，20例男性尸解时的左、右肾的称重记录见下表，问左、右肾重量有无不同？表1：20例男性尸解时左、右肾的称重记录编号左肾（克）右肾（克） 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中，对符合纳入标准的40名健康自愿者随机分为4组，每组10名，各组注射剂量分别为0.5U、1U、2U、3U，观察48小时后部分凝血活酶时间（s）。试比较任意两两剂量间的部分凝血活酶时间有无差别？

表2 各剂量组48小时部分凝血活酶时间（s） 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人，其中102例病人用西医疗法，其它189 例病人采用西医疗法加中医疗法，观察一年后，单纯用西医疗法组的病人死亡13例，采用中西医疗法组的病人死亡9例，请分析两组病人的死亡率差异是否有统计学意义？ 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查，并对大气中苯并（a）芘进行监测，结果如下，试检验两者有无相关？表4 八个城市的肺癌标化死亡率和大气中苯并（a）芘浓度城市编号肺癌标化死亡率（1/10万）苯并（a）芘（μg/100m3） 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学分析基本思路指南

医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。对于初学者，不必强记一大堆的公式，也不要死钻牛角尖，非要弄明白为什么这种方法叫“t检验”、“F检验”，为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题，感兴趣的读者可以查阅统计学史。对于只想应用的人来讲，你只要了解在什么情况下应该用什么方法，什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验，然后选定统计量，然后怎么怎么。但实际中我们拿到一堆数据的时候，不会坐在桌上先列出零假设和备择假设，也不会满座子地计算统计量。更实际的分析思路是: （1）先确定研究目的，根据研究目的选择方法。不同研究目的采用的统计方法不同，常见的研究目的主要有三类：一是差异性研究，即比较组间均数、率等的差异，可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析，即分析两个或多个变量之间的关系，可用的方法有相关分析。三是影响性分析，即分析某一结局发生的影响因素，可用的方法有线性回归、logistic回归、Cox回归等。（2）明确数据您身边的论文好秘书：您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表，扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型，根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。（3）选定统计方法后，需要利用统计软件具体实现统计分析过程。SAS中，不同的统计方法对应不同的命令，只要方法选定，便可通过对应的命令辅之以相应的选项实现统计结果的输出。（4）统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果，需要从中选择自己需要的部分，并做出统计学结论。但统计学结论不同于专业结论，最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择，可供读者参考。

医学统计学考试(详细)

医学统计学基本概念 1.医学统计学是以医学理论为指导，应用概率论与数理统计的有关原理和方法，研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤：（1）设计（2）收集资料（3）整理资料（4）分析资料；或者分三步：（1）研究设计（2）资料分析（3）结论。 3.定量资料：又称为数值变量资料，特点：（1）各观察值之间有量的差别；（2）数据间有连续性。它是指变量的取值不止是可列个，而是可取某区间[a,b]，（-oo,oo）上的一切值。 4.定性资料：又称为分类资料、分类变量资料（包括二项分类、多项分类资料），特点：（1）各观察值之间有质的差别；（2）数据间有离散性。它是指变量的取值有限的，至多是可列多个。附：无序分类：二项分类、多项分类 5.等级资料：又称为半定量资料，有序分类，指各类之间有程度的差别。特点：（）各观察单位间或者相同，或者存在质的差别；（2）各等级间只有顺序，而无数值大小，故等级之间不可度量。 6.个体individual：即每个观察单位。 7.总体population：根据研究目的确定的同质观察单位的全体。 8.样本：是从总体中随机抽取部分观察单位，其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters：描述某总体特征的统计指标称为总体参数，简称参数。如总体均数、总体标准差等。特点：参数是未知的，固有的，不变的！ 10.统计量：描述某样本特征的的统计指标称为样本统计量，简称统计量。特点：统计量是已知的，变化的，有误差的！ 11.概率probability：是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件：（1）可重复性：相同条件下可重复进行；（2）随机性：出现两种机两种以上结果；（3）偶然性：实验前不能肯定将出现哪种结果。 13.频率的稳定性：在重复试验中，事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p，频率的这一特性称为频率的稳定性。 14.概率的统计定义：频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性，因而是可以被认识和度量的。这个常数p就称为事件A出现的概率(probability)，记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出，频率为一变量，是样本统计量，而概率为常数，是一总体参数。实践中，当试验次数足够多时，可以近似地将频率作为概率的一个估计。 15.小概率原理：当某事件发生的概率小于或等于0.05时，统计学通常称该事件为小概率事件，其涵义为该事件发生的可能性很小，进而认为其在一次抽样中不可能发生，此即为小概率原理。 16.同质（homogeneity）：性质相同的事物称为同质的。 17.变异(variation)：同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异，而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化，因此需要确定其波动范围，即正常值范围，简称正常值(normal value)。 19.正常值范围(normal ranges)，是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error)：样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计：由样本信息估计总体参数称为参数估计，包括点估计和区间估计。 23.点估计(point estimation) ：直接用样本统计量作为总体参数的估计值。这种估计方法简单，但未考虑抽样误差的大小。 24.区间估计(interval estimation) ：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度为1-α的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是：每100个样本所算得的100(1-α)％可信区间，平均有100(1-α)个包含了总体参数。如取α=0.05，则每100个样本所算得的100个95％可信区间，平均有95个包含总体参数在内，有5个不包含总体参数。 26.可信区间的两个要素：第一个要素是可靠性，常用可信度1-α的大小表示；第二个要素是精确性，常用可信区间的长度CU-CL衡量。 27.均数95%可信区间，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按（见课本P42）构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。 28.可信度为95%的CI的涵义：每100个样本，按同样方法计算95%的CI，平均有95%的CI包含了总体参数。这里的95%，指的是方法本身！而不是某个区间！ 29.第一类错误（I型错误）：拒绝了实际上成立的H0假设，称为“假阳性”, 用α来表示。 30.第二类错误（II型错误）：不拒绝实际上不成立的H0，称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效：1-β称检验效能(power of a test)，过去称把握度。为当两总体确有差异，按检验水准α所能发现该差异的能力。1-β只取单尾。 32.完全随机设计：根据某一试验因素，将试验对象完全按随机设计分为若干个组，每个组的样本例数可以相等，也可以不等，分别求出各组试验结果的均数，即为单因素多个样本均数，单个因素可以有多个水平，R>2 33.随机区组设计又称配伍组设计(Random Block Design)：即两因素多个样本均数的比较(或称两因素方差分析，two way analysis of variance）。 34.绝对数：在计数资料中，各组的观察数称绝对数。 35.相对数：是两个有联系的指标的比，计数资料的统计描述主要是相对数（relative number）。 36.率（rate）：说明某现象发生的频率或强度，常用%、‰、1/万、1/10万等作单位，表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常以保留1-2位整数为宜。

医学统计学重点总结

医学统计学第一章医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体。样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。第二章集中趋势的统计描述一算术均法(mean)简称为均数,适用于正态或近似正态分布资料（一）直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三中位数(M)与百分位数中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。百分位数:用符号X P 表示,x 即百分位公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学上机试题-U

习题集（分析应用题） 1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后，测得其血凝抑制抗体滴度资料如下：请问：要反映其平均滴度，用何指标？为什么？抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计例数 2 6 5 10 4 2 1 30 2、测得某地300名正常人尿汞值，其频数表如下。欲根据此资料制定95%正常值范围。请问：用何种估计方法？（列出计算公式，不用计算） 300例正常人尿汞值（ug/L）频数表尿汞值例数尿汞值例数尿汞值例数 0-4924-1648-3 4-4728-952-- 8-5832-956-2 12-4036-460--

16-3540-564-- 20-2244--68-721 3、某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时，将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组，资料见下表。拟比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别，用何统计分析方法？ DN组与无DN组2型糖尿病患者ACE基因型分布的比较组别DD ID II合计 DN组42（37.8）48（43.3）21（18.9）111 无DN组30（21.7）72（52.2）36（26.1）138 合计72（28.9）120 （48.2） 57（22.9）249 4、某单位研究胆囊腺癌、腺瘤的P53基因表达，对同期手术切除的胆囊腺癌、腺瘤标本各10份，用免疫组化法检测P53基因，资料见下表。欲分析胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别，用何统计分析方法？胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较病种阳性阴性合计胆囊腺癌6410

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两

医学统计学考试重点

考试题型：名词解释10个选择20个填空题20个简答4-5个讨论分析1-2题计算1-2题绪论 2选1 总体：总体（population）指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 3选1 小概率事件：我们把概率很接近于0（即在大量重复试验中出现的频率非常低）的事件称为小概率事件 P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。统计学中，一般认为等于或小于0.05或0.01的概率为小概率。资料的类型（3选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 2选1 抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

预防医学与医学统计学总结

绪论进和维护健康，预防疾病、失能和早逝二．预防医学特点：1.工作对象包括个体及确定的群体，主要着眼于健康和无症状患者；2研究方法注重微观和宏观相结合，但更侧重于影响健康的因素与人群的关系；3.采取的对策更具积极的预防作用，具有较临床医学更大的人群健康效应。三．健康决定因素：指决定个体和人群健康状态的因素。包括：1、社会经济环境。2、物质环境3.个人因素。4卫生服务。四．三级预防策略：1.第一级预防：又称病因预防，即防止疾病的发生。2.第二级预防：在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作，以控制疾病的发展和恶化。3.第三级预防：对已患某些病者，采取及时的、有效的治疗措施，防止病情恶化，预防并发症和伤残，延长生命。第一章流行病学概论进健康的策略和措施的科学。流行病学定义涵：1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是：（1）揭示现象（2）找出原因（3）评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。二．流行病学基本原理：1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论（三级预防理论）5.数理模型。6.流行病学的几个基本原则：（1）群体原则（2）现场原则（3）对比原则（核心）（4）代表性原则三．流行病学的用途：1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史，提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。第二章疾病分布的存在方式及其发生、发展规律。二．疾病分布的测量指标：1.发病率：指在一定期间（一般为1年）特定群中某病新病例出现的频率。病频率的测量（日、周、旬、月），常用于疾病暴发或流行时的调查。例。患病率=发病率*病程。病的人数占所有易感接触者总数的百分率。 5.死亡率：指在一定时间期间（通常为1年），某人群中死于某病（或死于所有原因）的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率：表示一定时期，患某病的全部病人中因该病死亡者所占的比例。三．疾病的分布形式（“三间分布”） 1.地区分布：疾病的地方性：由于自然环境和社会因素的影响而使一些疾病无需从外地输入，只存在于某一地区，或在某一地区的发病率水平总是较高，这种现象称为疾病的地方性。 2.时间分布 3.人群分布：出生队列分析：将同一时期出生的人划归为一组称为一个出生队列，对其随访观察若干年，观察死亡等情况。 4.判断疾病地方性的依据：（1）该病在当地居住的各群组

医学统计学试卷

《医学统计学》考查试卷（必修）－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－说明：本试卷总计100分，全试卷共4页，完成答卷时间2小时。－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－一、填空（10小题，每小题2分，共计20分。） 1、统计学分为和两大部分。 2、统计思想是用样本估计（或推测）总体，它是通过和来实现的。 3、统计步骤包括、、、。 4、统计资料分为和，后者又分为、和。 5、总体服从正态分布的数值资料，常用与来描述其集中趋势与离散趋势。 6、假设检验的原理是。 7、假设检验得到，可认为差别无统计学意义，，可认为差别有统计学意义，，可认为差别有高度统计学意义。 8、直线回归反映两个变量的，而直线相关反映的是两个变量的。 9、2x 检验的思想可以概述为看和吻合程度如何。 10、秩和检验和Ridit 分析均属，前者关键是，后者关键是。二、选择题（有单选和多选，10小题，每小题1分，共计10分。） 1、当均数相差很大或量刚不同时，比较多个样本资料的离散趋势指标应选。（1）极差（2）变异系数（3）方差（4）标准差 2、总体均数95%的可信区间为。（1）)96.1,96.1(s x s x +- （2）)58.2,58.2(s x s x +-

（3）)96.1,96.1(x x s x s x +- （4）)58.2,58.2(x x s x s x +- 3、四个样本均数的比较，参数假设检验为。（1）0H ：4321x x x x === （2） 1H ：4321x x x x ≠≠≠ （3）0H ：4321μμμμ=== （4）1H ：4321μμμμ≠≠≠ 4、两样本均数比较，经t 检验差别有统计学意义时,P 越小，说明：。（1）两样本均数差别越大（2）两总体均数差别越大（3）越有理由认为两总体均数不同（4）越有理由认为两样本均数不同 5、分类资料的配对设计差异性（或优势性）检验需选用。（1）Pearson-2x 检验（2）CMH-2x 检验（3）McNemar-2x 检验（4）Fisher 的确切概率法 6、来自医院的资料可求得。（1）有效率（2）无效率（3）发病率（4）死亡率 7、作直线相关分析，要求：。（1）X 和Y 变量总体均服从正态分布（2）X 或Y 变量总体服从正态分布（3）只要因变量Y 总体服从正态分布（4）两变量总体服从不服从正态分布均可。 8、方差分析可用于。（1）两个样本均数的比较（2）多个样本均数的比较（3）回归系数的假设检验（4）多个样本率的比较 9、Fisher 确切概率法可用于。（1）两个样本均数的比较（3）多个样本均数的比较（3）两个样本率的比较（4）每组观察例数不太大的多个样本率的比较 10、等级资料（有序多分类资料），可采用的统计分析方法有。（1）2x 检验（2）秩和检验（3）Ridit 分析（4）t 检验或F 检验三、（本题10分）

医学统计学总结

医学统计学总结一。绪论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学. 2，医学统计学的主要内容： 1) 统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表,统计图 C：统计推断，如参数估计和假设检验. 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3，统计工作步骤: 1）设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法，拟定研究方案，预期分析指标,误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料 a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断 4，同质(homogeneity）：指被研究指标的影响因素相同。变异（variation）:同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别（男女）计数资料多分类不相容的多类属性血型(A，B，O，AB）有序多分类类间有程度差异的属性受教育程度（小学，中学，高中，大学…）等级资料5，总体（population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。统计量（statistics）描述样本变量值特征的指标（样本率,样本均数，样本标准差）。

医学统计学上机考试题样题及评分标准

上机考试题样题及评分标准姓名__________ 学号__________________ 成绩_________ 1、某监测站拟用极谱法替代碘量法来测定水中溶解氧含量,今对12 个水样同时用两种方法测定,结果如下,问能否用极谱法推算碘量法 ? ━━━━━━━━━━━━━━━━ 极谱法碘量法 (微安值) (溶解氧) ──────────────── 5.3 5.84 5.3 5.85 5.2 5.80 2.1 0.33 3.0 1.96 3.3 2.27 2.8 1.58 3.4 2.32 2.3 0.76 6.8 7.79 6.3 7.56 4.8 5.00 ━━━━━━━━━━━━━━━━ 评分标准：题意分析：根据题意，应做回归分析。（方法正确得10分） ⑴经绘制散点图，两指标间基本呈直线趋势，可以用直线回归分析。（5分） ⑵计算结果（10分）：以极谱法结果为x，碘量法结果为y，经 SPSS计算得： a=-3.113, b=1.668, F=1944.118（或t=44.092）, P=0.000（或

P<0.0005） ⑶结论（9分）：由于P<0.05，可认为极谱法与碘量法存在回归关系（或依存关系），可以用极谱法结果推算碘量法结果（6分），推算方程为： Y=-3.113+1.668X（3分） 2、某医院对比两种疗法对活动期＋二指肠球部溃疡的疗效，一组口服呋喃硝胺；另一组口服甲氰咪呱。结果如下，问两组的疗法是否有差别？例数愈合好转无效呋喃硝胺组 62 54 7 1 甲氰咪呱组 64 44 11 9 合计 126 98 18 10 评分标准：题意分析：该资料为等级资料，可采用秩和检验。（方法正确得10分） ①建立假设，确定检验水准（3分） H0：两组疗效的分布无差别 H1：两组疗效的分布有差别 α=0.05 ②计算结果（10分）：经SPSS计算得， U=1594.00（或W=3547或Z=-2.624），P=0.009 ③推断结论（6分，其中，统计结论3分，专业结论3分）：由于 P=0.009<0.05，按α=0.05，拒绝H0，接受H1，可认为两组疗效差异有统计学意义，呋喃硝胺的疗效高于甲氰咪呱。 3、现有170例已确诊的乳癌患者,请问：两种诊断方法的诊断结果是否有关系？两种方法何者为优 ? ──────────────── 临床诊断 X线诊断 ───────── 乳癌非乳癌 ──────────────── 乳癌 24 30

医学统计学公式总结

医学统计学公式总结-标准化文件发布号：（9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

一资料的描述性统计（一）算术均数(mean) （1）简单算术平均值定义公式为（直接法）：（2）利用频数表计算均数（加权法）：（二）方差（即标准差的平方）（三）变异系数二参数估计与参考值范围（一）均数的标准误（二）样本率的标准误（p 为样本率）（三）T 分布（u 为总体均数）（四）总体均数的区间估计（一般要求计算95%或99%的可信区间）（五)总体率的区间估计 n x n x x x x x n ∑= ++++= 321∑∑=++++++++= f fx f f f f x f x f x f x f x k k k 3213322111 ) (22 --=∑n x x s 222()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-= n s x t μ -= x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

（六)参考值范围估计双侧1-a 参考值范围： s u x a 2/± 单侧1-a 参考值范围：s u x a ->或 s u x a +< （可信区间计算是用标准误，参考值范围计算用标准差，百分位数法大家自己看书）三 T 检验与方差分析（一）T 检验（1）单样本T 检验检验假设：（假设样本来自均数为0 u 的正态总体）统计量t 值的计算：（2）配对T 检验检验假设：统计量t 值的计算：（d 为两组数据的差值，Sd 为差值的标准差）（3）两样本T 检验检验假设：统计量t 值的计算： 0μμ=：H 1 ,/00-=-=-=n n s x s x t x νμμ0 210==-μμμ：H d d d t s μ-==1-=n ν2 10μμ=：H 2 1)()(2121x x s x x t ----=μμ221-+=n n ν? ?? ?+= -2 1121s s C x x )()(2 222112∑-∑+-= x x x x s C

医学统计学试题及其答案

l．统计中所说的总体是指： A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2．概率P=0，则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4．测量身高、体重等指标的原始资料叫： B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5．某种新疗法治疗某病患者41人，治疗结果如下：治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是： D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6．样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程，属于统计工作哪个基本步骤：C A统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少： B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10．以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明，要计算集中趋势指标，宜选择 C A X B G C M D S E C V 13．各观察值均加（或减）同一数后： B A均数不变，标准差改变B均数改变，标准差不变 C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、l O、2、24+(小时)，问该食物中毒的平均潜伏期为多少小时 C A5B5．5C6D10E1 2