当前位置:文档之家› 医学统计学重点

医学统计学重点

医学统计学重点
医学统计学重点

医学统计学重点

第一章绪论

1.基本概念:

总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:

(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)

①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由

各分组标志及其频数构成。包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类

②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单

位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素

1.实验设计三要素:被试因素、受试对象、实验效应

2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

4.实验设计方法

有析因设计正交试验设计均匀试验设计

交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展

多组:单因素多水平配伍组设计拉丁方设计

(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。

析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。

第三章定量资料的统计描述、参考值范围

1.频数表编制过程(了解)

(1)找出样本数据的最大值和最小值,计算极差 R;

(2)分组:确定分组的组距 d 和组数 k;

一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组

(3)求频率密度:统计频数,算出频率、频率密度和累积频率;

(4)画出直方图。

2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。

3.集中趋势、离散趋势的指标及适用范围

(1)集中趋势:x,G,M,P

x ,M

算术均数:适用于对称分布;

不适用于偏态分布和资料中出现极值的资料。

几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。

不适用与观察值中有0或正负数值同时出现的资料。

中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。

百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;

用于确定医学参考值范围(偏态或分布不明的资料)。

众数:适用于大样本,较粗糙。

(2)离散趋势:

极差:优点:简单明了、容易使用。

缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。

②样本容量越大,极差可能越大。

③极差的抽样误差大,不稳定。

四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。

缺点:类似于极差,利用度低。

方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。

变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。

②比较均数相差悬殊的资料的变异度。

③衡量实验精密度和稳定性的常用指标。

(3)频数分布特征

高峰在中间,左右大致对称,称为对称分布。平均数=中位数=众数

高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。平均数>中位数>众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。平均数<中位数<众数

对称分布正(右)偏态分布负(左)偏态分布

4.正态分布图形的特点及意义

(1)特点:①f (x )关于x=μ对称 ②x=μ时取得最大值

③在x=μ±σ处为拐点,且以 x 轴为水平渐近线 ④f (x )大于0

⑤P (x=a )=0

⑥若 f (x) 在点 x 处连续,则F ′(x )=f (x) (2)意义:?

+∞∞

-)(x f =1,f (x )在负无穷到正无穷的积分值为1,即曲线下方面积为1。

5.μ和σ2的意义

μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。 σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。

6.标准化变换

z=

σ

μ

-x x ~N (μ,σ2) z ~N (0,1) F (x)=Ф(σμ-x )=Ф(z) 即P (X ≤x)=Ф(σ

μ

-x )=P (Z ≤z)

P (a

μ

-b )

7.标准正态分布界值

规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x 轴上方中间面积一致。 双侧界值:

P (|z|≤z 2α)=1-α P (z

α)=1-2α

P (|z|≥z 2α)=α P (z>z 2

α)=2α

单侧界值:

上限: 下限:

P (z>z α)=α P (z>z 1-α)=1-α P (z

8.正常值范围及意义

概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。

意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。 以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种 估计的可信度是95%,会冒5%的风险。 公式: 双侧95%的界限值:x ±1.96s 单侧95%的上限值:x +1.645s 单侧95%的上限值:x -1.645s

第四章 总体均数的估计、假设检验

1.标准误

(1)概念:每次样本计算出的x 不同,这些x 的标准差称为均数的标准误。 (2)意义:是衡量样本统计量抽样误差大小的统计指标。

(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描 述统计量的变异。 (4)均数标准误的公式:S x =

n

s 2.置信区间

(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x 1、x 2、…、xn)和θ2(x 1、 x 2、…、x n ),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(^

θ1<^

θ2)=1-α, 则称随机区间(^

θ1,^

θ2)为θ的1-α置信区间,其中称为^

θ1置信下限,称为^

θ2 置信上限,1-α称置信度。

(2)意义:区间(^θ1,^θ2)包含有参数θ的概率为1-α,不能说θ在(^θ1,^

θ2)的概率为 1-α。

例:可以说(a ,b )包含均数μ的概率为95%,不能说μ在(a ,b )的概率为95%。 (3)公式:单个正态总体均数μ的区间估计

①σ已知:

双侧:n

z x σα2

± 即 x z x σα2

±

z 分布

单侧:n

z x σ

α

± 即 x z x σα±

②σ未知:

双侧:n s

t x 2

α

± 即 x s t x 2

α± 小样本(n ≤50) t 分布

单侧:n

s

t x α± 即 x s t x α±

双侧:n s

z x 2

α

± 即 x s z x 2

α± 大样本(n>50) z 分布

单侧:n

s

z x α± 即 x s z x α± (4)两要素:

准确度:由1-α 决定,1-α 越大,准确度越高。 精确度:由区间长度决定。

99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。

3.抽样分布

(1)t 分布

①定义: 来自正态总体的一组样本,x 和s 分别是样本的均数和标准差。则t=n

s x /μ-~

t 分布,自由度 df=n-1,极限分布是标准正态分布。 ②图形分布特征:

以0为中心,左右对称的单峰分布。 自由度越大,越高瘦

③界值: 双侧:

P (|t|≤t 2α)=1-α P (t

α)=1-2α

P (|t|≥t 2α)=α P (t>t 2

α)=2α

单侧:

上限: 下限:

P (tt α)=α P (t>t 1-α)=1-α (2)χ2分布

①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n 的样本,计算 样本标准差s ,则χ2=(n-1)s 2/σ2服从自由度df=n-1的χ2分布。 ②图形分布特征: 曲线偏向左边 自由度越小曲线越偏 ③界值: 双侧:

P (x 2

>x 2

2

α)=2α P (x 2>212α-

x )=1-2α P (x 2

α)=1-2α P (x 2<212α-

x )=

2α 单侧:

上限: 下限:

P (x 2>x 2α)=α P (x 2>x 21-α)=1-α P (x 2

①定义:如果分别从两个正态总体N (μ1,σ1)和N (μ1,σ1)中随机抽取样本含量 n 1、n 2的两个样本,算出样本均数和方差分别为x 1,s 21和x 2,s 2

2,则σ

σ22

2

22121//s s F =

服从df 1=n 1-1,df 2=n 2-1的F 分布。

若χ1、χ2分别服从自由度df 1、df 2的χ2分布,则F=df

df

2

2

212

1

//χχ~df 1df 2

②图形分布特征 曲线偏向左边

df 1、df 2同时增大,曲线趋向于对称 ③倒数性质:F df df )(),1(2,1α-=

F df df

)

(

2,

11

α

④界值: 双侧:

P (F>F 2α)=2α P (F>2

1α-F )=1-2α

P (F

α)=1-2α P (F<2

1α-F )=2α

单侧:

上限: 下限:

P (F>F α)=α P (F>F 1-α)=1-α P (F

4.假设检验

(1)基本思想:反证法、小概率事件原理 (2)基本步骤:

①建立假设,确定检验水准

H0:原假设,差异存在但不显著或差异无统计学意义 H1:备择假设,差异显著或差异有统计学意义

②在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生) 参数检验统计量要求满足:

i)在H0成立的条件下,服从特定的抽样分布; ii)必须包含要检验的总体参数;

iii)对于给定的样本数据,能计算出该检验统计量的数值。 ③对于给定的α值做出检验结论,并给以专业解释

判断P 值:(与界值比较,反查界值表确定范围,软件计算) 若P>α,则接受 H 0,拒绝H 1 ;若P<α,则拒绝 H 0,接受H 1 。

(3)检验方法:

正态性检验、方差齐性检验、t检验

(4)两类错误

实际情况判断

接受H

0拒绝H

H

正确正确1-α第一类错误α

H

不正确第二类错误β正确1-β

①第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。

②P≤α时,拒绝H

,可能犯Ⅰ类错误(α)。此时,P值越小,犯Ⅰ类错误的概率越小,结论越可靠。

③P>α时,接受H

,可能犯Ⅱ类错误(β)。此时,虽然β未知,但P值越大,犯Ⅱ类错误的概率越小,结论越可靠。

④减少(增加)I型错误,将会增加(减少)II型错误

⑤增大n,可以同时降低两类错误。

第五章方差分析

1.方差分析基本思想

目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性差异。

基本思想:根据离差来源的不同,将总离差平方和分解为两部分:

由试验的随机因素(误差)引起的组内离差,

由因素的作用(即处理水平不同)引起的组间离差。

总离差平方和 = 组内离差平方和+ 组间离差平方和(SS

T = SS

E

+ SS

A

2.方差分析

单因素方差分析、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析

交叉设计方差分析、组内分组设计方差分析

第六章双变量相关与回归

1.散点图特征

正相关完全正相关负相关完全负相关

不相关

2.相关系数意义及分类

(1)意义:

①相关系数r的大小反映随机变量X和Y之间线性关系的密切程度:

若 r=0,则 X 与 Y 不相关;

若 |r|=1,则 X 与 Y 完全相关。

②相关系数r的符号反映随机变量X和Y之间线性关系的相关方向:

若 0

若 -1

(2)分类:

①积差相关系数:双变量为服从正态分布的计量资料

②等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。

(3)适用范围:

两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的。

3.线性相关分析和回归分析的联系与区别

(1)联系: ①r=l

l xy

xx

b

/ l xx 、l xy 分别是x 、y 的标准差

②方向一致,r 与b 方向一致

③r 与b 的假设检验等价,即同一样本存在:t r =t b

④回归强度与相关强度:R 2=SS 回/SS 总=r 2 (仅限Ⅱ型回归)

(2)区别: ①资料

相关:x,y 必须是随机变量

回归: x 是确定变量称Ⅰ型回归, y 必须是随机变量

x 是随机变量称Ⅱ型回归 ②计量单位:r 不受单位影响,b 受单位影响 ③意义:

相关说明相关关系,相关关系描述变量间关系的密切程度与方向。 回归说明依存关系,回归方程描述变量间的数量依存关系。 ④取值范围:|r|≤1,b R

4.最小二乘法

5.决定系数的意义

R 2=SS 回/SS 总=(SS 总-SS 剩)/SS 总=(1-SS 剩)/SS 总

0≤ R 2 ≤1,R 2越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好。

把观测点 (x i , y i ) 标在直角坐标系下作成散点图,则必存在着一条直线,使每个点 (x i , y i ) 距这条直线在纵方向上的距

离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。

第七章 两分类资料的统计描述与推断

1.相对数指标

两个有联系的指标之比。常用的有率和比(构成比、相对比)。

(1)率:频率,说明某现象发生的频率和强度。总体率:π,样本率:p 。 K ?=

可能发生该现象的总例某现象实际发生的例数

(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。 %100?=

察单位总数

同一事物各组成部分观位数

某一组成部分的观察单构成比

(3)相对比:两个有关指标A 、B 之比,说明两者的对比水平,A 是B 的若干倍或百分之几。 对比的数值可以是绝对数、相对数或平均数。

第八章 R ×C 表资料的分析

1.列联表分类及统计方法

(1)双向无序:多个样本率或构成比比较→χ2检验 (2)单向有序:

分组变量有序→χ2检验(同双向无序) 结果变量有序→秩和检验或Ridit 分析 (3)双向有序:

属性相同→McNemar 、Kappa 检验

属性不同→秩相关分析、线性趋势检验、秩和检验或Ridit 分析

2.列联表注意事项

(1)R ×C 表中不宜有20%以上的格子的T<5,不能有T<1。 理论数太小处理办法:①最好增加样本例数以增大理论数 ②删去理论数太小的行和列

③将太小理论数所在行或列的实际数与性质相近的邻行/列合并 ④采用Fisher 检验

(2)R×C表χ2检验未考虑等级顺序关系,若处理效应按强弱或优劣分为有序等级时采用秩和检验或Ridit分析。

(3)拒绝H0时不能确定是不全相等还是全不相等,需进行两两比较。

第九章非参数检验、Ridit分析

1.参数检验和非参数检验特点

(1)参数检验:

特点:总体分布的类型为已知,只是一个或几个参数未知,对未知参数进行检验。

优点:检验效能高,允许应用样本提供的数据

缺点:受应用条件限制

(2)非参数检验:

特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的位置,允许根据分布情况而不是总体参数做出推论。

优点:不依赖总体分布类型,应用广泛

缺点:符合参数检验的用非参数检验会降低检验效能。

2.检验方法

符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。

检 验 方 法

1.正态性检验

(1)目的:在做t 检验方差分析之前首先判断是否服从正态分布

(2)过程:假设H 0:总体服从正态分布;H 1:总体不服从正态分布。α

(3)SPSS 结果:看sig 值,sig>α,接受H 0,服从正态;sig<α,接受H 1,不服从正态。

2.方差齐性检验

(1)目的:利用样本信息推断总体方差是否相等 (2)前提:正态分布 (3)过程:

①建立假设:假设H 0:σ2

1=σ2

2即方差齐;H 1:σ2

1≠σ2

2。α ②计算统计量:σ

σ22

2

22121//s s F =

=s

s 2

2

2

1 df 1=n 1-1 df 2=n 2-1 ③P 值: Fα,接受H 0

F>F α(df 1,df 2)则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,满足方差齐性;sig<α,接受H 1,不满足方差齐性。

3.单样本t 检验

(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。 (2)前提: ①单组设计

②计量资料(非分类) ③资料服从正态分布 (3)过程:

①建立假设:假设H 0:μ=μ0 ;H 1:μ≠μ0。α ②计算统计量:=

z n x /σμ-或t= n

s x /μ- ③P 值: zα,接受H 0

z>z αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

4.配对t 检验

(1)目的:推断两组样本代表的总体均数的差值是否为零。 (2)前提: ①配对设计

②计量资料(非分类) ③差值服从正态分布 (3)过程:

①建立假设:假设H 0:μd =0 ;H 1:μd ≠0。α ②计算统计量:t=

n

d

s d / df=n-1

③P 值: tα,接受H 0 , t>t αdf 1,则P<α,拒绝H 0

t

αdf 1,则P>α,接受H 0 , t>t 2

αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

5.成组t 检验

(1)目的:推断两组样本代表的总体均数是否有显著性差异。 (2)前提:

①完全随机成组设计; ②计量资料(非分类); ③独立性; ④正态性; ⑤方差齐性。 (3)过程:

①方差齐性检验

②建立假设:假设H 0:μ1=μ2;H 1:μ1≠μ2(或μ1>μ2,μ1<μ2)。α ③计算统计量:t 或t ′(方差不齐)df=n 1+n 2-2

④P 值: tα,接受H 0 ,t>t α(df 1,df 2),则P<α,拒绝H 0

t

α(df 1,df 2),则P>α,接受H 0 ,t>t 2

α(df 1,df 2),则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

6.单因素方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。 (2)前提:

①完全随机多组设计; ②计量资料(非分类); ③独立性; ④正态性; ⑤方差齐性。 (3)过程:

①正态性检验和方差齐性检验

②建立假设:假设H 0:μ1=μ2=…=μn ;H 1:μ1、μ2、…、μn 不全相等或全不相等。α ③计算统计量:

④P 值:P>α,接受H 0 ,P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。 方差分析表:

(5)注意:组内变异:随机误差

组间变异:随机误差+处理因素 若H 0成立:组内变异≈组间变异 若H 1成立:组内变异 < 组间变异

7.配伍设计的方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。

变异

来源 离差平方和 自由度 均方

F 值

P 值 组间

SS A

K-1

MS A =SS A /(k-1)

F=MS A /MS E

F>F α

(k-1,N-k),

P<α

组内

SS E

N-k

MS E =SS E /(N-k)

总和

SS T

N-1

(2)前提:

①完全随机多组设计;

②计量资料(非分类);

③独立性;

④每个因素的各水平正态性;

⑤每个因素的各水平方差齐性。(3)模型设计:双因素且无交互作用:处理因素——重要实验因素

配伍因素——主要非处理因素

SS

总=SS

处理

+SS

配伍

+SS

误差

(3)过程:

①正态性检验和方差齐性检验

②建立假设:

处理组:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

配伍组:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。α

③计算统计量:

④P值:P>α,接受H

0 ,P<α,拒绝H

(4)SPSS结果:sig>α,接受H

0,差异无统计学意义;sig<α,接受H

1

,差异有统计学意义。

方差分析表

变异来源离差

平方和

自由度均方 F 值P 值

处理因素A SS

A

K-1MS

A

=SS

A

/(k-1)

F

A

=

MS

A

/MS

E

配伍因素B SS

B

B-1MS

B

=SS

B

/(b-1)

F

B

=

MS

B

/MS

E

误差SS

E (k-1)(b-1)MS

E

=SS

E

/(k-1)(b-1)

总和SS

T Kb-1

Fα(k-1,(k-1)(b-1))

Fα(b-1,(k-1)(b-1))

8.析因设计的方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:

①完全随机多组设计;

②计量资料(非分类);

③独立性;

④每个因素的各水平正态性;

⑤每个因素的各水平方差齐性。

(3)过程:

①正态性检验和方差齐性检验

②建立假设:

因素A:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

因素B:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

交互作用:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。α

③计算统计量:

④P值:P>α,接受H

0 ,P<α,拒绝H

(4)SPSS结果:sig>α,接受H

0,差异无统计学意义;sig<α,接受H

1

,差异有统计学意义。

方差分析表

变异来源离差

平方和

自由度均方 F 值P 值

因素A SS

A R-1MS

A

F

A

因素B SS

B S-1MS

B

F

B

A B SS

A×B (r-1)(s-1)MS

A×B

F

A×B

误差SS

E rs(l-1)MS

E

总和SS

T Rsl-1

Fα(r-1,rs(l-1))

Fα(s-1,rs(l-1))

Fα((r-1)(s-1), rs(l-1))

9.线性相关分析

(1)目的:分析两变量间是否有直线相关关系 (2)前提:x 、y 必须都是随机变量 (3)过程:

①计算样本相关系数r 的大小 r=

l

l l xy

xx xy

=

2

2)()())((y y x x y y x x -∑-∑--∑=s s y

x n y x n xy )1(--∑ df=n-2 将r 与界值表界值比较:

当|r|>r α时,P<α,拒绝H 0 ,认为有直线相关关系。 当|r|α,接受H 0 ,认为没有直线相关关系。 ②根据r ,df=n-2检验ρ是否为0

假设H 0:总体相关系数ρ=0,即无关系;H 1:总体相关系数ρ≠0,即有关系。α ③结合专业知识评价相关分析是否有价值

P 值:P>α,接受H 0 ,P<α,拒绝H 0 ,P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,无直线相关关系;sig<α,接受H 1,有直线相关关系。

10.线性回归分析

(1)目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断。

(2)前提:y 必须是随机变量 (3)过程:

①计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a ,斜率b 。

bx a y

+=? 意义:x 每增加1,y 增加a+bx ∑∑==---=n

i i n

i i

i

x x y y x x b

12

1

)()

)((? x b y a

-=? ②根据截距a ,斜率b ,检验样本所抽自的总体截距α是否为0,总体斜率β是否为0。 做法1:直接查相关系数的临界值表 做法2:费舍尔t 检验法:2

12r

n r t --=

df=n-2

做法3:F 检验

假设H 0:β=0,即无回归关系;H 1:β≠0,即有回归关系。α F=

剩回

回df SS df SS // df=n-1

③结合专业知识,评价此直线回归方程是否有实用价值。 Fα,接受H 0,无回归关系

F>F α df ,则P<α,拒绝H 0 ,有回归关系

(4)SPSS 结果:sig>α,接受H 0,无直线回归关系;sig<α,接受H 1,有直线回归关系。

11.列联表Χ2检验

(1)目的:①推断两个或多个总体率或构成比之间的差异;

②分析行列两种属性或两个变量之间有无关联性(相关分析); ③频数分布的拟合优度检验。 (2)前提:小样本,非二项分布 (3)过程:

①建立假设:H0:总体率或构成比无显著性差异(行列变量独立或无相关性) H1:总体率或构成比有显著性差异(行列变量不独立或有相关性),α ②计算最小理论频数T ij ,并计算Χ2。

一般公式:∑-=)1(2

2

c

r n n A N χ df=(r-1)×(c-1)

四格表公式: (最小理论频数:T )

基本公式:n ≥40且T ≥5 )

)()()(()(/)(2

2

2

d b c a d c b a bc ad n T T A ++++-=-=∑χ

校正公式:n ≥40且1≤T ≤5 )

)()()(()2|(|/)5.0|(|2

22d b c a d c b a n

bc ad n T T A ++++--=--=∑χ

特殊公式:n<40 , T<1 四格表确切概率法(Fisher )

③P 值:若χ2<χα2

df 则P>α,接受H 0,若χ2>χα2

df 则P<α,接受H 1。

(4)SPSS 结果:先看最小理论频数值范围,再看sig ,sig>α,接受H 0,总体率或构成比 无显著性差异;sig<α,接受H 1,总体率或构成比有显著性差异。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

相关主题
文本预览
相关文档 最新文档