当前位置:文档之家› 医学统计学重点

医学统计学重点

医学统计学重点
医学统计学重点

医学统计学重点

第一章绪论

1.基本概念:

总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:

(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)

①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由

各分组标志及其频数构成。包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类

②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单

位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素

1.实验设计三要素:被试因素、受试对象、实验效应

2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

4.实验设计方法

有析因设计正交试验设计均匀试验设计

交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展

多组:单因素多水平配伍组设计拉丁方设计

(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。

析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。

第三章定量资料的统计描述、参考值范围

1.频数表编制过程(了解)

(1)找出样本数据的最大值和最小值,计算极差 R;

(2)分组:确定分组的组距 d 和组数 k;

一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组

(3)求频率密度:统计频数,算出频率、频率密度和累积频率;

(4)画出直方图。

2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。

3.集中趋势、离散趋势的指标及适用范围

(1)集中趋势:x,G,M,P

x ,M

算术均数:适用于对称分布;

不适用于偏态分布和资料中出现极值的资料。

几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。

不适用与观察值中有0或正负数值同时出现的资料。

中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。

百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;

用于确定医学参考值范围(偏态或分布不明的资料)。

众数:适用于大样本,较粗糙。

(2)离散趋势:

极差:优点:简单明了、容易使用。

缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。

②样本容量越大,极差可能越大。

③极差的抽样误差大,不稳定。

四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。

缺点:类似于极差,利用度低。

方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。

变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。

②比较均数相差悬殊的资料的变异度。

③衡量实验精密度和稳定性的常用指标。

(3)频数分布特征

高峰在中间,左右大致对称,称为对称分布。平均数=中位数=众数

高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。 平均数>中位数>众数 高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。 平均数<中位数<众数

对称分布 正(右)偏态分布 负(左)偏态分布 4.正态分布图形的特点及意义

(1)特点:①f (x )关于x=μ对称 ②x=μ时取得最大值

③在x=μ±σ处为拐点,且以 x 轴为水平渐近线 ④f (x )大于0

⑤P (x=a )=0

⑥若 f (x) 在点 x 处连续,则F ′(x )=f (x) (2)意义:?

+∞∞

-)(x f =1,f (x )在负无穷到正无穷的积分值为1,即曲线下方面积为1。

5.μ和σ2的意义

μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。 σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。

6.标准化变换

z=

σ

μ

-x x ~N (μ,σ2) z ~N (0,1) F (x)=Ф(σμ-x )=Ф(z) 即P (X ≤x)=Ф(σ

μ

-x )=P (Z ≤z)

P (a

σμ-b )-Ф(σμ-a P (σμ-a <σ

μ-x <σμ-b )=P (σμ-a < Z <σμ

-b )

7.标准正态分布界值

规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x 轴上方中间面积一致。 双

P (|z|≤z 2α)=1-α P (z

α)=1-2α

P (|z|≥z 2α)=α P (z>z 2

α)=2α

单侧界值:

上限: 下限:

P (z>z α)=α P (z>z 1-α)=1-α P (z

8.正常值范围及意义

概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。

意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。 以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种 估计的可信度是95%,会冒5%的风险。 公式: 双侧95%的界限值:x ±1.96s 单侧95%的上限值:x +1.645s 单侧95%的上限值:x -1.645s

第四章 总体均数的估计、假设检验

1.标准误

(1)概念:每次样本计算出的x 不同,这些x 的标准差称为均数的标准误。

(2)意义:是衡量样本统计量抽样误差大小的统计指标。

(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描 述统计量的变异。 (4)均数标准误的公式:S x =

n

s 2.置信区间

(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x 1、x 2、…、xn)和θ2(x 1、 x 2、…、x n ),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(^θ1<^

θ2)=1-α, 则称随机区间(^θ1,^θ2)为θ的1-α置信区间,其中称为^θ1置信下限,称为^

θ2 置信上限,1-α称置信度。

(2)意义:区间(^θ1,^θ2)包含有参数θ的概率为1-α,不能说θ在(^θ1,^

θ2)的概率为 1-α。

例:可以说(a ,b )包含均数μ的概率为95%,不能说μ在(a ,b )的概率为95%。 (3)公式:单个正态总体均数μ的区间估计

①σ已知:

双侧:n

z x σα2

± 即 x z x σα2

±

z 分布

单侧:n

z x σ

α

± 即 x z x σα±

②σ未知:

双侧:n s

t x 2

α

± 即 x s t x 2

α± 小样本(n ≤50) t 分布

单侧:n

s

t x α± 即 x s t x α±

双侧:n s

z x 2

α

± 即 x s z x 2

α± 大样本(n>50) z 分布

单侧:n

s

z x α± 即 x s z x α± (4)两要素:

准确度:由1-α 决定,1-α 越大,准确度越高。 精确度:由区间长度决定。

99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。

3.抽样分布

(1)t 分布

①定义: 来自正态总体的一组样本,x 和s 分别是样本的均数和标准差。则t=n

s x /μ-~

t 分布,自由度 df=n-1,极限分布是标准正态分布。 ②图形分布特征:

以0为中心,左右对称的单峰分布。 自由度越大,越高瘦 ③界值: 双侧:

P (|t|≤t 2α)=1-α P (t

α)=1-2α

P (|t|≥t 2α)=α P (t>t 2

α)=2α

单侧:

上限: 下限:

P (tt α)=α P (t>t 1-α)=1-α (2)χ2分布

①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n 的样本,计算 样本标准差s ,则χ2=(n-1)s 2/σ2服从自由度df=n-1的χ2分布。 ②图形分布特征: 曲线偏向左边 自由度越小曲线越偏 ③

值:

双侧:

P (x 2

>x 2

2

α)=2α P (x 2>212α-

x )=1-2α P (x 2

α)=1-2α P (x 2<212α-

x )=

2α 单侧:

上限: 下限:

P (x 2>x 2α)=α P (x 2>x 21-α)=1-α P (x 2

①定义:如果分别从两个正态总体N (μ1,σ1)和N (μ1,σ1)中随机抽取样本含量 n 1、n 2的两个样本,算出样本均数和方差分别为x 1,s 21和x 2,s 2

2,则σ

σ22

2

22121//s s F =

服从df 1=n 1-1,df 2=n 2-1的F 分布。

若χ1

、χ2

分别服从自由度df 1

、df 2

的χ2

分布,则F=df

df

2

22

12

1//

χχ~df 1df 2

②图形分布特征 曲线偏向左边

df 1、df 2同时增大,曲线趋向于对称 ③倒数性质:F df df )(),1(2,1α-=

F df df

)

(

2,

11

α

④界值: 双侧:

P (F>F 2α)=2α P (F>2

1α-F )=1-2α

P (F

α)=1-2α P (F<2

1α-F )=2α

单侧:

上限: 下限:

P (F>F α)=α P (F>F 1-α)=1-α P (F

α

=1-α P (F

α

4.假设检验

(1)基本思想:反证法、小概率事件原理

(2)基本步骤:

①建立假设,确定检验水准

H0:原假设,差异存在但不显著或差异无统计学意义

H1:备择假设,差异显著或差异有统计学意义

②在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生)

参数检验统计量要求满足:

i)在H0成立的条件下,服从特定的抽样分布;

ii)必须包含要检验的总体参数;

iii)对于给定的样本数据,能计算出该检验统计量的数值。

③对于给定的α值做出检验结论,并给以专业解释

判断P值:(与界值比较,反查界值表确定范围,软件计算)

若P>α,则接受 H

0,拒绝H

1

;若P<α,则拒绝 H

,接受H

1

(3)检验方法:

正态性检验、方差齐性检验、t检验

(4)两类错误

①第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。

②P≤α时,拒绝H

,可能犯Ⅰ类错误(α)。此时,P值越小,犯Ⅰ类错误的概率越小,结论越可靠。

③P>α时,接受H

,可能犯Ⅱ类错误(β)。此时,虽然β未知,但P值越大,犯Ⅱ类错误的概率越小,结论越可靠。

④减少(增加)I型错误,将会增加(减少)II型错误

⑤增大n,可以同时降低两类错误。

第五章方差分析

1.方差分析基本思想

目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性差异。

基本思想:根据离差来源的不同,将总离差平方和分解为两部分:

由试验的随机因素(误差)引起的组内离差,

由因素的作用(即处理水平不同)引起的组间离差。

总离差平方和 = 组内离差平方和+ 组间离差平方和(SS

T = SS

E

+ SS

A

2.方差分析

单因素方差分析、配伍组设计方差分析、析因设计方差分析

拉丁方设计方差分析、正交设计方差分析

交叉设计方差分析、组内分组设计方差分析

第六章双变量相关与回归

1.散点图特征

正相关完全正相关负相关完全负相关

不相关

2.相关系数意义及分类

(1)意义:

①相关系数r 的大小反映随机变量X 和Y 之间线性关系的密切程度: 若 r=0,则 X 与 Y 不相关; 若 |r|=1,则 X 与 Y 完全相关。

②相关系数r 的符号反映随机变量X 和Y 之间线性关系的相关方向: 若 0

①积差相关系数:双变量为服从正态分布的计量资料

②等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。 (3)适用范围:

两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的。

3.线性相关分析和回归分析的联系与区别

(1)联系: ①r=l

l xy

xx

b

/ l xx 、l xy 分别是x 、y 的标准差

②方向一致,r 与b 方向一致

③r 与b 的假设检验等价,即同一样本存在:t r =t b

④回归强度与相关强度:R 2=SS 回/SS 总=r 2 (仅限Ⅱ型回归)

(2)区别: ①资料

相关:x,y 必须是随机变量

回归: x 是确定变量称Ⅰ型回归, y 必须是随机变量 x

②计量单位:r 不受单位影响,b 受单位影响 ③意义:

相关说明相关关系,相关关系描述变量间关系的密切程度与方向。 回归说明依存关系,回归方程描述变量间的数量依存关系。 ④取值范围:|r|≤1,b ∈R

4.最小二乘法

5.决定系数的意义

R 2=SS 回/SS 总=(SS 总-SS 剩)/SS 总=(1-SS 剩)/SS 总

0≤ R 2 ≤1,R 2越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好。

第七章 两分类资料的统计描述与推断

1.相对数指标

两个有联系的指标之比。常用的有率和比(构成比、相对比)。

(1)率:频率,说明某现象发生的频率和强度。总体率:π,样本率:p 。 K ?=

可能发生该现象的总例某现象实际发生的例数

(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。 %100?=

察单位总数

同一事物各组成部分观位数

某一组成部分的观察单构成比

(3)相对比:两个有关指标A 、B 之比,说明两者的对比水平,A 是B 的若干倍或百分之几。

把观测点 (x i , y i ) 标在直角坐标系下作成散点图,则必存在着一条直线,使每个点 (x i , y i ) 距这条直线在纵方向上的距

离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。

对比的数值可以是绝对数、相对数或平均数。

第八章R×C表资料的分析

1.列联表分类及统计方法

(1)双向无序:多个样本率或构成比比较→χ2检验

(2)单向有序:

分组变量有序→χ2检验(同双向无序)

结果变量有序→秩和检验或Ridit分析

(3)双向有序:

属性相同→McNemar、Kappa检验

属性不同→秩相关分析、线性趋势检验、秩和检验或Ridit分析

2.列联表注意事项

(1)R×C表中不宜有20%以上的格子的T<5,不能有T<1。

理论数太小处理办法:①最好增加样本例数以增大理论数

②删去理论数太小的行和列

③将太小理论数所在行或列的实际数与性质相近的邻行/列合并

④采用Fisher检验

(2)R×C表χ2检验未考虑等级顺序关系,若处理效应按强弱或优劣分为有序等级时采用秩和检验或Ridit分析。

(3)拒绝H0时不能确定是不全相等还是全不相等,需进行两两比较。

第九章非参数检验、Ridit分析

1.参数检验和非参数检验特点

(1)参数检验:

特点:总体分布的类型为已知,只是一个或几个参数未知,对未知参数进行检验。

优点:检验效能高,允许应用样本提供的数据

缺点:受应用条件限制

(2)非参数检验:

特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的位置,允许根据分布情况而不是总体参数做出推论。

优点:不依赖总体分布类型,应用广泛

缺点:符合参数检验的用非参数检验会降低检验效能。

2.检验方法

符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。

检验方法

1.正态性检验

(1)目的:在做t检验方差分析之前首先判断是否服从正态分布

(2)过程:假设H

0:总体服从正态分布;H

1

:总体不服从正态分布。α

(3)SPSS结果:看sig值,sig>α,接受H

0,服从正态;sig<α,接受H

1

,不服从正态。

2.方差齐性检验

(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布

(3)过程:

①建立假设:假设H 0:σ2

1=σ2

2即方差齐;H 1:σ2

1≠σ2

2。α ②计算统计量:σ

σ22

2

22121//s s F =

=s

s 2

2

2

1 df 1=n 1-1 df 2=n 2-1 ③P 值: Fα,接受H 0

F>F α(df 1,df 2)则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,满足方差齐性;sig<α,接受H 1,不满足方差齐性。

3.单样本t 检验

(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。 (2)前提: ①单组设计

②计量资料(非分类) ③资料服从正态分布 (3)过程:

①建立假设:假设H 0:μ=μ0 ;H 1:μ≠μ0。α ②计算统计量:=

z n x /σμ-或t= n

s x /μ- ③P 值: zα,接受H 0

z>z αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

4.配对t 检验

(1)目的:推断两组样本代表的总体均数的差值是否为零。 (2)前提: ①配对设计

②计量资料(非分类) ③差值服从正态分布 (3)过程:

①建立假设:假设H 0:μd =0 ;H 1:μd ≠0。α ②计算统计量:t=

n

d

s d / df=n-1

③P 值: tα,接受H 0 , t>t αdf 1,则P<α,拒绝H 0

t

αdf 1,则P>α,接受H 0 , t>t 2

αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

5.成组t 检验

(1)目的:推断两组样本代表的总体均数是否有显著性差异。 (2)前提:

①完全随机成组设计; ②计量资料(非分类); ③独立性; ④正态性; ⑤方差齐性。 (3)过程:

①方差齐性检验

②建立假设:假设H 0:μ1=μ2;H 1:μ1≠μ2(或μ1>μ2,μ1<μ2)。α ③计算统计量:t 或t ′(方差不齐)df=n 1+n 2-2

④P 值: tα,接受H 0 ,t>t α(df 1,df 2),则P<α,拒绝H 0

t

α(df 1,df 2),则P>α,接受H 0 ,t>t 2

α(df 1,df 2),则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

6.单因素方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。 (2)前提:

①完全随机多组设计;

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学考试(详细)

医学统计学基本概念 1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。 3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo) 上的一切值。 4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。它是指变量的取值有 限的,至多是可列多个。附:无序分类:二项分类、多项分类 5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值 大小,故等级之间不可度量。 6.个体individual:即每个观察单位。 7.总体population:根据研究目的确定的同质观察单位的全体。 8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。特点:参数是未知的,固有的,不变的! 10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的! 11.概率probability:是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。 13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。 14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。这个常数p就称为事件A出现的概 率(probability),记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。 15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能 发生,此即为小概率原理。 16.同质(homogeneity):性质相同的事物称为同质的。 17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、 机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。 19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error):样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。 23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。 24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又 称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则每100个样本所算得 的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。 27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内, 理论上有95个包含总体均数,而有5个不包含总体均数。 28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间! 29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。 30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准α所能发现该差异的能力。1-β只取单 尾。 32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为 单因素多个样本均数,单个因素可以有多个水平,R>2 33.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。 34.绝对数:在计数资料中,各组的观察数称绝对数。 35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。 36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常 以保留1-2位整数为宜。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学试卷

《医学统计学》考查试卷(必修) ---------------------------------------- 说明:本试卷总计100分,全试卷共4页,完成答卷时间2小时。 ---------------------------------------- 一、填空(10小题,每小题2分,共计20分。) 1、统计学分为 和 两大部分。 2、统计思想是用样本 估计(或推测)总体 ,它是通过 和 来实现的。 3、统计步骤包括 、 、 、 。 4、统计资料分为 和 ,后者又分为 、 和 。 5、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 6、假设检验的原理是 。 7、假设检验得到 ,可认为差别无统计学意义, ,可认为差别有 统计学意义, ,可认为差别有高度统计学意义。 8、直线回归反映两个变量的 ,而直线相关反映的是两个变量的 。 9、2x 检验的思想可以概述为看 和 吻合程度如何。 10、秩和检验和Ridit 分析均属 ,前者关键是 ,后者关键是 。 二、选择题(有单选和多选,10小题,每小题1分,共计10分。) 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标 应选 。 (1)极差 (2)变异系数 (3)方差 (4)标准差 2、总体均数95%的可信区间为 。 (1))96.1,96.1(s x s x +- (2))58.2,58.2(s x s x +-

(3))96.1,96.1(x x s x s x +- (4))58.2,58.2(x x s x s x +- 3、四个样本均数的比较,参数假设检验为 。 (1)0H :4321x x x x === (2) 1H :4321x x x x ≠≠≠ (3)0H :4321μμμμ=== (4)1H :4321μμμμ≠≠≠ 4、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明: 。 (1)两样本均数差别越大 (2)两总体均数差别越大 (3)越有理由认为两总体均数不同 (4)越有理由认为两样本均数不同 5、分类资料的配对设计差异性(或优势性)检验需选用 。 (1)Pearson-2x 检验 (2)CMH-2x 检验 (3)McNemar-2x 检验 (4)Fisher 的确切概率法 6、来自医院的资料可求得 。 (1)有效率 (2)无效率 (3)发病率 (4)死亡率 7、作直线相关分析,要求: 。 (1)X 和Y 变量总体均服从正态分布 (2)X 或Y 变量总体服从正态分布 (3)只要因变量Y 总体服从正态分布 (4)两变量总体服从不服从正态分布均可。 8、方差分析可用于 。 (1)两个样本均数的比较 (2)多个样本均数的比较 (3)回归系数的假设检验 (4)多个样本率的比较 9、Fisher 确切概率法可用于 。 (1)两个样本均数的比较 (3)多个样本均数的比较 (3)两个样本率的比较 (4)每组观察例数不太大的多个样本率的比较 10、等级资料(有序多分类资料),可采用的统计分析方法有 。 (1)2x 检验 (2)秩和检验 (3)Ridit 分析 (4)t 检验或F 检验 三、(本题10分)

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

相关主题
文本预览
相关文档 最新文档