当前位置:文档之家› 医学统计学复习重点 (1)

医学统计学复习重点 (1)

医学统计学复习重点 (1)
医学统计学复习重点 (1)

医学统计学复习重点

统计设计:调查设计、实验设计

第一章绪论

1.基本概念:

总体——根据研究目的确定,所有同质观察单位某种观察值的全体。

样本——总体中抽取的一部分具有代表性的个体组成的集合。

参数——刻画总体特征的统计指标。一般用希腊字母表示μ、σ、π

统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p

抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。

小概率事件P≤0.05

2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释)

第二章调查研究设计

第三章实验研究设计

1.调查研究(观察性研究):

特点:无人为施加处理因素

调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查

注意:收集的资料要有可比性

*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样

非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等

2.实验研究

特点:与调查研究最本质的区别:根据研究目的主动施加干预措施

实验设计的三个基本要素:受试对象、处理因素、实验效应

实验设计的基本原则:对照原则、随机化原则、重复原则

第四章 定量资料的统计描述 第五章 定性资料的统计描述

1. 定量资料

(1)定量资料——*频数分布表、直方图、箱式图——判断分布类型——

集中位置 离散趋势(变异程度)

*对称分布 (正态分布) X ±S 均数X 标准差S

*偏态分布 M (P 25~P 75)

中位数M=P 50 四分位数间距Q=P 25~P 75

对数正态分布

几何均数G

对数标准差S lgX

(2)描述离散趋势的统计指标: ? 极差R=最大值-最小值、

? 四分位数间距Q :常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 ? 方差(总体

、样本S 2)&标准差(

、S ):*正态或近似正态分布

? 变异系数

%100?=

X S

CV

(3)

(4)正态分布及其应用:**制定医学参考值范围

步骤:判断分布类型——正态分布——*双侧95%参考值范围:X ±1.96S 、

单侧95%参考值范围:下限为X -1.64S 、上限为X +1.64S ——偏态分布——*双侧95%参考值范围:(百分位数法)P 2.5~P 97.5

单侧95%参考值范围:下限为P 5、上限为P 95 2. 定性资料

*率:指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比。用以说明该现象发生的频率或强度。

*构成比:即比例,指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比。用以说明事物内部各组成部分所占的比重。

%

100观察单位总数同一事物各组成部分的位数

某一组成部分的观察单构成比?=

相对比:简称比,是两个有关联的指标之比值。用以说明一个指标是另一个指标的几倍或几分之几。

%)

100或(乙指标甲指标

相对比?=

应用相对数的注意事项:

(1) *计算相对数时分母应有足够的数量 (2) *分析时不能以构成比代替率

(3) 应分别将分子分母求和计算合计率

(4) *注意资料的可比性:常用标准化法解决率的可比性问题 (5) 样本相对数的统计推断 (6) 某些情况下最好使用绝对数 *合计率(平均率、粗率):应将分子和分母分别合计。

第六章 参数估计

1. 定量资料:用样本均数X 估计总体均数μ。抽样误差:均数的标准误*

均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之亦然。

2. 定性资料:用样本率p 估计总体率π。抽样误差:率的标准误

3. 参数估计的方法:

(1)点估计:抽取一个样本资料后,获得样本统计量;直接用样本统计量作为总体参数的估计值;缺点是没有考虑抽样误差。

*(2)区间估计:结合样本统计量和抽样误差,按一定的置信度(1-α)估计包含总体参数的区间范围,该区间称为(1-α)置信区间(CI )

总体均数的95%置信区间的含义:从正态总体中重复100次抽样,每次样本含量均为n ,

每个样本均按计算95%置信区间,则在这100个置信区间中,理论上有95个置信区间包含了总体均数。 a) 样本均数估计总体均数的方法:

?*t分布法:

?*正态分布:样本量足够大时(n>100)。

b)率的的置信区间:

?查表法

?*正态近似法:样本量足够大时(n>50且np、n(1-p)均≥5)。

95%的总体率的置信区间

*

第七章假设检验

1.基本原理:反证法、小概率事件推断

2.*假设检验的基本步骤:1.建立检验假设,确定检验水准

2.(选择检验方法),计算检验统计量

3.确定P值,作出推断结论

3.建立检验假设(H0和H1)

H0零假设或无效假设——通常为两总体参数相等或服从某分布;

H1备择假设——通常为两总体参数不相等或不服从某分布。

第八章~第十四章(不含第十章)

研究目的资料类型设计类型条件满足条件用不满足条件用

差异性分析定量资料

(*区分设计

类型)

样本均数与总体均数的比较

(单样本设计)

独立性、正态性

(相应设计的)t检验

单样本设计的

符号秩和检验*配对设计独立性、正态性(差值的总体服从分布)配对设计的秩和检验

两独立样本均数比较

独立性、正态性、△方差齐性(两组标准差

超过2倍以上提示方差不齐)

**t‘检验、变量变换、(相

应设计的)秩和检验完全随机设计

(多个独立样本)独立性、正态性、方差齐性(样本来自的总

体方差相等)

方差分析

变量变换、(相应设计的)

秩和检验随机区组设计

(多个相关样本)

计数资料

独立样本2×2

n≥40,理论数T≥5

n≥40,1<T<5,用校正公式

卡方检验

确切概率法

(或者增大样本量)独立样本R×C列联表

T不能<1,1<T<5格子数不能超过总格子

数的1/5

配对设计2×2

b+c>40

b+c<40,用校正公式

等级资料

单样本、配对符号秩和检验

两独立样本Wilcoxon秩和检验

多个独立样本K-WH秩和检验

随机区组Friedman秩和检验

关联性分析相关

(双变量关联

性分析)

*两定量变量*双变量正态分布

简单线性相关

(相关系数r)

秩相关

(相关系数r s)两分类变量卡方检验

两等级变量

秩相关

(等级相关)

直线回归分析LINE(线性、独立性、正态性、等方差性)

t检验

*配对设计:①配对的两个受试对象分别接受两种处理②同一样品用两种方法(或仪器)检验的结果③同一受试对象两个部位的数据。

推断目的:两种处理(或方法)的结果有无差别。

方差分析

总变异:所有观察值与总均值的离均差平方和

组间变异:不同处理组样本均数之间的差异。用组间离均差平方和表示。反映的是处理因素所致变异及个体变异和测量误差。组内变异:处理组内每个观察值之间的差异。用组内离均差平方和表示。反映的是个体变异和测量误差。

**

随机区组设计:是配对设计的扩大

可以安排两个因素的作用:

?研究因素:处理组间有无差异

?区组因素:控制非研究因素(重要的可控的混杂因素)

**

χ2检验

χ

2检验的基本思想:实际频数用A表示,根据H0确定的理论频数用T表示,则构造的χ2统计量为

1.*独立样本2×2列联表资料的χ2检验

*应用条件:n≥40,理论频数T≥5,

n≥40,1<最小T<5,计算校正的χ2值:

2.独立样本R×C列联表资料的χ2检验

*应用条件:理论数不能小于1,理论数在1和5之间的格子数不能超过总格子数的1/5 不满足条件时可合并或删除部分信息

3.*配对2×2列联表资料的χ2检验

**应用条件:b+c>40,

b+c<40,校正公式:

秩和检验(不考细节)*应用条件:定量资料不满足参数检验条件

*等级资料的统计推断

1.符号秩和检验:(1)单一样本与总体中位数比较

(2)*配对设计

配对设计假设检验步骤:

2.成组设计两样本比较:Wilcoxon秩和检验

(1)原始数据两样本比较

(2)*等级资料两样本比较

3.成组设计多个样本比较:K-WH秩和检验

(1)原始数据的多个样本比较

(2) 等级资料的多个样本比较

4. 多个独立样本间的多重比较:K-WH 秩和检验

5. 随机区组设计的秩和检验:Friedman 秩和检验

双变量关联性分析

1. *直线相关(连续性变量)(两定量变量)

*条件:**双变量正态分布。 不满足用秩相关。

*步骤:绘制散点图,如呈现线性趋势——计算统计指标:相关系数r ——对r 做假设检验——如P <0.05,解释相关系数的统计学意义

2.秩相关(连续型变量或等级

变量间)

*条件:连续型两变量不满足双变量正态分布。

*等级变量(有序变量)相关分析。

常用的为Spearman秩相关分析

直线回归分析

*

回归系数b:描述y与x在数量上的依存关系。

*解释:b 表示x 每增加(减)一个单位,y平均改变b个单位

*直线回归分析的基本步骤:

1.绘制散点图(观察是否有直线趋势、异常点)

2.估计回归参数,列出回归方程

3.对回归方程进行假设检验

4.解释回归系数的统计学意义

5.评价回归方程的拟合效果

()

*

医学统计学复习资料讲解学习

一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分:计量资料、计数资料、等级资料。 2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。 3.统计表的结构为:标题、标目、线条、数字。 4.可信区间的两个要素是:准确度、精密度。 5.方差分析的应用条件为:①各组样本是相互独立的随机样本 ②来自正态总体③各组总体方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。 7.从集中趋势、离散趋势两个方面来描述计量资料的分布特 征。 三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分) 1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方 法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s xμ - B σ μ - x C x s xμ - D x x σ μ - 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数 5.配对设计的目的 D A 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性 6.测定尿铅含量有甲乙两种方法。现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 A A 配对设计t检验 B 成组设计的t检验 C均数的u检验 D 方差分析 7.应变量Y的离均差平方和划分,可出现 A A SS剩=SS回 B SS总=SS剩 C SS总=SS回 D 以上均可 8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 C A r值的大小反映了两个变量之间是否有密切的关系 B r值接近于零,表明两变量之间没有任何关系

医学统计学复习资料

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题1.统计资料的类型分: 2.统计工作的步骤分为资料。 3.统计表的结构为:标 4.可信区间的两个要素 5.方差分析的应用条件来自正态总体③各组总 6.描述正态分布曲线形标是ν。 7.从集中趋势、离散趋 三、单项选择题(请把共20分) 1.将90名高血压病人 治疗,以服药前后血

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。样 本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling )是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s x μ- B σ μ-x C x s x μ- D x x σμ- 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D 中位数 5.配对设计的目的 D A 提高测量精度 B 操作方便 C 为了可以使用t 检验 D 提 高组间可比性 6.测定尿铅含量有甲乙 品,要比较两法测得的 A 配对设计t 检验 方差分析 7.应变量Y 的离均差平 A SS 剩=SS 回 B 上均可 8.相关系数r 与决定系数 确的是 C A r 值的大小反映了两 B r 值接近于零,表明 C 2 r 值接近于零,表明

医学统计学总复习练习题(含答案)

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为 C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 B A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有

!!医学统计学总复习练习题(2002)

1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

医学统计学复习重点

统计设计:调查设计、实验设计 第一章绪论 1.基本概念: 总体——根据研究目的确定,所有同质观察单位某种观察值的全体。 样本——总体中抽取的一部分具有代表性的个体组成的集合。 参数——刻画总体特征的统计指标。一般用希腊字母表示、、π 统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p 抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。 小概率事件 P≤ 2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释) 第二章调查研究设计 第三章实验研究设计 1.调查研究 (观察性研究): 特点:无人为施加处理因素 调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查 注意:收集的资料要有可比性 *随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样 非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等 2.实验研究 特点:与调查研究最本质的区别:根据研究目的主动施加干预措施 实验设计的三个基本要素:受试对象、处理因素、实验效应 实验设计的基本原则:对照原则、随机化原则、重复原则 第四章定量资料的统计描述 第五章定性资料的统计描述 1.定量资料 (1)定量资料——*频数分布表、直方图、箱式图——判断分布类型—— 集中位置离散趋势(变异程度)*对称分布 (正态分布) X±S均数X标准差S *偏态分布M(P 25~P 75 )中位数M=P 50 四分位数间距Q=P 25 ~P 75 对数正态分布几何均数G对数标准差S lgX (2)描述离散趋势的统计指标: 极差R=最大值-最小值、 四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 方差(总体、样本S2)&标准差(、S):*正态或近似正态分布

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学复习提纲

《医学统计学》复习提纲 第二章 统计描述 公式:几何均数 (1)直接法: n n X X X G ...21= 或 )lg (lg )lg ...lg lg ( lg 1211 n X n X X X G n ∑--=+++= (2)加权法: )lg (lg ....lg ...lg lg (lg 12122111 ∑ ∑--=++++++=f X f f f f X f X f X f G k k k 中位数(median ) (1) 直接法: n 为奇数 , 2 ) 1(+=n X M n 为偶数,)(21 12 2 ++= n n X X M (2)频数表法:用于频数表资料。 ∑-+ =)2 (L M f n f i L M 标准差(standard deviation ): n X ∑-= 2 ) (μσ 1 ) (2 --= ∑n X X S 离均差平方和 2 ) (∑-X X 常用SS 或l XX 表示。∑∑∑- =-= =N X X X X l SS XX 2 22 )() ( 直接法: 1 )(2 2 --= ∑∑n n X X S 加权法: 1 )(2 2 -- =∑∑ ∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。 率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 3. 应用相对数时应注意哪些问题? 4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。 制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。

医学统计学总复习

总复习 一、统计工作的基本步骤: 四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。 二、三种资料类型: 1. 计量资料(定量资料) 2. 计数资料(分类资料) 3. 等级资料 三、几个基本概念 1. 总体与样本 2. 概率 四、计量资料的统计描述 1. 集中趋势:X、G、M(Px):适用条件、计算 2. 离散趋势:R、Q、S、CV:意义及适用条件 五、集中趋势离散趋势指标的选择判断步骤: 资料 是 抗体滴度 G、S 否是 偏态、开口 M、Q

否 X、S 六、正态分布 1.正态分布的特征 2.正态曲线下分布面积的规律 3.u变换(见下) 七、抽样误差的概念 1. 抽样误差(概念) 2. 抽样误差的特点: ⑴客观存在,可控制但不能消除; ⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小; ⑶均数抽样误差的大小与标准差成正比,与√n成反比; ⑷减少抽样误差最切实可行的办法为:增加样本含量。 3. 总体均数的估计方法 ⑴点(值)估计: ⑵区间估计:①95%可信区间:X±1.96Sx ②99%可信区间:X±2.58Sx 附:①正常参考值范围估计:

①95%正常值范围:X±1.96S ②99%正常值范围:X±2.58S ②可信区间与正常值范围的区别 4. u变换与t变换: X-μ X-μ u变换: u=──── u=──── σσx t变换: X-μ t=──── Sx 八、假设检验的一般步骤: ⑴建立假设①H0:无效假设;H1:备择假设 ②单双侧检验:根据专业知识来定。 ⑵确定检验水准:α=0.05 ⑶选定检验方法并计算检验统计量 ⑷确定P值:直接计算、查表法 ⑸作出推断结论:统计结论:是否拒绝H0 专业结论:谁高谁低?(有无效果) 九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)

医学统计学重点复习试题集

医学统计学重点复习试题集 1、样本是总体中:DA 、按照研究者要求抽取总体中有意义的部分B 、随意抽 取总A 、任意一部分B 、典型部分C 、有愆义的部分D 、有代表性的体中任意部分 部分E 、有价值的部分C 、有童识的抽取总体中有典型部分D 、按照随机原则 抽取总体中2、参数是指:C 有代表性部分E 、总体中的每一个个体A 、参与个体 数B 、研究个体数C19、总体的统计指标D 、样本的、以舒张压?12. 7KPa 为高血 圧,测量1000人,结果有990名总和E 、样本的统计指标 非高血压患者,有10 名高血压患者,该资料属()资料。B 3、抽样的U 的是:E A 、计算B 、计数C 、 计量D 、等级E 、都对A 、研究样本统计量B 、研究总体统计量C 、研究典型案例 20、红细胞数(1012L-1)是:B E 、样本推断总体参数A 、观察单位B 、数值变量C 、名义变量 D 、等级变量 B 、数值变量 C 、名义变量 D ?等级变量E.21、某次研究进行随 机抽样,测量得到该市120名健康成年男子的研究个体血红蛋口数,则本次研究 总体为:C 5、疗效是:D A.所有成年男子B (该市所有成年男子C (该市A 、观察单 位B 、数值变量C 、名义变量D 、等级变量 E 、研所有健康成年男子 究个体D (120名该市成年男子E (120名该市健康成年男子6、抽签的方法属 于D 22、某地区抽样调査1000名成年人的血压值,此资料属于:A 分层抽样B 系 统抽样C 整群抽样D 单纯随机抽A 、集中型资料B 、数值变量资料C 、无序分类 资样E 二级抽样料 1、统计工作的步骤正确的是C D 、有序分类资料E 、离散型资料A 收集资 料、设计.整理资料、分析资料B 收集资料、整理资料、23、抽样调査的U 的是: 设计、统计推断A 、研究样本统计量B 、研究总体统i|?量C 、研究典型案C 设 计、收集资料、整理资料、分析资料D 收集资料、整理资料、例 核对、分析资料D 、研究误差E 、样本推断总体参数E 搜集资料、整理资料、 D 、研究误差 次/分)是:B 、研究个体4、脉搏数(E A 、观察单位

医学统计学总复习练习题

旗开得胜一、最佳选择题 1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 1

5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 1

医学统计学复习题

抽样研究的目的是( B ) A 研究样本统计量 B 由样本统计量推断总体参数 C 研究总体统计量 D 研究典型案例 医学统计学所说的样本是( A ) A 按照随机抽样原则抽取总体中有代表性的一部分 B 有意识的选择总体典型部分 C 依照研究者要求选取总体中有意义的一部分 D 随意抽取的总体中任意部分 在成组资料均数t 检验中:α=0.05, ν,05.0t t >, 则认为( D )。 A 两样本均数相同 B 两样本均数不同 C 两总体均数相同 D 两总体均数不同 完全随机设计方差分析中的组间变异表示( D ) A 处理因素效应大小 B 抽样误差大小 C 全部数据离散程度大小 D 处理因素效应和抽样误差综合作用大小 描述一组偏态分布资料的分布特征,以下哪个较好( D )。? A 几何均数结合全距 B 均数结合标准差 C 均数结合变异系数 D 中位数结合四分位数间距 配对设计的目的( C ) A 为了可以使用t 检验 B 为了可以使用F 检验 C 提高组间均衡可比性 D 提高测量精度 统计分析的主要内容是( C ) A 统计图表和假设检验 B 统计描述和计算统计指标 C 统计描述和统计推断 D 统计推断和参数估计 下面的变量中,属于计数资料的是( A ) A 性别 B 体重指数 C 收缩压和舒张压 D 肺活量 在成对资料均数t检验中,无效假设为( D ) A 两总体均数相等 B 两样本均数相等 C 两总体均数均为0 D 差数的总体均数为0 在下面哪种情况下四格表2χ检验需计算校正2χ值( B )。 A 1< E < 5或n > 40 B 1 ≤ E < 5且n ≥ 40 C E >5且n ≤ 40 D E < 1且n < 40 统计描述的主要内容是( B ) a 统计图表和假设检验 b 统计图表和统计指标 c 统计描述和统计推断 d 统计推断和参数估计 描述一组正态分布资料的分布特征,以下哪个较好( B )。? a 几何均数结合全距 b 均数结合标准差 c 均数结合变异系数 d 中位数结合四分位数间距 血清学滴度资料最常用计算( C )以表示其平均水平。 a 、算术均数 b、中位数 c 、几何均数 d 、全距

(完整word版)医学统计学上机考试复习题及答案

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指B

A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7.用均数与标准差可全面描述其资料分布特点的是C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为D

医学统计学复习要点

第一章绪论 1、数据/资料的分类: ①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。 ②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。 ③、等级资料,又称半定量资料或者有序分类变量。为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。 2、统计学常用基本概念: ①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。 ②、总体(population)指的是根据研究目的而确定的同质观察单位的全体。 ③、医学统计学(medical statistics):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。 ④、样本(sample):指的是从总体中随机抽取的部分观察单位。 ⑤、变量(variable):对观察单位某项特征进行测量或者观察,这种特征称为变量。 ⑥、频率(frequency):指的是样本的实际发生率。 ⑦、概率(probability):指的是随机事件发生的可能性大小。用大写的P表示。 3、统计工作的基本步骤: ①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排; ②、收集资料:采取措施取得准确可靠的原始数据; ③、整理资料:将原始数据净化、系统化和条理化; ④、分析资料:包括统计描述和统计推断两个方面。 第二章计量资料的统计描述 1. 频数表的编制方法,频数分布的类型及频数表的用途 ①、求极差(range):也称全距,即最大值和最小值之差,记作R; ②、确定组段数和组距,组段数通常取10-15组; ③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统一定为L≤X<U,最后一组包括下限。 ④、分组划记并统计频数。 频数分布的类型包括对称分布和偏态分布;偏态分布主要分为右偏态分布(也称正偏态分布)和左偏态分布(也称负偏态分布)。频数表的用途包括以下几个方面: ①、描述频数分布的类型; ②、描述频数分布的特征; ③、便于发现一些特大或特小的离群值; ④、便于进一步做统计分析和处理。 2. 集中趋势指标的适用条件、计算方法和意义。 统计学用平均数(average)这一指标体系来描述一组变量值的几种位置或者平均水平。 常用的平均数有算术均数、几何均数和中位数。 ①、算数均数,简称均数(mean),可用于反映一组呈对称分布的变量值在数量上的平均水平。计算方法包括直接计算法和频数表法(公式见2-2)。 ②、几何均数(geometric mean),可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常用于免疫学的指标。(计算公式见于2-3)③、中位数(median),适用于各种分布类型的资料,尤其是偏态分布资料和一端或者两端无确切数值的资料。 ④、百分位数(percentile)是一种位置指标,是一个界值,其重要用途是确定医学参考值范围(reference range)。 直接计算法(公式见于2-7、2-8) 频数表法(2-9、2-10) 3、离散趋势指标的适用条件、计算方法和意义。 描述数据变异大小的常用统计指标有极差、四分位数间距、方差、标准差和变异系数。 ①、极差,一组变量值的最大值与最小值之差。 ②、四分位数间距(quartile range,QR)是把全部变量值分为四部分的分位数后,由第3四分位数和第1四分位数相减而得。它一般和中位数一起描述偏态分布资料的分布特征。QR=P75-P25。 ③、方差(variance)也称均方差(mean square deviation)离均差平方和与样本含量的比值。计算公式为2-11 ④、标准差(standard deviation)是方差的正平方根,其单位与原变量值得单位相同。计算公式为2-13、2-14 ⑤、变异系数(coefficient of variation)记作CV,多用于观察指标单位不同时,或者均数相差较大时两者变异程度的比较。计算公式为2-16 4. 正态分布的图形,正态分布的特征,正态曲线下面积的分布规律。

医学统计学复习题

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

医学统计学复习题-19页文档资料

抽样误差与总体均数的估计 1. ( C ) A. 总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D. 个体变量值的离散程度 E. 总体标准差 2.抽样研究中,S为定值,若逐渐增大样本含量,则样本 ( B ) A. 标准误增大 B. 标准误减小 C. 标准误不改变 D. 标准误的变化与样本含量无关 E. 标准误为零 3. 关于以0为中心的t分布,叙述错误的是( E ) A. t分布是一簇曲线 B. t分布是单峰分布

C. 当v→∞时,t→μ D. t分布以0为中心,左右对称 E. 相同v时,∣t∣越大,p越大 4.均数标准误越大,则表示此次抽样得到的样本均数( C ) A. 系统误差越大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 测量误差越大 5.要减小抽样误差,最切实可行的办法是( A ) A. 适当增加观察例数 B. 控制个体变异 C. 严格挑选观察对象 D. 考察总体中每一个个体 E. 提高仪器精度 6."假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg ,后者反映的是"( E ) A. 总体均数不同 B. 抽样误差 C. 抽样误差或总体均数不同 D. 系统误差 E. 个体变异

7. "已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg 。从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8mmHg。则112.8mmHg 与120.2mmHg 不同的原因是" ( B ) A. 个体变异 B. 抽样误差 C. 总体均数不同 D. 抽样误差或总体均数不同 E. 系统误差 8. "已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg 。从该地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg ,标准差为10.4mmHg,则90.5mmHg 与120.2mmHg不同,原因是" ( C ) A. 个体变异 B. 抽样误差 C. 总体均数不同 D. 抽样误差或总体均数不同 E. 系统误差 9.从某地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg ,标准差为10.4mmHg,则该地7岁正常男孩的收缩压总体均数的95%的置信区间为( A )

相关主题
文本预览
相关文档 最新文档