当前位置:文档之家› 医学统计学考试重点整理

医学统计学考试重点整理

医学统计学考试重点整理
医学统计学考试重点整理

一、基本概念

1.总体与样本

总体:所有同质观察单位某种观察值(即变量值)的全体

样本:是总体中抽取部分观察单位的观察值的集合

2.普查与抽样调查

普查:就是全面调查,即调查目标总体中全部观察对象

抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查

3.参数与统计量

参数:总体的某些数值特征

统计量:根据样本算得的某些数值特征

4.Ⅰ型与Ⅱ型错误

假设检验的结论

真实情况拒绝H0不拒绝H0

H0正确Ⅰ型错误(ɑ) 推断正确(1?

ɑ)

H0不正确推断正确(1?β) Ⅱ型错误(β)

Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误

Ⅱ型错误(β错误): H0为假时却被接受,取伪错误

5.随机化原则与安慰剂对照

随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)

安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)

6.误差与标准误(区分率与均数)

㈠均数

抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n

㈡样本率

率的抽样误差:样本率p和总体率π的差异

率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

7.方差分析

方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

(方差分析的基本思想:把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义)

二、问题

1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点

㈠描述集中趋势的常用指标:

①均数(资料呈正态或近似正态)优点:反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本资料进行比较;在描述正态分布的特征方面有重要意义;缺点:因均数易受到极端值的影响,故不适用于描述偏态分布资料的集中位置。

②几何均数(呈倍数关系的等比资料或对数正态分布(正偏态)资料)优点:能正确描述观察值数值相差极大甚至达到不同数量级的集中位置(如:血清抗体滴度、细菌计数、体内某些微量元素含量);缺点:因为0不能取对数,所以数据中若有0则不宜直接使用几何均数。

③中位数(适合各种类型的资料尤其适用于:大样本偏态分布资料;资料有不确定数值;资料分布不明)优点:不受极端值影响,适用于各种类型资料;缺点:不能代表全体数据的水平。

㈡描述离散趋势的常用指标

①极差(可用于各种分布的资料)优点:是最简单的变异指标,可用于各种

分布的资料;缺点:只涉及两个极端值没有利用全部数据的信息,不能反映组内其他观察值的变异。

②四分位数间距(偏态分布、两端无确切值或分布不明资料)优点:能反映去

除两端各四分之一数据后中间一半观察值的变动范围;缺点:不能完全反映全体数据观察值的变动范围。

③方差标准差(正态)优点:反映总变异程度;缺点:数值大小易受平均水平

大小的影响。

④变异系数(观察指标单位不同;同单位资料,但均数相差悬殊)优点:消除

了因统计量单位不同、均数相差很大、数据分布的集中位置相差很远造成的影响;缺点:变异系数只是一个相对离散指标。

2. Poisson分布的性质

①总体均数μ与总体方差σ2相等时Poisson分布的重要特征;②当n很大,而π很小,且nπ=μ为常数时,Poisson分布可看做是二项分布的极限分布;③当μ增大时,Poisson分布渐进正态分布;④Poisson分布具备可加性;⑤μ的大小

决定了Poisson分布的图形特征。

3.检验的注意事项

①数据应该来自设计科学严密的实验或调查;②数据应该满足假设检验方法的前提条件;③正确理解假设检验中概率P值的含义;④结论不能绝对化;⑤统计学意义与实际意义。

4.直线回归与相关分析的区别与联系

㈠区别:①资料要求:直线相关性分析要求x、y服从双变量正态分布;直线回归分析要求在给定某个x值时y值服从正态分布②应用:说明两变量间的相互关系(互依关系)用直线相关分析;说明两变量的数量依存关系用直线回归分析③意义:相关系数r说明具有直线关系的两变量间相互关系的方向与密切程度;回归系数b表示x每改变一个单位所引起的y的平均该变量④计算公式:r=lxy/√lxxlyy,b=lxy/lxx⑤取值范围:﹣1≤r≤1,﹣∞<b<∞⑥单位:r没有单位,b有单位。

㈡联系:①对于服从双变量正态分布的同一组数据,即可做直线相关分析又可做直线回归分析,计算出的b与r正负号一致;②相关系数与回归系数的假设检验等价,即对于同一样本,tb=tr;③对于服从双变量正态分布的同一组资料,其相关系数r与回归系数b可以相互换算:r=bSx/Sy;④用回归可以解释相关。决定系数R2=SS回/SS总,为相关系数的平方。

5.应用相对数的注意事项

①不能以构成比代替率;②计算相对数的分母不宜过小,小则直接描述;③相对数的比较应注意其可比性;④应分别将分子分母合计求平均率;⑤样本率或构成比的比较应作假设检验。

6.率的标准化的基本思想和应用率的标准化的注意事项

率的标准化的基本思想:就是采用统一的标准构成,以消除年龄、性别病情轻重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率具有可比性。

应用率的标准化的注意事项:①选择的标准不同,计算出的标准化率也不相同;

②标准化率仅适用于相互间的比较,实际水平应采用未标准化率来反映;③样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否不同,需作假设检验;④各年龄组若出现明显交叉,则不适合采用标准化法,宜分层比较各年龄组率;⑤对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。

对于符合参数统计设计分析条件者,采用非参数统计分析,其经检验较能较低

8.标准误与标准差的区别与联系

标准差均数的标准误

区别统计符号总体标准差用?表示均数的标准误用?x 表示

样本标准差用S表示其估计值用S x 表示计算公式S=√∑(X-X )/(n-1) S x =S/√n

统计学意义标准差越小个体观察值标准误越小,反映

间变异程度越小抽样误差越小用途描述个体值的变异程度描述均数的抽样误差大小联系S x =S/√n

三、填空题

1.实验设计的三要素与四原则

三要素:受试对象、处理因素、实验效应

四原则:对照、随机化、盲法、重复

2.方差分析与两小样本t检验的应用条件

方差分析的应用条件:独立;正态;方差齐性(当组数为2时,方差分析与两均数比较的t检验是等价的,t=√F)

两小样本t检验的应用条件:正态;方差齐性(若方差不齐,则用t’检验)

3.调查研究设计的基本内容主要包括哪些

①明确调查目的和指标;②确定调查对象和观察单位;③确定调查方法;④确定调查方式;⑤确定调查项目和调查表;⑥制定资料整理分析计划;⑦制定调查的组织计划。

4.变量变换的目的

①使资料转换为正态分布;②使资料达到方差齐性;③使曲线直线化。

5.完全随机设计与随机区组设计方差分析变异分解

完全随机设计:SS总=SS组间+SS组内,v总=v组间+v组内

随机区组设计:SS总=SS处理+SS区组+SS误差,v总=v处理+v区组+v误差

6.变异系数的适用条件

①观察指标单位不同,如身高、体重;②同单位资料,但均数相差悬殊。

7.正态分布、标准正态分布、二项分布与Poisson分布的表示

正态分布:N(μ,σ2)

标准正态分布:N(0,1)

二项分布:x ~B(n,p)

Poisson分布:x ~p(μ)

四、简答题

㈠配对设计资料的x 2检验(不独立样本)

①制四格表(书P142)

②建立检验假设,确定检验水准

Ho:B=C,即两种方法的检测结果相同

H1:B≠C,即两种方法夫人检测结果不同

α=0.05

③计算x 2值和自由度

当b+c≥40, x 2=(b-c) 2/b+c , v=1

当b+c﹤40, x 2=(|b-c|-1) 2/b+c , v=1

④确定P值,作出统计推断

查表得:界值x 2=3.84,故P><?0.05,按α=0.05水准,接受()拒绝(),差异有/无统计学意义,可以认为两种方法的检测结果相/不同。

㈡完全随机设计的x 2检验(独立样本)

①制四格表(书P134)

②建立检验假设,确定检验水准

Ho:π1=π2,即两种药物的有效率相同

H1:π1≠π2,即两种药物的有效率不同

α=0.05

③计算x 2值和自由度

(实际频数A,理论频数TRC=nRnC/n,v=(R-1)(C-1) )

Ⅰ当n≧40且T≧5时,x 2=∑(A-T)2/T或x 2=(ad-bc) 2n/(a+b)(c+d)(a+c)(b+d),v=1;

Ⅱ当n≧40且1≦T<5时,用校正的X2值:x 2=∑(|A-T|-0.5)2/T,v=1或x 2=(|ad-bc|-n/2) 2n/(a+b)(c+d)(a+c)(b+d)或用四格表的确切概率法;

Ⅲ当n<40或T<1时,用四格表的确切概率法。

④确定P值,作出统计推断

查表得:界值x 2=3.84,故P><?0.05,按α=0.05水准,接受()拒绝(),差异有/无统计学意义,可以认为两种药物的有效率相/不同。

五、选择题

1.整群抽样与分层抽样的区别:书P15

2.抽样误差大小关系:书P16,整群抽样误差≥单纯随机抽样误差≥系统抽样误差≥分层抽样误差

3.t检验的应用条件:书P91

4.相关分析应用中应注意的问题:书P168

5.P407最佳选择题1、2

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学复习资料

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题1.统计资料的类型分: 2.统计工作的步骤分为资料。 3.统计表的结构为:标 4.可信区间的两个要素 5.方差分析的应用条件来自正态总体③各组总 6.描述正态分布曲线形标是ν。 7.从集中趋势、离散趋 三、单项选择题(请把共20分) 1.将90名高血压病人 治疗,以服药前后血

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。样 本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling )是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s x μ- B σ μ-x C x s x μ- D x x σμ- 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D 中位数 5.配对设计的目的 D A 提高测量精度 B 操作方便 C 为了可以使用t 检验 D 提 高组间可比性 6.测定尿铅含量有甲乙 品,要比较两法测得的 A 配对设计t 检验 方差分析 7.应变量Y 的离均差平 A SS 剩=SS 回 B 上均可 8.相关系数r 与决定系数 确的是 C A r 值的大小反映了两 B r 值接近于零,表明 C 2 r 值接近于零,表明

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学复习重点

统计设计:调查设计、实验设计 第一章绪论 1.基本概念: 总体——根据研究目的确定,所有同质观察单位某种观察值的全体。 样本——总体中抽取的一部分具有代表性的个体组成的集合。 参数——刻画总体特征的统计指标。一般用希腊字母表示、、π 统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p 抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。 小概率事件 P≤ 2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释) 第二章调查研究设计 第三章实验研究设计 1.调查研究 (观察性研究): 特点:无人为施加处理因素 调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查 注意:收集的资料要有可比性 *随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样 非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等 2.实验研究 特点:与调查研究最本质的区别:根据研究目的主动施加干预措施 实验设计的三个基本要素:受试对象、处理因素、实验效应 实验设计的基本原则:对照原则、随机化原则、重复原则 第四章定量资料的统计描述 第五章定性资料的统计描述 1.定量资料 (1)定量资料——*频数分布表、直方图、箱式图——判断分布类型—— 集中位置离散趋势(变异程度)*对称分布 (正态分布) X±S均数X标准差S *偏态分布M(P 25~P 75 )中位数M=P 50 四分位数间距Q=P 25 ~P 75 对数正态分布几何均数G对数标准差S lgX (2)描述离散趋势的统计指标: 极差R=最大值-最小值、 四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 方差(总体、样本S2)&标准差(、S):*正态或近似正态分布

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学重点复习试题集

医学统计学重点复习试题集 1、样本是总体中:DA 、按照研究者要求抽取总体中有意义的部分B 、随意抽 取总A 、任意一部分B 、典型部分C 、有愆义的部分D 、有代表性的体中任意部分 部分E 、有价值的部分C 、有童识的抽取总体中有典型部分D 、按照随机原则 抽取总体中2、参数是指:C 有代表性部分E 、总体中的每一个个体A 、参与个体 数B 、研究个体数C19、总体的统计指标D 、样本的、以舒张压?12. 7KPa 为高血 圧,测量1000人,结果有990名总和E 、样本的统计指标 非高血压患者,有10 名高血压患者,该资料属()资料。B 3、抽样的U 的是:E A 、计算B 、计数C 、 计量D 、等级E 、都对A 、研究样本统计量B 、研究总体统计量C 、研究典型案例 20、红细胞数(1012L-1)是:B E 、样本推断总体参数A 、观察单位B 、数值变量C 、名义变量 D 、等级变量 B 、数值变量 C 、名义变量 D ?等级变量E.21、某次研究进行随 机抽样,测量得到该市120名健康成年男子的研究个体血红蛋口数,则本次研究 总体为:C 5、疗效是:D A.所有成年男子B (该市所有成年男子C (该市A 、观察单 位B 、数值变量C 、名义变量D 、等级变量 E 、研所有健康成年男子 究个体D (120名该市成年男子E (120名该市健康成年男子6、抽签的方法属 于D 22、某地区抽样调査1000名成年人的血压值,此资料属于:A 分层抽样B 系 统抽样C 整群抽样D 单纯随机抽A 、集中型资料B 、数值变量资料C 、无序分类 资样E 二级抽样料 1、统计工作的步骤正确的是C D 、有序分类资料E 、离散型资料A 收集资 料、设计.整理资料、分析资料B 收集资料、整理资料、23、抽样调査的U 的是: 设计、统计推断A 、研究样本统计量B 、研究总体统i|?量C 、研究典型案C 设 计、收集资料、整理资料、分析资料D 收集资料、整理资料、例 核对、分析资料D 、研究误差E 、样本推断总体参数E 搜集资料、整理资料、 D 、研究误差 次/分)是:B 、研究个体4、脉搏数(E A 、观察单位

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学复习题

抽样研究的目的是( B ) A 研究样本统计量 B 由样本统计量推断总体参数 C 研究总体统计量 D 研究典型案例 医学统计学所说的样本是( A ) A 按照随机抽样原则抽取总体中有代表性的一部分 B 有意识的选择总体典型部分 C 依照研究者要求选取总体中有意义的一部分 D 随意抽取的总体中任意部分 在成组资料均数t 检验中:α=0.05, ν,05.0t t >, 则认为( D )。 A 两样本均数相同 B 两样本均数不同 C 两总体均数相同 D 两总体均数不同 完全随机设计方差分析中的组间变异表示( D ) A 处理因素效应大小 B 抽样误差大小 C 全部数据离散程度大小 D 处理因素效应和抽样误差综合作用大小 描述一组偏态分布资料的分布特征,以下哪个较好( D )。? A 几何均数结合全距 B 均数结合标准差 C 均数结合变异系数 D 中位数结合四分位数间距 配对设计的目的( C ) A 为了可以使用t 检验 B 为了可以使用F 检验 C 提高组间均衡可比性 D 提高测量精度 统计分析的主要内容是( C ) A 统计图表和假设检验 B 统计描述和计算统计指标 C 统计描述和统计推断 D 统计推断和参数估计 下面的变量中,属于计数资料的是( A ) A 性别 B 体重指数 C 收缩压和舒张压 D 肺活量 在成对资料均数t检验中,无效假设为( D ) A 两总体均数相等 B 两样本均数相等 C 两总体均数均为0 D 差数的总体均数为0 在下面哪种情况下四格表2χ检验需计算校正2χ值( B )。 A 1< E < 5或n > 40 B 1 ≤ E < 5且n ≥ 40 C E >5且n ≤ 40 D E < 1且n < 40 统计描述的主要内容是( B ) a 统计图表和假设检验 b 统计图表和统计指标 c 统计描述和统计推断 d 统计推断和参数估计 描述一组正态分布资料的分布特征,以下哪个较好( B )。? a 几何均数结合全距 b 均数结合标准差 c 均数结合变异系数 d 中位数结合四分位数间距 血清学滴度资料最常用计算( C )以表示其平均水平。 a 、算术均数 b、中位数 c 、几何均数 d 、全距

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

医学统计学复习题

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

相关主题
文本预览
相关文档 最新文档