卫生统计学复习题

  • 格式:doc
  • 大小:170.50 KB
  • 文档页数:5

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽?

答案:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

1.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

1.医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

制定参考值范围的一般步骤:

(1)定义“正常人”,不同的指标“正常人”的定义也不同。

(2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的指标。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。

(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。

2.正态分布、标准正态分布与对数正态分布的联系与区别。

2. 三种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布,对数正态分布是不对称的,其峰值偏在左边。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。对数正态分布不属于正态分布的范畴,对数正态分布变量经对数转换后的新变量服从正态分布。

3.对称分布在“X ± 1.96S 标准差”的范围内,也包括95%的观察值吗?

3.不一定。均数±1.96标准差范围内包含95%的变量值是正态分布的分布规律,不是对称分布的规律。对称分布不一定是正态分布。

1.假设检验时,当P ≤0.05,则拒绝H 0,理论依据是什么?

1.答:P 值系由H 0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。

当P ≤0.05时,说明在H 0成立的条件下,得到现有检验结果的概率小于α,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H 0。同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于α,也就是说,有了概率保证。

2.假设检验中α与P 的区别何在?

2.答:以t 检验为例,α与P 都可用t 分布尾部面积大小表示,所不同的是:α值是指在统计推断时预先设定的一个小概率值,就是说如果H 0是真的,允许它错误的被拒绝的概率。P 值是由实际样本获得的,是指在H 0成立的前提下,出现等于或大于现有检验统计量的概率。

1.t 检验和方差分析的应用条件?

1. t 检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

2.如何合理选择检验水准α?

2.设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。

3.以t 检验为例,说明检验假设中α和P 的区别。

3.以t 检验为例,α和P 都是用t 分布尾部面积大小表示,所不同的是:α表示I 型错误的概率,即H 0为真而被错误地拒绝的概率值。α是在统计分析时,根据I 型错误危害的大小,预先规定的,即规定统计结果为“接受 H 1” 时的误判率的界限值为α(即检验水准)。P 值是由实际样本得出的统计结果为“接受 H 1” 时误判率。根据P 与α的大小关系作出“不拒绝H 0”或“拒绝H 0”的统计推断。

1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?

1.常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:

率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。

构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。

比又称相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表

示,其公式为:相对比=甲指标 / 乙指标(或100%)

甲乙两个指标可以是绝对数、相对数或平均数等。

2. 为什么不能以构成比代率?请联系实际加以说明。

2.率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

3. 应用相对数时应注意哪些问题?

3. 应用相对数时应注意的问题有:

⑴ 计算相对数的分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验

1.服从二项分布及Poisson 分布的条件分别是什么?

1.二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。

2.二项分布、Poisson 分布分别在何种条件下近似正态分布? 2. 二项分布的正态近似:当n 较大,π不接近0也不接近1时,二项分布B (n,π)近似正态分布N (n π, )1(ππ-n )。

Poisson 分布的正态近似:Poisson 分布P (μ),当μ相当大时(≥20),其分布近似于正态分布。

3.在何种情况下,可以用率的标准误S p 描述率的抽样误差? 3. 当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p 描述率的抽样误差。

1. 用什么方法考察回归直线图示是否正确?

1.用以下三种方法判定:

⑴直线必须通过点(Y X ,)。

⑵若纵坐标、横坐标无折断号时,将此线左端延长与纵轴相交,交点的纵坐标必等于截距a 。

⑶直线是否在自变量X 的实测范围内。

2剩余标准差的意义和用途? 2.剩余标准差用s Y. X 表示:()()()2ˆ22.--=-=∑n Y Y n SS s X Y 剩 其意义是指当X 对Y 的影响被扣除后,Y 方面仍有变异(考虑b=0时,y 估计值是相等的,但此时仍然有剩余平方和存在;y 的估计值不相等,讲的恰好是回归平方和,因为此时估计值与y 的均数存在离差。)。这部分变异与X 无关,纯属抽样变异。故s Y. X 是用来反映Y 的剩余变异的,即不考虑X 以后Y 本身的随机变异。剩余标准差可用于:

⑴估计回归系数b 的标准误,XX X Y b l s s .=,进行回归系数的区间估计和假设检验。 ⑵估计总体中当X 为某一定值时,估计值Y ˆ的标准误。∑--+=22.ˆ)()(1X X X X n s s X Y Y 并可计算Y ˆ的可信区间,s Y. X 可作为预报精度的指标。

⑶估计总体中当X 为某一定值时,个体Y 值的标准差。 ∑

--+=22.ˆ)()(1X X X X n s s X Y Y ,并计算个体Y 值的容许区间。

3某资料n=100,X 与Y 的相关系数为r=0.1,可否认为X 与Y 有较密切的相关关系?

3.n=100,r=0.1时,对相关系数进行t 检验,按检验水准α=0.05,拒绝H 0(ρ=0),接受H 1(ρ≠0),认为两变量有相关关系,但决定系数r 2=0.12=0.01,表示回归平方和在总平方和中仅占1%,说明两变量间的相关关系实际意义不大。

4.r 与r s 的应用条件有何不同?

4.积差相关系数r 用于描述双变量正态分布资料的相关关系。等级相关系数r s 适用于下列资料: ⑴不服从双变量正态分布而不宜作积差相关分析的资料;

⑵总体分布型未知的资料;

⑶原始资料是用等级表示的资料。

5应用直线回归和相关分析时应注意哪些问题?

5.注意以下五个问题

⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。 ⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

6举例说明如何用直线回归方程进行预测和控制?

6.用直线回归方程进行预测和控制的步骤

⑴根据研究目的确定预报因子(X )和预报量(Y ),由X 估计Y 值,收集资料。 ⑵建立预报方程bX a Y

+=ˆ,并进行回归系数假设检验。若P 小于临界值,则回归方程成立。 ⑶根据回归方程在X 实测范围内对Y 进行预测,并计算X 为某定值时,个体Y 值波动范围(容许区间)。 例如,1~7岁儿童,X 为年龄,Y 为体重,可根据年龄预测(估计)体重。

统计控制是利用回归方程进行逆估计,如要求因变量Y 值在一定范围内波动,可以通过控制自变量X 的取值来实现。步骤同前。

例如,针刺哑门穴,进针深度Y 与颈围X 间存在直线关系,可根据X 取值达到控制Y 目的。

7直线回归分析时怎样确定因变量与自变量?

7.Ⅰ型回归中,X 为精密测量和严格控制的变量,Y 为正态变量。Ⅱ型回归中,X 、Y 均为服从正态分布的随机变量,可计算两个回归方程。何者为X ,何者为Y ,根据研究目的确定。例如,测得某一人群的身高和体重两变量,若目的只是由身高估计体重,则确定X 为身高,Y 为体重。

1.logistic 回归模型中,偏回归系数i β的解释意义是什么?

答:j β的流行病学意义是在其它自变量固定不变的情况下,自变量j X 的暴露水平每改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量j X 的水平每