医学统计学课后习题答案
- 格式:doc
- 大小:875.50 KB
- 文档页数:87
11-多因素实验资料的方差分析11-3(1)本题为4个处理组的2×2析因涉及,因分成3天进行,若将每天的实验结果设为一个区组,先进行随机区组的方差分析:方差分析表1变异来源df SS MS F Sig.总变异11 818.369区组间 2 3.762 1.881 .230 .801处理组间 3 765.529 255.176 31.196 .000误差 6 49.078 8.180从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。
(3)依据完全随机设计析因试验方法进行方差分析方差齐性检验表F df1 df2 Sig.1.429 3 8 0.304P值大于0.05,尚不能认为方差不齐。
方差分析表2变异来源df SS MS F Sig.总变异11 818.37试样处理方式(A) 1 716.11 716.11 108.42 0.000试样重量(B) 1 36.40 36.40 5.51 0.047AB 1 13.02 13.02 1.97 0.198误差8 52.84 6.605结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶核黄素浓度测量有影响。
11-4假定不存在高阶交互作用,仅对A、B、C、D、E5个因素的主效应进行分析,采用正交设计的方差分析法:正交设计的方差分析变异来源df SS MS F Sig.总变异15 3495.366A 1 540.911 540.911 21.714 .001B 1 1743.689 1743.689 69.998 .000C 1 787.223 787.223 31.602 .000D 1 82.038 82.038 3.293 .100E 1 92.400 92.400 3.709 .083误差10 249.104 24.910从上表可以看出,A、B、C三个因素的主效应有统计学意义(P<0.05),即A、B、C三个参数对高频呼吸机的通气量有影响。
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验➢优点:资料信息利用充分;检验效能较高➢缺点:对资料的要求高;适用范围有限2.非参数检验➢优点:适用范围广,可适用于任何类型的资料➢缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1) 均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069) (2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较, t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038, 转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义 (3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。
几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。
所谓“开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。
故百分位数是一个界值,也是分布数列的一百等份分割值。
显然,中位数即是P 50分位数。
即中位数是一特定的百分位数。
常用于制定偏态分布资料的正常值范围。
2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的离散程度大。
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。
其缺点是:1.不灵敏; 2.不稳定。
四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。
所以四分位数间距又可看成中间一半观察值的极差。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1) 均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069) (2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较, t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038, 转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义 (3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
卫生统计学课后习题及答案卫生统计学课后习题及答案卫生统计学是一门研究人群健康和疾病模式的学科,它通过收集、分析和解释数据来揭示人群健康状况的特征和变化趋势。
在学习卫生统计学的过程中,课后习题是必不可少的一部分,它可以帮助学生巩固所学知识,并提高解决实际问题的能力。
下面我将给大家介绍一些卫生统计学课后习题及其答案。
一、描述统计学习题1. 某医院在一周内随机抽取了100名患者,调查了他们的年龄情况,得到以下数据:18, 22, 25, 28, 30, 35, 38, 40, 45, 50, 55, 60, 65, 70。
请计算这组数据的平均数、中位数和众数。
答案:平均数=40.71,中位数=40,众数=无。
2. 某地区调查了500名居民的身高情况,得到以下数据:150cm, 155cm,160cm, 160cm, 165cm, 170cm, 175cm, 180cm, 185cm, 190cm。
请计算这组数据的标准差和变异系数。
答案:标准差=12.91,变异系数=7.17%。
二、推断统计学习题1. 某医院想要了解某种疾病的发病率,随机抽取了1000名居民进行调查,发现有100人患有该疾病。
请计算该疾病的发病率及其95%的置信区间。
答案:发病率=10%,95%的置信区间为(8.11%, 11.89%)。
2. 某研究团队想要了解某种药物的有效性,随机选择了200名患者,其中100人服用药物A,100人服用安慰剂。
经过观察,发现服用药物A的患者中有80人痊愈,服用安慰剂的患者中有60人痊愈。
请计算药物A的治愈率及其95%的置信区间。
答案:药物A的治愈率=80%,95%的置信区间为(73.45%, 86.55%)。
三、生存分析学习题1. 某研究团队对500名癌症患者进行了随访,发现其中100人在5年内死亡。
请计算该癌症患者的5年生存率及其标准误。
答案:5年生存率=80%,标准误=2.68%。
2. 某药物对某种疾病的治疗效果进行了观察,共有200名患者参与了研究,其中100人服用药物A,100人服用安慰剂。
. . . .
. 资料. .. . 医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:
1. × 2. × 3. × 4. × 5. √ 6. √ 7. ×
单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布
答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: . . . .
. 资料. .. . 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。
3.
u(变量变换)标准正态分布、0、1
4. 96.1 58.2 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. 96.1 58.2 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大
是非题:
1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √
单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B
问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? . . . .
. 资料. .. . 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平 均 数 意 义 应用场合 均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增减倍数 ①等比资料;②对数正态分布资料 中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两 察值水平 端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1) 意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/fx)(n·x%-ΣfL) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考 值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同? (1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(µ,σ2)表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σ2lgX)表示。 (2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。 ②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。 6.医学中参考值范围的含义是什么?确定的原则和方法是什么? 含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。 (2)原则: ① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结. . . .
. 资料. .. . 果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。 ② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。 ③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。 ④ 决定取双侧范围值还是单侧范围值。 ⑤ 选择适当的百分范围 ⑥ 确定可疑范围 ⑦ 估计界值 (3)方法: ① 百分位数法:Px=L+(i/fx)(n·x%-ΣfL)
② 正态分布法(对数正态分布):
XlgXlg1SuXlgSuX
双侧
百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。 7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗? 答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。
计算题:
1. 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4074 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 . . . .
. 资料. .. . 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03
4.47 3.04 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05 (1)编制频数分布表,简述其分布特征。 ① 找出最大值、最小值求全距(R): 全距=最大值-最小值=7.22-2.70=4.50(mmol/L) ② 求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L) ③ 分组段,划记(表1-1)
表2-6 某地101例30~49岁健康男子血清总胆固醇值划记表 组段(mmol/L) 划记 频数 2.5~ 1 3.0~ 8 3.5~ 9 4.0~ 23 4.5~ 25 5.0~ 17 5.5~ 9 6.0~ 6 6.5~ 2 7.0~7.5 1 合计 101
由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。