医学统计学 定性资料的分析
- 格式:ppt
- 大小:971.50 KB
- 文档页数:72
护理论文写作过程中常用统计学方法的描述和常见错误医学统计学是应用概率论和数理统计的基本原理和方法,被广泛地应用到医学研究中。
在医学研究过程和医学论文的撰写过程中常常需要对数据进行统计学处理。
正确的统计学方法对说明研究问题、证明研究假设的成立具有重要意义。
统计学方法选择不当,对研究的科学性、逻辑性、合理性和严谨性都会产生严重影响。
本刊编辑部针对常见的护理统计学错误进行归纳总结,供读者参考。
一、统计描述在研究中,对每个观察单位的某项特征进行测量或者观察,该项特征称为变量。
根据变量值的特点,将研究资料分为两大类:定量资料和定性资料。
1.定量资料:又称为数值变量,分为连续型变量(如:身高、体重等)和离散型变量(如:每个病人就诊次数)。
当数据符合正态分布时,用(均数± 标准差,)来描述,当数据符合偏态分布时,用(中位数,四分位数间 ( M,Q))来描述。
若样本数较少或者缺乏相关先验信息时,应对资料进行正态性检验。
精确判断一组数据是否呈正态分布,最好借助于SPSS、SAS 等统计分析软件。
2.定性资料:是指对每个研究对象的某些方面的特征和性质,进行表达或描述所得的资料,分为无序分类变量(如: 性别、血型等)和有序分类变量(如疗效: 显效、有效和无效)。
通常用率(百分率、千分率和万分率)和构成比(百分比)来描述。
二、统计分析1.定量资料的统计学分析主要考虑两个方面,一是正确辨析定量资料所选取的实验设计类型;二是检查定量资料是否具备参数检验(独立性正态性和方差齐性)的前提条件。
实际上很多科研人员不能正确判定其实验设计类型,导致大量统计学错误出现。
主要有以下两类错误:(1)不管定量资料对应的实验设计类型是什么,一律套用单因素两水平(或成组)设计资料的检验方法(如t 检验或秩和检验)或单因素多水平设计定量资料的分析方法(如单因素多水平设计定量资料的方差分析或秩和检验)。
(2)当定量资料不满足参数检验的前提条件时,盲目套用参数检验方法。
第8章 定性资料的比较 案例辨析及参考答案案例8-1 某单位调查了4类人员乙型肝炎表面抗体(HBsAb )的阳性率,想比较3种病人与健康人群的阳性率有无差别,数据见教材表8-14。
教材表8-14 4类人员乙型肝炎表面抗体(HBsAb )的阳性率 组别 阳性人数阴性人数合计 阳性率/%肝癌病人 肝炎病人 食管癌病人 健康人 17 18 5 3 159 160 142 151 176 178 147 154 9.66 10.11 3.40 1.95 合计436126556.56请大家对本案例讨论如下问题:(1)若看成一个4×2列联表资料进行1次2χ检验,是否能达到分析目的? (2)若将每一种病人与健康人群HBsAb 的检查结果分别组成四格表,进行3次四格表2χ检验,对否?(3)怎样达到分析目的? 案例辨析(1)因为分析目的是“想比较3种病人与健康人群的阳性率有无差别”,进行1次2χ检验,不能达到分析目的。
(2)独立地进行3次四格表2χ检验是不妥的,因为那样做会增大犯假阳性错误的概率。
正确做法(1)就本例而言,对于这个4组二分类资料,当小于5的理论频数的个数少于总格子数的 1/5 时,适合用一般2χ 检验进行总的分析。
其结果是 2χ= 14.148 9,P =0.002 7<0.05,4类人员HBsAb 阳性率之间的差别有统计学意义。
(2)接着作两两比较,原作者较关注3种病人与健康人的HBsAb 比较,其阳性率是否有差异,因此只需比较3次。
但每次比较,对应的检验水准应作调整(见后)。
(3)为了达到前述的统计分析目的,又使犯假阳性错误的概率不增加,应当对每个四格表资料进行假设检验时降低检验水准,即取300803)2(050./.=⨯='α。
于是,肝癌病人和健康人比较2χ=8.577 9,P =0.003 4<0.008 3;肝炎病人和健康人比较2χ= 9.288 3,P = 0.002 3<0.008 3; 食管癌病人和健康人比较校正2χ=0.180 7,P =0.670 7>0.008 3。
医学统计学第一章 绪言研究设计、资料分析、结论定量资料:以定量值表达每个观察单位的某项观察指标,如血脂心率等。
定性资料:以定性方式表达每个观察单位的某项观察指标,如血型性别等。
等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效分级等。
总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
(以上均可能考名解)描述某总体特征的指标称为总体参数,简称参数;描述某样本特征的指标称为样本统计量,简称统计量。
概率是随机事件发生可能性大小的一个度量,概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
定量资料的统计指标(大题):算术均数,几何均数,中位数和百分位数。
同质性与异质性:同质是指观察单位具有相同的性质,是构成研究总体的必备条件;异质性是指性质不同,研究内容不同,对同质性的要求不同。
第二章 个体变异与变量分布变异(名解):是以具有同质性的观察单位为载体,某项观察指标在观察单位之间显示的差别。
【在同质的基础上各观察单位(或个体)之间的差异】 正偏态与负偏态【2.3节为重点,尤其是统计指标与图的关系】几何均数应用于比值数据,中位数适用于偏态分布离散趋势指标(重点简答):全距,四分位数间距,方差,标准差和变异系数,其中常用的是标准差和变异系数。
变异系数(名解):亦称离散系数,是标准差s 与均数x 之比,即XS CV X100%,变异系数常用于比较度量衡单位不同的两组或多组资料的变异度、比较均数相差悬殊的两组或多组资料的变异度。
如何正确使用相对数(选择或简答):1,计算相对数的分母不宜过小。
2,分析时不能以构成比代替率。
3,对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)。
4,计算率时要注意资料的同质性,对比分析时应注意资料的可比性。
福建中医药大学中西医结合学院医学统计学中西医结合学院计数资料的统计描述常用相对数指标定性资料在统计分析时常用绝对数和相对数来描述。
绝对数(absolute number)是指计数资料各类别的频数,反映事物在某时某地出现的实际水平,是实际工作和科研中不可缺少的基本数据。
为了进一步更直观地表达现象间的关系,定性资料也常使用相对数(relative number)来进行统计描述。
相对数是指两个及以上有联系的指标之比,常用的相对数指标有率、构成比和相对比。
两种疗法的疗效比较组别有效无效合计有效率通塞脉方组2673378.9%活血温经汤组3623894.7%合计6297187.3%常用相对数指标一、率率(rate)表示某现象发生的频率或强度,是频率指标。
常以百分率、千分率、万分率或十万分率来表示。
计算通式为:式中k为比例基数,可取100﹪、1000‰、10000/万、100000/10万。
选择k的依据为:①习惯用法,如恶性肿瘤死亡率多选用十万分率,婴儿死亡率多选用千分率等。
②计算结果一般保留1~2位整数,便于读、写和计算。
如0.078﹪可用7.8/万表示。
发病率(incidence rate ,IR )表示某时期(如某一年)内某疾病新发生的频率。
1、发病率患病率fabinglv(prevalence rate ,PR )又称现患率,表示某一时点/时期某人群中某疾病存在的频率,分为时点患病率(point prevalence rate )和时期患病率(period prevalence rate )。
2、患病率发病率和患病率不可混淆。
发病率的基数是某时期可能患该病的人数,基数较小,k一般是%;而患病率的基数是该地的平均人口数,基数大,k一般是10000/万,甚至100000/10万。
因此,一般来说发病率的数值较小而患病率的数值较大。
病死率(cause fatality rate ,CFR )表示某时间内,某疾病患者中因该病死亡的频率。