定性资料的统计描述
- 格式:ppt
- 大小:1.01 MB
- 文档页数:83
频数分布表和频数分布图 直接法:均数加权法:直接法:几何均数加权法: 直接法中位数 频数表法 极差 (全距)R直接法 当nx%=INT (nx%)时百分位数 当nx%>INT(nx%)时, P x =x INT(nx%)+1四分位数间距 频数表法四分位数间距 Q u -Q L P 25 ,P 50, P 75总体方差 样本方差直接法加权法比较计量单位不同比较均数相差悬殊对称型(正态分布) 集中位置在中间,左右两侧的频数大致对称分布 类 正偏态:集中位置偏向数值小的一侧(左侧) 型 不对称型(偏态分布)负偏态:集中位置偏向数值大的一侧(右侧)方差 标准差 变异系数 主要用途 定性资料的统计描述集中趋势离散程度分布特征集中描述 适用离散趋势适用均数 单峰对称分布资料 方差和标准差 越大,越离散 单峰对称分布资料 几何均数G对数正态分布, 观察组之间等比 变异系数CV越大,越变异不同计量单位 均数相差较大 中位数M 各种分布 不对称分布, 两端无确切值 分布不明确四分位数间距①偏态分布资料 ②两端无确切值 ③分布不明确资料概念:随机变量X 取各种值的概率称为概率分布规律,简称分布 正态分布就是一种重要的连续型随机变量的分布类型形态:呈对称钟形,在均数处最高,两侧不断降低,逐渐与横轴接近,但不与横轴相交正态分布曲线 密度函数为,分布函数,表示随机变量X 取小于或等于x 的概率①正态曲线在横轴上均数处最高。
②正态分布以均数为对中心,左右对称③正态分布有两个参数,即位置参数μ和形态参数。
特征 若固定,改变μ,曲线沿x 轴平行移动,其形态不变,若固定μ,越小,曲线越陡峭 正态分布 越大,曲线越低平,但中心在x ④正态曲线下的面积分布有规律密度函数标准正态分布(Z 分布) 分布函数标准化变换 估计总体变量值的频数分布查表过高过低均异常→双侧 应用 确定取单侧或双侧参考值 过高异常→上限 过低异常→下限 制定医学参考值范围 主要目的为减少假阳性(确诊)→99%主要目的为减少假阴性(初筛)→95% 服从正态→正态分布法不服从→百分位数法参考值范围正态分布法百分位数法确定适当的百分界限选择制定医学参考值范围方法标态 正态 面积或P -1~168.27% -1.64~1.6490% -1.96~1.96 95% -2.58~2.5899%双侧单侧双侧单侧只有上限只有下限只有上限只有下限95 P2.5~P72.5P5P9599 P0.5~P99.5P1P99。
第5章 定性资料的统计描述♦ 1.掌握相对数的意义、概念、分类 ♦ 2.熟悉相对数的特点和计算方法 ♦ 3.掌握相对数应注意的问题 ♦ 4.熟悉动态数列的概念和意义♦ 5.熟悉医学常用相对数指标的概念和意义 第一节 常用相对数♦ 绝对数:调查或实验研究中清点定性资料得到的实际数据被称为绝对数。
♦ 相对数:两个有联系指标之比。
♦ 医学上常用的相对数有率、构成比 、相对比等统计指标 一、率率(rate式中:K 为比例基数,常以百分率(%)、千分率(‰)万)表示,原则上使计算结果至少保留1~2位整数。
但在医学资料中某些指标的比例基数是固定的。
常见率的指标如下:⒈人口学指标:粗死亡率、出生率、人口自然增长率、婴儿死亡率、新生儿死亡率等人口学指标常用的比例基数是1000‰。
2.肿瘤指标:恶性肿瘤死亡率、发病率、患病率通用比例基数是100000/10万。
3.其他指标:生存率、病死率通用的比例基数是100%。
二、构成比构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
♦ 常用来表示疾病或死亡的顺位、位次或所占比重。
由于构成比之和为100%,一部♦ 比(ratio )又称相对比,是A 、B 是B 的若干倍或百分( 或× 100%) 常用相对比指标1.对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。
2.关系指标:指两个有关的、但非同类事物的数量的比。
3.计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。
表5-1 1993~1998年某地损伤与中毒病死率(%)与构成比(%)第二节1.计算相对数时分母一般不宜过小 ,一般不能小于30例。
2.分析时不能以构成比代替率 。
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.应当注意不能用构成比的动态分析代替率的动态分析。
5.在比较相对数时应注意可比性。
6.对样本率(或构成比)的比较应随机抽样,并做假设检验。
第五章定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。
如性别、HIV感染情况、病情轻重等都属于分类资料。
分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。
例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。
但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。
第一节常用相对数及其应用一、定性资料的频数分布与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指标进行统计描述和统计推断。
定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双向分类形成的表,可用于考察两种属性的关系。
表5.1为某中学不同性别青春期少年对自身体型感觉的构成情况的列联表。
表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况性别自感偏瘦正常自感偏胖男39 186 20女25 130 54列联表的横标目一般为分组变量,纵标目为结局变量。
列联表的用途主要有:1. 列出每组中各种不同结局分类后的频数。
2. 描述频数分布的特征。
3. 便于进一步对分类资料的特征进行统计描述和统计推断。
二、常用相对数指标除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。
相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。
(一)率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。
频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。