第1讲 分类变量的描述统计(1)
- 格式:ppt
- 大小:1.29 MB
- 文档页数:55
《实用医学统计学与SAS应用》在线开放课程分类变量资料的统计描述1主要内容概念常用的相对数应用注意事项总结1. 概念:什么是分类变量资料?•分类变量资料又称定性资料、计数资料,它的测量或观察的结果表现为某种属性或者类别。
怎样描述分类变量资料?在医学研究中清点分类资料得到的数据被称为绝对数。
绝对数是研究某客观事物或某现象本质的基本信息,但不便于相互之间进行比较。
例如2017年5月甲小学学生手足口病发病人数为50人,而同期乙小学学生发病人数为40人,但是不能据此认为甲小学的学生手足口病发病情况比乙小学严重,因为该年两个小学的学生人数不一定相等。
因此,根据绝对数提供的资料计算相应的相对数指标,以便进行统计学描述及比较。
2.常用相对数相对数的定义相对数(relative number):两个有联系的指标之比。
医学研究中常用于描述分类资料的相对数包括率、构成比及相对比等统计指标。
(1).率率(rate )是说明某现象发生的频率或强度的指标,其计算为:k =⨯某段时间内实际发生某现象的观察单位数率同时期内可能发生某现象的观察单位数k 为比例基数,可以是100%,也可以是1000‰、100000/10万。
例1 某市2013年平均人口数为6 538 372人,其中男性年中平均人口为3 215 645,因恶性肿瘤而死亡的人数有15 783人,女性平均人口为3 322 727,因恶性肿瘤而死亡的人数有12 235人,试分析该市2013年男性以及女性的恶性肿瘤死亡的严重程度。
157********/10490.82/103215645⨯=万万12235100000/10368.22/103322727⨯=万万男性:女性:(2).构成比构成比(proportion)表示事物内部各组成部分所占的比重,常以百分数表示,因此又称为百分比。
构成比的计算方法如下:100 该事物内部某一组成部分的观察单位数构成比=%某事物内部各组成部分的观察单位总数事物中某部分的构成比大,说明事物中以该部分的频数为多。
实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。