定性资料统计描述
- 格式:doc
- 大小:127.50 KB
- 文档页数:6
第5章 定性资料的统计描述♦ 1.掌握相对数的意义、概念、分类 ♦ 2.熟悉相对数的特点和计算方法 ♦ 3.掌握相对数应注意的问题 ♦ 4.熟悉动态数列的概念和意义♦ 5.熟悉医学常用相对数指标的概念和意义 第一节 常用相对数♦ 绝对数:调查或实验研究中清点定性资料得到的实际数据被称为绝对数。
♦ 相对数:两个有联系指标之比。
♦ 医学上常用的相对数有率、构成比 、相对比等统计指标 一、率率(rate式中:K 为比例基数,常以百分率(%)、千分率(‰)万)表示,原则上使计算结果至少保留1~2位整数。
但在医学资料中某些指标的比例基数是固定的。
常见率的指标如下:⒈人口学指标:粗死亡率、出生率、人口自然增长率、婴儿死亡率、新生儿死亡率等人口学指标常用的比例基数是1000‰。
2.肿瘤指标:恶性肿瘤死亡率、发病率、患病率通用比例基数是100000/10万。
3.其他指标:生存率、病死率通用的比例基数是100%。
二、构成比构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
♦ 常用来表示疾病或死亡的顺位、位次或所占比重。
由于构成比之和为100%,一部♦ 比(ratio )又称相对比,是A 、B 是B 的若干倍或百分( 或× 100%) 常用相对比指标1.对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。
2.关系指标:指两个有关的、但非同类事物的数量的比。
3.计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。
表5-1 1993~1998年某地损伤与中毒病死率(%)与构成比(%)第二节1.计算相对数时分母一般不宜过小 ,一般不能小于30例。
2.分析时不能以构成比代替率 。
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.应当注意不能用构成比的动态分析代替率的动态分析。
5.在比较相对数时应注意可比性。
6.对样本率(或构成比)的比较应随机抽样,并做假设检验。
第五章 定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。
如性别、HIV 感染情况、病情轻重等都属于分类资料。
对于这类资料,其绝对数往往不便于进行相互比较。
例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。
但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。
第一节 常用相对数及其应用相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。
一、率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。
频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。
其计算公式可表达为:K =⨯同时期实际发生某现象的观察单位数频率某时期可能发生某现象的观察单位总数(5.1) 式中,K 为比例基数,可以是100%、1000‰、100000/10万等。
比例基数的选择主要根据习惯用法或使计算结果保留1~2位整数,以便阅读。
例5.1 为研究吸烟与肺癌的关系,某医生收集了2003~2005年286例住院肺癌患者的吸烟史,吸烟的肺癌患者有166例,而同时期同年龄段的1855名非肺癌患者中,吸烟的有407例。
试计算该资料中肺癌患者与非肺癌患者的吸烟率。
由式(5.1),肺癌患者的吸烟率=166/286100%=58.04%⨯,非肺癌患者吸烟率=407/1855100%=21.94%⨯,肺癌患者的吸烟率比非肺癌患者的吸烟率高36.1%。
速率(rate)是带有时间因素的频率,根据数理统计的定义是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生频率之意。
(一) 单项选择题 1. 某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为( )。
A. 该病男性易得B. 该病女性易得C. 该病男性、女性易患率相等D. 尚不能得出结论2. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是( )。
A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的老年人口在总人口中所占比例比乙县小D. 甲县的老年人口在总人口中所占比例比乙县大3. 已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( )。
A. 分别进行比较B. 两个率比较的χ2检验C. 不具备可比性,不能比较D. 对性别进行标准化后再比较4. 经调查得知甲乙两地的冠心病粗死亡率为40/10万,按年龄构成标化后,甲地冠心病标化死亡率为45/10万;乙地为38/10万,因此可以认为( )。
A. 甲地年龄别人口构成较乙地年轻B. 乙地年龄别人口构成较甲地年轻C. 甲地冠心病的诊断较乙地准确D. 甲地年轻人患冠心病较乙地多5. 某地区某种疾病在某年的发病人数为a 0,以后历年为a 1,a 2,……,a n ,则该疾病发病人数的年平均增长速度为( )。
A .B .C .D .6. 某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的2.5倍,则结论为( )。
A . 北方籍战士容易发生中暑B . 南方籍战士容易发生中暑C . 北方、南方籍战士都容易发生中暑D . 尚不能得出结论7. 某地区某种疾病在某年的发病人数为a 0,以后历年为a 1,a 2,……,a n ,则该疾病发病人数的年平均发展速度为( )。
A .B .C .D .8. 相对比包括的指标有( )。
A . 对比指标B .计划完成指标C . 关系指标D .以上都是 (二) 名词解释1...10++++n a a a n n n a a a 110+⨯⨯n n a a 010-n n a a nn a a a 110+⨯⨯nn a a 010-n n a a 1...10++++n a a a n1. 相对数2. 率3. 构成比4. 比5. 标准化法6. 动态数列7. 时点动态数列8. 定基比9. 环比 10.平均增长速度(三)简答题1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请了解实际加以说明。
3. 应用相对数时应注意哪些问题?(四)计算题1.某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中发病者有108人,其中男性患者79人,而女性患者29人。
试计算:⑴该院总流感发病率?⑵男、女流感发病率?⑶男、女患者占总发病人数的百分比?2.下表为一抽样研究资料,试:填补空白处数据并根据最后三栏结果作简要分析。
表6-2 某地各年龄组恶性肿瘤死亡情况年龄(岁)⑴人口数⑵死亡总数⑶其中恶性肿瘤死亡数⑷恶性肿瘤死亡占总死亡的%⑸恶性肿瘤死亡率(1/10万)⑹年龄别死亡率(‰)⑺0~ 82920 4 2.9020~ 63 19.05 25.7340~ 28161 172 4260及以上32合计167090 715 90 12.593.某城市1971~1981年乙脑发病率如下,试作动态分析。
表6-3 某城市1971~1981年乙脑发病率(1/10万)年份1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 发病率20.52 6.31 1.87 3.07 1.08 1.38 2.29 2.31 2.47 2.76 2.944.试就下表资料分析比较甲、乙两医院乳腺癌手术后的五年生存率。
表6-4甲、乙两医院乳腺癌手术后的五年生存率(%)腋下淋巴结转移甲医院乙医院病例数生存数生存率病例数生存数生存率无45 35 77.77 300 215 71.67 有710 450 68.38 83 42 50.60 合计755 485 64.24 383 257 67.10(一) 单项选择题1.D2.D3.D4.B5.D6.D7.C8.D (二) 名词解释1. 相对数(relative number )是两个有了解的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。
2. 率(rate )又称频率指标,说明一定时期内某现象发生的频率或强度。
计算公式为: ,表示方式有:百分率(%)、千分率(‰)等。
3. 构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
计算公式为: ,表示方式有:百 分数等。
4. 比(ratio )又称相对比,是A 、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。
计算公式为: ,表示方式有:倍数或分数等。
5. 标准化法(standardization method)是常用于内部构成不同的两个或多个率比较的一种方法。
标准化法的基本思想就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
6. 动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
7. 时点动态数列是依据指标在时间方面的特点划分的一种动态数列,各个指标是在时点上的数据,如历年人口数、性别比例、现场调查中的患病人数、时点患病率等。
8. 定基比即统一用某个时间的指标作基数,其它各时间的指标与之相比。
9. 环比即以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。
10.平均增长速度是用于概括某一时期的平均速度变化,即该时期环比的几何均数减1, 其计算公式为: (三) 简答题1.常用的相对数指标有:率、构成比和相对比。
意义和计算公式如下:率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。
构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
比又称相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%) 甲乙两个指标可以是绝对数、相对数或平均数等。
2.率和构成比所说明的问题不同,绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。
这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。
但不能认为%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比BA =比110-=-=n n a a 平均发展速度平均增长速度年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。
若要比较高血压的患病率,应该计算患病率指标。
3. 应用相对数时应注意的问题有:⑴计算相对数的分母一般不宜过小。
⑵分析时不能以构成比代替率。
⑶不能用构成比的动态分析代替率的动态分析。
⑷对观察单位数不等的几个率,不能直接相加求其总率。
⑸在比较相对数时应注意可比性。
⑹对样本率(或构成比)的比较应随机抽样,并做假设检验。
(四)计算题:1. ⑴该院总流感发病率为:(108/900)×100%=12%⑵男性流感发病率为:(79/760)×100%=10.39% ;女性流感发病率为:(29/140)×100%=20.71%⑶男性患者占总发病人数的百分比为:(79/108)×100%=73.15% ;女性患者占总发病人数的百分比为:(29/108)×100%=26.85%2.填补空白处数据,见下表()内。
表6-5 某地各年龄组恶性肿瘤死亡情况年龄(岁)⑴人口数⑵死亡总数⑶其中恶性肿瘤死亡数⑷恶性肿瘤死亡占总死亡的%⑸=⑷/⑶恶性肿瘤死亡率(1/10万)⑹=⑷/⑵年龄别死亡率(‰)⑺0~ 82920 (138) 4 2.90 (4.82)(1.66)20~ (46638)63 (12)19.05 25.73 (1.35)40~ 28161 172 42 (24.42)(149.14)(6.11)60~ (9371)(342)32 (9.36)(341.48)(36.50)根据最后三栏结果作简要分析。
由表中第⑸栏可知:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4;20~岁组次之,占19.05%;60~岁组恶性肿瘤死亡人数虽多,但仅占总死亡的9.36%;0~岁组恶性肿瘤死亡占总死亡比重最低,仅占2.90%。
由表中第⑹栏可知:恶性肿瘤的年龄别死亡率随年龄的增大而增加,以60~岁组为最高,为341.50/10万。
故可认为随年龄增大,患恶性肿瘤的危险增加,应引起足够的重视。
由表中第⑺栏可知:年龄别死亡率以20至40岁最低,以后随年龄的增加而增加,60岁以后高达36.50‰。
3.计算结果见表6-6。
表6-6 某市1971~1981年乙脑发病率动态分析年份发病率(1/10万)绝对增长量发展速度(%)增长速度(%)累计逐年定基比环比定基比环比1971 20.52 ——100 100 ——1972 6.31 -14.21 -14.21 30.75 30.75 -69.25 -69.25 1973 1.87 -18.56 -4.44 9.11 29.64 -90.89 -70.361974 3.07 -17.45 1.20 14.96 164.17 -85.04 64.17 1975 1.08 -19.44 -1.99 5.26 35.18 -94.74 -64.82 1976 1.38 -19.14 0.30 6.73 127.78 -93.27 27.78 1977 2.29 -18.23 0.91 11.16 165.94 -88.84 65.94 1978 2.31 -18.21 0.02 11.26 100.87 -88.74 0.87 1979 2.47 -18.05 0.16 12.04 106.93 -87.96 6.93 1980 2.76 -17.76 0.29 13.45 111.74 -86.55 11.74 19812.94-17.580.1814.33106.52-85.676.524.两医院乳腺癌患者的病情构成不同,比较两医院的标准化率,计算过程见表6-7。