第二章计量资料的统计描述

格式：ppt
大小：1.72 MB
文档页数：54

下载文档原格式

/ 54

统计背诵版(三份整合)

统计学资料背诵版一、单选题：第二章：计量资料的统计描述1、描述一组偏态分布资料的变异度，以四分位数间距指标较好。

2、用均数和标准差可以全面描述正态分布资料的特征。

3、各观察值均加（或减）同一数后标准差不变。

4、比较某地1~2岁和5~5.5岁儿童身高的变异程度，宜用变异系数。

5、偏态分布宜用中位数描述其分布的集中趋势。

6、各观察值同乘以一个不等于0的常数后，变异系数不变。

7、正态分布的资料，均数等于中位数。

8、对数正态分布是一种右偏态分布（说明：设X变量经Y=lgX变换后服从正态分布，问X变量属何种分布？）9、横轴上，标准正态曲线下从0到2.58的面积为49.5%10、当各观察值呈倍数变化（等比关系）时，平均数宜用几何均数。

第三章：总体均数的估计与假设检验1、均数的标准误反映了样本均数与总体均数的差异。

2、两样本均数比较的t检验，差别有统计学意义时，P越小，说明越有理由认为两总体均数不同。

3、甲乙两人分别从同一随机数字表抽得30个（各取两位数字）随机数字作为两个样本，求得X1和S 12、X2和S22，则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间，很可能包括04、在参数未知的正态总体中随机抽样，丨X－μ丨≥t0.05/2，vS X的概率为5%5、某地1992年随机抽取100名健康女性，算得其血清总蛋白含量的均数为74g/L，标准差为4g/L，则其95%的参考值范围为74±1.96×46、关于以0为中心的t分布，叙述错误的是相同时，丨t丨越大，P越大。

7、在两样本均数比较的t检验中，无效假设为两总体均数相等。

8、两样本均数比较作t检验时，分别取以下检验水准，犯第二类错误概率最小的是α=0.309、正态性检验，按α=0.10水准，认为总体服从正态分布，此时若推断有错，其错误的概率等于β，而β未知。

10、关于假设检验，说法正确的是采用配对t检验还是两样本t检验是由试验设计方案所决定的。

计量的统计描述2016-07-01

i50 f50
(n 2
fL)
例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见表2-6第(1)、(2)栏，求中位数及第25 、第75 百分位数。
天数
人数 f
累计频数
累计频率（%）
(1)
(2)
12～
4
24～
17
36～
32
48～
24
60～
18
72～
12
84～
5
96～
4
108～
2
(3)
(4)
fX 2
(5)=(2)×(3)2
20.10 37.07 114.70 198.98 346.74 521.67 401.03 313.27 227.53 148.21 106.92 57.67 2493.89
计数资料频数分布表
人流次数
(1)
0 1 2 3 4 5 6 合计
人数
(2)
402 330 232 118
第三节描述离散趋势
（变异（variation）指标）
反映数据的离散度（ Dispersion ）。即个体观察值的变异程度。常用的指标有：
1. 极差(Range） (全距) 2. 百分位数与四分位数间距
Percentile and Quartile range 3. 方差 Variance 4. 标准差Standard Deviation 5. 变异系数 Coefficient of Variation
三、频数表和图的用途 1、描述频数分布的类型
对称分布：各组段的频数以频数最多组段为中心左右两侧大体对称；
偏态分布：频数最多组段不在中心位置，其两侧组段数不对称。

统计学第二章计量资料的统计描述

数据。同时，还需要对数据进行质量控制和预处理，以消除误差和异常值的影响。
02
统计数据整理与展示方法
数据清洗与预处理技巧
80%
缺失值处理
根据数据的分布情况和实际背景，选择合适的缺失值填充方法，如均值、中位数、众数等。
100%
异常值处理
采用箱线图、散点图等方法识别异常值，并根据实际情况选择删除、替换或保留。
分类
根据测量水平的不同，计量资料可分为离散型和连续型两类。离散型数据只能取整数值，如人口数、医院床位数等；连续型数据则可以取实数范围内的任何值，如身高、体重等。
计量资料特点分析
数值性
计量资料以数值形式表示，具有数量化的特点，便于进行数学运算和统计分析。
连续性
连续型计量资料在实数范围内可以取任意值，数据分布的连续性使得统计推断更为精确。
06
统计图表在数据可视化中应用
常见统计图表类型介绍
条形图（Bar Chart）
用于展示分类数据之间的比较，横轴表示分类，纵轴表示数量或比例。
折线图（Line Chart）
用于展示时间序列数据或连续性数据的趋势变化，横轴表示时间或类别，纵轴表示数量或比例。
散点图（Scatter Plot）
用于展示两个变量之间的关系，横轴和纵轴分别表示两个变量，点的位置表示变量的取值。
一组观察值中出现次数最多的数。
计算方法
应用场景
中位数计算需先将数据排序，然后取中间位置的数；众数计算则是统计各数值出现的次数，取出现次数最多的数。
适用于各种类型的数据，尤其适用于偏态分布数据。中位数和众数对极端值不敏感，因此能较好地反映数据的集中趋势。
不同集中趋势指标比较
算术平均数、中位数和众数都是描述数据集中趋势的指标，但各有特点。

《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京：人民卫生出版社，2010第二章计量资料的统计描述计算分析题（P26）1. 根据某单位的体检资料，116名正常成年女子的血清甘油三酯测量结果如下，请据此资料：（1）描述集中趋势应选择何指标？并计算之。

（2）描述离散趋势应选择何指标？并计算之。

（3）求该地正常成年女子血清甘油三酯的95%参考值范围。

（4）试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比？表2-1某单位116名正常成年女子的血清甘油三酯（mmol/L）测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116（1）数据文件数值变量名：组段，频数；用Compute产生新变量“组中值”（也可直接输入组中值）。

（2）操作步骤Analyze èData èWeight Cases ；Weight Cases by 频数。

Analyze èDescriptives èDescriptives ；将“组中值”选入V ariable 框中；单击OK 。

（3）结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布，故选择均数描述集中趋势，选择标准差描述离散趋势。

某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16（mmol/L ），标准差为0.20（mmol/L ）；该地正常成年女子血清甘油三酯的95%参考值范围是（0.77，1.55）mmol/L 。

计算过程根据公式s x 96.1±，即1.16±1.96×0.20。

该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59％，1.5 mmol/L 以下者估计占总人数的95.54％。

研究生统计学第二章计量资料统计描述2正态分布

二、标准正态分布如果以总频数为1，不同u值时的频数（概率）可用下式求得：
(u) 1 e , u 如果以曲线下的总面积为1，则从-∞至u的面u积2可/2用下列积分公式求得： 2
(u) 1 ueu2/2d, u u
2
二、标准正态分布标准正态分布u 值所对应的概率和曲线下的面积
二、标准正态分布
154
0.004181
158
0.013112
162
0.029661
166
0.048407
170
0.056992
174
0.048407
178
0.029661
182
0.013112
186
0.004181
190
0.000962
194
0.000160
女性
x
f(x)
147
0.000122
150
0.000886
研究生统计学第二章计量资料统计描述2 正态分布
第一节第二节第三节第四节第五节
第二章计量资料的统计描述
频数分布集中趋势的描述离散趋势的描述正态分布医学参考值范围的制定
第四节正态分布
• 正态分布的概念和特征 • 标准正态分布 • 正态分布的应用
– 正态分布是许多统计方法的理论基础 – 质量控制 – 制定医学参考值范围
Fx2e d,x x
正态分布曲线下的面积例设某地成年男性身高的均数为170cm，标准差为7cm，假设该地共有成年男性10 000人，
求该地身高不超过160cm者有多少人？又该地身高在160cm～180cm之间者共有多少人？
F(16)0 1 e d1 160 1 216 710720 60.0764 72

医学统计学第二章计量资料的统计描述

肌红蛋白含量
人数
0～
2
5～
3
10～
7
15～
9
20～
10
25～
22
30～
23
35～
14
40～
9
45～50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血清肌红蛋白（μg / m L）
图 2-3 101 名正常人血清肌红蛋白的频数分布
医学统计学第二章计量资料的统计描述
计量资料（定量资料、数值变量资料）总体：有限或无限个（定量）变量值样本：从总体随机抽取的n个变量值：
X1,X2,X3,……,Xn
n为样本例数（样本大小、样本含量）
2
统计描述——描述其分布规律 1、用频数分布表（图）
要求：大样本如 n〉30
2、用统计指标描述集中趋势离散趋势
6
➢制表步骤了解分布
1. 求极差（range）极差也称全距，即最大值和最小值之差，记作R。本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2．确定组距(i) :
组段数通常取组 10-15组本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率（%） (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27

卫生统计学课件第二章计量资料的统计描述(共33张PPT)

11111，11111，11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式： 13cm之间的占该地7岁男童的百分比。
∑f · X=1638
双侧界值：P 2.5 ~ P 97..5 定义：又称参考值范围，是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征： ∑（X- X）=0 估计误差之和为0。
估计的方法： 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算（双侧） 95% 正常值(医学参考值）范围公式：
（x1.96 · S，x1.96 · S ）
即（x±1.96 · S ）例：
1.96 × 3.79 ）
即（156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段：第一组段包括最小值，如本例为154 89 cm 取整数 2 cm 应用：单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表（频数分布）：表示各组及它们对
注意：合理分组，才能求均数，否则没有意义。
96 ·S，x 1. Q = Qu 一 Ql
单侧上界： P 95
单侧下界： P 5
31
习题：
1.各观察值加同一数后： A.均数不变，标准差改变 B.均数改变，标准差不
变
2.用均数和标准差可全面描述：
3.正态分布曲线下，从均数u 到u 的面积为； A.95% B.45% C. 97.5% D.47.5%
19
相关概念：离均差、离均差平方和、方差（2 S2 ）标准差的符号： S

计量资料的统计描述

第二章计量资料的统计描述一、教学大纲要求（一）掌握内容1. 频数分布表与频数分布图（1）频数表的编制。

（2）频数分布的类型。

（3）频数分布表的用途。

2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。

算术均数、几何均数、中位数。

3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。

极差、四分位数间距、方差、标准差、变异系数。

（二）熟悉内容连续型变量的频数分布图：等距分组、不等距分组。

二、教学内容精要计量资料又称为测量资料，它是测量每个观察单位某项指标值的大小所得的资料，一般均有计量单位。

常用描述定量资料分布规律的统计方法有两种：一类是用统计图表，主要是频数分布表（图）；另一类是选用适当的统计指标。

（一）频数分布表的编制频数表（frequency table ）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。

对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2，…20个病人的天数。

如描述某学校学生性别分布情况，男、女生的人数即为各自的频数。

对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。

制作连续型数据频数表一般步骤如下：1.求数据的极差（range ）。

min max X X R -= （2-1） 2.根据极差选定适当“组段”数（通常8—10个）。

确定组段和组距。

每个组段都有下限L 和上限U ，数据χ归组统一定为L ≤χ<U 。

3.写出组段，逐一划记。

频数表可用于揭示资料的分布特征和分布类型，在文献中常用于陈述资料，它便于发现某些特大或特小的可疑值，也便于进一步计算指标和统计分析处理。

（二）描述频数分布中心位置的平均指标描述中心位置的平均指标，但常因资料的不同而选取不同的指标进行描述。

1.算术均数算术均数（arithmetic mean ）简称均数，描述一组数据在数量上的平均水平。

计量资料的统计描述

医学参考值范围的制定方法
*
选择适当的百分范围。
正态分布法计算医学参考值范围。单侧：双侧：
百分位数法计算医学参考值范围。
百分位数法与正态分布法
*
前者适合任何分布类型的资料，实际中最为常用。后者仅适用于正态分布资料，则结果不稳定。后者的结果比较稳定。
三、频数分布表的用途
*
可代替繁杂的原始资料，便于进一步分析。
01
01
02
03
04
便于观察数据的分布类型。
便于发现资料中某些远离群体的特大或特小的可疑值。
当样本含量较大时，可用各组段的频率作为概率的估计值。
02
03
04
图2-2 115名正常成年女子的血清转氨酶的频数分布右偏态分布或正偏态分布图2-3 101名正常人的血清肌红蛋白的频数分布左偏态分布或负偏态分布
第二节集中趋势的描述
平均数（average）
*
平均数是描述一组观察值集中位置和平均水平的统计指标。常用的平均数包括：算数均数（mean）几何均数（geometric mean）
中位数（median）和百分位数（percentile）
算数均数
*
直接法加权法均数的应用适用用于对称分布或偏度不大的资料，能够很好的反映数据的集中位置和平均水平。算数均数容易受到频数分布尾端极大或极小值的影响。
01
02
03
101名正常成年女子的血清总胆固醇
直接法：
加权法：
几何均数（geometric mean）
观察值间按倍数变化的资料可以计算几何均数（G）以描述其平均水平。
01
计算公式为：
02
加权法为：
03

第二章统计描述

G ' lg1(
fi lg Xi ) lg1(
1 0.6021 4 0.9031
1 2.709Байду номын сангаас )
fi
40
lg1(67.1282) 48 40
G 1: 48
中位数（median, M）
适合于表达偏态资料、或分布不明的资料的平均水平，尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的资料的平均水平。
血清总胆固醇 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~
7.0~7.5 合计
频数f 1 8 9 23 25 17 9 6 2 1
101
fx 2.75 26 33.75 97.75 118.75 89.25 51.75 37.5 13.5 7.25 478.25
13
174
单侧正常值范围的上限为 1.81
14
188
（mol/L）。
1.69~
4
192
1.93~
4
196
2.17~
1
197
2.42~
2
199
2.66~
0
199
2.90~3.14
1
200
3.四分位数间距（quartile interval, Q）
Q=P75-P25
Q=QU-QL
优缺点：用四分位数间距作为描述数据分布离散程度的指标，比极差稳定，但仍未考虑到每个数据的大小，常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。
第1四分位数记作Q1，第2、第3四分位数，分别记作 Q2、Q3；第1百分位数，记作P1。同理，还有第2、第 3、 ···、第99百分位数，分别记作P2、P3、 ···、P99。

医学统计学：计量资料的统计描述

方差、标准差计算方法和意义
方差
指各数据与均数之差的平方和的平均数，用于反映数据的术平方根，用于衡量数据偏离均数的程度。标准差越大，数据分布越离散。
变异系数在医学研究中应用
变异系数
指标准差与均数之比，用于比较不同单位或不同均数水平下数据的离散程度。在医学研究中，常用于评价不同指标或不同人群间的变异程度。
分类
根据测量水平不同，可分为离散型计量资料和连续型计量资料。离散型计量资料只能取整数值，如人口数、医院床位数等；连续型计量资料可以取实数范围内的任何值，如身高、体重等。
计量资料特点分析
01
数值性
计量资料以数值形式表示，具有明确的数量特征。
可比性
同类计量资料之间可以进行比较，如不同人群的身高、体重等。
众数
一组观察值中出现次数最多的数。
应用场景
常用于描述无明显集中趋势或分布规律资料的集中趋势，如一些分类数据的统计描述。
04 离散程度指标解读
极差、四分位数间距计算及意义
极差
指一组数据中最大值与最小值之差，用于反映数据的波动范围。计算简单，但易受极端值影响。
四分位数间距
指第三四分位数与第一四分位数之差，用于反映中间50%数据的离散程度。较极差更稳定，不易受极端值影响。
常用统计描述方法介绍
频数分布表与直方图
通过分组和计数的方式展示数据的分布情况，适用于连续型
变量。
集中趋势描述
包括算术均数、几何均数和中位数等，用于描述数据的平均水平或中心位置。
离散程度描述
包括标准差、方差和四分位数间距等，用于描述数据的波动范围或离散程度。
偏态与峰态描述
通过偏态系数和峰态系数等描述数据的偏态和峰态特征，反

2计量资料的统计描述指标介绍

2计量资料的统计描述指标介绍计量资料的统计描述指标是对数据集合进行概括和描述的方法，可帮助我们了解数据的分布、集中趋势和离散程度，以及可能存在的异常值。

常用的统计描述指标包括均值、中位数、众数、极差、标准差、方差、四分位数和百分位数等。

1. 均值（Mean）：均值是一组数据的总和除以数据的个数。

均值可以反映数据的集中程度，但容易受到异常值的影响。

2. 中位数（Median）：中位数是一组数据按大小排序后，位于中间位置的数值。

中位数可以反映数据的中间位置，不受异常值的影响。

3. 众数（Mode）：众数是一组数据中出现次数最多的数值。

众数可以反映数据集中的特点。

4. 极差（Range）：极差是一组数据的最大值与最小值之差。

极差可以反映数据的全面分布。

5. 标准差（Standard Deviation）：标准差测量数据的离散程度。

标准差越大，数据的离散程度越大。

6. 方差（Variance）：方差是标准差的平方。

方差可以反映数据的离散程度，但单位是原数据的平方。

7. 四分位数（Quartiles）：四分位数将一组数据按大小排序后，分为四等分，分位点分别是Q1（25%分位点）、Q2（中位数）和Q3（75%分位点）。

四分位数可以帮助我们了解数据集的分布情况。

8. 百分位数（Percentiles）：百分位数是将一组数据按大小排序后，分为100等分，每个等分对应一个百分位数。

百分位数可以帮助我们了解数据的分布情况，例如第75百分位数表示排在该位置的数据值大约有75%的数据小于它。

这些统计描述指标都是通过对数据进行运算得出的，可以帮助我们了解数据的分布情况和特点。

在实际应用中，我们可以根据具体的问题选取适当的统计描述指标进行分析，帮助我们更好地理解数据。

同时，还需要注意统计描述指标的局限性，例如均值容易受到异常值的影响，中位数和众数不能反映数据的离散程度等，因此在使用时需要结合具体情况进行综合分析。

计量资料的统计描述

例4-2-3：利用表4-2-1计算某社区101名正常成年女子的血总胆固醇的均数。
X 1´ 2.45 3´ 2.75 L1´ 5.75 409.75 4.06(mmol/L) 1 3L 1 101
（二）几何均数几何均数（geometric mean G）适用于观察值变化范围跨越多个数量级的资料。几何均数适用于成等比级数的资料，特别是对数正态分布资料。
例4-2-5：2004年某社区52例慢性肝炎患者的 HBsAg滴度数据如表4-2-3。试计算滴度的几何均数。
（三）中位数中位数（median M）是将变量值从小到大排列，位置居于中间的那个变量值，称为中位数。可用于各种分布的定量资料，特别是偏态分布资料和开囗资料（一端或两端无确切数值的资料）。
S CV ´ 100% X
S为标准差，X 为均数。
（公式4-2-15）
（六）运用变异指标的注意事项
1．变异指标表示变量值的变异程度或离散趋势，常与集中指标平均数结合运用，说明变量值集中的位置与离散程度。 2．变异指标种类虽多，但任一变异指标，其值大表示变异大，数值参差不齐；值小表示变异小，数值比较集中在平均数周围。比较两个或几个同类事物的变异，要用同一变异指标。 3．正态分布资料宜用均数与标准差描述集中与离散趋势。有了均数与标准差就可根据正态分布理论将频数分布描绘出来。偏态分布资料宜用中位数及四分位数间距、极差等描述其集中趋势和变异程度。 4. 比较几组资料的变异程度，若各组资料的单位不全相同，或均数相差悬殊时，宜用变异系数描述其变异程度。
(四) 百分位数将频数等分为十或一百的分位数称十分位数或百分位数。百分位数的符号为Px，X代表第X百分位。一个百分位数Px将全部变量值分为两部分，在不包含Px的全部变量值中有x%的变量值比它小，(100-x)%变量值比它大。

第02章计量资料的统计描述课件

组段数 5；组距 10分
表2.1 某医院产科某月顺产婴儿出生身长（单位：cm） 48 48 47 42 53 49 45 50 48 52 49 57 46 48 46 42 49 51 50 51 56 42 59 49 48 52 42 49 55 53 51 45 47 47 47 50 48 51 51 53 46 47 57 45 46 51 46 51 47 51 55 47 52 47 48 54 47 54 49 44 53 54 45 48 44 48 42 47 48 50 55 50 53 56 49 50 56 41 53 53 49 44 49 48 45 52 52 46 54 50 44 53 49 47 48 45 51 45 50 53
（1）直接法—根据样本含量的奇偶选择公式
n为奇数时 n为偶数时
M X ( n1) 2
1
M
2
X(n) 2
X ( n 1) 2
例2-6：9只大鼠存活天数如下： 4，10，7，3，15，2，9，13，>60 则这9只大鼠的平均存活天数为多少天?
排序：2，3， 4， 7, 9，10 ，13， 15， >60 故这9只大鼠的平均存活天数为9天。
-
二、频数分布图
图2.1 100名顺产婴儿出生身长的频数分布
频数
三、频数表和频数分布图用途
1、描述频数分布的类型
25 20 15 10
5 0
图 2 - 2 101 名正常成年女子血清总胆固醇的频数分布
血清总胆固醇（mmol/L）
对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称。
PX
大

2-计量资料的统计描述(11硕)

k：频数表的组段数， f ：频数，
其中 X =
∑ fX ∑f
X：组中值
本组段下限值+下组段下限值 2
测得130健康成年男子脉搏资料次/分)如下，试编制频健康成年男子脉搏资料(次分如下如下，例2-1 测得健康成年男子脉搏资料数表和观察频数分布情况。数表和观察频数分布情况。
75 82 66 60 72 81 77 69 84 80 76 80 77 67 78 70 75 68 66 68 72 82 64 75 72 66 79 65 70 76 69 67 67 75 67 75 64 70 73 70 66 69 76 73 72 71 79 69 60 79 72 73 75 79 80 63 73 66 76 77 57 64 75 66 68 77 76 81 82 64 68 74 71 69 70 74 61 63 73 70 71 58 65 79 61 76 80 64 64 66 72 70 62 78 70 68 64 80 65 69 69 64 76 70 73 65 69 74 73 73 72 60 72 72 72 77 70 78 73 78 73 77 71 70 71 69 73 76 63 76

本章内容
频数分布集中趋势的描述离散趋势的描述正态分布医学参考值范围的制定
第一节频数分布
频数分布表频数分布图频数表和频数分布图的用途
一、频数与频数分布表
频数(frequency) 频数对一个随机事件进行重复观察，其中某变量值出现的次数频数分布表(frequency distribution table) 频数分布表是用表格的形式将各变量的取值与之相对应的频数用以表达的一种统计计算或分析表

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

几何均数的计算方法（1）直接计算法
G n X1 X 2 X n
G lg
1
lg X ( ) n
例：求以下数据的平均水平
10 100 1000 1000 1000 10000 100000
lg10 lg100 ……+lg100000 G lg ( ) 7 -1 lg (3) 1000
（2）几何均数的频数表法
f lg X 1 G lg f

例2-5 69例类风湿关节炎（RA）患者血清EBV-VCA-lgG 抗体滴度的分布见表，求其平均抗体滴度。
G lg
1
f lg X ( ) lg f
1
150.2778 ( ) lg 1 (2.1779) 150.6 69
带有小数，故取整trunc(118.8）= 118
P 99 X (trunc (118.8)1) X (119) 42(天)
（2）频数表法
例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表，分别求中位数及第25、第75百分位数。
iX PX LX (nX % f L ) fX
第二章计量资料的统计描述
卫生统计学教研室李婵娟
数据类型
计量资料：用仪器、工具等测量方法获得的数据计数资料：按某种属性分类，然后清点每类个数等级资料：半定性或半定量观察结果，有大小顺序
计量资料
计数资料
等级资料
存活
医疗费用(元) 年龄(岁) 身高(cm) 性别
费别治疗效果
2492
43
25 20
人数
15 10 5 0 2.5 12.5 22.5 32.5 42.5 52.5 血清肌红蛋白（μ g / m L）图 2-3 101 名正常人血清肌红蛋白的频数分布
图某地居民235人发汞含量分布
图某地居民糖尿病人年龄的频数分布图
右偏态分布资料
-1
√
例2-4 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为：10，20， 40，40，160，求几何均数。
G 10 20 40 40 160 34.8
5
G lg
1
lg X ( ) lg n
1
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
算术均数（arithmetic 几何均数（geometric
mean） mean）
中位数（median）
一、算术均数
简称均数(mean)，可用于反映一组呈对称分布的变量值在数量上的平均水平。

适用条件：对称分布，特别是正态分布资料。
算术均数的计算方法
（1）直接计算法
X1 X 2 X n X X n n

9例正常人的发汞值： 1.1 1.8 3.5 4.8 4.2 5.6 5.9 7.1 10.5 M=4.8 10例正常人的发汞值： 2.1 1.8 3.5 4.8 4.2 5.6 5.9 7.1 6.5 >8

M=(4.8+5.6)/2=5.2
百分位数（Percentile）
百分位数是一种位置指标，用 PX 来表示。
三、频数表和频数分布图用途
1、描述频数分布的类型
25 20
频数
15 10 5 0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
血清总胆固醇（mmol/L）
图 2 - 1 101 名正常成年女子血清总胆固醇的频数分布
对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称。
二、频数分布图
25 20
频数
① 纵轴的刻度必须从 ”0”开始
②各直条间不留间隔
15 10 5 0
③各直条组距相等
2.45 3.05 3.65 4.25 4.85 5.45 6.10
血清总胆固醇（mmol/L）
图 2 - 1 101 名正常成年女子血清总胆固醇的频数分布
×
二、几何均数（Geometric mean）用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
适用条件：成等比级数资料，特别是对数正态分布资料。
几何均数的计算原理
X1 X2 X3 ……… Xn
G lg
1
lg X ( ) n
lgX1 lgX2 lgX3 ………lgXn
lg X X n
1、求极差(Range)，也称全距，R=3.36 2、确定组段数 12 和组距 0.30
最大值
3、根据组距写出组段
4、分组划记，统计频数
表 101名正常成年女子的血清总胆固醇频数分布
组段频数， f 1 3 6 8 17 20 17 12 9 5 2 1 101 2.30～ 2.60～ 2.90～ 3.20～ 3.50～ 3.80～ 4.10～ 4.40～ 4.70～ 5.00～ 5.30～ 5.60～5.90 合计
A B O AB
3 3 3 1
70~80
80~90 90~100
53
41 25
组段数 5；组距 10分
最小值例 101名正常成年女子血清总胆固醇(mmol/L)如下
2.35 4.78 3.91 4.15 3.60 4.50 3.30 4.06 4.15 4.21 3.95 4.59 4.55 3.51 3.27 4.73 5.26 4.36 3.32 3.92 4.19 4.80 4.06 4.52 4.17 5.25 4.95 5.35 3.58 2.68 3.41 3.07 3.19 5.13 3.98 3.00 4.17 3.66 4.52 4.12 3.55 4.59 3.78 5.03 3.26 4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51 2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86 4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02 3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70 4.34 4.61 3.87 3.58 3.84 3.63 3.99 4.33 4.84 4.75 3.95 5.35 4.50 3.87 4.48 3.29 4.41 2.91 3.91 3.84 3.96 5.71 4.28 3.25
MX
n为偶数时
(
n 1 ) 2
1 M X n X n ( 1) 2 (2) 2
例2-7 8名患者食物中毒的潜伏期分别为
1，2，2，3，5，8，15，24
求其中位数。本例n=8, 为偶数
小时，
1 1 1 M X 8 X 8 X 4 X 5 3 5 4(小时) ( 1) 2 (2) 2 2 2
小
X%
PX
大
(100-X)%
（1）直接计算法设有n个原始数据从小到大排列, 第X百分位数的一种近似计算公式为：
当 nX % 为带有小数位时：
取整
tr u n c (5 .5 ) 5 tr u n c (9 .3 ) 9
PX X [trunc( nX %)1]
当 nX % 为整数时：
1 1 P5 X (6) X (7) (3 4) 3.5(天 ) 2 2
住院天数： 1 2 2 2 3 3 4 4 5 40 40 42 45 序号：1 2 3 4 5 6 7 8 9 117 118 119 120
（2）第99百分位数：
120 99% 118.8
177.0
1
1
1
0
2665
4495 3231
40
57 51
171.2
180.7 171.0
1
2 1
2
2 1
1
3 1
0
0 0
2567
2005
56
53
2=女
169.5
174.9
2
1
2
3
2
3
0
1
……
性别：1=男费别: 1=自费 2=医保 3=公费治疗效果: 1=治愈 2=好转 3=无效存活：0=存活 1=死亡
1 PX X ( nX %) X ( nX %1) 2
例对某医院120名细菌性痢疾治愈者的住院天数统计，试求第5百分位数和第99百分位数。住院天数： 1 2 2 2 3 3 4 4 5 40 40 42 45 序号：1 2 3 4 5 6 7 8 9 117 118 119 120 （1）第5百分位数：n=120， 120 5% 6 ，为整数：
医学统计工作的基本步骤

统计设计收集资料整理资料分析资料统计推断
计量资料
统计表统计图
统计描述
统计指标
参数估计
假设检验
第一节频数分布
相同情形出现的次数
某班成绩频数分布表
组段 50~60 60~70 频数 25 40
一、频数分布表（frequency table）
某班血型频数分布表血型分组频数
例用直接法计算101名正常成年女子的血清总胆固醇的均数。
2.35 4.78 3.91 4.15 3.60 4.50 3.30 4.06 4.15 4.21 3.95 4.59 4.55 3.51 3.27 4.73 5.26 4.36 3.32 3.92 4.19 4.80 4.06 4.52 4.17 5.25 4.95 5.35 3.58 2.68 3.41 3.07 3.19 5.13 3.98 3.00 4.17 3.66 4.52 4.12 3.55 4.59 3.78 5.03 3.26 4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51 2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86 4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02 3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70 4.34 4.61 3.87 3.58 3.84 3.63 3.99 4.33 4.84 4.75 3.95 5.35 4.50 3.87 4.48 3.29 4.41 2.91 3.91 3.84 3.96 5.71 4.28 3.25

第二章计量资料的统计描述

合集下载

统计背诵版(三份整合)

计量的统计描述2016-07-01

统计学第二章计量资料的统计描述

《医学统计学》计算题答案

研究生统计学第二章计量资料统计描述2正态分布

医学统计学第二章计量资料的统计描述

卫生统计学课件第二章计量资料的统计描述(共33张PPT)

计量资料的统计描述

计量资料的统计描述

第二章统计描述

医学统计学：计量资料的统计描述

2计量资料的统计描述指标介绍

计量资料的统计描述

第02章计量资料的统计描述课件

2-计量资料的统计描述(11硕)

文档推荐

最新文档

第二章计量资料的统计描述

合集下载

统计背诵版(三份整合)

计量的统计描述2016-07-01

统计学第二章计量资料的统计描述

《医学统计学》计算题答案

研究生统计学第二章计量资料统计描述2正态分布

医学统计学 第二章 计量资料的统计描述

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

计量资料的统计描述

计量资料的统计描述

第二章统计描述

医学统计学：计量资料的统计描述

2计量资料的统计描述指标介绍

计量资料的统计描述

第02章 计量资料的统计描述课件

2-计量资料的统计描述(11硕)

文档推荐

最新文档

医学统计学第二章计量资料的统计描述

卫生统计学课件第二章计量资料的统计描述(共33张PPT)

第02章计量资料的统计描述课件