当前位置:文档之家› 第一单元 计量资料的统计描述

第一单元 计量资料的统计描述

第一单元 计量资料的统计描述
第一单元 计量资料的统计描述

第一单元计量资料的统计描述

【习题】

分析计算题

1.1 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下:

40 87 105 113 121 127 133 142 152 168 215

54 88 105 113 121 127 134 143 153 173 220

61 92 106 113 122 127 135 143 153 176

74 94 107 114 124 128 136 143 155 177

77 94 107 116 124 128 137 145 156 180

80 95 109 117 124 128 138 147 156 182

81 96 109 119 125 130 138 147 163 183

82 97 111 119 125 130 138 149 163 186

83 102 112 120 126 131 140 151 166 188

85 105 112 120 126 132 141 151 168 195

(1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。

(2) 计算适当的集中趋势指标和离散程度指标。

1.2 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。

表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表

头发中铜的对数值频数f

0.350 0~ 1

0.450 0~ 2

0.550 0~ 4

0.650 0~ 3

0.750 0~18

0.850 0~36

0.950 0~22

1.050 0~ 6

1.150 0~ 3

1.250 0~ 3

1.350 0~1.450 0 4

合计102

1.3 某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的平均潜伏期。

表2 某年某地一次伤寒暴发潜伏期频数表

潜伏期/d 发病人数f

3~ 3

5~24

7~20

9~17

11~14

13~7

15~ 6

17~ 2

19~ 1

21~23 2

合计96

1.4 测得566名成年男子的心率及血压情况如表3,试比较这些指标的离散程度。

表3 566名成年男子的心率及血压

指标X S

心率/(次·min-1) 77.30 12.83

收缩压/kPa 17.17 1.74

舒张压/kPa 10.63 1.25 脉压差/kPa

6.54

1.52

1.5 根据1999年某大学的体检资料,得该校312名一年级女大学生的平均 身高X =158.0㎝,标准差S =6.5㎝,请据此资料:

(1) 计算其95%频数范围。

(2) 试估计该校一年级女大学生身高在156.5~159.2㎝范围内的人数。 (3) 试估计该校身高低于152㎝一年级女大学生所占比例。

1.6 最佳选择题

(1) 下列指标中 可以用来描述计量资料的离散程度。 a. X b. G c. M d. R e. 75P (2) 偏态分布资料宜用 来描述其集中趋势。 a. X b. S c. M d. CV e. 2S

(3) L U Q Q -排除了有序数列两端各 的观察值的影响。 a. 5% b. 10% c. 15% d. 20% e. 25% (4) 离散程度指标中,最容易受极端值影响的是 。 a. R b. S c. CV d. 2S e. L U Q Q - (5) 可用于比较坐高与头围的变异度。 a. R b. S c. CV d. 2S e. L U Q Q -

(6) 频数分布两端无确切值的资料,宜用 来描述其分布的集中趋势。 a. X b. G c. M d. R e. 2S

(7) 两组同质资料,若甲组X 小于乙组X ,但甲组S 大于乙组S ,则 。 a. 甲组X 代表性较好 b. 甲组X 代表性较差 c. 两组X 一样大 d. 两组S 一样大 e. 无法判断

(8) 分布的资料,X 等于M 。

a. 对称

b. 正偏态

c. 负偏态

d. 偏态

e. 正态

(9) 用X和S可以全面描述分布资料的分布特征。

a. 正态

b. 对称

c. 正偏态

d. 负偏态

e. 任何计量资料

复习思考题

1.7 均数、中位数、几何均数的适用范围有何异同?

1.8 同一资料的标准差是否一定小于均数?

1.9 极差、四分位数间距、标准差、变异系数的适用范围有何异同?

【习题解答】

分析计算题

1.1 解:

(1) 编制频数表,绘制直方图

1) 频数表的编制

①求全距X min=40,X max=220,全距R=220-40=180(μg/g)

②划分组段n=102,拟分10组;组距=R/组数=180/10=18(μg/g),确定各组段的上下限,见表1.1.1。

③统计各组段频数。

表1.1.1 102名男性脑卒中患者发锌含量的频数分布

组段/(μg·g-1) 频数f频率/% 累计频数累计频率/% 40~ 2 1.96 2 1.96 58~ 2 1.96 4 3.92 76~9 8.82 13 12.75 94~15 14.71 28 27.45 112~28 27.45 56 54.90 130~21 20.59 77 75.49 148~11 10.78 88 86.27 166~9 8.82 97 95.10 184~ 3 2.94 100 98.04

202~220

2 1.96 102 100.00 合计

102

100.00

2) 绘制直方图,见图1.1.1。

图1.1.1 102名男性脑卒中患者发锌含量的频数分布

3) 本资料频数分布范围为40~220μg/g ;集中分布在94~、112~、130~、148~组段,其中112~组段的频数分布最多;从中央向两侧频数逐渐减少,左右基本对称。

(2) 由上述分析可知,本资料呈单峰对称分布,近似正态,故选用X 作为描述集中趋势的指标,以S 作为描述离散程度的指标。

用加权法求均数:

==

102

2

2113193267249?+?+???+?+?=

∑n

fX

X 128.94(μg/g )

由频数表得∑=fX 13152,∑=2fX 1801182,代入公式:

32.30S ==

(μg/g )

SPSS操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量x和标签Zn;再点击Data View标签,录入数据(见图1.1.3,图1.1.4)。

图1.1.3Variable View窗口内定义要输入的变量x和标签Zn

图1.1.4Data View窗口内录入数据

分析:

Graphs Histogram

Variable:Zn[x] 要描述的变量是x,Zn是标签

Analyze Descriptive Statistics Descriptives

Variable[s]:Zn[x]

1.2 解:本题为对数正态分布资料,应采用几何均数描述其集中趋势。

令发铜含量为X ,发铜对数值为lg X

1

11lg lg

()10.400020.500094.4lg ()=lg 8.42(/)

12102f X G f g g μ--=?+?+???

== ?++??

∑∑

-…+4 1.4000…+4

即男性脑卒中患者头发中铜含量的几何均数为8.42μg/g 。 SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量logx 和f ;再点击Data View 标签,录入数据(见图1.2.1,图1.2.2)。

图1.2.1 Variable View 窗口内定义要输入的变量logx 和f

图1.2.2 Data View 窗口内录入数据

分析:

Data

Weight Cases

Weight Cases by

Frequency Variables : f 权重为f Analyze

Descriptive Statistics

Descriptives

Variable[s]: logx 描述变量logx 注:将结果中的mean 求反对数,就可以得到几何均数。

1.3 解:本资料为偏态分布资料,宜用中位数来描述其集中趋势。

()M L M 2

(50%)9 9650%47 9.1217

i M L n f f =+

?-=+?-=∑天 即该年该地伤寒暴发潜伏期的中位数约为9.12天。

注:由于本题无原始数据,不宜用统计软件计算中位数。

1.4 解:本资料是比较计量单位不同的多个指标的离散程度,宜用变异系数来描述,根据公式%100?=

X

S

CV ,计算结果见表1.4.1。 表1.4.1 566名成年男子的心率及血压的离散程度比较

指标 X

S

CV /% 心率/(次·min -1) 77.30 12.83 16.60 收缩压/kPa 17.17 1.74 10.13 舒张压/kPa 10.63 1.25 11.76 脉压差/kPa

6.54

1.52

23.24

由变异系数可见,脉压差的离散程度最大,其次是心率,而舒张压和收缩压的离散程度较小。

1.5解:(1) 95%频数范围即95%的医学参考值范围,根据题意,得

下限: 1.96158.0 1.96 6.5145.26

X S

-=-?=cm

上限: 1.96158.0 1.96 6.5170.74

X S

+=+?=cm

即该校一年级女大学生身高的95%频数范围为(145.26,170.74) cm。

(2) 本题为非标准正态分布,需先进行标准化变换。由于312例为大样本,可用样本均数X和样本标准差S作为总体均数μ和总体标准差σ的点估计值,得

1 1156.5158.0

0.23

6.5

X u

μ

σ

--

===-

2 2159.2158.0

0.18

6.5

X u

μ

σ

--

===

查标准正态分布曲线下的面积表得

Φ(u1) =Φ(-0.23) =0.4090,Φ(u2)=1-Φ(-0.18) =1-0.4286=0.5714

D =Φ(u2)-Φ(u1) =0.5714-0.4090 =0.1624 =16.24%

故估计该校1999年身高界于156.5~159.2cm范围内的一年级女大学生所占比例为16.24%,估计312名一年级女大学生中身高界于156.5~159.2cm范围内的人数为312×16.24% =50.67≈51名。

(3) 根据公式

X

u

μ

σ

-

=得

152158.0

0.92

6.5

u

-

==-

查标准正态分布曲线下的面积表得

Φ(u) =Φ(-0.92) =0.1788=17.88%

故估计该校1999年一年级女大学生中身高低于152cm者所占比例为17.88%。

1.6最佳选择题

(1) d (2) c (3) e (4) a (5) c (6) c (7) b (8) a (9) a

【复习思考题参考答案】

1.7答:三者的相同点为均用于描述定量资料的集中趋势,其不同点见表1.7.1。

表1.7.1 常用平均数的不同点比较

平均数意义应用

均数平均数量水平对称分布,特别是正态分布或近似正态分布的资料

几何均数平均增(减)倍数等比资料;对数正态分布资料

中位数位次居中的观察值水平偏态分布;两端无确切值;分布不明确的资料

1.8答:不一定。均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。

1.9答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:

极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。

四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。

标准差常用于描述对称分布,特别是正态分布或近似正态分布资料离散程度。

变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

【补充选择题】

A型题

1.统计资料的类型可以分为

A 定量资料和等级资料

B 分类资料和等级资料

C 正态分布资料和离散分布的资料

D 定量资料和分类资料

E 二项分布资料和有序分类资料

2.下列符号中表示参数的为

A S

B u

C

D t

E X

3.统计学上所说的随机事件发生的概率P,其取值范围为

A P≤1

B P≥1

C P≥0

D1≥P≥0E1>P>0

4.小概率事件在统计学上的含义是

A 指的是发生概率P≤0.5的随机事件

B 指一次实验或者观察中绝对不发生的事件

C 在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05

D 以上说法均不正确

E A和C正确

5.描述定量资料集中趋势的指标有

A 均数、几何均数、变异系数

B 均数、几何均数、四分位数间距

C 均数、变异系数、几何均数

D 均数、四分位数间距、变异系数

E 均数、几何均数、中位数

6.关于频数表的说法正确的是

A 都分为10个组段

B 每一个组段必须组距相等

C 从频数表中可以初步看出资料的频数分布类型

D 不是连续型的资料没有办法编制频数表

E 频数表中的每一个组段不一定是半开半闭的区间,可以任意指定

7. 关于偏态分布资料说法不正确的是

A正偏态资料的频数分布集中位置偏向数值大的一侧

B负偏态资料的频数分布集中位置偏向数值大的一侧

C 偏态分布资料频数分布左右不对称

D 不宜用均数描述其集中趋势

E 不宜用变异系数来描述其离散程度

8. 对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势

A 几何均数

B 均数

C 方差

D 中位数

E 四分位数间距

9.下列关于标准差的说法中哪种是错误的

A 对于同一个资料,其标准差一定小于均数

B 标准差一定大于0

C 同一个资料的标准差可能大于均数,也可能小于均数

D 标准差可以用来描述正态分布资料的离散程度

E 如果资料中观察值是有单位的,那么标准差一定有相同单位

10. 下列关于标准差S和样本含量n的说法,正确的是

A 同一个资料,其他条件固定不变,随着n增大,S一定减小

B 同一个资料,即使其他条件固定不变,随着n增大,也不能确定S一定减小

C 同一个资料,其他条件固定不变,随着n增大,S一定增大

D 以上说法均正确

E 以上说法均错误

11. 用下列哪两个指标可以较全面地描述正态分布特征

A 均数和中位数

B 中位数和方差

C 均数和四分位数间距

D 均数和标准差

E 几何均数和标准差

12. 下列哪个资料适宜用几何均数来描述其集中趋势

A 偏态分布的资料

B 对称分布的资料

C 等比级数资料

D 一端不确定的资料

E 正态分布资料

13. 下列关于变异系数的说法,错误的是

A 与标准差一样都是用来描述资料变异程度的指标,都有单位

B 可以比较计量单位不同的几组资料的离散程度

C 可以比较均数相差悬殊的几组资料的离散程度

D 变异系数的实质是同一个资料的标准差与均数的比值

E 变异系数可以用来描述正态分布资料的变异程度

14. 假设将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是

A 均数将增大,标准差不改变

B 均数和标准差均增大

C 均数不变,标准差增大

D 不一定

E 均数和标准差均没有变化

15. 假设将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的是

A 均数不发生改变

B 标准差将不发生改变

C 均数是否变化不一定

D 变异系数不发生改变

E 中位数不发生改变

16. 下列关于正态分布曲线的两个参数μ和σ说法正确的是

A μ和σ越接近于0时,曲线越扁平

B 曲线形状只与μ有关,μ值越大,曲线越扁平

C 曲线形状只与σ有关,σ值越大,曲线越扁平

D 曲线形状与两者均无关,绘图者可以随意画

E 以上说法均不正确

17. 对于正态分布曲线的描述正确的是

A 当σ不变时,随着μ增大,曲线向右移

B 当σ不变时,随着μ增大,曲线向左移

C 当μ不变时,随着σ增大,曲线向右移

D 当μ不变时,随着σ增大,曲线将没有变化

E 以上说法均不正确

18.在正态曲线下,下列关于μ-1.645σ说法正确的是

A μ-1.645σ到曲线对称轴的面积为90%

B μ-1.645σ到曲线对称轴的面积为10%

C μ-1.645σ到曲线对称轴的面积为5%

D μ-1.645σ到曲线对称轴的面积为45%

E μ-1.645σ到曲线对称轴的面积为47.5%

19. 在正态曲线下,小于μ-2.58σ包含的面积为 A 1%

B 99%

C 0.5%

D 0.05%

E 99.5%

20. 在正态曲线下,大于μ-2.58σ包含的面积为 A 1%

B 99%

C 0.5%

D 0.05%

E 99.5%

21. 下列关于标准正态分布的说法中错误的是 A 标准正态分布曲线下总面积为1

B 标准正态分布是μ=0并且σ=1的正态分布

C 任何一种资料只要通过σ

μ

-=

X u 变换均能变成标准正态分布

D 标准正态分布的曲线是唯一的

E 因为标准正态分布是对称分布,所以u ≥-1.96与u ≤1.96所对应的曲线下面积相等

22. 某年某中学体检,测得100名高一女生的平均身高X =154cm, S =6.6cm ,该校高一女生中身高在143~170cm 者所占比重为(0.00780.04752.42, 1.67u u =-=-) A 90%

B 95%

C 97.5%

D 94.5%

E 99%

23. 下列关于确定正常人肺活量参考值范围说法正确的是

A 只能为单侧,并且只有上限

B 只能为单侧,并且只有下限

C 只能为双侧,这样才能反映全面

D 单双侧都可以

E 以上说法均不确切

24. 下列关于医学参考值范围的说法中正确的是

A 医学参考值范围是根据大部分“健康人”的某项指标制定的

B 医学参考值范围的制定方法不受分布资料类型的限制

C 在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题

D 在制定医学参考值范围时,最好用95%范围,因为这样比较好计算

E 以上说法均不正确

25. 为了制定尿铅的正常值范围,测定了一批正常人的尿铅含量,下列哪种说法正确

A 无法制定,要制定正常值范围必须测定健康人的尿铅含量

B 可以制定,应为单侧上限

C 可以制定,应为单侧下限

D 可以制定,但是无法确定是上侧范围还是下侧范围

E 可以制定双侧95%的参考值范围

B型题

26~30题

A 中位数

B 四分位数间距

C 均数

D 几何均数

E 对数标准差的反对数

26. 对于只有上限不知道下限的资料,欲描述其集中趋势宜用

27. 某学校测定了大学一年级新生乙肝疫苗的抗体滴度,欲描述其集中位置,宜用

28. 描述偏态资料的离散程度,可用

29. 描述近似正态分布的资料的集中趋势,最适宜用

30. 偏态分布的资料,如果经对数变换后服从正态分布,那么欲描述其离散程度,应选用

补充选择题参考答案

1.D

2.C

3.D

4.C

5.E

6.C

7.A

8.D

9.A 10.B 11.D 12.C 13.A 14.A 15.D 16.C 17.A 18.D 19.C 20.E 21.C 22.D 23.B 24.A 25.B 26.A 27.D 28.B 29.C 30.E

习题-计量资料统计描述

计量资料统计描述----习题 1、中位数是表示变量值()的指标。 A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.变异程度 2、血清学滴度资料最常计算()来表示平均水平。 A.算术均数 B.中位数 C.几何均数 D.全距 E.百分位数 3、最小组段无下限或最大组段无上限的频数分布资料宜用() A.算术均数 B.中位数 C.几何均数 D.全距 E.标准差 4、原始数据同减去一个不等于零的常数后,()。 A. x 不变,S 变 B. x 变,S 不变 C. x 和S 都不变 D. x 和S 都变 E.以上均不对 5、变异系数CV()。 A.表示X 的绝对离散度 B.表示X 的相对离散度 C.表示x的绝对离散度 D.表示x的相对离散度 E.以上均不对 6、描述一组偏态分布资料的变异度,以()指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.均数 7、用均数和标准差可以全面描述()资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.分布不知 E.对数正态分布 8、比较身高和体重两组数据变异度大小宜采用() A.变异系数 B.标准差 C.四分位数间距 D.全距 E.方差 9、偏态分布宜用()描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数 D.众数 E.百分位数 10、各观察值同乘以一个不等于0 的常数后,()不变。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.变异系数 11、()分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 E.以上均不对 12、随机抽查某地成年女子身高,算得均数x =160cm,标准差S=5cm,则可计算变异系数CV=------- 5 160 C.(160/5)cm D.(5/160)cm ×160 13、变异系数CV 的数值()。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 E.不能判定 14、列数8、-3、5、0、4、-1 的中位数是()。 、关于标准差,哪项是错误的()。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E.适用于对称分布资料 16、5 人的血清滴度为<1:20、1:40、1:80、1:160、1:320 描述平均滴度,用哪种指标较好()。 A.平均数 B.几何均数 C.算术均数 D.中位数 E.众数

@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A 、描述平均水平(中心位置): 均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度: 标准差、四分位数间距、 变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median )M 和百分位数(percentile ) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 12n X X X X X n n +++== ∑L

用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n 为奇数时-- n 为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) =第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???+如果只调查了前八位中学生,则: +(+)(+)天

百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数f x :所在组段频数 注:有的教材X= r ; L f ∑=C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 2565~ 15 34 P 25在此 68~ 25 59 71~ 26 85∑f 75 L 7574~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内;

计量资料描述

计量资料的统计描述 描述性统计分析是进行统计分析的第一步,做好这一步是正确进行统计推断的先决条件。 计量资料常用的统计描述指标和方法主要有: 1、集中趋势指标(Central Tendency):包括均数、几何均数、中位数等。其中均数适用于正态分布和对称分布资料;几何均数适用于对数正态分布和呈等比的数据资料;中位数适合于所有分布类型的资料,但在实际中,中位数主要应用于偏态分布资料、分布不明资料和开口资料。 2、离散趋势指标(Dispersion):包括全距、四分位数间距、方差、标准差、变异系数、标准误等。方差、标准差用于正态分布资料,四分位数间距用于偏态分布资料,变异系数用于度量单位不同和均数相差悬殊的资料,标准误用于反映样本均数的离散程度,说明均数抽样误差大小。 SPSS的许多模块均可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程: Frequencies过程:产生频数表;按要求给出某百分位数。对计量资料、计数资料和等级资料的描述都适用 Descriptives过程:进行一般性的统计描述,用于服从正态分布的资 料,计算产生均数、标准差等; Explore过程:用于对数据概况不清时的探索性分析;

Crosstabs过程:完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本次实习练习前3个过程:Frequencies过程,Descriptives过程,Explore过程。Crosstabs过程在X2检验实习讲述。 Frequencies过程 案例: 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5。 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05 一、建立数据文件 1、定义变量:在数据窗口,点击,定义一个变量,变量名(Name)“x”,类型(Type)“数值()8,小数位数(Decimals)2,变量标签(Label):“血清总胆固醇”。 (2)输入数据:

计量资料汇总统计描述

第二章 计量资料的统计描述 一、教学大纲要求 (一)掌握容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉容 连续型变量的频数分布图:等距分组、不等距分组。 二、 教学容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range )。 min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

统计学计量的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A、描述平均水平(中心位置): 均数X、中位数和百分位数、几何均数G、众数(mode) B、描述数据的分散程度: 标准差、四分位数间距、变异系数、方差、全距 (一)均数mean和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median)M和百分位数(percentile) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n为奇数时-- n为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数

值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) = 第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数 f x :所在组段频数 注:有的教材X= r ; L f =C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 25 65~ 15 34 P 25在此 68~ 25 59 71~ 26 85 ∑f 75 L 75 74~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合 计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内; P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25=65+3x[(130x25%-19)/15]=65.90 P 75=74+3x[(130x75%-85)/19]=74.66

计量资料汇总统计描述

第二章计量资料的统计描述 一、教学大纲要求 (一)掌握内容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容 连续型变量的频数分布图:等距分组、不等距分组。 二、教学内容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range)。

min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

计量资料的统计描述

第二章 计量资料的统计描述 一、教学大纲要求 (一)掌握内容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容 连续型变量的频数分布图:等距分组、不等距分组。 二、 教学内容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range )。 min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

第一单元-计量资料的统计描述Word版

第一单元计量资料的统计描述 【习题】 分析计算题 1.1 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下: 4087105113121127133142152168215 5488105113121127134143153173220 6192106113122127135143153176 7494107114124128136143155177 7794107116124128137145156180 8095109117124128138147156182 8196109119125130138147163183 8297111119125130138149163186 83102112120126131140151166188 85105112120126132141151168195 (1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。 (2) 计算适当的集中趋势指标和离散程度指标。 1.2 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。 表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表 头发中铜的对数值频数f 0.350 0~ 1 0.450 0~ 2 0.550 0~ 4 0.650 0~ 3 0.750 0~18 0.850 0~36

0.950 0~22 1.050 0~ 6 1.150 0~ 3 1.250 0~ 3 1.350 0~1.450 0 4 合计102 1.3 某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的平均潜伏期。 表2 某年某地一次伤寒暴发潜伏期频数表 潜伏期/d发病人数f 3~3 5~24 7~20 9~17 11~14 13~7 15~6 17~2 19~1 21~232 合计96 1.4 测得566名成年男子的心率及血压情况如表3,试比较这些指标的离散程度。 表3 566名成年男子的心率及血压 指标X S 心率/(次·min-1)77.3012.83 收缩压/kPa17.17 1.74

实验一计量资料频数表的整理与统计描述

实验一计量资料频数表的整理与统计描述 一、测得12人的血红蛋白含量(g/L)121,118,130,120,122,118,116,124, 127,129,125,132。请计算其均数,几何均数,中位数,标准差,极差,变异系数。 二、某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05 1、编制频数分布表并绘制直方图,简述其分布特征。 2、选择适当的集中趋势指标、离散趋势指标并计算。 三、某市1974年为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞接触史地238 2、计算均数X、几何均数G和中位数M,何者较大?为什么?何者用于说明本 资料的集中位置较适合? 3、选用何种指标描述其离散程度较好?请计算。 四、 和半对数线图,并说明两种图形的不同意义。 五、思考题及名词解释 1、描述计量资料集中趋势的指标有哪些?它们有何异同? 2、描述计量资料离散趋势的指标有哪些?它们有何异同? 3、说明频数分布表的用途。 4、变异系数的用途是什么?

计量资料的统计描述

第二节 计量资料的统计描述 数值变量的统计描述主要是分成两步:一是正态分布性检验,二是统计描述指标的计算。根据资料是否正态,选择的指标不一样,如资料呈正态性分布则选用算术均数和标准差,如资料呈非正态分布则用中位数和四分位间距进行描述。统计指标计算的具体命令有三个:Frequencies:可以产生详细的频数表,还可以按要求给出某百分位点的数值;Descriptive:适用于正态分布资料;Explore:功能最强大,直接给出四分位间距和可信区间。 一、原始资料的统计描述 例16.2 某地某年测量了100名正常成年男子血清总胆固醇(mol/L)含量,数据见表16.4,请进行统计描述。 表16.4 某地某年100名成年男子血清总胆固醇(mol/L)含量 3.37 4.79 5.10 4.77 5.32 4.50 5.10 4.70 4.44 5.16 4.37 6.25 5.55 4.56 3.35 4.08 4.63 3.61 4.97 4.17 5.77 5.09 4.38 5.18 4.79 5.15 4.79 5.30 4.77 4.40 4.89 5.86 3.40 3.38 4.55 5.15 4.24 4.32 5.85 3.24 5.85 3.04 3.89 6.16 4.58 5.72 4.87 5.17 4.61 4.12 4.43 4.31 6.14 4.88 2.70 4.60 6.55 4.76 4.48 6.51 5.18 3.91 5.39 4.52 4.47 3.64 4.09 5.96 6.14 4.69 6.36 4.60 5.09 4.47 3.56 4.23 4.34 5.18 5.69 4.25 6.30 3.95 4.03 5.38 5.21 7.22 4.31 4.71 5.21 3.97 5.12 4.55 4.90 3.05 5.20 4.74 5.54 3.93 3.50 6.38 1.建立数据文件 取变量CHO,定义为数值型,宽度为8,2位小数。录入数据,如图16.2所示。 图16.2 数据文件 2.正态性分布检验 操作如下: (1)Analyze==>Nonparametic test==>1-sample K-S,弹出窗口,如图16.3。 (2)Test variable list框:选入变量(CHO); (3)Test distribution复选框组:选中normal复选框单击OK钮,结果输出表16.5。 表16.5“Kolmogorov-Smirnov Z”是正态分布的统计量为0.791,P=0.560,可以认为该资料呈正态分布。

文本预览