当前位置:文档之家› 第二单元__计量资料的统计推断

第二单元__计量资料的统计推断

第二单元__计量资料的统计推断
第二单元__计量资料的统计推断

第二单元 计量资料的统计推断

【习题】 分析计算题

2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:

表4 某年某地健康成年人的红细胞数和血红蛋白含量

指 标

性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L

-1

男 360 4.66 0.58 4.84

女 255 4.18 0.29 4.33 血红蛋白/g ·L -1

男 360 134.5 7.1 140.2

255

117.6

10.2

124.7

*《实用内科学》(1976年)所载均数(转为法定单位)。

请就上表资料:

(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别?

(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:

(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。

女性红细胞数的变异系数0.29

100%100% 6.94%4.18

S CV X =

?=?= 女性血红蛋白含量的变异系数10.2

100%100%8.67%117.6

S CV X =?=

?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。

男性红细胞数的标准误0.031

X S =

==(1210/L )

男性血红蛋白含量的标准误0.374X S =

==(g/L )

女性红细胞数的标准误0.018X S =

==(1210/L )

女性血红蛋白含量的标准误0.639X S =

==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按

(/2/2X X X u S X u S αα-+ , )计算。

该地男性红细胞数总体均数的95%可信区间为:

(4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为:

(4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准

H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别

0.05α= 2) 计算检验统计量

22.829X X u ===

3) 确定P 值,作出统计推断

查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。

(5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较

① 建立检验假设,确定检验水准

H 0:0μμ=,即该地男性红细胞数的均数等于标准值 H 1:0μμ<,即该地男性红细胞数的均数低于标准值 单侧0.05α= ② 计算检验统计量

0 4.66 4.84

5.8060.031

X X t S μ--=

==- ③ 确定P 值,作出统计推断

查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地男性红细胞数的均数低于标准值。

2) 男性血红蛋白含量与标准值的比较 ① 建立检验假设,确定检验水准

H 0:0μμ=,即该地男性血红蛋白含量的均数等于标准值 H 1:0μμ<,即该地男性血红蛋白含量的均数低于标准值 单侧0.05α= ② 计算检验统计量

0134.5140.2

15.2410.374

X X t S μ--=

==- ③ 确定P 值,作出统计推断

查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地男性血红蛋白含量的均数低于标准值。

3) 女性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准

H 0:0μμ=,即该地女性红细胞数的均数等于标准值 H 1:0μμ<,即该地女性红细胞数的均数低于标准值 单侧0.05α= ② 计算检验统计量

0 4.18 4.33

8.3330.018

X X t S μ--=

==- ③ 确定P 值,作出统计推断

查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地女性红细胞数的均数低于标准值。

4) 女性血红蛋白含量与标准值的比较 ① 建立检验假设,确定检验水准

H 0:0μμ=,即该地女性血红蛋白含量的均数等于标准值 H 1:0μμ<,即该地女性血红蛋白含量的均数低于标准值 单侧0.05α= ② 计算检验统计量

0117.6124.711.1110.639

X X t S μ--=

==- ③ 确定P 值,作出统计推断

查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地女性血红蛋白含量的均数低于标准值。

2.2 为了解某高寒地区小学生血红蛋白含量的平均水平,某人于1993年6月随机抽取了该地小学生708名,算得其血红蛋白均数为10

3.5g/L ,标准差为1.59g/L 。试求该地小学生血红蛋白均数的95%可信区间。

2.2解:σ未知,n 足够大时,

总体均数的区间估计可用(/2/2X X X u S X u S αα-+ , )。 该地小学生血红蛋白含量均数的95%可信区间为:

(103.5 1.96103.5 1.96-+, ),即(103.38 , 103.62)g/L 。

2.3 一药厂为了解其生产的某药物(同一批次)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为10

3.0mg ,标准差为2.22mg 。试估计该批药剂有效成分的平均含量。

2.3解:该批药剂有效成分的平均含量的点值估计为10

3.0 mg 。

σ未知且n 很小时,总体均数的区间估计可用()/2,/2,X X X t S X t S αναν-+ , 估

计。查t 界值表得t 0.05/2,9=2.262,该批药剂有效成分的平均含量的95%可信区间为:(103.0 2.262103.0 2.262

-+, ,即(101.41 , 104.59)mg 。

2.4 152例麻疹患儿病后血清抗体滴度倒数的分布如表5,试作总体几何均数的点值估计和95%区间估计。

表5 152例麻疹患儿病后血清抗体滴度倒数的分布

滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计 人 数

1

7

10

31

33

42

24

3

1

152

2.4解:将原始数据取常用对数后记为X ,则

152 1.85970.44250.0359X n X S S ====,,,,用(/2/2X X X u S X u S αα-+,)

估计,则滴度倒数对数值的总体均数的95%可信区间为:

(1.8597 1.960.0359 1.8597 1.960.0359-?+?

, ),即(1.7893 , 1.9301)。 所以滴度倒数的总体几何均数的点估计值为: 1.8597101072.39X ==,滴度倒

数的总体几何均数的95%区间估计为( 1.7893 1.93011010 , ),即(61.56 , 85.13)。 SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量x 和f ;再点击Data View 标签,录入数据(见图2.4.1,图2.4.2)。

图2..4.1 Variable View窗口内定义要输入的变量x和f

图2.4.2 Data View窗口内录入数据

分析:

Transform Compute…

Target Variable:键入logx

Numeric Expression:LG10(x) 将原始数据取对数值

Data Weight Cases…

Weight cases by Frequency Variable:f 权重为f

Analyze Descriptive Statistics Explore… 探索性分析Dependent list:logx 分析变量logx

Display:Statistics

Descriptives 统计描述

注:最后得到结果是原始数据对数值的均数及其95%可信区间。

2.5 某口腔医生欲比较“个别取模器龈下取模技术”与“传统硅橡胶取模方法”两种取模技术精度的差异,在12名病人口中分别用两种方法制取印模,在体视显微镜下测量标志点到龈沟底的距离,结果如表6,问两种取模方法结果有无差异?

表6 12个病人口腔某测量标志点到龈沟底的距离/cm

病例号个别取模器龈下取模技术传统硅橡胶取模方法

1 0.626 0.614

2 0.627 0.626

3 0.670 0.654

4 0.548 0.549

5 0.590 0.574

6 0.603 0.587

7 0.605 0.602

8 0.347 0.338

9 0.768 0.759

10 0.576 0.572

11 0.330 0.318

12 0.233 0.219

2.5解:本题为配对设计的两样本均数的比较,采用配对t检验。

表2.5.1 12个病人口腔某测量标志点到龈沟底的距离/cm

(1) 建立检验假设,确定检验水准

H 0:0d μ=,即两种取模方法结果无差异 H 1:0d μ≠,即两种取模方法结果有差异

0.05α= (2) 计算检验统计量

两种取模方法结果的差值d 的计算见表2.5.1。

120.00930.00610.0018d d n d S S ====, ,, 00.0093

5.1670.0018

d t S -=

== 112111n ν=-=-=

(3) 确定P 值,作出统计推断

查t 界值表得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为两种取模方法结果有差异,个别取模器龈下取模法标志点到龈沟底

的距离略高于传统硅胶取模法。

病例号 个别取模器龈下取模1d

传统硅橡胶取模法2d

12d d d =-

1 0.626 0.614 0.01

2 2 0.627 0.626 0.001

3 0.670 0.65

4 0.016 4 0.548 0.549 -0.001

5 0.590 0.574 0.01

6 6 0.603 0.58

7 0.016 7 0.605 0.602 0.003

8 0.347 0.338 0.00

9 9 0.768 0.759 0.009 10 0.576 0.572 0.004 11 0.330 0.318 0.012 12

0.233

0.219

0.014

SPSS操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量x1和x2;再点击Data View标签,录入数据(见图2.5.1,图2.5.2)。

图2.5.1 Variable View窗口内定义要输入的变量x1和x2

图2.5.2 Data View窗口内录入12对数据

分析:

Analyze Compare Means Paired-samples T Tes t…配对设计均数比较t检验Paired Variables:x1 x2 配对变量为x1和x2

2.6 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如表7,问两组的平均效价有无差别?

表7 钩端螺旋体病患者血清作凝溶试验测得的稀释倍数

标准株(11人) 100 200 400 400 400 400 800 1600 1600 1600 3200 水生株(9人) 100

100

100

200

200

200

200

400

400

2.6解:本题为成组设计的两小样本几何均数的比较,采用成组t 检验。

将原始数据取常用对数值后分别记为1X 、2X ,

则11122211 2.79360.45209 2.26760.2353n X S n X S ======,,;,, (1) 建立检验假设,确定检验水准

H 0:两种株别稀释倍数的总体几何均数的对数值相等 H 1:两种株别稀释倍数的总体几何均数的对数值不等

0.05α= (2) 计算检验统计量

3.149

X X t =

=

=

122119218n n ν=+-=+-=

(3) 确定P 值,作出统计推断

查t 界值表得0.005

SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量g 和x ;

再点击Data View标签,录入数据(见图2.6.1,图2.6.2)。

图2.6.1 Variable View窗口内定义要输入的变量g和x

图2.6.2 Data View窗口内录入数据

分析:

Transform Compute…

Target Variable:键入logx

Numeric Expression:LG10(x) 将原始数据取对数值

Analyze Compare Means Independent-Samples T Test… 成组设计t检验

Test Variable[s]:logx 分析变量logx Grouping Variable:g 分组变量g

Use Specified Values Group1:键入1 定义比较的两组

Group2:键入2

2.7 某医生为了评价某安眠药的疗效,随机选取20名失眠患者,将其随机分成两组,每组10人。分别给予安眠药和安慰剂,观察睡眠时间长度结果如表8,请评价该药的催眠作用是否与安慰剂不同。

表8 患者服药前后的睡眠时间/h

安眠药组

安慰剂组 受试者 治疗前 治疗后

受试者 治疗前 治疗后 1 3.5 4.7 1 4.0 5.4 2 3.3 4.4 2 3.5 4.7 3 3.2 4.0 3 3.2 5.2 4 4.5 5.2 4 3.2 4.8 5 4.3 5.0 5 3.3 4.6 6 3.2 4.3 6 3.4 4.9 7 4.2 5.1 7 2.7 3.8 8 5.0 6.5 8 4.8 6.1 9 4.3 4.0 9 4.5 5.9 10

3.6

4.7

10

3.8

4.9

2.7解:本题采用成组t 检验比较两小样本差值的均数,以治疗后与治疗前的睡眠时间的差值为变量进行统计分析。

安眠药组:111100.880.4826d n d S ===, , 安慰剂组:22210 1.390.2685d n d S ===, ,

两样本标准差相差不大,可认为两总体方差齐,略去方差齐性检验。 (1) 建立检验假设,确定检验水准

H 0:12d d μμ=,即安眠药的催眠作用与安慰剂相同

H 1:12d d μμ≠,即安眠药的催眠作用与安慰剂不同

α=0.05

(2) 计算检验统计量

2.9203

t =

=

=-

1221010218n n ν=+-=+-=

(3) 确定P 值,作出统计推断

查t 界值表得0.005< P < 0.01,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为安眠药的催眠作用与安慰剂不同,安慰剂的催眠效果好于安眠药。

SPSS 操作 数据录入:

打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量g

、x1和x2;再点击Data View 标签,录入数据(见图2.7.1,图2.7.2)。

图2.7.1 Variable View 窗口内定义要输入的变量g 、x1和x2

图2.7.2 Data View窗口内录入数据

分析:

Transform Compute…

Target Variable:键入d

Numeric Expression:键入x2-x1 计算x2与x1的差值

Analyze Compare Means Independent-Samples T Test…成组设计t检验

Test Variable[s]:d 分析变量d

Grouping Variable:g 分组变量g

Use Specified Values Group1:键入1 定义比较的两组

Group2:键入2

2.8 某医师用依降钙素治疗绝经后妇女骨质疏松症,收集30例绝经后骨质疏松症妇女,随机分成两组,一组服用依降钙素+乳酸钙,另一组只服用乳酸钙,24周后观察两组患者腰椎L2-4骨密度的改善率,结果如表9,请问依降钙素治疗绝经后妇女骨质疏松是否有效?

表9 各组患者L2-4骨密度的改善率/%

依降钙素+乳酸钙

乳酸钙 -0.20 -0.83 0.21 0.26 1.86 0.47 1.97 1.07 9.20 1.18 3.56 1.26 2.80 1.69 3.29 1.75 3.30 2.31 3.47 2.65 3.60 2.78 4.30 6.02 4.39 3.36 8.42 2.10 6.02

3.14

2.8解:本题采用成组t 检验比较两小样本均数。

依降钙素+乳酸钙组: 11115 3.7460 2.5871n X S ===,, 乳酸钙组: 22215 1.9473 1.6041n X S ===,,

两样本标准差相差不大,可认为两总体方差齐,略去方差齐性检验。 (1) 建立检验假设,确定检验水准

H 0:12μμ=,即依降钙素治疗绝经后妇女骨质疏松无效 H 1:12μμ>,即依降钙素治疗绝经后妇女骨质疏松有效 单侧α=0.05 (2) 计算检验统计量

2.2885

X X

t=

==

12

21515228

n n

ν=+-=+-=

(3) 确定P值,作出统计推断

查t界值表得0.01< P <0.025,按0.05

α=水准,拒绝H

,接受H1,差别有统计学意义,可以认为依降钙素治疗绝经后妇女骨质疏松有效。

SPSS操作

数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量

g和x;再点击Data View标签,录入数据(见图2.8.1,图2.8.2)。

图2.8.1 V ariable View窗口内定义要输入的变量g和x

图2.8.2 Data View窗口内录入数据

分析:

Analyze Compare Means Independent-Samples T Test…

Test Variable[s]:x

Grouping Variable:g

Use Specified Values Group1:键入1

Group2:键入2

2.9 为比较大学生中男女血清谷胱甘肽过氧化物酶(GSH-PX)的活力是否不同,某人于1996年在某大学中随机抽取了18~22岁男生48名,女生46名,测得其血清谷胱甘肽过氧化物酶含量(活力单位)如表10。问男女性的GSH-PX 的活力是否不同?

X±)

表10 男女大学生的血清谷胱甘肽过氧化物酶(S

性别n S

男48 96.53±7.66

女46 93.73±14.97

2.9解:本题为成组设计的两小样本均数比较

(1) 方差齐性检验

1) 建立检验假设,确定检验水准

H 0:22

12σσ=,即男、女性GSH-PX 活力的总体方差齐 H 1:2212σσ≠,即男、女性GSH-PX 活力的总体方差不齐

α=0.10

2) 计算检验统计量

22

22/14.97/7.66 3.819F S S =小大==

11146145n ν=-=-= , 22148147n ν=-=-=

3) 确定P 值,作出统计推断

查方差齐性检验用F 界值表得P <0.10,按0.10α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为两总体方差不齐。故应用't 检验。

(2) 成组设计两小样本均数的't 检验 1) 建立检验假设,确定检验水准

H 0:12μμ=,即男、女性GSH-PX 活力相同 H 1:12μμ≠,即男、女性GSH-PX 活力不同

α=0.05

2) 计算检验统计量

' 1.134X X t =

=

=

()

1212

22

22

2212222124422222222121212127.6614.97484666.41667.6614.9711484648146111

X X X X S S S S n n S S S S n n n n n n ν????++ ? ?+????====≈????????+ ? ? ? ?--????????

++---- 3) 确定P 值,作出统计推断

查t 界值表得0.20< P <0.40,按0.05α=水准,不拒绝H 0,差别无统计学意

义,尚不能认为男、女性GSH-PX 活力不同。

2.10 某研究者欲比较甲、乙两药治疗高血压的效果,进行了随机双盲对照试验,结果如表11,请问能否认为两种降压药物等效?

表11 两药降血压/kPa 的效果比较 n

S

甲药 50 2.67 0.27 乙药

50

3.20

0.33

2.10解:本题采用两样本均数的等效检验(等效界值0.67?= kPa )

。 (1) 建立检验假设,确定检验水准

H 0: |21μμ-| ≥ 0.67 kPa ,即两种降压药不等效 H 1: |21μμ-| < 0.67 kPa ,即两种降压药等效 单侧α=0.05 (2) 计算检验统计量

12

12||

2.322

X X X X X X t S ?---=

=

=

=

1225050298n n ν=+-=+-=

(3) 确定P 值,作出统计推断

查t 界值表得0.01< P <0.025,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为甲乙两种药物的降压效果等效。

习题-计量资料统计描述

计量资料统计描述----习题 1、中位数是表示变量值()的指标。 A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.变异程度 2、血清学滴度资料最常计算()来表示平均水平。 A.算术均数 B.中位数 C.几何均数 D.全距 E.百分位数 3、最小组段无下限或最大组段无上限的频数分布资料宜用() A.算术均数 B.中位数 C.几何均数 D.全距 E.标准差 4、原始数据同减去一个不等于零的常数后,()。 A. x 不变,S 变 B. x 变,S 不变 C. x 和S 都不变 D. x 和S 都变 E.以上均不对 5、变异系数CV()。 A.表示X 的绝对离散度 B.表示X 的相对离散度 C.表示x的绝对离散度 D.表示x的相对离散度 E.以上均不对 6、描述一组偏态分布资料的变异度,以()指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.均数 7、用均数和标准差可以全面描述()资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.分布不知 E.对数正态分布 8、比较身高和体重两组数据变异度大小宜采用() A.变异系数 B.标准差 C.四分位数间距 D.全距 E.方差 9、偏态分布宜用()描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数 D.众数 E.百分位数 10、各观察值同乘以一个不等于0 的常数后,()不变。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.变异系数 11、()分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 E.以上均不对 12、随机抽查某地成年女子身高,算得均数x =160cm,标准差S=5cm,则可计算变异系数CV=------- 5 160 C.(160/5)cm D.(5/160)cm ×160 13、变异系数CV 的数值()。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 E.不能判定 14、列数8、-3、5、0、4、-1 的中位数是()。 、关于标准差,哪项是错误的()。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E.适用于对称分布资料 16、5 人的血清滴度为<1:20、1:40、1:80、1:160、1:320 描述平均滴度,用哪种指标较好()。 A.平均数 B.几何均数 C.算术均数 D.中位数 E.众数

@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A 、描述平均水平(中心位置): 均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度: 标准差、四分位数间距、 变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median )M 和百分位数(percentile ) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 12n X X X X X n n +++== ∑L

用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n 为奇数时-- n 为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) =第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???+如果只调查了前八位中学生,则: +(+)(+)天

百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数f x :所在组段频数 注:有的教材X= r ; L f ∑=C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 2565~ 15 34 P 25在此 68~ 25 59 71~ 26 85∑f 75 L 7574~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内;

看医统学习题(计数资料)

《医学统计学习题》计数资料 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙 普通型300 100 60.0 65.0 重型100 300 40.0 45.0 暴发型100 100 20.0 25.0 合计500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是: A、重新计算,多保留几位小数 B、对率进行标准化 C、对各医院分别求平均治愈率 D、增大样本含量,重新计算 6、5个样本率作比较,χ2>χ20.01,4,则在α=0.05检验水准下,可认为: A、各总体率不全等 B、各总体率均不等 C、各样本率均不等 D、各样本率不全等 7、两个独立小样本计量资料比较的假设检验,首先应考虑: A、用t检验 B、用Wilcoxon秩和检验 C、t检验或Wilcoxon秩和检验均可 D、资料符合t检验还是Wilcoxon秩和检验条件 13.对三行四列表资料作 2检验,自由度等于 A. 1 B. 2 C. 3 D. 6 E. 12 14. 根据下述资料,则 病情 病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型40 36 90 60 54 90 重型60 42 70 40 28 70 合计100 78 78 100 82 82 A. 乙疗法优于甲疗法 B. 甲疗法优于乙疗法 C. 甲疗法与乙疗法疗效相等 D. 此资料甲、乙疗法不能比较 E. 以上都不对15.在实际工作中,同质是指()。 A.被研究指标的非实验影响因素均相同。B.研究对象的测量指标无误差。 C.被研究指标的主要影响因素相同。D.研究对象之间无个体差异。E.以上都对。答案 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙

医学统计学第3版,02计量资料的统计描述试题

第二章 计量资料的统计描述 一、教学大纲要求 (一)掌握内容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容 连续型变量的频数分布图:等距分组、不等距分组。 二、 教学内容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range )。 min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

作业与参考标准答案ch第三部分计数资料统计描述和统计推断

作业与参考标准答案ch第三部分计数资料统计描述和统计推断

————————————————————————————————作者:————————————————————————————————日期:

《医学统计学》 【教材】倪宗瓒主编.医学统计学.北京;高等教育出版 社.2004. 【作业】教材附录二 【习题解答】 第三单元 计数资料的统计描述和统计推断 分析计算题 3.1 解: (1) 100%= ?同年该年龄组死亡人数 年龄组死亡人数构成比某年某年龄组死亡总数 %39.1%1001802 25 ~0=?= 岁组死亡人数构成比 余类推; 10000010= ?同年该年龄组死亡人数 死亡率万某年某年龄组平均人口数 010000010 3.3610?=25 ~岁组死亡率= 万万745000 余类推; 岁组死亡率 各年龄组死亡率 相对比~0= 04.1336 .380 .43~30== 岁组相对比 余类推。 各年龄组死亡人数构成比、死亡率和相对比计算结果见表3.1.1。 表3.1.1 某地某年循环系统疾病死亡资料 年龄组 /岁 平均人口数 循环系统 死亡人数 死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率/0~组死亡率)

0~ 745000 25 1.39 3.36 — 30~ 538760 236 13.10 43.80 13.04 40~ 400105 520 28.86 129.97 38.68 50~ 186537 648 35.96 347.38 103.39 60~ 52750 373 20.70 707.11 210.45 合 计 1923152 1802 100.00 93.70 — (2) 死亡人数构成比是指某年龄组死亡人数与各年龄组死亡人口总数之比,说明总死亡人数中各年龄组死亡人数所占的比重; 死亡率是指某年实际死亡数与该年可能发生死亡人数(本题即为该年平均人口数)之比,用以说明死亡发生的频率或强度; 相对比用以说明各年龄组死亡率是0~岁组死亡率的几倍或几分之几。 3.2解:因为甲、乙两医院某传染病的类型构成明显不同,且疾病类型对该病的治疗效果有影响,故应进行标准化,再比较两医院的治愈率。根据本题资料,以两医院合计病人数为标准人口,采用直接标准化法。 表3.2.1 直接法计算甲、乙两医院某传染病标准化治愈率/% 类型 标准病人数 N i 甲医院 乙医院 原治愈率/% p i 预期治愈人数 N i p i 原治愈率/% p i 预期治愈人数 N i p i 普通型 552 59.9 331 65.2 360 重 型 552 39.9 220 44.9 248 暴发型 252 19.8 50 25.4 64 合 计 1356 48.4 601( i i N p ∑) 45.4 672( i i N p ∑) 甲医院某传染病标准化治愈率:601 100%44.3%1356p '=?=甲 乙医院某传染病标准化治愈率:672100%49.6%1356p '=?=乙 可以看出,经标准化后乙医院的该传染病的治愈率高于甲医院。

计量资料汇总统计描述

第二章 计量资料的统计描述 一、教学大纲要求 (一)掌握容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉容 连续型变量的频数分布图:等距分组、不等距分组。 二、 教学容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range )。 min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

统计学计量的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A、描述平均水平(中心位置): 均数X、中位数和百分位数、几何均数G、众数(mode) B、描述数据的分散程度: 标准差、四分位数间距、变异系数、方差、全距 (一)均数mean和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median)M和百分位数(percentile) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n为奇数时-- n为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数

值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) = 第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数 f x :所在组段频数 注:有的教材X= r ; L f =C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 25 65~ 15 34 P 25在此 68~ 25 59 71~ 26 85 ∑f 75 L 75 74~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合 计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内; P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25=65+3x[(130x25%-19)/15]=65.90 P 75=74+3x[(130x75%-85)/19]=74.66

计数资料的统计学分析 (1)

[模拟] 计数资料的统计学分析 A型题题干在前,选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。 第1题: 计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料 参考答案:E 答案解析: 第2题: 计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数 参考答案:D 答案解析: 第3题: 计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比 参考答案:C 答案解析: 第4题: 频率指标,它说明某现象发生的如下哪一种

B.强度 C.比重大小 D.例数 E.各组的单位数 参考答案:B 答案解析: 第5题: 构成指标,它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数 参考答案:A 答案解析: 第6题: 对480人进行老年性白内障普查,分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人,白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(%)是多少 A.5 B.50 C.60 D.80 E.20 参考答案:C 答案解析: 第7题: 对1000人进行老年性白内障普查,分50岁一和60岁一两个年龄组,受检人数分别为480人和520人,白内障例数分别为120人和280人。回答患者50岁一年龄构成比(%)是多少 A.53.9 B.12 C.30 D.28

参考答案:C 答案解析: 第8题: 在计数资料计算相对数时,应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中 参考答案:D 答案解析: 第9题: 在计数资料进行相对数间比较时,应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样 参考答案:E 答案解析: 第10题: X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率 参考答案:D 答案解析: 第11题: X2值愈大,则X2值的概率P值如下哪种情况

第三单元 计数资料的统计描述和统计推断(第一部分)

第三单元计数资料的统计描述和统计推断 【习题】 分析计算题 3.1 某地某年循环系统疾病死亡资料如表18。 表18 某地某年循环系统疾病死亡资料 年龄组/岁平均人口数 循环系统 死亡人数 死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率 /0~组死亡率) 0~745000 25 30~538760 236 40~400105 520 50~186537 648 60~52750 373 合计1923152 1802 (1) 请根据以上数据计算各年龄组死亡人数构成比、死亡率和相对比。 (2) 分析讨论各指标的含义。 3.2 请就表19资料比较甲、乙两个医院某传染病的治愈率/%。 表19 甲、乙两院某传染病治愈率(%)的比较 类型 甲医院乙医院 病人数治愈数治愈率/% 病人数治愈数治愈率/% 普通型414 248 59.9 138 90 65.2 重型138 55 39.9 414 186 44.9 暴发型126 25 19.8 126 32 25.4 合计678 328 48.4 678 308 45.4 3.3 传统疗法治疗某病,其病死率为30%,治愈率为70%。今用某种新药治疗该病10人,结果有1人死亡。问该新药的治疗效果是否优于传统疗法(单侧)。

3.4 甲、乙两地各抽样调查1万名妇女,结果甲地卵巢癌患病人数100人,乙地卵巢癌患病人数80人,请问甲乙两地妇女的卵巢癌患病率是否不同。 3.5 对甲地一个由40名新生儿组成的随机样本进行某病的基因检测,结果阳性2例。据此资料,估计该地此病的基因总体携带率的95%可信区间。 3.6 已知一般人群中慢性气管炎患病率为9.7%,现调查了300名吸烟者,发现其中有63人患有慢性气管炎,试推断吸烟人群慢性气管炎患病率是否高于一般人群。 3.7 研究者取4mL某饮料进行细菌培养,得细菌数60个,试估计平均每1mL 饮料中细菌数的均值和标准差,并估计平均每1mL饮料中细菌数的95%可信区间。 3.8 分别从两种饮料中各取10mL样品进行细菌培养,甲饮料培养细菌440个,乙饮料培养细菌300个,问两种饮料中细菌数有无差别。 3.9 若某地区1998年新生儿腭裂发生率为2.15‰ ,1999年在此地区抽样调查1000名新生儿,发现腭裂1例,问此地区1999年腭裂发生率是否比1998年低。 3.10 对某地区居民饮用水进行卫生学检测中,随机抽查1mL水样,经培养获大肠杆菌菌落2个,试估计该地区水中平均每毫升所含大肠杆菌菌落的95%可信区间。 3.11 将80例均为初治的乳腺癌患者随机分配到甲乙两种治疗方案中,每组各40例,甲方案31例有效,乙方案14例有效,问两种治疗方案的有效率有无差别? 3.12 为了解某中药治疗原发性高血压的疗效,将44名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表20,问该药治疗原发性高血压是否有效? 表20 两种疗法治疗原发性高血压的疗效 分组例数有效有效率/% 实验组23 21 91.30 对照组21 5 23.81

最新第一单元 计量资料的统计描述

第一单元计量资料的统计描述 【习题】 分析计算题 1.1 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下: 40 87 105 113 121 127 133 142 152 168 215 54 88 105 113 121 127 134 143 153 173 220 61 92 106 113 122 127 135 143 153 176 74 94 107 114 124 128 136 143 155 177 77 94 107 116 124 128 137 145 156 180 80 95 109 117 124 128 138 147 156 182 81 96 109 119 125 130 138 147 163 183 82 97 111 119 125 130 138 149 163 186 83 102 112 120 126 131 140 151 166 188 85 105 112 120 126 132 141 151 168 195 (1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。 (2) 计算适当的集中趋势指标和离散程度指标。 1.2 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。 表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表 头发中铜的对数值频数f 0.350 0~ 1 0.450 0~ 2 0.550 0~ 4 0.650 0~ 3 0.750 0~18 0.850 0~36

6.计量资料的统计推断—t检验

6 计量资料的统计推断-t检验 t检验是以t分布为理论依据的假设检验方法,常用于正态总体小样本资料的均数比较,t检验统计量有三个不同的形式,适用于单因素设计的三种不同类型:①单个样本的均数与已知总体均数比较的检验,适用于单组设计,给出一组服从正态分布的定量观测数据和一个标准值(总体均值)的资料。②配对t检验,适用于配对设计。③成组t检验,适用于完全随机设计的两均数比较。 SPSS中使用菜单Analyze →Compore Means作t检验,Compore Means的下拉菜单如表6-1所示。 表6-1 Compore Means下拉菜单 Means…分层计算… One-Sample T Test…单样本t检验… Independent-Samples T Test…独立样本t检验… Paired-Sample T Test…配对t检验… One-Way ANOV A…单因素方差分析… 6.1 计量资料的分层计算 Means过程可以对计量资料分层计算均数、标准差等统计量,同时可对第一层分组进行方差分析和线性趋势检验。 例6-1某学校测得不同年级、不同性别的12名学生的身高(cm),数据见表6-2。试用SPSS的Means过程分别计算不同年级、不同性别学生身高的均数和标准差。 表6-2 12名学生的身高(cm) 解年级:1=“初一”、2=“高一”,性别:1=“男”、2=“女”。 选择Analyze→Compare Means→Means命令,弹出Means对话框,如图6-2。在变量列表中选中身高,送入Dependent(因变量)框中;选中年级,送入Independent(自变量),确定第一层依年级分组,单击Next按钮,选中性别,送入Independent,确定第二层依性别分组;单击OK。输出结果如图6-3所示。 在Means对话框单击Options(选项)按钮,弹出Means:Options对话框,可以选择要计算的统计量,默认Mean、Number of cases、Standard Deviation;在Statistics for First Layer中,可对第一层分组作方差分析(Anova table and eta)和线性趋势检验(Test for linearity)。

相关主题
文本预览
相关文档 最新文档