当前位置:文档之家› 华西统计学资料-随访资料的生存分析

华西统计学资料-随访资料的生存分析

华西统计学资料-随访资料的生存分析
华西统计学资料-随访资料的生存分析

生存分析的意义和应用

无论观察性研究,还是实验(试验)性研究,有时需对研究对象进行追踪观察,不仅了解某事件发生的结局,同时还了解发生这种结局所经历的时间。

例如临床治疗措施效果评价:白血病化疗缓解持续时间和缓解率、乳腺癌术后生存时间和生存率、肾移植术后生存时间和生存率等。

上述生存资料若按通常的方法进行分析,有两方面的问题:

1.n 年生存率有时出现后一年大于前一年的现象。

100%

n n n 活满年的人数

年生存率=

观察满年的人数

表1 某地1974—1981年胃癌根治术后随访记录 年份 例数

生存年数 1

2 3 4 5 6 7 8 1974 29 28 25 23 19 18 17 17 17 1975 26 24 19 18 18 18 16 16 1976 24 21 19 16 14 14 13 1977 32 27 23 21 18 16 1978 25 23 20 16 16 1979 36 31 29 26 1980 25 23 19 1981

46

36

合计 243

213 154 120 85

66

46

33

17

1974年—1981年共手术243例,1974年手术29例,术后1年内死亡1例,活满1年的28例,到1982年末,活满8年的17例。以次类推。

观察满1年的243例,活满1年的213例:

1年生存率=213

100%87.65% 243

?=

观察满2年的病例243 - 46 = 197例,活满2年的共154例:

2年生存率=154

100%78.17% 197

?=

6年生存率=58.23%

7年生存率=60.00%

8年生存率=58.62%

由于失访或死于其它疾病而终止观察等原因,分析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。因此,在观察例数较少同时截尾数据较多时,此法很不理想。

2. 某时点生存率不能反映整个生存过程,比较时可能出现不正确的结论。

分析生存资料的统计方法称为生存分析(survival analysis)。它是将事件的结局和发生这种结局所经历的时间两个因素综合起来分析的一种统计方法。它能够处理截尾数据,并对整个生存过程进行分析或比较。

生存分析在临床医学和公共卫生等领域应用广泛:

1.临床治疗方案或处理措施的效果评价。如恶性肿瘤手术或化疗后(转移或死亡前)生存时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。

2.疾病危险因素分析和疾病预后的影响因素分析。如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。

3.特殊人群卫生保健措施的效果评价。如中老年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评价(宫内保留时间或有效避孕时间)、某疫苗接种效果评价(观察抗体滴度了解免疫力持续时间或某病发病率)等。

生存分析包括统计描述和统计推断两方面:

统计描述:计算生存率、绘制生存率曲线、计算中位生存时间等。

统计推断:估计总体生存率的可信区间、生存率曲线的比较。

随访研究的几个问题

一、随访内容

1.开始随访的时间:入(出)院时间、确诊时间、开始治疗时间等可作为随访开始的时间。如乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随访开始时间。

2.随访的结局和终止随访的时间

随访的结局可能有以下几种:

①“死亡”:泛指处理措施失败的事件。如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。终止随访时间为“死亡”时间。

②失访:拒绝随访、失去联系或中途退出等。终止随访时间为最后一次访问时间。

③死于与研究疾病无关的原因:终止随访时间为死亡时间。

④研究终止。研究终止时观察对象仍然存活。终止随访时间为研究终止时间。

3.影响生存的有关因素:如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对生存率的影响。

二、随访方式

1.全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。

2.观察对象在不同时间接受处理措施,完成一定数量随访病例或按事先规定的时间停止随访。

生存分析的几个概念

1.“死亡”事件

“死亡”事件(death event)又称失败事件(failure event),泛指标志某种措施失败或失效的事件,是根据研究目的确定的。如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为“死亡”事件。

2.生存时间

生存时间(survival time)也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察持续的时间,常用符号t表示。

表2 6例乳腺癌患者术后随访记录

患者编号

观察记录

生存天数

t

开始日期终止日期

结局

(死=1,生=0)

原因

1 02-09-03 02-12-29 0 死于肺癌118+

2 02-09-10 02-12-08 1 转移死亡90

3 02-09-1

4 02-12-31 0 研究终止108+

4 02-08-2

5 02-11-29 0 失访96+

5 02-10-01 02-11-28 0 死于车祸59+

6 02-10-04 02-12-28 1 复发死亡86

生存时间分为两种类型:

1.完全数据(complete data):指从观察起点到发生“死亡”事件所经历的时间。提供了观察对象确切的生存时间。

2.截尾数据(censored data):亦称截尾值(censored value)或终检值。指从观察起点到发生非“死亡”事件所经历的时间。

截尾原因即前述三种情况:失访、死于与研究疾病无关的原因、研究终止。截尾数据不能提供完全的信息,常用符号“+”表示。

三、生存率

指某个观察对象活过t时刻的概率,常用P(X>t)表示。生存率也是一个广义概念,研究者定义的“死亡”事件不同,其含义亦不同。

如白血病化疗的失败事件是白血病复发,生存率即为缓解率;预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率;安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。

生存分析的主要内容

一、描述生存过程

计算各时点生存率、绘制生存率曲线、计算中位生存时间等。常用方法有乘积极限法和寿命表法。

二、比较生存过程

比较两组或多组生存曲线(生存过程)。常用方法有对数秩检验和分层对数秩检验等。

三、生存过程的影响因素分析

多因素生存分析如Cox比例风险模型分析疾病发生、发展及其预后的影响因素。例如,分析影响鼻咽癌手术预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等。

生存资料的统计描述及

生存率的区间估计

一、乘积极限法

乘积极限法(product-limit estimate)又称kaplan-Meier法,适用于未分组生存资料的分析。

例1 某方案治疗Ⅲ期肺癌患者11例,随访时间(月)如下。试估计各时点生存率及其标准误。

1,2,3,5,6,9+,11,13,16,26,37+,

表3 例1资料生存率及标准误的计算

(月)

X (1) d X

(2)

病例数

n X

(3)

概率

q

X

(4)

概率

p

X

(5)

P(X>t)

(6)

标准误

s P(X>t)

(7)

1 1 11 1/11 1-1/11 0.9091 0.0867

2 1 10 1/10 1-1/10 0.8182 0.1163

3 1 9 1/9 1-1/9 0.7273 0.1343

5 1 8 1/8 1-1/8 0.6364 0.1450

6 1

7 1/7 1-1/7 0.5455 0.1501

9+0 6 0 1 0.5455 0.1501

11 1 5 1/5 1-1/5 0.4364 0.1638

13 1 4 1/4 1-1/4 0.3273 0.1550

16 1 3 1/3 1-1/3 0.2182 0.1364

26 1 2 1/2 1-1/2 0.1091 0.1030

37+0 1 0 1 0.1091 0.1030

生存率的计算

1.生存时间X:由小到大排列,遇非截尾和截尾值相同,截尾值排后。

2.死亡数d x:与生存时间X对应。注意:截尾值对应的个体未发生“死亡”事件,故死亡数为0。

3.期初病例数n x,表示恰好在该时刻以前的病例数。如n5为8,表示恰好在5月时点前有8人存活。

4.死亡概率q x ,表示X 月前的观察对象恰好在X 月时点死亡的概率。

5.生存概率?x p

,表示X 月前的观察对象恰好在X 月时点存活的概率。

6.生存率P (X >t )。表示该人群恰好活过t 时刻的概率。它为小于和等于 t 时刻的各时点生存概率的乘积。

7.生存率的标准误

()(P X t s P X t >=>

例如,P(X >3)的标准误为

(3)(0.7270.1343

P X s P X >=>==

生存率曲线

未分组资料的生存率曲线称Kaplan-Meier 曲线,它是以时间t 为横轴,生存率P(X>t)为纵轴的曲线,其中水平横线表示从一个时点到下一个时点的距离。

可对某一个体任意时刻的生存率作出估计,反之亦可由任意生存率估计生存时间。生存率0.5所对应的生存时间即中位生存时间。

由图可见,生存率P(X >t)=0.5时,中位生存时间的估计值在6~11月之间:

6110.54550.436460.54550.5

t

--=

--

84364

.05455.0)5.05455.0)(116(6=----

=t

① 生存时间具有截尾值,一般不呈正态分布,故不宜用平均生存时间来描述生存资料。

② 若生存率0.5处所对应的曲线与X 轴平行,则中位生存时间不止一个。

③ 若Kaplan-Meier 曲线上生存率全大于0.5,则中位生存时间无法估计。

总体生存率可信区间的估计

正态近似原理估计某时点总体生存率可信区间:

()()P x t P x t u s α>>±

生存率曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。

二、寿命表法

适用于分组的生存资料。① 实际工作中,随访结果常常没有每个观察对象确切的生存时间,只能获得按随访时间分组的资料。② 当样本较大(如n ≥ 50)时,采用乘积极限法估计生存率及其标准误较为繁琐。

例2某院对100例确诊的原发性肝癌患者进行随访,见表第(1)至(3)栏。据此资料计算生存率和标准误。

表2100例原发性肝癌患者生存率及标准误

确诊后月数

X (1) 期内失

访人数

W

X

(2)

期内死

亡人数

D

X

(3)

期初观

察人数

L

X

(4)

校正

人数

N

X

(5)

死亡概

1

q

X

(6)

生存概

1

p

X

(7)

n月

生存率

(n=X+1)

n

p

(8)

生存率标

准误

s

n

p0

(9)

0~ 2 17 100 99 0.1717 0.8283 0.8283 0.0379 1~ 1 26 81 80.5 0.3230 0.6770 0.5608 0.0502 2~ 3 27 54 52.5 0.5143 0.4857 0.2724 0.0457 3~ 2 15 24 23 0.6522 0.3478 0.0947 0.0314 4~0 2 7 7 0.2857 0.7143 0.0677 0.0277 5~ 1 2 5 4.5 0.4444 0.5556 0.0376 0.0221 6~0 0 2 2 0.0000 1.0000 0.0376 0.0221 7~ 1 0 2 1.5 0.0000 1.0000 0.0376 0.0221 8~9 0 1 1 1 1.0000 0.0000 0.0000

生存率的计算

1. 确诊后月数X~:“0~”表示从确诊日起不满一月,“1~”表示确诊后1月至不满2月,依次类推。

2.期内失访人数W X:泛指具有截尾数据的人,表示随访已满X月,但在未满X+1月期间失访的人。

3.期内死亡人数D X:指期内死于肝癌的人数。

4.期初观察人数L X:指时刻X以前的人数。

5.校正人数N X:相当于实际观察人时数。在各

月月初观察人数中减去同月失访人数的一半。

6.死亡概率1q x :指活满 X 月的病人在 X + 1月内死亡的概率。

7.生存概率1p X :指活满 X 月的病人在 X + 1月内存活的概率,即在活过某时刻的条件下,再活下一时间段的概率。

8.n 月生存率

n

p 0

,表示活过n 月的概率。

9.生存率标准误的计算。

生存率曲线

以生存月数X 为横轴,n 月生存率n p 0为纵轴作生存率曲线。

总体生存率可信区间的估计

根据正态近似原理用n

p

p u s

n

0±α0

估计。

不宜用该法计算接近尾部的生存率可信区间。

生存曲线比较的假设检验

—— 对数秩检验

对数秩检验(log-rank test )的基本思想是:若无效假设成立,则根据各个时点两组的期初观察人数和死亡概率,计算两组在各个时点的理论死亡数。如无效假设成立,理论死亡数与实际死亡数应相差不大。反之,则不支持无效假设成立,进而认为两条生存曲线差异有统计学意义。

对数秩检验可用于两个或多个样本生存曲线的比较,其检验统计量:

()

χ

2

2

=-∑

A T T

v = 组数-1

当有T 小于5时,用下式计算校正χ2

值。

()

χ

2

2

05=--∑

A T T

.

例3 将22例Ⅲ期非小细胞肺癌患者随机分配到

放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下。比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。

甲:放疗组1,2,3,5,6,9+,11,13,16,26,

37+

乙:放化疗联合组10,11+,14,18,22,22,26,

32,38,40+,42+

1.建立检验假设和确定检验水准

H0:单放疗与放化疗联合两治疗方案的生存率曲线分布相同

H1:单放疗与放化疗联合两治疗方案的生存率曲线分布不同

α=0.05

2.计算统计量χ2值

表3 单放疗组和放化疗联合组理论死亡数的计算

序号 组别 观察时间 死亡数 期初病例数

理论病死数

(1) (2) t (3) d (4) n 甲 (5) n 乙 (6) 合计 (7) 甲 (8)=(4)×(5)/(7) 乙

(9)=(4)×(6)/(7)

1 甲 1 1 11 11 2

2 0.5000 0.5000 2 甲 2 1 10 11 21 0.4762 0.5238

3 甲 3 1 9 11 20 0.4500 0.5500

4 甲

5 1 8 11 19 0.4211 0.5789 5 甲

6 1

7 11 1

8 0.388

9 0.6111 6 甲 9+

0 6 11 17 0.0000 0.0000 7 乙 10 1 5 11 16 0.3125 0.6875 8 甲 11+ 1 5 10 15 0.3333 0.6667 9 乙 11 0 4 10 14 0.0000 0.0000 10 甲 13 1 4 9 13 0.3077 0.6923 11 乙 14 1 3 9 12 0.2500 0.7500 12 甲 16 1 3 8 11 0.2727 0.7273 13 乙 18 1 2 8 10 0.2000 0.8000 14 乙 22 2 2 7 9 0.4444 1.5556 15 甲乙 26 2 2 5 7 0.5714 1.4286 16 乙 32 1 1 4 5 0.2000 0.8000 17 甲 37+ 0 1 3 4 0.0000 0.0000 18 乙

38 1 0 3 3 0.0000 1.0000 19 乙

40+

0 0 2 2 0.0000 0.0000 20 乙

42+

0 0 1 1 0.0000 0.0000 合计

5.1282 11.8718

表4 例3对数秩检验总结表

组 别 观察死亡数 A 理论死亡数

T 死亡比

A/T 甲

9 5.1282 1.7550 乙

8 11.8718

0.6739

()

()

χ

2

2

2

95128251282

8118718118718

419

=

-+

-=.....

v = 2-1=1

3.求出P 值,作出统计推断

查2χ界值表,得P < 0.05,在α=0.05水准拒绝H0,接受H1,可以认为单独放疗和放化疗联合治疗Ⅲ期非小细胞肺癌的生存率曲线分布不同,放化疗联合治疗的效果较好(因为A组死亡比大,表示B组生存率曲线高)。

对于分组资料,计算公式完全相同,只是表中d、n甲、n乙、n分别表示对应于各观察时间区间的比较组的死亡人数、甲组校正人数、乙组校正人数、合计校正数。

对数秩检验也可用于三组生存曲线的比较。

由对数秩检验过程可知,若每一时点A组死亡率都高一点(生存率低一点),则检验结果必然为A不同于B。因此,在比较的两条生存率曲线无交叉时,直接用对数秩检验是合适的。反之,就需进一步分析原因,了解是否存在混杂因素的影响。

例4 为比较A、B两治疗方案对某病的治疗效果,

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解 第二章 统计调查与整理 1. 见教材P402 2. 见教材P402-403 3. 见教材P403-404 第三章 综合指标 1. 见教材P432 2. %86.12270 25 232018=+++= 产量计划完成相对数 3. 所以劳动生产率计划超额%完成。 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本,未完成计划,还差%完成计划。 5. %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数;所以计划完成数实际完成数标因为,计划完成程度指%105%103= = 1.94%%94.101% 103% 105,比去年增长解得:计划完成数==()得出答案)将数值带入公式即可以计算公式, 上的方程,给大家一个很多同学都不理解也可以得出答案,鉴于(根据第三章天)。 个月零天(也即是个月零(月)也就是大约)(上年同季(月)产量达标季(月)产量超出计划完成产量 达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式:提前多出万吨,比计划数万吨产量之和为:季度至第五年第二季度方法二:从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零 年第四季度为止提前(天),所以截止第五)(根据题意可设方程:万吨完成任务。天达到五年第二季度提前万吨。根据题意,设第万吨达到原计划,还差万吨产量之和为:季度至第五年第一季度方法一:从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

五、其它30分(3~5道题目,每题6~10分) 随访资料的生存分析: 【06真题】 九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。记录的资料如下:(5分) 1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2、判断上述随访时间哪些属截尾值?写出观察对象编号。 【05真题、04真题、03真题】 四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。资料如下表:(8分) 16例某种癌症病人随访资料 病人号治疗组分组日期终止日期是否该病死亡截尾值 1 A 68.05.1 2 68.05.30 Y 2 B 70.10.18 71.04.16 Y 3 B 69.02.12 70.11.06 Y 4 A 72.01.30 74.05.31 仍存活 5 A 73.11.11 74.01.02 Y 6 B 68.03.12 73.03.30 车祸死亡 7 A 69.01.06 69.01.04 Y 8 A 69.02.08 70.02.08 迁出 9 B 71.05.02 71.11.13 Y 10 B 68.03.08 68.05.23 Y 11 B 73.12.12 74.02.20 Y 12 A 74.05.01 74.05.09 Y 13 B 72.07.02 72.07.15 Y 14 B 68.12.18 74.04.31 失访 15 A 69.01.01 74.05.31 仍存活 16 B 73.09.02 73.09.20 Y 1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2.判断上述随访时间哪些属截尾值,写出观察对象编号。 3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法? 4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示? 【答案】jszb 0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。 1、本资料并未按时间分组,实际上是A、B两个治疗组的未分组资料。 一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。 但研究目的不同,时间单位不同,使用恰当的时间单位。 本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小, 因此,本资料随访时间单位以月较合适? 2、产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。 因此,编号4、6、8、14、15观察对象属截尾值。

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

《统计学》计算题型与参考答案

《统计学》计算题型 (第二章)1.某车间40名工人完成生产计划百分数(%)资料如下:9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求: (1)编制分配数列;(4分) (2)指出分组标志及其类型;(4分) (3)对该车间工人的生产情况进行分析。(2分) 解答: (1)

(2)分组标志:生产计划完成程度 类型:数量标志 (3)从分配数列可以看出,该计划未能完成计划的有4人,占10%,超额完成计划在10%以内的有22人,占55%,超额20%完成的有7人,占17.5%。反映该车间,该计划完成较好。 (第三章)2.2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个农贸市场农产品的平均价格较高?(8分)并分析说明原因。(2分) 解答: (1)x 甲=∑∑m x m 1=24 8.41 6.36.314.24.21246.34.2?+?+?++=30/7=4.29(元) x 乙= ∑∑f xf = 1 241 8.426.344.2++?+?+?=21.6/7=3.09(元) (2)原因分析:甲市场在价格最高的C 品种成交量最高,而乙市场是在最低的价格A 品种成交量最高,根据权数越大其对应的变量值对平均数的作用越大的原理,可知甲市场平均价格趋近于C ,而乙市场平均价格却趋近于A ,所以甲市场平均价格高于乙市场平均价格。

统计学计算题和标准答案

企业型号价格(元/台)甲专卖店销售额(万元)乙专卖店销售量(台) A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 日加工零件数(件)60以下60—70 70—80 80—90 90—100 工人数(人) 5 9 12 14 10 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案:2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y)x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年,按照设定的方法,到2016年应该是5 y=345.6+14.4*5=417.6元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数;

统计学练习题及答案

2014统计学练习题及答案 一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高4%,则劳动生产率的任务仅实现一半。(错) 2、在统计调查中,调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。(对) 6.上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季.的影响使实际值高于趋势值,(对) 7.特点是“先对比,后综合。”(错 8.隔相等的时点数列计算平均发展水平时,应用首尾折半的方法。( 错) 9.均数指数的计算特点是:先计算所研究对象各个项目的个体指数;然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中,组数等于数量标志所包含的变量值的个数。(对) 12.中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 14.变异度指标越大,均衡性也越好。( 对) 15.于资料的限制,使综合指数的计算产生困难,就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。(对) 17.数虽然未知,但却具有唯一性。(错) 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的(错) 19.以经常进行,所以它属于经常性调查(错) 20.样本均值来估计总体均值,最主要的原因是样本均值是可知的。()答案未 21.工业普查中,全国工业企业数是统计总体,每个工业企业是个体。(错) 22.标志的承担者,标志是依附于个体的。(对) 23.志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。(错) 24.标和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 25.计指标都是用数值表示的,所以数量标志就是统计指标。(错) 26.标及其数值可以作为总体。(错) 27.润这一标志可以用定比尺度来测定。(错) 28.统计学考试成绩分别为55分,78分,82分,96分,这4个数字是数量指标。(错) 29.术学派注重对事物性质的解释,而国势学派注重数量分析。(错) 30.是统计研究现象总体数量的前提。(对) 31.析中,平均发展速度的计算方法分水平法和方程两种。(错) 32.数值越大,说明相关程度越高:同理,相关系数的数值越小,说明相关程度越低(对 33.志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(错) 34.度具有另外三种尺度的功能。(对) 35.民旅游意向的问卷中,“你最主要的休闲方式是什么?”,这一问题应归属于事实性问题

随访资料的生存分析

第十五章生存分析 第一节生存资料的特点 前面有关章节介绍了多种定量资料和定性资料的统计分析方法。下面是一个临床实例,请思考该资料的特点,应选用何种统计方法进行统计分析较为合适。 某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,随访时间(月)如下(带“+”号的数据表示患者至少存活了多少个月)。试比较化疗和放化疗联合治疗肺癌的疗效是否有差别。 化疗组1,2,3,5,6,9+,11,13,16,26,37+ 放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+ 该医生的研究目的是评价化疗和放化疗联合治疗两种临床治疗措施的疗效。临床治疗措施的疗效评价,一方面要看治疗措施所引起的“结局”(该资料中,即为“生存”或“死亡”),另一方面还要看得到这种结局所经历的时间长短(该资料中,即为患者接受化疗或放化疗联合治疗后存活多长时间,或患者接受化疗或放化疗联合治疗后多长时间发生死亡)。显然,结局为“生存”且存活时间越长,其疗效就越好。反之,结局为“死亡”且存活时间越短,其疗效就越差。结局虽然都是“死亡”,但能够使患者生存时间越长的临床治疗措施的疗效就越好。 从前面几个章节所学习的内容来看,可以考虑的方法有t检验、方差分析或秩和检验。但t检验和方差分析都要求所比较的两个样本来自正态分布总体,而该资料两个组中均有带“+”号的数据,其提供的信息不完整,如“9+”表示该患者至少存活了9个月,但准确死亡时间不清楚,这就导致两个样本的总体分布不明确,不满足t检验和方差分析的应用条件。退一步说,即使该资料满足t检验和方差分析的应用条件,但由于这两种方法均只是比较患者接受化疗和放化疗联合治疗后的生存时间有无差别,并未分析两种治疗措施的结局有无差别,因而达不到综合评价这两种治疗措施疗效的目的。因此,不宜采用t检验或方差分析。秩和检验虽不对样本所来自的总体作严格限定,但它也只能比较患者接受两种治疗措施后的生存时间有无差别,并不能分析两种治疗措施的结局有无差别,因而也达不到综合评价这两种治疗措施疗效的目的。因此,该资料也不适宜采用秩和检验。 那么,能否将其转变为定性资料后采用定性资料的统计分析方法进行分析?

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

(完整版)统计学复习题答案

一、主要术语 描述统计 ....:研究数据收集、处理和描述的统计学分支。 推断统计 ....:研究如何利用样本数据来推断总体特征的统计学分支。 观测数据 ....:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。 实验数据 ....:在实验中控制实验对象而收集到的数据。 异众比率 ....:非众数组的频数占总频数的比率。 四分位差 ....:也称为内距或四分间距,上四分位数与下四分位数之差. 。 显著性水平 .....:假设检验中发生第Ⅰ类错误的概率,记为 P-.值.:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。 拟合优度检验 ......:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体是否服从某种分布。一般地,可以用于任何假设的概率分布。 独立性检验 .....:检验两个分类变量之间是否存在相关关系。 多个总体比例差异检验 ..........:检验多个总体比例是否都相等。 消费者物价指数 .......:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。 生产者价格指数 .......:反映企业产品出厂价格变动趋势和变动程度的一种相对数。 股票价格指数 ......:是反映某一股票市场上多种股票价格变动趋势的一种相对 二.简答和计算P41—P42: 2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。 2.6你认为应当如何控制调查中的回答误差? 回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。 调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。 2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。 2.8如何设计调查方案? 第一步:确定调查目的 第二步:确定调查对象和调查单位 第三步:确定调查项目和调查表 第四步:调查表格和问卷的设计 第五步:确定调查时间和调查方法等

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学计算题答案(课后)

9. (1)工人日产量平均数: 45 60 55 140 65 260 75 150 85 50 660 =64.85(件 / 人) (2)通过观察得知,日产量的工人数最多为 260人,对应的分组为 60~70,则众数在60~70这一组中,则众数的取值范围在 60~70 之间。 利用下限公式计算众数: n x f i i i 1 n f i i 1 众数M ° (f m f m 1 )

=65.22 (件) (3)首先进行向上累计,计算出各组的累计频数: 10.(1)全距 只=最大的标志值一最小的标志值 =95—55=40 x f ⑵平均日装配部件数x ―」 55 4 65 12 75 24 85 6 95 4 50 =73.8 (个) n _ X i x f i i 1 n 260 140 (260 140 (260 15C) (70 60) 660 1 2 330.5 比较各组的累计频数和 330.5,确定中位数在60~70这一组 利用下限公式计算中位数: ~~2- S m 1 M e L 壬 60 660 200 2 (70 60) 65(件) 260 ⑷分析:由于x M e M o , 所以该数列的分布状态为左偏。 平均差 A.D

f i i 1 |55 73.8 4 |65 73.8| 12 |75 73.8| 24 |85 73.8 6 |95 73.8 4 4 12 24 6 4 =7.232 (件)

⑷标准差系数V -100% x 9.93 73.8 13.46% X i f i 30 4 50 25 70 84 90 126 110 28 267 =81.16 (件) 乙企业的平均日产量X 乙 xf j 30 2 50 8 70 30 90 42 110 18 2 (X i X) f i i 1 n f i i 1 2 2 2 2 2 (55 73.8) 4 (65 73.8) 12 (75 73.8) 24 (85 73.8) 6 (95 73.8) 4 ⑶方差 4 12 24 6 4 =98.56 (个) 标准差 n (x x)2 f i i 1 n 、、98.56 9.93(件) 13. 甲企业的平均日产量x 甲

统计学教案习题17随访资料的生存分析

第十七章 随访资料的生存分析 一、教学大纲要求 (一)掌握内容 1.生存分析基本概念 生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。 2.估计生存率的方法:Kaplan-Meier 法、寿命表法。 (二)熟悉内容 1.生存曲线、半数生存期。 2.生存资料的基本要求。 3.两生存曲线的比较的对数秩检验。 (三)了解内容 Cox 回归模型。 二、教学内容精要 (一)生存分析中的基本概念 1.生存时间(survial time )指观察到的存活时间,如表11-1中t 分别为360,990,1400,1800天。生存时间有两种类型: (1)完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。 (2)截尾数据(censored data )由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+ 天。 表11-1 4例鼻咽癌随访记录 患者序号 (男=1) 处理组号 开始日期 终止日期 (死=1) 存活天数 1 0 1 11/29/80 11/04/85 1 360 2 1 1 06/13/82 06/08/83 1 990 3 1 0 03/02/83 12/31/86 0 1400+ 4 0 08/04/83 04/10/86 1 1800 2.死亡概率与生存概率 (1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。年死亡概率的计算公式为q = 某年年初观察例数 某年内死亡数 ,若年内有截尾,则分母用校正人口数(校正人口

统计学练习题及答案

第一章导论练习题 1.单选题 (1)统计研究对象的特点包括(C)。 A、总体性 B、具体性 C 、总体性和具体性D、同一性 (2)下列指标中不属于质量指标的是( D )。 A、平均价格 B 、单位成本 C 、资产负债率 D 、利润总额 (3)下列指标中不属于数量指标的是(C)。 C 、资产报酬率D、A、资产总额 B 、总人口 人口增加数 (4)描述统计和推断统计的之间的关系是( A )。 A、前者是后者的基础 B、后者是前者的基础 C 、两者没有关系 两这互为基础(5)一个统计总体(D ) A、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 (6)若要了解某市工业生产设备情况,则总体单位是该市(D) A每一个工业企业 B 每一台设备 C 每一台生产设备 D 每一台工业生产设备 (7)某班学生数学考试成绩分别为65 分71 分、80 分和87 分,这四个数字是(D) A指标 B 标志C变量 D 标志值 (8)下列属于品质标志的是(B) A 工人年龄 B 工人性别C工人体重 D 工人工资 9)现要了解某机床厂的生产经营情况,该厂的产量和利润是( D )A 连续变量B 离散变量C 前者是连续变量,后者是离散变量者是连续 变量(10)劳动生产率是(B ) A 动态指标 B 质量指标 C 流量指标 D 强度指标 (11)统计规律性主要是通过运用下述方法整理、分析后得出的结论( B )D、 D 前者是离散变量,后

欢迎下载 2 A 统计分组法 B 大量观察法 C 综合指标法 D 统计推断法 (12) (C ) 是统计的基础功能 A 管理功能 B 咨询功能 C 信息功能 D 监督功能 (13) ( A )是统计的根本准则,是统计的生命线 A 真实性 B 及时性 C 总体性 D 连续性 (14)统计研究的数量是( B ) A 抽象的量 B 具体的量 C 连续不断的量 D 可直接相加的量 C ) (15 )数量指标 般表现为( A 平均数 B 相对数 C 绝对数 D 众数 (16 )指标是说明总体特征的,标志是说明总体单位特征的,所以( A ) A 指标和标志之间在一定条件下可以相互转换 B 指标和标志都是可以用数值表示的 C 指标和标志之间是不存在关系的 D 指标和标志之间的关系是固定不变 的 2. 多选题 (1) 统计学发展过程中经历的主要学派有( ABCD )。 (2) 下列标志中属于品质标志的有 ( AC )。 (3) 下列指标中属于质量指标的有( ABD )。 (4) "统计”一词含义有( BCD )。 A 统计研究 B 统计工作 C 统计资料 3?判断题 1、 现代统计学的核心是描述统计学。 ( F ) 2、 描述统计学是推断统计学的基础。 ( T ) 3、 统计指标可以分成数量指标和质量指标。 ( T ) 4、 所有标志都可以用数量表现。 ( F ) A 政治算术学派 B 国势学派 C 数理统计学派 D 社会统计学派 A 企业的经济类型 B 劳动生产率 C 企业所属的行业 D 企业的负债总额 A 平均亩产 数 B 人均钢产量 C 国民生产总值 D 存货周转次 D 统计学

统计学计算题及答案

1002 1050 1 ■ 1050 1020 汇2 = 1032 (人) 上半年平均人数: 1002 1050 1 1050 1020 2 1020 1008 3 二 1023 计算题 1 .某公司某年9月末有职工250人,10月上旬的人数变动情况是:10月4日新招 聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍, 同日又有3名职 工辞职离 岗,9日招聘7名营销人员上岗。试计算该公司 10月上旬的平均在岗人数。 af 250 3 262 2 258 2 252 1 259 2 答案1 . a 256 送 f 3+2+2+1+2 要求:⑴具体说明这个时间序列属于哪一种时间序列。 (2)分别计算该银行2001年第一季度、第二季度和上半年的平均现金库存额。 1)这是个等间隔的时点序列 (答案: 3° - a , - a 2,a 3 亠,亠 a n 」-3n 2 - 2 n 第一季度的平均现金库存额: 500 520 + 480 +450 + 2 2 3 第二季度的平均现金库存额: 二480 (万元) 500 580 550 600 2 2 3 上半年的平均现金库存额: = 566 .67(万元) 500 580 + 480 + …+550 +600 + 2 -------------------------------------------- J 二 52 3 .33,或 = 480 566.67 = 523.33 6 答:该银行2001年第一季度平均现金库存额为 480万元,第二季度平均现金库存额为 566.67 万元,上半年的平均现金库存额为 523.33万元. 3某单位上半年职工人数统计资料如下: 要求计算:①第一季度平均人数;②上半年平均人数 答案:第一季度平均人数 2 12 3

统计学计算题和答案精编版

统计学计算题和答案 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

三个企业生产的同一型号空调在甲、乙两个专卖店销售,有关资料如下: 企业型号价格(元/ 台) 甲专卖店销售额 (万元) 乙专卖店销售量 (台) A250050.0340 B3400115.6260 C4100106.6200 合计—272.2— 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性?

60以下60—7070—8080—9090—100日加工零件数 (件) 工人数(人)59121410 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。 年份200920102011201220132014 87431062711653147941580818362 GDP(亿 元) 答案:

年平均增长速度:100%100%22.9% x-== 四,某百货公司2010—2014年的商品销售额资料如下: 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案: 2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y) x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4

生存分析

生存分析 第一节 Life Tables过程 14.1.1 主要功能 14.1.2 实例操作 第二节 Kaplan-Meier过程 14.2.1 主要功能 14.2.2 实例操作 第三节 Cox Regression过程 14.3.1 主要功能 14.3.2 实例操作 在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。 第一节 Life Tables过程 14.1.1 主要功能 调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。 返回目录返回全书目录 14.1.2 实例操作

[例14-1]用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。 14.1.2.1 数据准备 激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2。 14.1.2.2 统计分析 激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击?钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击?钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击?钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

统计学计算题和答案

三个企业生产的同一型号空调在甲、乙两个专卖店销售,有关资料如下: 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 四,某百货公司2010—2014年的商品销售额资料如下: 答案: 2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y) x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计 1728 0 144 10 b=∑xy/∑x2=144/10= a=∑y/n=1728/5= y=+ 预测2016年,按照设定的方法,到2016年应该是5 y=+*5=元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 六、某商店三种商品的销售资料如下: 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数; 3、分析销售量和价格变动对销售额的影响程度和影响绝对额。 答案:总指数:(36*2+160*+100*)/(30*+140*+100*=% : 2.某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,

统计学计算题及答案

统计学计算题及答案 计算题 1(某公司某年9月末有职工250人,10月上旬的人数变动情况是:10 月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍,同日又有3名职工辞职离岗,9日招聘7名营销人员上岗。试计算该公司10月上旬的平均在岗人数。 af250,3,262,2,258,2,252,1,259,2,答案1( a,,,256f3,2,2,1,2, 2(2(某银行2001年部分月份的现金库存额资料如下: 日期 1月1日 2月1日 3月1日 4月1日 5月1日 6月1日 7月1日 500 480 450 520 550 600 580 库存额(万元) 要求:(1)具体说明这个时间序列属于哪一种时间序列。 ? (2)分别计算该银行2001年第一季度、第二季度和上半年的平均现金库存额。 (答案:1)这是个等间隔的时点序列 aa0naaaa,,,,?,,123,1n22a(2) ,n 第一季度的平均现金库存额: 500520,480,450,22a,,480(万元) 3 第二季度的平均现金库存额: 500580,550,600,22a,,566.67(万元) 3 上半年的平均现金库存额: 500580,480,?,550,600,480,566.6722a,,523.33,或,,523.33 62 答:该银行2001年第一季度平均现金库存额为480万元,第二季度平均现金库存额为566.67万元,上半年的平均现金库存额为523.33万元. 3某单位上半年职工人数统计资料如下:

时间 1月1日 2月1日 4月1日 6月30日 1002 1050 1020 1008 人数(人) 要求计算:?第一季度平均人数;?上半年平均人数 . 答案:第一季度平均人数: 1002,10501050,1020,1,,222a,,1032(人) 1,2 上半年平均人数: 1002,10501050,10201020,1008,1,,2,,3222a,,1023 1,2,3 1 4(某企业2001年上半年的产量和单位成本资料如下: 1 2 3 4 5 6 月份 2000 3000 4000 3000 4000 5000 产量(件) 73 72 71 73 69 68 单位成本(元) 试计算该企业2001年上半年的产品平均单位成本。 答案:某企业2001年上半年的产量和成本资料 月份 1 2 3 4 5 6 合计 产量(件)a 2000 3000 4000 3000 4000 5000 21000 单位成本(元)c 73 72 71 73 69 68 —总成本(万元)b=a×c 14.6 21.6 28.4 21.9 27.6 34.0 148(1 试计算该企业2001年上半年的产品平均单位成本。 解:产品总产量a,2000,3000,4000,3000,4000,50000,21000(件) , 产品总成本b,14.6,21.6,28.4,21.9,27.6,34.0,148.1(万元) , b总成本148.1万元,平均单位成本c ,,70.52(元/件)a总产量21000件,, 148.1,10000b6或:平均单位成本 c,,,70.52(万元)21000a

相关主题
文本预览
相关文档 最新文档