当前位置:文档之家› 统计学教案习题17随访资料的生存分析

统计学教案习题17随访资料的生存分析

统计学教案习题17随访资料的生存分析
统计学教案习题17随访资料的生存分析

第十七章 随访资料的生存分析

一、教学大纲要求

(一)掌握内容 1.生存分析基本概念

生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。 2.估计生存率的方法:Kaplan-Meier 法、寿命表法。 (二)熟悉内容

1.生存曲线、半数生存期。 2.生存资料的基本要求。

3.两生存曲线的比较的对数秩检验。 (三)了解内容 Cox 回归模型。

二、教学内容精要

(一)生存分析中的基本概念

1.生存时间(survial time )指观察到的存活时间,如表11-1中t 分别为360,990,1400,1800天。生存时间有两种类型:

(1)完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。

(2)截尾数据(censored data )由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+天。

表11-1 4例鼻咽癌随访记录

患者序号

性别 (男=1)

处理组号

开始日期 终止日期 结局 (死=1)

存活天数 1

0 1 11/29/80 11/04/85 1 360 2 1 1 06/13/82 06/08/83 1 990 3 1 0 03/02/83 12/31/86 0 1400+ 4 0

08/04/83

04/10/86

1

1800

2.死亡概率与生存概率

(1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。年死亡概率的计算公式为q =

某年年初观察例数

某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年

初人口数-

2

1截尾例数)。

这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。

(2)生存概率(survival probability )与死亡概率相对应,记为p ,表示在某单位时段开始时存活的个体到该时段结束时仍存活的机会大小。年生存概率的计算公式为

=

-=q p 1某年年初人口数

某年活满一年人数,若年内有截尾,也要用校正人口数。

(二)生存率的Kaplan-Meier 法与寿命表法估计 1.生存率

(1)生存率(survival rate ) 指病人经历k t 个单位时间后仍存活的概率,记为)(k t S 。若无截尾数据,则

)(k t S ==

≥)(k t T P 观察总例数

时刻仍存活的例数

k t (11-1)

其中T 为病人的存活时间。如果含有截尾数据,分母就必须分时段校正,故此式一般不能直接应用。

(2) 生存率估计的概率乘法原理

假定病人在各个时段生存的事件独立,生存概率为k p p p ,,,21 ,则应用概率乘法得生存率估计的应用公式为

)(k t S =k k p p p t T P 21)(=≥ (11-2) 若式中k p p p ,,,21 用校正人数估计,便可处理截尾数据。

生存概率与生存率在意义上差别很大,前者是单个时段的概率,后者是从0至k t 多个时段的累积结果。

(3) 生存曲线(survival curve) 指将各个时点的生存率连接在一起的曲线图。 (4) 半数生存期(median survival time ) 表示恰好有50%的个体可活这么长时间。 2.生存率的估计方法

(1)乘积极限法(product-limit method ) 直接用概率乘法原理估计生存率(不分组),由Kaplan-Meier 于1958年提出,因而又称Kaplan-Meier 法。这是一种非参数法,主要用于小样本,也适用于大样本。其生存曲线是左连续的阶梯形曲线。 (2)寿命表法(life-table method ) 当样本例数足够多时,乘积极限法可按时间分组计算,这就是寿命表法,实际上是乘积极限法的一种近似。其生存曲线呈折线形。 (三)两样本生存曲线的比较——对数秩检验

对数秩检验(log-rank test )用于两样本生存曲线的比较,其零假设为两总体生存曲线相同,基本思想是如果零假设成立,根据不同日期两种处理的期初人数和死亡人数,计算各种处理在各个时期的理论死亡数。若零假设成立,则实际死亡数与理论死亡数不会相差太大,否则应认为零假设不可能成立,两条生存率曲线差异有统计学意义。

对数秩检验统计量(近似法)为:

=-=

m

k k

k k T T A 1

2

2

)

,1-=m υ (11-3)

其中k A 和k T 分别是第k 组死亡的实际数和理论期望数。在0H 成立的条件下,统计量2

χ服从

自由度为1-m 的2χ分布,m 为组数,据2

χ作出是否拒绝0H 的决定。

(四)Cox 回归模型

Cox 回归是生存分析中最重要的方法之一,其优点是适用范围很广和便于做多因素分析。

Cox 回归假定病人的风险函数为

)e x p ()()(22110p p X b X b X b t h t h +++= (11-4) 其中)(t h 为风险函数,又称风险率或瞬间死亡率,)(0t h 为基准风险函数,是与时间有关的任意函数,b X ,分别是观察变量及其回归系数。英国统计学家Cox D R 提出了参数i b 的估计和检验方法,故称为Cox 回归。

三、典型试题分析

(一)单项选择题

1.生存分析的效应变量是 ( )。

A .正态的和方差齐性的

B .生存时间和结局变量

C .生存时间

D .结局变量

答案:B

[评析] 本题考点:生存分析的概念

生存分析是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,所以它的应变量有两个,即生存时间和结局。

2.随访资料做生存分析的条件为( )。

A .有一定的例数

B .有一定的死亡数

C .死亡比例不能过小

D .自变量取值不随时间变化 答案:B

[评析] 本题考点:生存资料的基本要求

生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不能太少(≧30);③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。所以最佳答案应选B 。

3.Cox 回归风险率( )。

A .等于一个常数

B .服从某种分布规律

C .等于基准函数乘上一个比例因子

D .适用于任意肿瘤资料 答案:C

[评析] 本题考点:Cox 回归模型的特点及应用

首先,用于Cox 回归模型分析的资料必须满足生存资料的基本要求,因此任意肿瘤资料不一定满足此要求,排除D 。Cox 回归风险函数中因)(0t h 未定义,所以不知道风险在病人与病人之间的差别和风险随时间变化的具体分布,排除A ,B 。所以正确答案为C ,从风险回归函数的定义式也可看出。

4.采用log-rank 检验分析肺癌发病资料,其中吸烟、慢性支气管炎2个因素都有统计学意义,由此可认为( ):

A .吸烟与肺癌有因果联系

B .慢性支气管炎与肺癌有因果联系

C .2个因素与肺癌有因果联系

D .以上都不对 答案:D

[评析] 本题考点:模型中的变量如何选择取舍

选入模型的变量是统计学上的有关变量,不一定都与肺癌有因果关系,其中某些可能只

有伴随关系而已;未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或实验中对该因素进行了控制而引起的。所以正确答案选D 。

5.根据表11-1中的存活时间,试用Kaplan-Meier 法估计生存曲线。

[评析] 本题是考察对乘积极限法的应用情况,此法应用普遍,应熟练掌握。具体解法见表11-2。

表11-2 乘积极限法估计生存率计算表

t

2 990

3 1 31 2 (43)(2)=0.50 0.2500

参照表11-2,计算步骤为:

1.列出序号:k =1,

2,...(第1列);

2.死亡时间排队:将存活时间t (完全数据)从小到大顺序排列,重复数据只列一次, 截尾数据(如1400)+不列入(第2列);

3.求出t 时刻期初例数n :即存活时间大于或等于t 的例数(含死者)(第3列); 4.列出t 时刻的死亡数d :即死亡时间为t 的例数(第4列); 5.求出t 时刻的死亡概率:(第5列); 6.求出t 时刻的生存概率:(第6列); 7.分别计算生存率及其标准误;(第7、8列); 8

四、习题

(一)名词解释

1.生存分析

2.生存时间

3.完全数据

4.截尾数据

5.死亡率

6.死亡概率

7.生存概率

8.生存率

(二)单项选择题

1.Cox回归的自变量( )。

A.必须服从正态分布和方差齐性B.必须是计量资料

C.可以是计量资料或分类资料D.无任何条件

2.生存分析中的生存时间为( )。

A.出院至失访的时间B.手术至失访的时间

C.观察开始至终止的时间D.观察开始至失访的时间3.关于膀胱癌化疗的随访资料做生存分析,可当作截尾值处理的是( ):A.死于膀胱癌B.死于意外死亡

C.死于其它肿瘤D.b,c都是

(三)简答题

1.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?

2.生存分析可用于发病资料的分析吗?请举例说明。

3.生存时间能计算平均数、标准差吗?

4.Cox回归可估计参数,故属于参数方法?

(四)计算题

1.表11-3第2-4列是296例肝癌患者的生存数据,试作生存分析并绘图示之。

2.某院用甲、乙两疗法组治疗急性黄疸性肝炎,随访十年得资料如下:

甲疗法组12,25,50+,68,70,79+,83+,91+,114+,114+,

乙疗法组1,1,9,17,21,25,37,38,58,72+,73

比较两疗法的生存期(月)有无差别。

五、习题答题要点

(一)名词解释

1.生存分析:生存分析(survival analysis)是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。

2.生存时间:生存时间(survival time)指观察到的存活时间。

3.完全数据:完全数据(complete data)指从起点至死亡所经历的时间,即死者的存活时间。

4.截尾数据:由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得

部分病人不能随访到底,称之为截尾。从起点至截尾所经历的时间,称为截尾数据(censored data )。

5. 死亡率:某年内死亡例数与年中观察例数之比称为死亡率(mortality rate )。 6. 死亡概率:死亡概率(mortality probability )是指某年内死亡例数与年初观察例数之比,若年内有截尾,分母用校正人口数。

7. 生存率:生存率(survival rate )指病人经历k t 个单位时间后仍存活的概率,即k t 时刻仍存活的例数与观察总例数之比。

8.生存概率:生存概率(survival probability )表示在某单位时段开始时存活的个体到该时段结束时仍存活的机会大小,它是某年活满一年人数与年初观察例数之比,若年内有截尾,分母用校正人口数。

(二)单项选择题 1.C 2.C 3.D (三)简答题

1.当作截尾数据处理。

2.可用于慢性病的发病资料分析。

3.如果此资料所包含的数据都是完全数据,可以计算均数和标准差(但可能因资料非正态而没有实际意义),若数据中包含截尾数据,则不可以计算均数和标准差。

4.属于半参数模型(因0()h t 未定义)。 (四) 计算题

1.参照表11-3,列表计算。

表11-3 寿命表法估计296例肝癌患者生存率计算表

-2c ⑴

(4)

(5)

(6)

(7)

(8)

(9) (10)

1

0~ 94 10 296 291.0 0.3230 0.6770 0.6770 0.0274 2 1~ 74 15 192 184.5 0.4011 0.5989 0.4055 0.0294 3 2~ 22 10 103 98.0 0.2245 0.7755 0.3144 0.0285 4 3~ 22 6 71 68.0 0.3235 0.6765 0.2127 0.0263 5 4~ 5 5 43 40.5 0.1235 0.8765 0.1864 0.0255 6 5~ 6 6 33 30.0 0.2000 0.8000 0.1492 0.0245 7 6~ 4 1 21 20.5 0.1951 0.8049 0.1201 0.0237 8 7~ 2 1 16 15.5 0.1290 0.8710 0.1046 0.0230 9 8~ 3 2 13 12.0 0.2500 0.7500 0.0784 0.0217 10 9~ 2 0 8 8.0 0.2500 0.7500 0.0588 0.0202 11 10~ 2 2 6 5.0 0.4000 0.6000 0.0353 0.0177 12 11~ 2 2 2

2.0 1.0000 0.0000 0.0000 0.0000

计算方法和步骤为:

(1)列出序号:k =1,2,...(第1列); (2)求校正期初人数:0n n c =-2c (第6列); (3)计算死亡概率:n d q =(第7列);

(4)计算生存概率:q

p

-=1(第8列);

(5)计算生存率及其标准误:(第9、10列)。 (6)绘制生存曲线。

a t

图11-2 寿命表法生存曲线

2.该题用log-rank 检验,其计算步骤为:

(1)检验假设:0H :两总体生存率曲线相同;1H :两总体生存率曲线不同;05.0=α。 (2)计算出0A =4,1A =10,0T =8.6694,1T =5.3306. (3)计算检验统计量

2

χ=6052.63306

.5)

3306.510(6694

.8)

6694.84()

(2

2

1

2

=-+

-=

-∑

=m

k k

k k T T A

(4)确定P 值作结论:据自由度为1的2

χ分布查表得P <0.05,按05.0=α水准拒绝0H ,

接受1H ,故可认为两总体生存率曲线不同,甲组疗法生存期长。

(骆福添 杜晓晗)

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学分析计算题_与解析

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

2014年7月高等教育自学考试 00974《统计学原理》试题及答案

2014年7月高等教育自学考试 统计学原理试卷及答案 (课程代码 00974) 一、单项选择题(本大题共20小题,每小题1分,共20分) 1.构成统计总体的每一个别事物,称为 C A .调查对象 B .调查单位 C .总体单位 D .填报单位 2.对事物进行度量,最精确的计量尺度是A A .定比尺度 B .定序尺度 C .定类尺度 D .定距尺度 3.《中华人民共和国统计法》对我国政府统计的调查方式做的概括中指出,调查方式的主体是C A .统计报表 B .重点调查 C .经常性抽样调查 D .周期性普查 4.是非标志的成数p 和q 的取值范围是D A .大于零 B .小于零 C .大于1 D .界于0和1之间 5.在经过排序的数列中位置居中的数值是A A .中位数 B .众数 C .算术平均数 D .平均差 6.确定中位数的近似公式是A A .d f S f L m m ?-+ -∑1 2 B .d L ??+??+ 2 11 C .∑∑? f f x D . ∑-)(x x 7.反映现象在一段时间内变化总量的是B A .时点指标 B .时期指标 C .动态指标 D .绝对指标 8.重置抽样与不重置抽样的抽样误差相比A A .前者大 B .后者大 C .二者没有区别 D .二者的区别需要其他条件来判断 9.如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数A A .多一些 B .少一些 C .可多可少 D .与总体各单位差异无关 10.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是D A .样本数目 B .样本可能数目 C .总体单位数 D .样本容量 11.在12个单位中抽取4个,如果进行不重置抽样,样本可能数目M 为B A .4 12 B . ! 8!4! 12 C .12×4 D .12 4 12.方差是各变量值对算术平均数的A A .离差平方的平均数 B .离差平均数的平方根 C .离差平方平均数的平方根 D .离差平均数平方的平方根

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1、设某地区有200家独立核算得工业企业,要研究这些企业得产品生产情 况,总体就是( )。 A、每一家工业企业 B、200家工业企业 C、每一件产品 D、200家工业企业得全部工业产品 2、有600家公司每位职工得工资资料,如果要调查这些公司得工资水平情 况,则总体单位就是( )。 A、600家公司得全部职工 B、600家公司得每一位职工 C、600家公司所有职工得全部工资 D、600家公司每个职工得工资 3、一个统计总体( )。 A、只能有一个指标 B、可以有多个指标 C、只能有一个标志 D、可以有多个标志 4、以产品等级来反映某种产品得质量,则该产品等级就是( )。 A、数量标志 B、品质标志 C、数量指标 D、质量指标 5、在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数就是( )。 A、变量值 B、变量 C、指标值 D、指标 6、年龄就是( )。 A、变量值 B、连续型变量 C、离散型变量 D、连续型变量,但在实际应用中常按离散型处理 7、人口普查规定统一得标准时间就是为了( )。 A、登记得方便 B、避免登记得重复与遗漏 C、确定调查得范围 D、确定调查得单位 8、以下哪种调查得报告单位与调查单位就是一致得( )。 A、职工调查 B、工业普查 C、工业设备调查 D、未安装设备调查 9、通过调查大庆、胜利、辽河等油田,了解我国石油生产得基本情况。这 种调查方式就是( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 10、某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定就是( )。 A、调查时间 B、登记期限 C、调查期限 D、标准时间 11、统计分组得关键问题就是( )。 A、确定分组标志与划分各组界限 B、确定组距与组中值

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

统计学原理练习题及答案

统计学原理练习题及答案 2007-12-7 9:32:24 阅读数:6162 《统计学原理》综合练习题 一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。() 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数( ) 10、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。() 15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。() 16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。() 22、施肥量与收获率是正相关关系。() 23、计算相关系数的两个变量都是随机变量() 24、利用一个回归方程,两个变量可以互相推算()

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

统计学原理-计算题

《统计学原理》 计算题 1.某地区国民生产总值(GNP)在1988-1989年平均每年递增15%,1990-1992年平均每年递增12%,1993-1997年平均每年递增9%,试计算: 1)该地区国民生产总值这十年间的总发展速度及平均增长速度 答:该地区GNP在这十年间的总发展速度为 115%2×112%3×109%5=285.88% 平均增长速度为 111.08% == 2)若1997年的国民生产总值为500亿元,以后每年增长8%,到2000年可达到多少亿元? 答:2000年的GNP为 500(1+8%)13=1359.81(亿元) 2.某地有八家银行,从它们所有的全体职工中随机动性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断:(F(T)为95.45%,则t=2) 1)全体职工中有储蓄存款者所占比率的区间范围 答:已知:n=600,p=81%,又F(T)为95.45%,则t=2所以 0.1026% == 故全体职工中有储蓄存款者所占比率的区间范围为 81%±0.1026% 2)平均每人存款金额的区间范围 3.某厂产品产量及出厂价格资料如下表: 要求:对该厂总产值变动进行因素分析。(计算结果百分数保留2位小数) 答:①总产值指数 11 00500010012000604100020 104.08% 600011010000504000020 p q p q ?+?+? ==?+?+? ∑ ∑ 总成本增加量 Σp1q1-Σp0q0=2040000-1960000=80000(元)②产量指数

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

统计学原理第九章(相关与回归)习题答案

第九章相关与回归 一.判断题部分 题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。() 答案:× 题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。() 答案:√ 题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。() 答案:× 题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。() 答案:× 题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。() 答案:× 题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。() 答案:√ 题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。() 答案:×

题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。() 答案:× 题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。() 答案:√ 题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。() 答案:× 题目11:完全相关即是函数关系,其相关系数为±1。() 答案:√ 题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。() 答案× 二.单项选择题部分 题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。 A.相关关系 B.函数关系 C.回归关系 D.随机关系 答案:B 题目2:现象之间的相互关系可以归纳为两种类型,即()。 A.相关关系和函数关系 B.相关关系和因果关系

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t 检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可 用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。 下面是本人简单总结的常用方法的选择,可供读者参考。如有引用本图者,请注明引自《医学案例统计分析与SAS应用》一书,谢谢。

统计学原理例题分析一(20200920021933)

统计学原理例题分析(一) 一、判断题(把“V”或“X”填在题后的括号里) 1.社会经 济统计的研究对象是社会经济现象总体的各个方面。()参考答案:X 2.总体单位是标志的承担者,标志是依附于单位的。() 参考答案:“ 3?标志通常分为品质标志和数量标志两种。() 参考答案:“ 4.当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。() 参考答案:“ 5.调查方案的首要问题是确定调查对象。() 参考答案:“ 6.我国目前基本的统计调查方法是统计报表、抽样调查和普查。() 参考答案:“ 7.调查单位和填报单位在任何情况下都不可能一致。() 参考答案:X 8.按数量标志分组,各组的变量值能准确的反映社会经济现象性质上的差别。() 参考答案:X 9.在确定组限时,最大组的上限应低于最大变量值。() 参考答案:X 10.按数量标志分组的目的,就是要区别各组在数量上的差别。() 参考答案:X 11.离散型变量可以作单项式分组或组距式分组,而连续型变量只能作组距式分组。() 参考答案:2

12.对于任何两个性质相同的变量数列,比较其平均数的代表性,都可以采

用标准差指标。() 参考答案:X 13.样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。() 参考答案:“ 14.样本容量指从一个总体中可能抽取的样本个数。() 参考答案:X 15.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。() 参考答案:X 16.产量增加,则单位产品成本降低,这种现象属于函数关系。() 参考答案:X 17.在直线回归方程Y = a +bx中,b值可以是正的,也可以是负的。 () 参考答案:“ 18.回归系数b和相关系数丫都可用来判断现象之间相关的密切程度。 () 参考答案:X 19.平均指标指数是综合指数的一种变形。() 参考答案:X 20.序时平均数与一般平均数完全相同,因为它们都是将各个变量值的差异抽象化了。() 参考答案:X 二、单项选择题(从下列每小题的四个选项中,选出一个正确的,请将正确答案的序号填在括号内) 1 ?以产品的等级来衡量某种产品的质量好坏,则该产品等级是() A.数量标志 E.品质标志 C.数量指标 D.质量指标。

统计学原理第三章习题答案

第三章统计资料整理 一.判断题部分 1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(×) 2:统计分组的关键问题是确定组距和组数。(×) 3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。(×) 3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。(∨) 4:次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标志值在总体中所起的作用程度。(∨) 5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(×) 6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(∨) 7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(∨) 8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。(×) 9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。(×) 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(∨) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。(×) 二.单项选择题部分 1:统计整理的关键在( B )。 A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 2:在组距分组时,对于连续型变量,相邻两组的组限( A )。 A、必须是重叠的 B、必须是间断的 C、可以是重叠的,也可以是间断的 D、必须取整数 3:下列分组中属于按品质标志分组的是( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。 A、60---70分这一组 B、70---80分这一组 C、60—70或70—80两组都可以 D、作为上限的那一组 5:某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于( B )。 A、简单分组 B、复合分组 C、分析分组 D、结构分组 6:简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同

统计学原理例题分析及综合练习

统计学原理例题分析及综合练习 第一部分例题分析 一、判断 1.社会经济统计工作的研究对象是社会经济现象总体的数量方面。【√】 2.全面调查包括普查和统计报表。【×】 3.统计分组的关键是确定组限和组距。【×】 4.变异指标和平均指标从不同侧面反映了总体的特征,因而变异指标的数值越大则平均指标的代表性越高,反之平均指标的代表性越低。【×】 5.抽样极限误差总是大于抽样平均误差。【×】 6.根据样本各单位标志值或标志属性计算的综合指标称为统计量(样本指标)。【√】7.(甲)某产品产量与单位成本的相关系数是-0.8:(乙)产品单位成本与利润率的相关系数是-0. 95;因此,(乙)比(甲)的相关程度高。【√】 8.已知:工资(元)倚劳动生产率(千元)的回归方程为:y。=10+80x因此,当劳动生产率每增长1千元,工资就平均增加90元。【×】 9.在综合指数中,要求其同度量因素必须固定在同一时期。【√】 10.某产品产量在一段时间内发展变化的速度,平均来说是增长的,因此该产品产量的环比增长速度也是年年上升的。【×】 11.已知各期环比增长速度为3%、2%、7%和5%,则相应的定基增长速度的计算方法为【103%×102%×107%×105%】 -100%。【√】二、单选1.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是【C.每一件产品】。 2.对一个统计总体而言【D.可以有多个指标】。 3.在某班学生学习情况调查中【C.全班平均成绩是指标】。 4.全面调查与非全面调查的划分是以【C.调查对象所包括的单位是否完全来划分的】。 5.全国工业企业设备普查,全国每个工业企业是【D.填报单位】。 6.下列分组中哪个是按品质标志分组【B.半成品按品种分组】。 7.某市场销售洗衣机,2009年共销售60000台,年底库存50台。这两个指标是【C.前者是时期指标,后者是时点指标】。 8.反映抽样指标与总体指标之间可允许的误差范围的指标是【B.抽样极限误差】。 9.当所有的观察值y都落在直线yc=a+bx上时,则x与y之间的相关系数为【B.γ=1】。 10.某工厂今年一季度同去年一季度相比,产量提高了5%,产值增长了15%,则产品价格提高了【B.9.5%】。 11.某企业第一、第二季度和下半年的原材料平均库存额分别为l0万元、15万元和20万元,则全年平均库存额为【B.16. 25万元】。 三、多选 1.总体单位是总体的基本组成单位,是标志的直接承担者。因此【A.在国营企业这个总体下,每个国营企业就是总体单位 D.在全部工业产品这个总体下,每一个工业产品就是总体单位】 2.在全国人口普查中【B.每个人是总体单位 C.年龄是变量 E.具有大专以上文化程度的人数是指标】 3.有三个学生,其统计学原理成绩分别是60分、70分、80分。这三个数字是【C.数量标志表现 D.标志值 E.变量值】 4.要了解某市商业企业经营状况,则统计指标是【A.该市商业企业个数 B.该市商业职工数 D.该市商业企业销售额】 5.在对工业企业生产设备的调查中【B.工业企业的全部生产设备是调查对象 C.每台生产设备是调查单位 E.每个工业企业是填报单位】 6.在统计调查中【C.调查时限是调查工作起止的期限 D.抽样调查与典型调查的根本区

相关主题
文本预览
相关文档 最新文档