当前位置:文档之家› 统计学选择题判断题汇总(有答案)

统计学选择题判断题汇总(有答案)

统计学选择题判断题汇总(有答案)
统计学选择题判断题汇总(有答案)

二、判断题(每题1分,计10分,请填入或“ 了()

1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来;()

2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确;()

3、凡是离散型变量都适合编制单项式数列;()

4、任何变量数列都存在众数;()

5如果、' ,则变量分布为左偏;()

6、判定系数越大,估计标准误就越大;()

7、正相关是指两个变量的数量变动方向都是上升的;()

8统计的本质就是关于为何统计,统计什么和如何统计的思想;()

9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列;()

10、同度量因素在起到同度量的同时,还具有一定的权数作用。()

三r单皿选择理(母題丄分.计丄。分)

U统计学的硏究对象是()、

A.各种现歸的內在规祎

爪g■种珊象的数量万面

址廿括动过程

D,息休与祥本的关系

茁以产品的等级来种产品的屆屋好坏,则谦产品等簸是()”

?瀏量栢标Z虧量指标C、数量标志D、品危标志

头下到哪个变量不能乘用定比计量尺度9 ()°

4企业駆工人数

L.企业产品产量

C.企业捎售额

D、企业刑润额

4、最常用的统计调查方式是I),

氐、昔萱ti.重点调直C>抽样调萱1A科学推算

5.如黑计算算术平均数的所有夷星伍祁増协100.则方差(〕*

A.増)!□ 10D B、增加10000 C、不变 D.不詮确定

认雇如学生崗善试成绩月优秀、良好*中籌、及格和不圧格李表示■那么全斑成绩的水平盒低应该用卄么平均狡来说明¥ I )

Ar可臥用算术平均逊b只第煤数

B可以.用众数或中位数 6只能用中位散

九某企业眈12年的产值比凯連年增长了初风则年平均増长速度为()酿

‘7$ E、iT-lOO^ 、込8慚D,苗_10%沃当时期数列分析的目的侧童于研究某现象在昔时朗发展水平的累计总和B九应釆用[)方柱计車平物岌展速度。

入、算沖干均数「调和平均数 C.方程幫送 D.几何平均法

4某一时闾数外当时间变量"2乩,ri时,得到趨势方程为$ =玷亠7蛆

那么若取c=0, 2, 4, 6, 8, …时,方程中的〃将为()?

Cx

no

Dx 34

10x 同样冬的侍币支出少购买珈的商品.那么商詰价格指数是()。

X 、95.24%

氏 10596

S 105.25% D> 596 -s 判断题(每题1分.计10分)

1-5 x

x x

x

A /

6-

10 x x A /

x

三、单选题(毎题1分,计10分) 1-5 B D D C C 6-10

C D C

B C

一?中取走齐訖(符小題2分'耳20分J

1?在企业统计中,下列统计标志中属于幽蚩标志的杲(C )

A.

文化程度 B 、职业 C 、月工资 D 、行业

2下列慝于相对数的综合指标有(E 〉

As 匡民收入 B 、人均国民收入 6匡內生产净垃 D.设备台数

3有三个企11菸年利洞颔分别是5000万元、8COO 万元和3900万元,则这句话中有(B )个变童?

A. 0个 B 、两个

C. 1个

4?下列变量中展于连续型变:i 的是Q )

A.身高 3.产品件数

5下列各項中,属于时点指标的有(A >

A.咋冇碱

B.总收入

6. 典型调查足(B )确走调查里位旳

A 、随机

B 、主观

C 、随意

D 盲目

7- 总体标淮差未知时总体均值的假设检验要用到(A ):

A 、Z 统计重

B 、I 统计重

C 、统计量

D 、X 统计量 8- 把样本总体中全部里位数的集合称为(A )

As 样本 B 、小总体

C 、样本容量

D 、总体容量

9?概率的取值范围是p (D )

A 、大于1

B 、大于T

C 、小于1

D 、在0与1之间

10-算术平均数的离差之和等于(A )

A 、零

B 、1

C 、一 1

D 、2

二、多顷选择題(每小題2分,共10分。每題全部答对才给分,否则不计分〉 1.数18的计量尺度色括(

ABCD

):

A 、定类尺度

B 、定序尺度

C 、定距尺度

D 、定比尺度

E 、测量尺度

2?下列属于连续型变量的有 ( BE ):

A 、工人人数

B 、商品销售额

C 、商品庫存赖

D 、商品库存量

E 、总产值

Ax 144

D 、3个

D 、产品品种 D 、人均收入

C 、企辿人数

J 平均收入

3.

测量娈量离中趋势的指标有( ABE )

填报单位 D 、每台设备是调查单位 5. 下列平均数中,容易受数列中极端值影响的平均数有(ABC )

A.算术平均数 B 、调和平均数

Dx 中住数

Ex 众数

三.判断題(在正确答案后写“对”,在错误答案后写“错”。每小題1分,共10分)

is S 性别”是品盾标志。(对〉

2、 方差杲离差平方和与相应的自由度之比。(错)

3、 标准差系数是标准差与均值之比。(对〉 4算术平均数的离差平方和是一个最大值。(错)

5、 区间怙计就是直接用样本统计量代表总体参数。(错〉

6、 在假设检殓中,方差已知的正态总体均值的检验要计算Z 统计臺。(错〉

7、 统计方注包括推断统计方注和描述统计方法。(对)

3、在一做情况厂,当统计量上二壬二靠NO 吋,通常送扌罩“从作为爸择假设。(错) 9、 总体比例万差的埋论最大值是025 o (错) 10、 平均发展速度是増长董与基期水平的比值)(错〉

1、一个统计总体( 〉

Ax 只能有一个标志B 、只能有一个指标C 、可以有多个标志D 、可以有多个指标 2>调查某大学2000名学生学习惰况,则总休单位是< )

A 、2000名学生

B 、2000名学生的学习成绩 C.每一名学生D.每一名学生的学习成廣

3、 杲:地进疔區自世业企业经营情况鳴查,则调查刈象是( )。

A.该地孑有高业企业B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、 以下哪种调查笊报告单位与询查单位是一致的( )o

Ax 工业巷查 B 、工业设备调查 C 、职工调查 D.未安装设备调查

5、 某市进行工业企业生产设备普杳庚求在7月1日至7月10日全部谓杳完毕厕这一时间规定是( )

o

As 调查时间 B 、调查期限 C.标准时间 Ds 登记朗限 6、 草连续光量分为5 第一组为40--50,第二组为50一一60,第三组为60--70,第四纟且为70- -80,第壬组为80叹上,则( )

Ax 50在算一组,70在第四组 3、60在第三组,80在第五组 C 、70在隽四组,30在笫五组 D 、S0在笫四组,50在笫二组 7、 已知某局所厲12个工业企业的职工人数和工资总颍,要求计負该局取工的平均工资,应该采用(

As 简单算术平均法 B.加权算术平均法 6加权调和平均法 D 、几何平均法 8、 用水平法检查长期计划主成程皮,应規定( )

As 计划崩初应达到的水平 Rs 计划朗圭应达到的水平 J 计划歩中应达到的水平 D.整个计划期应达到的水平

Ax 极差

D 、众数

B 、平均差 E 、标准差

C 、几何平均数 4?在工业企业的设备调查中(

BDE

A.工业企业是调查对象

Bx 工业企业的所有设备是羽查对象 C 、每台设爸是 E 、每个工业企业是填报牟位

C 、几何平均数

9、某地区有10万人,共有80个医院。平均毎个医院要报务1250人,这个指标是()。

Ax平均指标B、逞度相对指标

C.总量拒标D、发展水平指标

10. 时间序歹忡,毎个指标数值可以相加的是( )。

As 相对数时间序列 E 、时期数列

C 、间断时点数列

D 、平均数时间序列

11 x 根据旳间序列用最小平方法配合二次曲线,所依据的样本资料的特点定< 〉。

As 时间序列中各期的逐亦増长臺大体相等 B.各期的二级曙长臺大体相等 C 、各務的环比发展速度大体相等 D 、各朗同比習长虽的大体相 12. 红星机械厂计划规定,今年甲产品的单位产品成本比云年降任4%,实际执行的结果降低了 5%,则该 产品单位成本條低计划完成程度的算式为( )>

5% 105%

A 、4%

B 、104%

95% C 、96%

D 、5%-4%

13、某企业报告朗产量比基期产量増长了 10%,生产费用増长了 8%,则其产品单位成本降诋了 ( ).

As 1. 8% B 、2% C 、20% D 、18%

14、 在不唾复抽样中,抽样单位数从5%启加到25%, 样平均误差( 人

A s 増加39.7% 堆加约3,5 C 、洞少约30 6 没有什么变化 15、 若某总体次数分布呈左阿分布丿则成立的有(_ 八 A 、x> A/r >M o B. X M Q >M 9 D 、以上都不对 lx ACD2 v ACDE3、BC4、ABCDE5、ADE 6、 二、多顷选择题(每题2分,共20分〉 1、下列各页中属于品质祢志的有(

。 ) Ax 性别 出年龄丄职芬 、D 民族占工资 2、从表式上看,统计表由哪些部分构成(

A 、总标题

B 、主词 C.纵栏标题

A 结构相对数 C ?比镀相对数

E ?计划完成相対数

4、下列统计弟标馬于总重走轿的罡(

Ax 工资总前

Bs 裔业网点宅戾 D 、人均国内生产总值 収进出口总荻

5s 走皋増长济寒孝于(

A ?定基发展速度-1

E ?定昱塔长量除咲最初水平

6s 早企业为了分祈本厂生产的两种产品产量的娈动情况'已计苜出产重指数为118.616 ,这一捋欝是 ( )o

A.综合指数 ?陀指数 .个体指数 D 数量命标揩数 ?匿莹击林挎数 7、彩响抽样俣差的因亲有< 〉。

A.帚有阳啓体还泉无阳总体

B.杲平均射怀杲成逊C 、是重亏油样还杲不重再捕样 D ?总体标W 变异程度大小E 、以上答耒都对 8. 下別正诵的说底自( )。 A. 类型抽样只存在组内拾匡谓差'不存在组司柏样误差。 B. 券犁揃样只存在组I 目柏样谆差,不有在组内紬样谆年。

C. 整擀伯轩只存衽器同汩杆误羞,不存在苗内泊杆误差。

D. 整務抱杆只有在番内}日样差'不冇在舒司伯样课差? 也洪型柚祥藍存在组內牠存误差,又存在组间扶存逞洼。 沢统计学的基本就念中< 〉。 X 标志是说明总体旦位特征能概念 ?冉林是说明总体特征的枇念 Us 可資的数莹标土定尖重 .舟棣和棣土都罡癸重 E 、馬虽牯标乍不爺冃铀倍表示的

ABD7. CDS^ AC 、ABC10、ACE

)。 3?横行标题

K 在和对約中.孑项和母顶可以5?检佶罟的吉(

)o

?比例相对数 ?动态相对敖

匚环比启快速度的连垂决 环比増长速度抑1后的连亟干再顶1

弋、对某市工业企业状况进行诩查」得到卩面资料,属于统计扌旨标的有< ” A.该市工泄企业实际产值対110亿元 B ?某企业为亏损企业 J 该市丁业企业观工人對80 FA D.某企业資全刹嗣浇为北% 哄该市工业企业机器台謝为7500台 三、判断題(毎赶1分』共⑷分)

I 、总体和蔥体虽桂拘关系鱼晶周宣开查的。( ) 氛徉才脂标是随矶交量。〔 > 3、 所选择单位的标志值占总体标志总重的纯大比例,这些单垃就是重点单位< ) 4、 综合指数和平均指数都是总指埶o ( )

九在简堕随机轴誓时,当里体单位數较事时.苦轴样比咧为6必则不重复曲样的抽样平均谋垂叱重复 I 由阵的拙样平均宦差犬约脑少40% < )。 趴对二同一娈量仆布.茸标准苯永远小干平均萍“( “

九在抽样调杳E-系境性误差是宙人為的周因造成的,因就应十尽童克瓶.( )

6. 以丄949茸恥为最衩处干,1迪F 年花为最未小千,计亘$肘黄产星的年平1匀发展谯度时,应当幵4S 次 爪()

9、各个套星值弓它们的算求平均数的商逹平方和等于最小信.( )

一、 单项选择题(每题1舒,共15?)

1、D

2、C3. B4.匚

3、E?、B7x AS . B9. BIO. Bl U 512 > C13 . A14 .匚 13、B 二、 多项选择题(毎题2分,共20分)

1 . ACD2. ACDE3. BC4. ABCDE5 . ADE 右、ABDT 、CDS. AC? v ABC10. ACE

三、半U 断题〔毎題【分,共10分〉

1 t X2x A /3. A /4. A /5. A /6. X7^ 加 4 丿1叭 X

统计基础判断题:1?统计着眼于事物的整体,不考虑个别事物的特征() 2?统计工作有前后之分,在时间中是不能交叉进行的() 3..指标都是用数值表示的,而标志则不能用数值表示?() 4?指标体系就是把若干个统计指标结合在一起而形成的体系() 5. 统计调查中的调查单位与填报单位有时一致 ,有时则不一致()

6. 结构相对指标一般只能在分组的基础上计算 ,且分子与分母不能互换.()

7. 随着研究目的的不同,总体单位总量有肯能变化为总体标志总量(

8. —个总体有多个总体单位总量和总体标志总量

.()

9. 一个总体有一个总体单位总量,有多个总体标志总量()、 10. 权数对加权算术平均数的影响取决与总体单位数的多少 .()、

1. x

2.x

3.x

4.v

5.v

6.x

7.v

8.v

9.v10.v

~学年第

学期期末考试试卷(1 )卷

二、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内, 选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题 2分,共20分。)

1、统计学的核心内容是 c

A 数据的收集

B 数据的整理

C 数据的分析

D 数据的分组

E 以上都不对 2、下列指标中属于质量指标的有()

A 国民收入

B 平均工资

C 计划完成程度

D 出勤率

E 总产量数

3、变量是可以取不同数值的量,变量的数量表现是变量值,所以 A 数量标志和所有统计指标是变量 B 所有标志值和指标值是变量

C “工业企业总产值”是个变量值

D 变量不包括品质标志

E “某企业工业总产值 20万元”是个变量值

4、 下列项目中属于非全面调查的有 A.重点调查 B.抽样调查 C.典型调查

D.全面统计报表

10、菟城市有200万人,有裔业瘵害机枸1D0Q0牛】裔业网点.宕度的逆扌

旨标二

1D0001、

200000^ =□ <牛f 干人

E 定期调查

5、编制时间数列的可比性原则包括abce

A.时间方面的可比

B.总体空间范围的可比

C.统计指标内容和计算方法的可比

D.统计指标的名称和含义可比E统计指标的计量单位和计算价格的可比

6、从一个总体中可以抽取一系列样本,所以

A. 样本指标的数值不是唯一确定的

B. 所有可能样本的平均数的平均数等于总体平均数

C. 总体指标是确定值,而样本指标是随机变量

D.总体指标和样本指标都是随机变量

E.所有可能样本的标准差等于总体的标准

7、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题A 现象的变化是否有周期性B 原数列的项数

C 原数列波动大小

D是否需要移动平均数列的首尾数值E是时期数列还是时点数列

8、在编制指数时,确定同度量因素需要考虑的问题有

A 各指标间的经济联系

B 同度量因素的可比性

C 同度量因素固定的时期

D 实际条件和使用上的方便

E 同度量因素是否符合指数形式

9、分类抽样中的类与整群抽样中的群相比,有

A 二者相同

B 二者不一样

C 二者的划分原则相反

D 要求群内差异大,类内差异小

E 要求群内差异小,类内差异大

10、一元线形回归方程中的回归系数ac

A 能说明两变量间的变动方向

B 不能说明两变量间的变动方向

C 能表明两变量间的变动程度

D 不能表明两变量间的变动程度

E 其数值大小受计量单位的影响

一、判断题(判断正误,正确的在括号内打",错误的打X,每个判断1分,共10分)

1 、在全国人口普查中,总体是全国总人口,总体单位是每一户,全国总人口数是变量。()

2、对于有限总体只能进行全面调查。()

3、众数、中位数都是位置代表值,它们不受极值的影响,对于偏态分布它们的代表性好于均值。()

4、对离散型变量只能编制组距数列,对连续型变量既可以编制组距数列也可以编制单项数列。()

5、几何平均法适用于变量的连乘积等于总比率或总速度的现象。()

6、权数本身对加权算术平均数的影响取决于权数绝对值的大小。()

7、在其他条件不变下,提高估计的置信度,会加大允许误差,要减小允许误差,就要降低估计的可靠程度。()

8、说明数据分布离散程度的标准差数值越大,则表明平均数的代表性越小。()

9、最小平方法的思路是使各实际值与估计值之间的离差和为最小,以此估计参数,拟合趋势或回归方程。()

10、已知物价上涨后,居民用同样多的货币购买的商品数量却少15%,则物价指数为117.7%。()

二、不定项选择题(在下列各小题的备选答案中,有一个或多个是正确的,请把正确答案的题号写在题前的括号内,

选择了错误答案,该小题无分,漏选正确答案,酌情给分,每小题2分,共20分。)

1、统计学的核心内容是

A数据的收集B数据的整理C数据的分析D数据的分组E以上都不对

2、下列变量中属于离散变量的有

A职工人数B机器设备台数C人的身高与体重D汽车、船舶数E工业增加值

3、编制动态数列的重要条件是动态数列的每个指标必须具有

A 可加性

B 可比性

C 完整性

D 连续型

E 间隔性

4、某班7 位学生英语成绩分别为88, 85, 85, 91 , 88, 93, 88 分,则英语成绩的众数、中位数分别为

A 88 、91

B 85 、91

C 88、88

D 85 、88

E 85、93

5、抽样调查遵循随机原则的原因是

A 样本容量有限

B 保证总体中每个单位有同等机会被抽中

C 能确定抽样方法

D 能确定推断的可靠程度

E 能计算抽样误差

6、在编制指数时,确定同度量因素需要考虑的问题有

A 各指标间的经济联系

B 同度量因素的可比性

C 同度量因素固定的时期

D 实际条件和使用上的方便

E 同度量因素是否符合指数形式

7、分类抽样中的类与整群抽样中的群相比,有

A 二者相同

B 二者不一样

C 二者的划分原则相反

D 要求群内差异大,类内差异小

E 要求群内差异小,类内差异大

8、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题

A 现象的变化是否有周期性

B 原数列的项数

C 原数列波动大小

10级统计学判断单选多选题

10级统计学判断、单选、多选题 第一章 一、判断题部分 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×) 4.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(×) 5.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 6.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 7.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) , 二、单项选择题部分 1.社会经济统计的研究对象是(C)。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.社会经济统计认识过程的规律和方法 2.对某城市工业企业未安装设备进行普查,总体单位是(B)。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 3.工业企业的设备台数、产品产值是(D )。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量、 4.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是(B)。 A.品质标志 B.数量标志 C.标志值 D.数量指标 5.在全国人口普查中(B )。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 6.下列指标中属于质量指标的是(B)。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 7.指标是说明总体特征的,标志是说明总体单位特征的,(B)。 A.标志和指标之间的关系是固定不变的 B.标志和指标之间的关系是可以变化的 ? C.标志和指标都是可以用数值表示 D.只有指标才可以用数值表示 8.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是(A)。 A.绝对数 B.相对数 C.平均数 D.百分数 9.离散变量可以(B)。

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

卫生统计学线性回归练习题

一、是非题 1.单个自变量的线性回归就是直线回归。 2.直线回归就是指自变量和应变量的观察值落在在一条直线上。 3.直线回归中预测值Y 是固定某个X 值,Y 的总体均数估计值。 4.用逐步回归的方法评价自变量与应变量之间的关联性,只能推断某个自变量与应变量有关联性,不能推断无它们之间无关联性。 二、选择题 1.用最小二乘法确定直线回归方程的原则是各观察点() A . 距直线的纵向距离相等 B . 距直线的纵向距离的平方和最小 C . 与直线的垂直距离相等 D . 与直线的垂直距离的平方和最小 2.直线回归的系数假设检验() E . 只能利用相关系数r 的检验方法进行检验 F . 只能用t 检验 G . 只能用F 检验 H . 三者均可 3.Y ?=7+2X 是1~7岁儿童以年龄(岁)估计体重(公斤)的回归方程,若把体重的单位换成市斤, 则此方程( ) A .截矩改变 B .回归系数改变 C . 截矩与回归系数都改变 D .回归系数不变 E .截矩不变 4.直线回归系数的假设检验,其自由度为( ) A .n B .n-1 C .n-2 D .2n-1 E .2n-2 5.对应变量Y 的离均差平方和,下列哪个分解是正确的?( ) A .SS 剩=SS 回 B .SS 总=SS 剩 C .SS 总=SS 回 D .SS 总+SS 剩=SS 回 E .SS 总+SS 回=SS 剩 三、计算分析题

1.15名儿童的身高与肺死腔容积的观察值如表15-3所示。 表15-3 儿童身高与肺死腔容积的观测数据 对象号 身高(cm) X 肺死腔容积(ml) Y 对象号 身高(cm) X 肺死腔容积(ml) Y 1 110 45 9 175 102 2 116 32 10 167 111 3 123 41 11 165 88 4 130 45 12 160 65 5 129 43 13 157 79 6 142 67 14 156 92 7 147 58 15 149 58 8 153 57 试用该资料进行回归分析: (1)计算样本回归方程的截矩与回归系数; (2)进行回归系数等于0的假设检验; (3)验证是否存在F t b =的关系; (4)估计回归系数β的95%置信区间。 2.一名产科医生收集的12名产妇24h 的尿,测量其中雌三醇的含量,同时记录了产儿的体重,见表15-4。 表15-4 待产妇尿中雌三醇含量与新生儿体重 编号 尿雌三醇(mg/24h) X 新生儿体重(kg) Y 编号 尿雌三醇(mg/24h) X 新生儿体重(kg) Y 1 7 2.5 7 19 3.1 2 9 2.5 8 21 3.0 3 12 2.7 9 22 3.5 4 14 2.7 10 24 3.4 5 16 3.7 11 25 3.9 6 17 3.0 12 27 3.4 (1)试用该数据进行回归分析; (2)求回归系数的95%置信区间; (3)试求当待产妇尿中雌三醇含量为18(mg/24h)时,新生儿体重个体值的95%预测区间。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

统计学判断题

1.统计研究中的变异是指总体单位质的差别(1分) ★标准答案:错误 2.统计数据整理就是对原始资料的整理。(1分) ★标准答案:错误 3.访问调查回答率较低,但其调查咸本低。(1分) ★标准答案:错误 4.总体单位总数和总体标志值总数是不能转化的。()(1分) ★标准答案:错误 5.异距数列是各组组距不都相等的组距数列。(1分) ★标准答案:正确 6.绝对数随着总体范围的扩大而增加。()(1分) ★标准答案:正确 7.绝对数随着时间范围的扩大而增加。()(1分) ★标准答案:错误 8.变异是统计存在的前提,没有变异就没有统计(1分) ★标准答案:正确 9.报告单位是指负责报告调查内容拘单位。报告单位与调查单位有时一致,有时不一致,这要根据调查任务来确定(1分) ★标准答案:正确 10.大量观察法要求对社会经济现象的全部单位进行调查(1分)

★标准答案:错误 11.普查可以得到全面、详细的资料,但需花费大量的人力、物力和财力及 时间。因此,在统计调查中不宜频繁组织普查(1分) ★标准答案:正确 12.三位工人的工资不同,因此存在三个变量(1分) ★标准答案:错误 13.由于电子计算机的广泛使用,手工汇总已没有必要使用了(1分) ★标准答案:错误 14.统计表是表达统计数据整理结果的唯一形式。(1分) ★标准答案:错误 15.统计分组的关键是正确选择分组标志和划分各组的界限。(1分) ★标准答案:正确 16.调查时间是指调查工作所需的时间(1分) ★标准答案:错误 17 .总体单位是标志的承担者,标志是依附于总体单位的(1分) ★标准答案:正确 18.统计数据的效度和信度的含义是一致的。(1分) ★标准答案:错误 19.反映总体内部构成特征的指标只能是结构相对数。()(1分) ★标准答案:错误 20.年代都是以数字表示的,所以按年代排列各种指标属于按数量标志分组。

医学统计学名词解释问答题

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

最新统计学复习题目答案

请各位同学全面看书复习,以书本上知识点为主,本复习题为重点,认真准备。祝大家新 年快乐,复习考试顺利!白胜陶121220。 班级:____________姓名:____________学号:____________评分:____________ 一、判断题(判断下列题目是否正确,如果正确请打“√”,错误请打“×”) 1、参数是指描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值 × 2、统计量是指用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数× 3、众数是总体中出现最多的次数。√ 4、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。√ 5、抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法× 6、普查是指为特定目的专门组织的非经常性全面调查× 7、直方图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的√ 8、直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义× 9、直方图的各矩形通常是连续排列,条形图则是分开排列√ 10、茎叶图(stem-and-leaf display)是用于显示未分组的原始数据的分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字√ 11、众数是一组数据中出现次数最多的变量值× 12、众数(mode)是一组数据中出现次数最多的变量值√ 13、中位数(median)是数据排序后处于中间位置上的值√ 14、四分位数(quartile)是数据排序后处于25%和75%位置上的值√ 15、极差一组数据的最大值与最小值之差× 16、平均差(mean deviation)是各变量值与其平均数离差绝对值的平均数√ 17、自由度是指附加给独立的观测值的约束或限制的个数。从字面涵义来看,自由度是指一组数据中可以自由取值的个数,当样本数据的个数为n时,若样本平均数确定后,则附加给n 个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。√ 18、标准分数的(性质)是均值等于0,方差等于1√ 19、标准分数(性质)是:z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1 √ 20、经验法则表明:当一组数据对称分布时:约有68%的数据在平均数加减1个标准差的范围之内,约有95%的数据在平均数加减2个标准差的范围之内,约有99%的数据在平均数加减3个标准差的范围之内√ 21、离散系数(coefficient of variation)是标准差与其相应的均值之比√ 22、(stratified sampling) 分层抽样是将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本× 23、(systematic sampling) 系统抽样将总体中的所有单位(抽样单位)按一定顺序排列,

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

卫生统计学试题1

卫生统计学试题1 注:因原件较模糊,所以试题中可能有错字或答案错漏,有的请指出,仅供参考;复习主要看书本。 一、选择题(每题只有一个正确答案,共40分) 1、随机事件的概率p 等于( ) A p=0 B p=1 C p= D 040 B T<1或n<40 C T>5且n>40 D 以上都不是 10、( )表示某一事物内部各部分所占比重。 A 频率指标 B 构成比 C 相对比 D 定比 11、t 检验的前提条件是( ) A n 较大 B 小样本来自正态总体且总体方差具有齐性 C 总体标准差已知 D 以上都不是 12、同一资料相关回归分析中,求得r t 与b t 值,其关系( )

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

医学统计学名词解释及问答题

1、 总^(population):就是根据研究目得确泄得同质研究对象得全体。 2、 样本(sample):从总体中抽取得一部分有代表性得个体。 3、 同质(homogeneity):就是指所研究得观察对象具有某些相同得性质或特征。 4、 变异(variation):指同质个体得某项指标之间得差异。 5、 参数(parameter):反映总体特征得指标称为参数。 6、 统计量(statistic):通过样本资料il ?算出来得相应指标称为统计量。 7、 抽样误差(sampling error):由随机抽样造成得样本指标与总体指标之间、样本指标与样本指标 Z 间得差异。 8、 概率(probability):某事件发生得可能性大小。 9、 正态分布(normal distribution):高帐位于均数处冲间高两边低,左右完全对称地下降,但永远不与 横轴相交得钟形曲线。 10、 平均数(average):就是描述一组同质变量值得平均水平或集中趋势得指标。 11、 中位数(median):将一组数据由小到大排列,位于中间位置得观测值。 12、 医学参考值范@(medical reference range):X 称正常值范饥医学上常将包括绝大多数正常人得 某项指标得波动范围称为该指标得正常值范鬧。 13、 方差他I 伽CC):就是徉个数据与平均数之差得平方得平均数。 14、 标准差(standard deviation):就是各数据偏离平均数得距离得平均数,它就是离均差平方与平均 后得方根,用0表示。 15、 标准i^tstandard error):样本均数得标准差,等于原变量总体标准差除以例数得平方根,用以说明 均数抽样误差得大小。 16、 均数得抽样误差(sampling error of mean):由个体差异与抽样所导致得样本均数与样本均数之 间,样本均数与总体均数之间得差异。 17、 假设检验(hypothesistesting):先对总体做出某种假设,然后根据样本信息来推断其就是否成立 得一类统计方法得总称。 18、 统计推断(statistical inference):就是根据已知得样本信息来推断未知得总体,就是统计分析得目 得,包括参数估计与假设检验。 19、 I 型错误(type I error):拒绝了实际上成立得Hu.这类弃真错误,发生得槪率为Q,为已知。 20、 II 型错误(type II error):不拒绝实际上不成立得Ho,这类存伪错误,发生得概率为B ,未知。 21、 检验效能(power of test):又称把握度,为意义就是两总体确有差别,按a 水准能发现它们 有差别得能力。 可信区间(confidence interval):指总体参数可能所在得范围。 率(血⑹:说明某现象发生得频率或强度。 构成比(constituent ratio):^示某事物内韶^$组成部分所占得比重或分布,常以百分数表示。 相对比(relative ratio):表示两个有关事物指标之比,常以百分数与倍数表示,用以说明一个指标 就是另一个指标得几倍或百分之几。 26、 标准化率(standardized 臥C):亦称调整率,就是采用统一得标准对内部构成不同得各组频率进行 调整与对比得方法。 27、 参数检验(paramchic test):—类依赖于总体分布得具体形式得统计推断方法。 28、 非参数检验(non parametric test):-类不依赖总体分布类型得检验,在应用中可以不考虑被研究 对象为何种分布以及分布就是否已知,检验假设中没有包括总体参数得统计方法。 22 、 23、 24

卫生统计学题库(6版)

第一章绪论 第二章(一)A1型:1.下面的变量中,属于分类变量的是_____。 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.下面的变量中,属于定量变量的是_____。A.性别 B.体重 C.血型 D.职业 E.民族 3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 4.上述资料可以进一步转换为_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 5.若要通过样本作统计推断,样本应是_____。 A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量_____。A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E.是由样本数据计算出的统计指标 7.因果关系_____。A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现 为数量间的联系 D.可以通过单独考察两个变量间关系得出 E.可以通过变量间数量上的联系来证明 (二)A2型:1.教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有180万儿童参与,约有1/4参与者得到了随机化。这180万儿童是_____。 A.目标总体 B.研究总体 C.1份样本 D.1份随机样本 E.180万份样本 2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对_____而言。 A.180万儿童 B.每个儿童 C.所有使用索尔克疫苗的儿童 D.所有儿童 E.180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。 2.假变量可以参与计算,所以假变量是定量变量。 3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。 4.同质的个体间不存在变异。 5.如果个体间有变异,则它们一定不是来自同一总体。 第二章定量资料的统计描述(一)A1型:1.用频率表计算平均数时,各组的组中值应为_______。 A.本组段变量值的平均数 B. 本组段变量值的中位数 C. 本组段的上限值 D. 本组段的下限值 E. (本组段上限值+本组段下限值)/2 2.离散型定量变量的频率分布图可以用_______表达。 A. 直方图 B. 直条图 C.百分条图 D.箱式图 E.复式条图 3. 变异系数越大说明_______。A.标准差越大 B.平均数越大 C.标准差、平均数都大

相关主题
文本预览
相关文档 最新文档