1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、
肾疾病,无汞作业接触史的居民238人的发汞含量如下:
发汞值~~~~~~~~~~(mol/kg):
人数 20 66 60 48 18 16 6 1 0 3
(1)说明此频数分布的特征。
(2)选用何种指标描述其集中趋势和离散趋势
(3)估计该地居民发汞值的95%参考值范围
答:(1)偏态分布
(2)选用中位数描述集中趋势,四分位间距描述离散趋势
(3)
频数相对频数累积频数累积相对频数
~2020
~660.86
~600.146
~480.194
~18212
~16228
~6234
~1235
~00235
~32381
合计238
=+(238×%-0)×2/20=
=+(238×%-228)×2/6=
所以估计该地居民发汞值的95%参考值范围(,)
2、某市场出售一批番茄汁罐头,罐头内vc平均含量(mg/100g)是未知的。今从中抽取16
个罐头,经测定含量如下:
16,22,21,23,21,19,15,13,23,17,20,29,18,22,16,25
计算:(1)试问这批罐头内vc平均含量及95%区间估计
(2)假如另一批罐头vc平均含量为22mg/100g,试问这两批罐头vc含量是否相同
答:(1)样本平均值=20 样本标准差= 16开方=4
20-×4=
20+×4=
,
(2) 22∈,
所以含量相同
3、某药厂为了解其生产的某药物(同一批)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为,标准差,试估计该批药物有效成分的平均含量
答:该批药物有效成分的平均含量的95%可信区间为:
(样本均值标准误,样本均值+标准误)
即:(,)
4、为了观察寒冷对动物鸟中17-KS排出量的影响,实验安排了营养正常组的大白鼠在寒冷前与寒冷后分别测定尿中17-KS排出量,请问这个实验设计的模型是什麽
答:这个实验设计的模型是配对设计资料的t检验
5、男性四组人群营养实验中胡罗卜素春、夏、秋、冬四季之比较
春夏秋冬
∑X
N 137 179 135 123
x
∑X2
(1)试检验四季之间胡萝卜素存留量(毫克)有无显著差别
(2)如有显著差别,应如何确定
(一)
1. 假设和和确定检验水准
H0 :四季之间胡萝卜素存留量的总体均数相等,1=2=3=4
H1 :四季之间胡萝卜素存留量总体均数不全相等 =
检验统计量F 值 X =+++=
N =137+179+135+123=574 X2=
C=(X )2/N=2
/574=
∑
∑
=-=-=
-=
740.86050.33079.416)22
C x x x SS ij (总
=-=
ν总 = N-1 = 574-1=573
091
.4505.330107.18106.24100.25106.46)x (
)
(SS 2
2222
ij 2
=-+++=-=-=
∑
∑∑C n
x x n i
i 组间 =()2
/137 + ()2
/179 + ()2
/135+()2
/123 -=
ν组间 = k-1 =4-1 =3
SS 组内=∑
-2
)(i ij
x x
=S 总- SS 组间 =组内= N-k =574-4=570
MS 组间 = SS 组间/ν组间 =3= MS 组内 = SS 组内/ν组内=570= F= MS 组间/MS 组内==
方差分析结果表
变异来源 SS ν MS F P 总 573 组间 3 < 组内
570
3.确定P 值和作出推断结论 以ν1(ν组间)=3及ν2(ν组内)=570,查F 界值表得P<, 按=水准拒绝H 0 ,接受H1,故可以认为四季之间胡萝卜素存留量(毫克)差别有统计学意义。 (二)
进行平均值之间的多重比较,未讲 略 6、 五只高血压狗口服萝芙木总碱(2-8mg/kg 体重),其收缩压的变化如下:
狗号 给药前
给药期
停药后
1 16
2 130 170
试分析不同用药时间,动物间服药后收缩压的变化。
答:做随机区组方差分析:
提出假设检验:
H0:τi=0; H1:τi≠0,至少有一个不等式成立。
H0:βj=0; H1:βj≠0,至少有一个不等式成立。
α=。
SS总=;v总=14
SS处理=;v处理=2
SS区组=;v区间=4
SS误差=;v误差=8
由此,列方差分析表得
方差分析表
变异来源SSνMS F P 处理219.<区组412.<误差8
总计14
注:查表得(2,8)=,(2,8)=。(4,8)=,(4,8)=
统计学结论:
(1)处理因素在α=水平上拒绝H0,接受H1。
(2)区组因素在α=水平上拒绝H0,接受H1。
因此,不同用药时间,收缩压差别极显著;而不同的狗,收缩压差别也极显著
7、每组6只动物(羊)给某种激素再不同时间抽血,观察其血浆磷脂含量变化
对照给雌激素
合计
上午下午上午下午
说明:因原题目中数据不全,每组只按数据齐全的前4只进行计算;此外,原题目未说明希望分析的问题,故应用方差分析和t检验分析该问题。
1.方差分析
应用方差分析前,先做方差齐性检验:S112=, S122=, S212=, S222=。方差不齐,不能应用方差分析。
若此题方差齐,应用方差分析过程应为:
(1)给予雌激素的假设:
H0:τi=0; H1:τi≠0,至少有一个不等式成立。
α=。
(2)测量时间的假设:
H0:βj=0; H1:βj≠0,至少有一个不等式成立。
α=。
(3)交互作用的假设:
H0:(τβ)ij=0; H1:(τβ)ij≠0,至少对一种(ij)组合成立。
α=。
SS总=
ν总=16-1=15
SS A=+/(2×4)- 16=
νA=2-1=1
SS B=+ /(2×4) - 16=
νB=2-1=1
SS AB=+++/4-+/(2×4)-+ /(2×4)+16=
νAB=(2-1)×(2-1)=1
SS误差=SS总- SS A - SS B- SS AB =
ν误差=ν总-νA-νB-νAB =12
方差分析表
变异来源SSνMS F P
A雌激素1()>
B测量时间1()<
A*B交互1()<
误差12
总计15
统计学结论:
(1)接受H0:τi=0的无效假设;拒绝 H1:τi≠0,至少有一个不等式成立。
(2)拒绝H0:βj=0的无效假设; 接受H1:βj≠0,至少有一个不等式成立。
(3)拒绝H0:(τβ)ij=0的无效假设; 接受H1:(τβ)ij≠0,至少对一种(ij)组合成立。
尚不能认为使用雌激素对该激素水平具有影响;下午该激素水平高于上午;雌激素的使用与测量时间之间存在交互作用。
2.t检验(给予雌激素是否使该种激素上下午波动幅度减小)
方差齐性检验:
F=Sd12/Sd22=, 1=4-1=3, ν2=4-1=3。
F<(3,3)=, P>, 方差齐。
H0:d1=d2; H1:d1>d2。
α=。
Sc2=[(4-1)× +(4-1)×]/(4+4-2)=
t= ×(1/4+1/4)]=
ν=4+4-2=6
t>=(6)
拒绝H0:d1=d2的无效假设; 接受H1:d1>d2。
给予雌激素可以使该种激素上下午波动幅度减小
说明:若分析雌激素是否对该种激素上下午波动幅度有影响,H1:d1≠d2,则应为双侧检验,t<= (6),接受H0:d1=d2的无效假设; 拒绝H1:d1>d2,尚不能认为雌激素对该种激素上下午波动幅度有影响。
8、标准差和标准误有何区别和联系
标准差是反映数据变异程度的指标,其大小受每一个观察值的影响,变异程度大,标准差也大.常用于描述对称分布,尤其是正态分布资料的离散程度。可以反映样本均数的代表性.
标准误是样本均数的标准差,反映了样本均数与总体均数之间的离散程度,即样本均数变异程度的指标,常用来表示抽样误差的大小。标准误大反映样本均数抽样误差大,其对总体均数的代表性差。标准误小,样本均数抽样误差就小,其对总体均数的代表性就好。
标准差随着样本量的增多,逐渐趋于稳定,如同地区、同年龄、同性别儿童的身高、体重的标准差,当样本含量达到约200以上时,基本趋于稳定。
标准误随着样本量的增多而减小,如均数的标准误,当标准差不变时,与样本量的平方根呈反比。
9、可信区间和参考值范围有何不同
可信区间是从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着100次抽样, 95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。
参考值范围是指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。
10、假设检验和区间估计的异同之处有哪些
同:两者都是对总体特征进行推断的方法。区间估计用以说明参数量的大小,如推断总体均数所在的范围,而假设经验用于推论质的差别,如推断总体均数是否不同。
异:可信区间不仅可回答假设检验的问题,而且可以比假设检验提供更多的信息,可信区间在解决假设检验问题基础上,还可获得是否有专业意义的信息。
11、假设检验时,一般当P<则拒绝H0,理论依据是什么
假设检验时,先提出无效假设H0,然后在假设成立的前提下看实际抽到的样本是否属小概率事件(如果当一个事件发生的概率很小时,那么在一次试验时这个事件时“不会发生的”,
一旦发生了,称其为小概率事件。统计学中,将P<称为小概率事件。)。若属小概率事件,则拒绝该假设;若不属于小概率事件,则不拒绝该假设。得出的结论是概率性的,不是绝对的肯定或者否定。犯一类错误(拒绝了正确的无效假设)的概率是α=。
12.第一类错误和第二类错误有何区别和联系
错误类型第一类错误第二类错误
意义拒绝了正确的无效假设H0
即无效假设原本是正确的,但由于偶
然因素的影响,随机抽样时,得到一
个较大的检验统计量t 值,故t值大
于了 t,,只能拒绝无效假设,错
误地得出有差别的结论。接受了错误的无效假设H0
即无效假设原本是不正确的,但所算得的统计量t 没有超过t,水平从而接受了无效假设,错误地得出了无差别的结论。
假阳性错误假阴性错误
相应概率,即检验水准,一般取 = 或。
应按所犯第一类错误的危害性,
紧密结合分析问题的具体情况,事先
选定的取值。β,我们称(1-β)为检验效能,β值的大小一般未知,只有在不同总体特征已知的基础上,按预定的和n才能做出估算。
β的取值,实际上也应根据第二类错误的危害性事先确定。通常检验效能应该达到左右。
②两类错误的联系:
在样本量固定的情况下,减小会引起β增大;减小β会引起增大。若要同时减小和β,只有增大样本含量。所以样本含量应尽可能大一些,同时正确的实验设计与严格规定实验操作方法,能够减少抽样误差,提高检验效果。
13.某地某年人口数58723人,脑卒中发病81人,脑卒中死亡45人,该地当年各种疾病死亡372人,试问上述数字能计算多少个有意义的相对数并说明都是些什么相对数
能算出五个有意义的相对数:
强度相对数:该地当年的脑卒中发病率:(81/58723)*1000‰ = ‰
该地当年的脑卒中死亡率:(45/58723)*万分之万 = 万分之
该地当年的脑卒中病死率:(45/81)*100% = %
该地当年的疾病总死亡率:(372/58723)*1000‰ = ‰结构相对数:该地当年内脑卒中死亡人数占疾病总死亡人数的比例(构成比):
(45/372)*100% = %
相对数有三类:率
构成比
相对比
1.率(rate ):
某现象实际发生数于可能发生某现象的总数之比,用以反映某现象发生的频率或强度,又称为频率指标,具有概率意义。
计算公式为: 依据习惯选定,或使得所计算得的率保留一到两位整数。
常用的率包括发病率、患病率、死亡率、病死率等。(1)发病率:表示在观察期内,可能发
生某种疾病的一定人群中新发生该病的频率。 某病发病率= ×K
在通常情况下,发病率的分母泛指一般平均人口数。
意义:发病率是反映某病在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。
(2)患病率:表示在某时点检查时可能发生某病的一定人群中患有某病的频率。
其中某病病例数包括新病例和旧病例,凡患该病的一律统计在内。同一人不应同时成为同一疾病的两个病例。
意义: 这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平,估计医疗设施的需求量。 (3)反映疾病防治效果的指标治愈率
有效率
某病病死率=
2. 构成比 说明某事物内部各组成部分所占的比重或比例。 常以百分数表示,计算公式为:
相对比,
比较两个指标时用以反映两个有关指标间数量上的比值,如A 指标是B 指标的若干倍,或A 指标是B 指标的百分之几,通常用倍数或分数表示。 计算公式为:相对比=
相互比较的两个指标可以是相同性质的指标,也可以是性质不同的指标;两变量可以为数值变量、分类变量,可以是绝对数、相对数、平均数等。 不能以比代率
因为构成比说明的是事物内部各部分所占的比重或分布,不能说明某现象发生的强度和频率大小。只有频率指标:率才能说明事物的严重程度。(如真正答题时,自己最好举一个
)
‰%(或单位总数可能发生某现象的观察数
发生某现象的观察单位率=
1000100?K
?=
该时点受检人口数
数
检查时发现的某病病例某病患病率K
?=
受治人数
治愈人数
治愈率K
?=
受治人数
治疗有效人数
有效率%
100?观察期间内某病患者数
同期因该病死亡人数
%
位总数
同一事物内部的观察单数某组成部分的观察单位比=100?%)(或乙指标
甲指标
100?的平均人口数
观察期内可能发生某病例数同期内新发生某病的病
例子来说明,书34页)
20、下表为变性卵蛋白在38o C与25o C时之凝固百分数:
时间(分钟) 3 6 9 12 15 18
38o C 12 30 44 53 66
25o C 30 40 49 58
试求出两个时间推算凝固百分数之回归方程式,并检验两个回归系数间差别的显著性。
(by milanlan,老师说不要求第二问)
解:n=6,∑X i=63,X i=,∑X i2=819
∑Y i1=,Y i1=,∑Y i12=,∑X i Y i1= 3705
∑Y i2=,Y i2=,∑Y i22=,∑X i Y i2= 2661
l xy1= ∑X i Y i1-(∑X i)(∑Y i1)/n=3705-63×6=
l xy2= ∑X i Y i2-(∑X i)(∑Y i2)/n=2661-63×6=
l xx=∑X i2-(∑X i)2/n=819-632/6=
l yy1=∑Y i12-(∑Y i1)2/n= l xy1/l xx==, a1= Y i1-b1× X i=即38o C时Y=+
b2= l xy2/l xx=, a2=即25o C时Y=+
21、.测定小鼠肾上腺中抗坏血酸含量时测半个腺和整个腺体所得数据如下:
半个 371 592 464 519 470 528 580 420 563
整个 381 627 485 546 500 546 595 569 595
解释:
这道题老师上课说了,用直线回归,因为如果以半个腺的抗坏血酸含量为自变量x,以整个腺的抗坏血酸含量为应变量Y,若能找到两者之间的线性关系则可以在以后的试验中由
半个腺的测量值来预测该测量值对应的整个腺的Y值。
计算:
1.画散点图,看两者之间是否存在直线关系。
表一
半个(x)371592464519470528580420563整个(y)381627485546500546595569595对应拟和直线图
表二,因为第八组数据离直线太远,故舍去。
半个(x)371592464519470528580563整个(y)381627485546500546595595对应拟和直线图
2.求出方程(计算回归系数b和截距a)。
注意因为从以上作图可知舍去了第八组数据,所以计算时也不予考虑。老师上课讲过异常值应该舍,但没有讲如何检验异常值。本人在北大时好像学过,但已经忘记,且觉得不必要,大家谁要是觉得必要,请看以前的统计书,如果有人会,请上传21题补丁,谢谢了!
半个(x)整个(y)
371381
592627
464485
519546
470500
528546
580595
563595
∑Xi=4087∑Yi=4275
X平均=Y平均=
∑X i2 =2125815∑Y i2 =2327797
∑Xi*Yi=2224322
因为公式比较繁,大家参照课本180页自己计算:
Lxy=
Lxx=
Lyy=
b==
a=-*=-
回归方程为:y=-+(注意书上的写法,这里因为本人能力不能写出)。
3.对总体的回归系数β进行假设检验。
使用方差分析:
建立假设检验:H 0:β=0,即半个腺和整个腺的抗坏血酸含量有关 H 1:β≠0, 无关 计算统计量F 值
df
SS
MS
F
P 回归分析 1 42954 42954
<
残差 6 总计
7
根据上表P 值,认为不能拒绝H 0
22、相关系数和回归系数的联系和区别 区别:
在资料要求上:回归要求因变量Y 服从正态分布;x 是可以精确测量和严格控制的变量,一般称为一型回归。相关要求两个变量x 、y 服从双变量正态分布。这种资料若进行回归分析称为II 型回归。
在应用上:说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用
相关。
联系:
1、 对同一组数据同时计算r 和b ,它们的正负号是一致的。r 为正号说明两变量间的相互关系是同向变化的。b 为正, 说明X 增(减)一个单位,Y 平均增(减)b 个单位。
2、 r 和 b 的假设检验是等价的,即对同一样本,两者的t 值相等。由于r 的假设检验可直接查表, 而b 的假设检验计算较繁。故在实际应用中常以前法代替后法。
3、 r 与b 值可相互换算
4、 用回归解释相关 相关系数的平方r2 称为决定系数(coefficient of determination ):
此式说明当SS 总不变时,回归平方和的大小取决于r2。回归平方和是由于引入了相关变量而使总平方和减小的部分。回归平方和越接近总平方和,则r2 越接近1,说明引
XX
YY YY
XX YY XX XX XY
YY XX XY l l r
b l l
b l l l l
l l l r ====总回
SS SS l l l l l l r YY XX XY YY XX XY =
==/2
22
入相关的效果越好。例如r=, n=100 时,可按检验水准拒绝H0, 接受H1 ,认为两变量有相关关系。但 r2 = 2 =, 表示回归平方和在总平和中仅占4%,说明两变量间的相关关系实际意义不大。
23、剩余标准差的意义和用途
SS Y 。X 为剩余标准差,是指将X 固定为某一确定值以后,Y 的标准差。 越小,说明用回归方程所作的估计的误差越小。剩余标准差 可由下式求得:
式中Sy 为变量Y 的标准差,r 为相关系数,n 为样本例数。
它直接反映观察值y 对估计值的平均离差。就回归直线来说,其平均离差值愈小,则所有观察点平均地愈靠近回归线,即关系程度愈密切;而当其平均离差值愈大,则所有观察点平均地离回归线愈远,即关系愈不密切。可见这个指标是从另一侧反映关系密切程度的。它是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小,从另一方面看,也就是反映着估计值平均数的代表性的可靠程度。 用途:回归系数的t 检验,u y 的区间估计,个体Y 值的容许区间
24、拟做动物实验,设实验和对照组的差别x 1-x 2=1.5克,标准差为2.5克,显著性水平
为,实验的成功率为90%,试求出所需动物数
解:见书P 343。本题属于两样本均数比较,所需样本量的计算公式是:
N1=N2=2×〔(t α/2+t β)S/δ〕2
N1=N2=2×〔+ ×〕2
=,取整59。
实验组合对照组各需59只动物,总共需118只。
25、用中药治疗慢性肾炎的近控率为30%,现试验新药的疗效,要求新药的近控率达到50%,
才能推广使用,
=,成功率为,问每组需多少人
解:见书P 343。本题属于两组样本率比较,本题采用单侧检验(个人认为如此,大家说呢),所以公式为:
N1=N2=×〔(u α+u β)/(sin -1√p 1-sin -1√p 2)〕2
N1=N2=×〔+/(sin -1√√)〕2
=,取整102。 旧药和新药各需102人。 26、欲了解某地菜农钩虫感染率是否高于粮农,估计两总体率约20%及10%,今指定=, =,问需查多少人
两样本率的比较 双侧检验: p1=,p2=,双侧2=,单侧=
2
)
1)(1(2
)?(22
.---=--=
∑n r n S n Y Y S y
x y
按照p343公式26-2计算可得:
n1=n2=
每组需要262例,两组共需524例。
27、几种基本的抽样方法的优缺点和适用场合是什么
老师的ppt上提到的是单纯随机抽样、系统抽样和整群抽样
我查到的是四种:简单随机抽样、系统抽样、分层抽样和整群抽样(分层抽样很重要啊~老师应该是忘了讲吧)
(另注:这几种方法都属于概率抽样,另外还有非概率抽样,应该不会考)
概率抽样的原则:(随机性原则)
总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
简单随机抽样:
按照等概率的原则,直接从含有N个元素的总体中抽取n个元素组成的样本(N>n)。(随机数表)
系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)
前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
分层抽样(类型抽样):
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
整群抽样:
抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。
一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。
#分层抽样与整群抽样的区别:
分层抽样要求各子群体之间的差异较大,而子群体内部差异较小;整群抽样要求各子群体之间的差异较小,而子群体内部的差异性很大。换句话说,分层抽样是用代表不同子群体的子样本来代表总体中的群体分布;整群抽样是用子群体代表总体,再通过子群体内部样本的分
布来反映总体样本的分布。
28、实验为什么要设对照组如何设对照组
正确的设立对照,才能平衡非处理因素对实验结果的影响,从而把处理因素的效应充分显露出来,设立对照是控制各种混杂因素的基本措施。设立对照组的意义在于使实验组和对照组内的非处理因素的基本一致,即均衡可比。
设立对照时应使对照组与实验组的非实验因素均衡一致,也就是在设立对照时除给予处理单因素不同外,其他对实验效应应有影响的因素(即非处理因素)尽量均衡一致,才能显示“对照”的作用。即设立对照组应满足均衡性要求,做到:
1、组间除干预措施外,其他影响结果的非处理因素等尽可能相同。
2、对所研究疾病的易感度及发病机会相等。
3、检测和观察方法及诊断标准必须一致。
常用的实验对照有:
空白对照对照组不施加任何处理因素。
实验对照对照组不施加处理因素,但施加某种实验因素
标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。
自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。一般情况下还要求设立平行对照组。
相互对照这种对照不设立对照组,而是两个或几个试验组相互对照。
配对对照把研究对象条件相同的两个配成一对,分别给不同的处理因素,对比两者
之间的不同效应。配对对照常用于动物实验,临床试验也可采用,但严格地说,很难找到相同或十分相似的对子。
29、有刊物报道, 某厂调查纺织女工子宫下垂者为132人, 其中115人为
站立工作者, 占%; 坐着工作的有17人, 占%。结论为“
站立工作是子宫下垂的患病因素”。问此项资料是否支持该项结论
为什么
不支持。因为题目中给的数据为构成比。分析时常见的错误是以构成比代替率来说明问题。构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。
30、要分析———的关系,不能用方差分析法。
A 母亲年龄与出生体重
B 籍贯与血红蛋白含量
C 性别与尿液比重
D 职业与血型
31、实验设计的基本原则是———。
A 收集、整理、分析
B 对照、重复、随机
C 设计、计算、重复
D 设计、随机、对照、
32、对两地某病发病情况进行调查资料对比分析时,可采用———。
A 两地某病的各自总发病率比较
B 两地某病的各年龄段发病率比较
C 两地某病的标化率比较
D 两地某病的发病率进行显著性检验。
33、显著性检验中,P〈表示———。
A 第一类错误的概率小于
B 假阴性的概率小于
C 第二类错误的概率小于
D 以上都对
34、9例肝硬化患者治疗后存活天数分别为:128,215,79,243,784,65,49, 162,215.反
映本组资料的平均水平的取值应为162。(中位数)
35、变异系数适用于下列哪些场合:
A 反映几组具有不同量纲的计量资料的变异度大小
B 反映定量与定性资料的变异度大小
C 反映几组算术均值相差悬殊的计量资料的变异度大小
D 反映几组有缺失值数据的计量资料的变异度大小
36、人在进行数据处理时,误用了配对资料的t检验分析本属于成组设计的计量资料。在
通常情况下,这意味着:
A 增大了犯I类错误的机会
B 增大了犯II类错误的机会
C 增大了犯III类错误的机会
D 增大了犯IV类错误的机会
37、好的实验设计,能减少人力、物力,提高实验效率,还有助于消除和减少:
A 系统误差
B 随机误差
C 抽样误差
D 责任事故
38、试验设计中必须涉及的项目为要素,试验设计的要素有:
A 试验要素
B 试验单位
C 试验计划
D 试验效应
39、已知A药对某病有效,现发现一种增效剂B,可提高A药的疗效,想通过临床试验了解
A+B的疗效是否显著地优于单用A药的疗效,应选用:
A t检验
B X2检验
C 双侧检验
D 单侧检验
用均数和标准差可全面描述正态分布资料的特征。
40、用最小二乘法确定直线回归方程的原则是各观察点距直线的纵向距离的平方和最小。
41、研究某药物治疗糖尿病的疗效临床观察了200名糖尿病人的血糖情况,其研究总体是
糖尿病病人的血糖值。
42、某年某单位报告了果胶除铅的疗效观察,30名铅中毒工人住院治疗,治疗前测得尿铅
的均数为l , 血铅的均数为dl ;用果胶20天后再测尿铅均数降为l , 血铅均数降为dl,说明果胶有较好的作用,你如何评价
这道题主要的问题是没有设计对照。应该同时随机抽取若干个铅中毒的住院病人,与服用果
胶的试验组构成对照,分别测量不服用果胶20天前后的血铅、尿铅的变化量;再用完全随
机设计两总体的t检验进行显著性分析。
43、例已确诊为肠憩室的患者,被随机分为两组,分别给予甲乙两种饮食,观察食物排除
时间(小时),试问两种食物对肠蠕动效果有无差别问可用那一种检验方法:
甲组 76 75 44 55 51 66 69 68 52 60 71 62 70 75
乙组 97 74 79 83 95 101 98 95 52 64 68 88 83
n1=14, 平方和=58418,和=894,样本标准差=
n2=13, 平方和=91927,和=1077,样本标准差=15
F=(标准差1/标准差2)2= 所以,方差齐性。 Sc= Sx1-x2= T=|x1(均数)-x2(均数)|/ Sx1-x2=|—|/=>t25,单侧= 所以,有极显著差异。 44、实验设计的基本原则是什么说明其重要性,并按实验设计原则评述下面问题: 研究者为研究ADI药物预防肠道传染病的效果,设计如下试验:在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组,服用ADI 药物(剂量按年龄、体重严格计算);在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组,不服用ADI 药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现:甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园150名儿童肠道传染病的发病率(P〈〉。 于是,研究者得出结论:ADI药物有预防肠道传染病的作用。你认为如何为什么 实验设计的三大原则(或四大原则)及意义是: 对照原则:设立对照是控制各种混杂因素的基本措施; 随机化原则:提高对比组之间均衡可比的重要手段,是控制选择性偏倚唯一有效的方法。也 是资料分析、统计推断的理论基础; 重复原则:重复是消除非处理因素影响的又一重要手段; 盲法原则:作为一条附加原则,通过减少主观上的干扰来更好地控制误差。 该实验设计不合理,结论不可信(不科学哪个说法好一些啊:() 根本的原因是没有做好随机化。随机化是实验研究中据设计要求,每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。本实验中在甲幼儿园的一定被分到实验组而乙的一定是对照组。 由此而产生的结果是:虽然“两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的”但是没有考虑其他的未知因素的影响,(如易感度及发病机会可能不相等不敢确定,因为老师把环境因素什么的给否认了)实验前的基础条件不同,即均衡性不存在,因而不能显示“对照”的作用。 所以,合理的设计应该是在甲幼儿园抽的50名受试者随机分为实验和对照组,乙幼儿园也同样,然后合并进行实验组和对照组并进行后续分析。 By RRChen P.S.以上只是个人的一点想法,不知道与老师的本意有多大距离。 这道题似乎很重要,大家一定要各抒己见,争取拿到一个比较完美的答案:) God bless us! 45、某地抽查了360名男性红细胞计数,均数为Χ1012/L,标准差为Χ1012/L,同时抽查了255名女性红细胞计数,均数为Χ1012/L,标准差为Χ1012/L。问:这个资料取自什么实验设计 随机抽样 46、有人在研究耐力训练与提高战士体质的关系时,设计了如下的实验:以血乳酸为主要观察指标,用20名连队的战士按训练方案进行耐力训练,以机关同龄的20名战士为对照,对照组进行日常活动,观察经4周训练后,两组战士进行一定量的运动时血乳酸的变化。两组战士训练前后血乳酸(mg/L)观测结果 组别训练前训练后 训练组± ± ** 对照组± ± * * 与训练前比P< # # 与对照组比P< 答:因为机关兵与连队兵是不同的,所以如果用机关兵作对照,不符合实验设计中设置对照对均衡性(是指在设立对照时除给予处理因素不同外,其他对实验效应有影响的因素尽量均衡一致)的要求。这是该实验设计的错误。 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY- 医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。 《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。 A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小 1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0 医学统计学试题及答案 The latest revision on November 22, 2020 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 医学统计学试题 一.选择题(每题2分,共20分) 1、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是() A、n1+n2 B、n1+n2-1 C、n1+n2+1 D、n1+n2-2 2、标准误反映() A、抽样误差的大小 B、总体参数的波动大小 C、重复实验准确度的高低 D、数据的离散程度 3、最小二乘法是指各实测点到回归直线的() A、垂直距离的平方和最小 B、垂直距离最小 C、纵向距离的平方和最小 D、纵向距离最小 4、用样本推论总体,具有代表性的样本指的是() A、总体中最容易获得的部分个体 B、在总体中随意抽取任意个体 C、依照随机原则抽取总体中的部分个体 D、用配对方法抽取的部分个体 5、随机误差指的是() A、测量不准引起的误差 B、由操作失误引起的误差 C、选择样本不当引起的误差 D、由偶然因素引起的误差 6、某项指标95%医学参考值范围表示的是() A、检测指标在此范围,判断“异常”正确的概率大于或等于95% B、检测指标在此范围,判断“正常”正确的概率大于或等于95% C、在“异常”总体中有95%的人在此范围之外 D、在“正常”总体中有95%的人在此范围 7、从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文χ2χ20.01,1,乙文χ2χ20.05,1,可认为() A、两文结果完全相同 B、甲文结果更为可信 C、乙文结果更为可信 D、甲文说明总体的差异较大 8、两样本均数比较的t检验和u检验的主要差别是() A、t检验只能用于小样本资料 B、u检验要求大样本资料 C、t检验要求数据方差相同 D、u检验能用于两大样本均数比较 9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是() A、适用范围广 B、检验效能高 C、检验结果更准确 D、不易出现假阴性错误 10、两数值变量相关关系越强,表示() A、相关关系越大 B、相关系数越大 C、回归系数越大 D、相关系数检验统计量t值越大 [参考答案] 1-5:DACCD 6-10:DBBAB 二.名词解释(每题4分,共20分) 1、偏回归系数 2、Ⅱ型错误: 3、非参数检验: 4、残差平方和/剩余平方和: 5、率的标准误: [参考答案] 1.表示其他自变量保持不变时,X j增加或减少一个单位引起的Y的变化量。 2.指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。 3.不依赖于总体分布类型、不针对总体参数的检验方法,如假设两总体分布相 同检验统计量基于变量的秩等,这类检验方法称为非参数检验。 4.指除x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中 无法用x与y的线性关系所能解释的部分变异,用以表示考虑回归关系后,y 的随机误差。 5.指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。 (一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数 《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关 7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描 《医学统计学》样题一 班别:___________ 姓名:________________ 学号:________________ 《中山大学授予学士学位工作细则》第六条:“考试作弊不授予学士学 位。” 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 4. 要减少抽样误差,通常的做法是______ 。 A适当增加样本例数 B 将个体变异控制在一个范围内 C减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P v P值越小,则获得的结论是_________ 。 A两样本均数差别越大 B 两总体均数差别越大 C越有理由说两总体均数不同 D 越有理由说两样本均数不同 E越有理由说两总体均数差别很大 6在两样本均数比较的t检验中,无效假设是________ 。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E 样本均数等于总体均数 7. 要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是_________ A用该市岁女孩身高的95%或99%E常值范围来评价 B作身高差别的假设检验来评价 C用身高均数的95%£ 99刑信区间来评价 D不能作评价 E以上都不是 8. 两个独立样本秩和检验时的H。是_____ 0 A两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D两总体分布相同 E 两总体分布没有关联 9. 在配对设计数值变量资料的对比分析中,配对的目的是为了___________o A提高测量精度 B 操作方便 C 应用t检验 D提高组间可比性E减少实验误差 10. 配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数 据,两次t检验的结果 ______ 0 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E结论可能相同或相反 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、 肾疾病,无汞作业接触史的居民238人的发汞含量如下: 发汞值~~~~~~~~~~(mol/kg): 人数 20 66 60 48 18 16 6 1 0 3 (1)说明此频数分布的特征。 (2)选用何种指标描述其集中趋势和离散趋势 (3)估计该地居民发汞值的95%参考值范围 答:(1)偏态分布 (2)选用中位数描述集中趋势,四分位间距描述离散趋势 (3) 频数相对频数累积频数累积相对频数 ~2020 ~660.86 ~600.146 ~480.194 ~18212 ~16228 ~6234 ~1235 ~00235 ~32381合计238 =+(238×%-0)×2/20= =+(238×%-228)×2/6= 所以估计该地居民发汞值的95%参考值范围(,) 2、某市场出售一批番茄汁罐头,罐头内vc平均含量(mg/100g)是未知的。今从中抽取16 个罐头,经测定含量如下: 16,22,21,23,21,19,15,13,23,17,20,29,18,22,16,25 计算:(1)试问这批罐头内vc平均含量及95%区间估计 (2)假如另一批罐头vc平均含量为22mg/100g,试问这两批罐头vc含量是否相同 答:(1)样本平均值=20 样本标准差= 16开方=4 20-×4= 20+×4= , (2) 22∈, 所以含量相同 3、某药厂为了解其生产的某药物(同一批)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为,标准差,试估计该批药物有效成分的平均含量 答:该批药物有效成分的平均含量的95%可信区间为: (样本均值标准误,样本均值+标准误) 即:(,) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料 第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必 医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2 医学统计学试题 姓名____________分数_________ 选择题(每个2分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )A相对比 B 构成比C定基比D率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )A n1+ n2 B n1+ n2–1 C n1+ n2 +1 D n1+ n2 -2 10、标准误反映(A)A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C) A tr>tb B tr 第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计 试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分) 3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别医学统计学部分试题及答案解析
医学统计学试题及答案
《医学统计学》样题一
医学统计学题库
医学统计学试题及答案
医学统计学试题 (2)
(完整word版)医学统计学试题和答案
医学统计学试题及答案
医学统计学样题一
医学统计学试题及答案
医学统计学样题及答案
医学统计学试题及答案
医学统计学练习题与答案
医学统计学题库完整
医学统计学试题及答案
医学统计学试题及其答案
医学统计学选择题及答案个
医学统计学题库完整
医学统计学历年考题及答案