《卫生统计学》第1次平时作业
一、选择题(每小题1分,共30分)
1.抽样研究中的样本是( C )。
A )研究对象的全体
B )总体中特定的一部分
C )总体中随机抽取的一部分
D )随意收集的一些观察对象
2.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )。 A )系统误差 B )随机测量误差 C )抽样误差 D )随机误差
3.欲了解某市某年所有三级甲医院的病床数,该市每个三级甲医院就是一个( B )。 A )有限总体 B )观察单位 C )无限总体 D )观察值 4.下面的变量中哪个是数值变量( B )。
A )每个病人就诊的科室
B )每个病人就诊的次数
C )每个病人就诊的疾病
D )每个病人就诊的医院
5.用某年全市的出生数和婴儿死亡数计算婴儿死亡率,这种方法是属于( C )。 A )抽样研究 B )参数估计 C )统计描述 D )统计推断
6.医学人口统计应属于卫生统计学中的哪部分内容( C )。 A )卫生统计学基本原理 B )卫生统计学基本方法 C )健康统计 D )卫生服务统计 7.下面哪一种统计资料的来源不属于经常性的资料( D )。 A )统计报表 B )门诊病例 C )出生报告卡 D )调查问卷
8.5人的血清滴度为1:20,1:40,1:80,1:160,1:320,则平均滴度是( B )。 A )1:40 B )1:80 C )1:160 D )1:320 9.某组资料共5例,
1902
=∑x
,30=∑x ,则均数和标准差分别是( D )
。 A )6, B ), C )38, D )6,
10.偏态分布数值资料,对数变换后,分布仍呈偏态。描述数据的集中趋势宜用( C )。 A )算术平均数 B )几何平均数 C )中位数 D )标准差
11.反映抗体滴度资料平均水平,适宜采用的指标是( B )。
A)算术均数B)几何均数
C)中位数D)标准差
12.描述一组对称(或正态)分布资料的变异度时,最适宜选择的指标是( B )。
A)极差B)标准差
C)四分位数间距D)变异系数
13.比较身高与体重的变异程度,适宜的指标是( D )。
A)极差B)标准差
C)四分位数间距D)变异系数
14.关于标准差,下面哪个说法是正确的( B )。
A)标准差可以是负数B)标准差必定大于或等于零
C)标准差无单位D)同一资料的标准差一定比均数小
15.关于变异系数,下面哪个说法是错误的( D )。
A)变异系数就是标准差与均数的比值
B)比较同一人群的身高、体重两项指标的变异度时宜采用变异系数
C)两组资料均数相差悬殊时,应用变异系数描述其变异程度
D)变异系数的单位与原始数据相同
16.正态分布曲线,当μ恒定时,α越大( C )。
A)曲线沿横轴越向左移动B)观察值变异程度越小,曲线越陡峭
C)观察值变异程度越大,曲线越平缓D)曲线沿横轴越向右移动
17.某年某地6岁的男孩身高服从正态分布,其均数为115.0cm,标准差为10cm,则( C )。
A)5%的6岁的男孩身高大于95cm B)5%的6岁的男孩身高大于105cm
C)%的6岁的男孩身高大于134cm D)%的6岁的男孩身高大于125cm
18.关于相对数,下列哪一个说法是错误的( D )。
A)相对数是两个有联系的指标之比B)常用相对数包括相对比,率与构成比
C)计算相对数时要求分母要足够大
D)率与构成比虽然意义不同,但性质相近,经常可以混用
19.某县流脑发病率动态分析显示:以1982年的10万为基期水平,83年流脑发病率降至10万,84年为10万,85年为10万,1985年的定基发展速度是( B )。
A)% B)% C)% D)%
20.对两地的结核病死亡率比较时作率的标准化,其目的是( D )。
A)为了能更好地反映人群实际死亡水平B)消除两地总人数不同的影响
C)消除各年龄组死亡率不同的影响D)消除两地人口年龄构成不同的影响21.随机抽取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为( C )。
A)35% B)% C)% D)无法计算
22.标化后的总死亡率( A )。
A)仅仅作为比较的基础,它反映了一种相对水平B)它反映了实际水平
C)它不随标准选择的变化而变化D)它反映了事物实际发生的强度
23.某日门诊各科疾病分类资料,可作为( C )。
A)计算死亡率的基础B)计算发病率的基础
C)计算构成比的基础D)计算病死率的基础
24.为表示某地近20年来婴儿死亡率的变化情况,宜绘制( A )。
A)普通线图B)直方图
C)直条图D)散点图
25.要表示某校18岁女生体重与肺活量的相关关系,宜绘制( C )。
A)直方图B)百分条图
C)散点图D)普通线图
26.直条图适用于( C )。
A)构成比资料B)连续性资料
C)各自独立的分类资料D)双变量资料
27.直方图适用于( D )。
A)构成比资料B)连续性资料
C)各自独立的分类资料D)数值变量的频数表资料
28.下面哪一种图要求纵轴必须从零开始,中间不可以有折断( B )。
A)百分条图B)直条图
C)直方图D)线图
29.下面中一种图,其横轴为连续性变量的组段,同时要求各组段的组距相等( C )。
A)百分条图B)直条图
C)直方图D)以上皆是
30.将某地居民的性别、年龄结合起来分组,研究不同性别、年龄别的住院率,这样得到的统计表属于( B )。
A)简单表B)复合表C)频数表D)四格表
二、填空题(每小题1分,共10分)
1.计数资料是指_将全体观察单位按照某种性质和类别进行分组,然后分别清点各组中的例数,这样所得到的数据__,常用的统计指标有__率__,____构成比等_,常用的统计方法有_u检验、卡方检验等_。P3 2.频率是对_样本__而言,概率是对_总体__而言。P7
3.统计资料的两个主要来源_经常性资料_,___一时性资料__。P7
4.收集统计资料的基本三个要求__资料必须完整、正确、及时_,_要有足够的数量_,_注意资料的代表性和可比性_。P8
5.主要从哪两个方面对原始资料进行检查与核对__原始数据有无错漏_,_数据间的相互关系是否合符逻辑_。P8
6.计量资料的分布特征有_集中趋势__和__离散趋势_。P12
7.描述计量资料离散趋势的常用指标有 极差,四分位数间距,方差和标准差,变异系数。P18-20 8.正态分布由参数_均数(μ_)_, 标准差(σ)_。P21 9.常用的相对数有_率_、__构成比__、__相对比_。P29
10.设计统计表的横纵标目时,基本要求是_必须合乎逻辑,主谓分明_,即横标目在表中作主语,表示被研究事物;纵标目在表中作谓语,表示被研究事物的各项统计指标_。P41-42
三、名词解释(每小题2分,共10分)
1.抽样研究p5
2.均数p13
3.构成比p29
4.动态数列p36
5.统计表p41
四、简答题(每小题3分,共18分)
1.描述离散趋势的指标有哪些它们各自的特点及适用条件
描述频数分布离散趋势的指标包括极差、四分位间距、方差和标准差及变异系数。
极差的特点是简单明了,但是不能反映全部数据的变异度,不够稳定。其适用条件是任何分布。
四分位间距的特点是比较稳定,但是不能反映全部数据的变异度,其适用条件一是偏态分布,二是末端无确定值。 方差有特点是可反映全部观察值的变异情况,但单位为原单位的平方,其适用条件是对称分布,尤其适用于正态分
布。
标准差的特点是可反映全部观察值的变异情况,但单位和原单位相同。其适用于对称分布,特别是正态分布。
变异系数的特点一是相对离散程度,二是没有度量衡单位,便于比较,所以适用条件一是量纲不同的资料,二是适用于均数相关悬殊的资料。
2.正态分布有哪些参数为什么说正态分布是很重要的连续性分布
。其答题要点为:总体均数μ和总体标准差σ被称为正态分布参数。μ为位置参数,它描述了正态分布集中趋势的位置;σ为展度参数,反映正态分布的离散程度。若已知某数值变量服从正态分布或近似正态分布,如同年龄、同性别儿童及同性别健康成人身高、体重等,可按正态分成的规律估计某个体变量值所在的范围,如95%的医学参考值的估计。同时正态分布是很多统计分析方法的基础。
3.了解正态分布曲线下面积分分布规律有何用处
其答题要点为:根据正态曲线下面积的分布规律,可以估计观察值的频数分布情况,通常用于估计95%的观察值所在范围和99%的观察值所在范围,临床医学常用以估计医学参考值范围。
4.应用相对数时有哪些注意事项
答题要点:常用的相对数指标有率、构成比、相对比。在应用相对数指标时应注意:(1)构成比与率是意义不同的两个统计指标,应用时不能相互混淆。构成比说明事物内部各组成部分所占的比重,而率则说明某事物或现象的发生频率或强度,不能以构成比代替率来说明问题。(2)样本含量太小时,不宜计算相对数,最好用绝对数来表示。(3)对各组观察例数不等的几个率,不能直接相加求其总率。(4)在比较相对时应注意资料的可比性。
5.率的标准化法的基本思想直接标化法需要的条件是什么
其答题要点为:当不同人群的总率进行比较时,若其人群的内部构成(如年龄、发生影响、病情轻重等)存在差异,而年龄、性别等因素对率有影响。为消除构成的影响,要按照统一标准构成对两个人群进行校正,使两个人群构成一致。这种选择统一构成,然后计算标准化率的方法称为率的标准化法。直接法计算标准化率需下面两个条件:(1)资料条件:已知实际人群的年龄别(级)率,且各年龄组率无明显交叉;选择标准人群的年龄组人口数或构成比。
6.绘制统计表的基本要求是什么p41-42
解答:统计表是以表格的形式列出统计指标。一张统计表只能有一个中心,项目的排列要合理。统计表由标题、标目、线条、数字四个基本部分构成。其基本要求如下。
(1)标题:要求用一句简明扼要的话说明表的内容,必要时注明资料的时间、地点,写在表的上方(中央)。
(2)标目:标目指明表内数字的含义,它分为横标目(主语作用)和纵标目(谓语作用),横标目放在表的左侧,表明表内同一横行数字的含义,表明被研究的事物;纵标目用来表明表内同一纵列数字的含义,表示被研
究事物的各项统计指标。标目的设计原则是符合逻辑,主谓分明、文字简明,纵标目应注明指标单位。
(3)线条:对统计表线条的基本要求是力求简洁,除必须绘制的顶线、底线、标目线、(必要时可绘制总标目线、合计线)之外,应尽量减少其它不必要的线条。
(4)数字:基本要求是必须准确无误,一律用阿拉伯数字表示。同一指标的数字的小数点位数应一致,位次对齐。数字为“零”填写“0”,暂缺或未计录入“…”,无数字用“—”表示。
(5) 备注:(非必要结构)需要说明某一项目时用“*”标记,将备注写在表的底线下方。
五、计算分析题(共32分)
名健康成年男性的血清总胆固醇(mg/dl )如下:222,142,136,212,129,207,172,150,
161,216,174,186,求均数和标准差。 (5分)
解答:
2107186174142222=++++=∑ x
3819111861741422222
2
2
2
2
=+++=∑ x
2.某市100名7岁男童的身高均数为120.0cm ,标准差为4.80cm 。问: (1)身高在110cm 以下者占该地7岁男童的百分数 (2)该地7岁男童身高的95%参考值范围
(3)若一男童身高为135.0cm ,怎样评价 (5分) 解答: (1)
查表得:%88.10188.0)08.2(==-Φ,即身高在110cm 以下者占该地7岁男童的%。 (2))41.129,59.110(80.496.112096.1=?±=±s x
即该地7岁男童身高的95%参考值范围为(110.59cm ,129.41cm )
(3)此男童身高为135cm ,高于95%参考值范围上限,可认为该男童身高偏高。
3.甲乙两医院历年乳腺癌手术资料见表1,是否可以认为乙医院有术后5年生存率(%)高于甲医院 甲乙两医院历年乳腺癌手术后5年生存率%
08.280
.4120
110-=-=-=
s x x u )
/(58.17512
2107dl mg n x x ===∑)
/(97.3211212
/21073819111
/)(222
dl mg n n x x
s =--=--=
∑∑
(6分)
主要考察:对象的总率受内部构成的影响——标准化
解答:不能认为乙医院有术后5年生存率(%)高于甲医院。主要原因:
(1)从分组看:无腋下淋巴结转移组, 5年生存率甲医院大于乙医院(%>%),有腋下淋巴结转移组, 5年生存率甲医院也大于乙医院(%>%)。提示甲医院的5年生存率两个组均高于乙医院。
(2)合计五年生存率出现乙医院高于甲医院,是由于乙医院观察病例中,无腋下淋巴结转移组所占的比例(300/383*100%)明显高于甲医院观察病例中无腋下淋巴结转移组所占的比例(45/755*100%)所致。即
内部构成对总率的影响。
(3)要比较甲乙两所医院总的5年生存率,应该进行标准化处理,消除内部构成对总生存率的影响。
4.某妇产科医院拟分析畸形儿与母亲分娩年龄关系,将历年在医院分娩的畸形儿116例与其母亲的年龄进行了如
(6分)
其答题要点:该资料为构成比资料,计算医院分娩的116名畸形儿的母亲的年龄分布,在这些畸形儿中母亲年龄26岁所占的比重最大,其次为24-29(除26岁外)各年龄组。不能根据该资料得出“母亲年龄在24-29岁时,最容易生出畸形儿”的结论。若要回答哪个年龄组母亲容易生出畸形儿,需要收集各年龄母亲出生的新生儿数及畸形儿资料,计算各年龄组母亲的畸形儿发生率。
5.将以下文字叙述经整理后,绘制成统计表。
某县防疫部门在该地区不同年龄组的人群中,开展了某种疫苗的预防接种工作,并进行了下列调查:接种前,观察1920人的锡克试验反应情况:其中:幼儿园儿童144人,阳性37人;小学生1417人,阳性323人;中学生359人,阳性41人。接种后,抽取482人作为样本,其锡克试验反应情况为:幼儿园儿童101人,阳性21人;小学生145人,阳性22人;中学生236人,阳性15人。(5分)
6.某医生列出下表,分析中小学生近视性眼底改变(弧形斑眼底)与年级高低、视力不良程度的关系。请问该表有哪些不符合列表原则和要求的地方,并予以改正。
视力不良程度轻中重备
注近视
眼人
数
弧形
斑眼
数
%近视
眼人
数
弧形
斑眼
数
%近视
眼人
数
弧形
斑眼
数
%
小学生21720143436033P<
初中生173301576212162P<
高中生903778517062P<
(5分)
原表存在以下不当
(1)无标题
(2)“视力不良程度”纵标目标识内容不当
(3)标的线条过于繁杂
(4)纵标目“%”的含义不明确等
原表可修改为:
《卫生统计学》第2次平时作业
一、选择题(每小题1分,共30分)
1.表示均数抽样误差大小的统计指标是( C )。
A )标准差
B )方差
C )均数标准误
D )变异系数
2.抽样研究中,s 为定值,若逐渐增大样本含量,则样本( B )。 A )标准误增大 B )标准误减少
C )标准误不改变
D )标准误的变化与样本含量无关 3.均数标准误越大,则表示此次抽样得到的样本均数( C )。 A )系统误差越大 B )可靠程度越大 C )抽样误差越大 D )可比性越差
4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为,标准差为 mmHg ,后者反映的是( A )。 A )个体变异 B )抽样误差
C )总体均数不同
D )抽样误差或总体均数不同
5.随机抽取上海市区120名男孩作为样本,测得其平均出生体重为3.20Kg ,标准差0.50 Kg 。则总体均数95%可信区间的公式是( B )。
A )±×
B )±×120
C )±×
D )±×120
6.下列关于总体均数可信区间的论述是正确的,除了( C )外。 A )总体均数的区间估计是一种常用的参数估计
B )总体均数可信区间所求的是在一定概率下的总体均数范围
得 分
教师签名
得 分 批改人
C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内
D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5%
7.总体率可信区间的估计符合下列(A、C)情况时,可以借用正态近似法处理。
A)样本例数n足够大时B)样本率p不太大时
C)np和n(1-p)大于5时D)p接近1或0时
8.正太近似法估计总体率95%可信区间用( D )。
A)p±B)p±σ
C)p±σ D)p±
9.统计推断的内容( C )。
A)用样本指标估计相应总体指标B)假设检验
C)A和B答案均是D)估计参考值范围
10.关于假设检验,下列哪个是正确的( A )。
A)检验假设是对总体作的某种假设
B)检验假设是对样本作的某种假设
C)检验假设包括无效假设和零假设
D)检验假设只有双侧的假设
11.两样本均数假设检验的目的是判断( C )。
A)两样本均数是否相等B)两总体均数的差别有多大
C)两总体的均数是否相等D)两样本均数的差别有多大
12.比较两种药物疗效时,对于下列哪项可作单侧检验( C )。
A)已知A药与B药均有效B)不知A药好还是B药好
C)已知A药不会优于B药D)不知A药与B药是否均有效
13.当总体方差已知时,检验样本均数与已知总体均数差别的假设检验是( B )。P88
A)只能用t检验B)只能用u检验
C)t检验或u检验 D)方差分析
14.完全随机设计的两样本均数t检验时,不仅要求数据来自正态分布总体,而且要求( B )。
A)两组数据均数相近,方差齐B)两组数据方差齐
C)两组数据均数相近D)两组数据的σ已知
15.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验( C )。P71公式判断A)t值符号相反,结论相反B)t值符号相同,结论相同
C)t值符号相反,但结论相同D)t值符号相同,但大小不同,结论相反
16.以下正确的一项是( D )。
A)配对设计的t检验中t值的分子是两样本均数之和
B)配对设计的t检验中t值的分子是差值的和
C)配对设计的t检验中t值的分母是差值的标准差
D)配对设计的t检验中t值的分母是差值均数的标准误
17.在比较完全随机设计两个小样本的均数时,需要(校正)t检验的情况是( A )。P69
A)两总体方差不等B)两样本方差不等
C)两样本均数不等D)两总体均数不等
18.假设检验时所犯的两类错误的关系是( B )。P76
A)n一定时,α减小则β减小B)n一定时,α减小则β增大
C)α值改变与β值无关D)n一定时,α减小则β不变
19.若检验效能1-β=,其含义是指( D )。P76
A)统计推断中有10%的把握认为两总体均数不相等
B)按α=,有90%的把握认为两总体均数相等
C)两总体均数确实相等时,平均100次抽样中,有90次能得出两总体平均有差别的结论
D)两总体均数确实有差别时,平均100次抽样中,有90次能得出两总体均数有差别的结论20.为调查我国城市女婴出生体重:北方n1=5385人,均数为3.08Kg,标准差为0.53Kg;南方n2=4896人,均数为3.10Kg,标准差为0.34Kg,经统计学检验,P=<,这意味着( D )。P77
A)南方和北方女婴出生体重的差别无统计学意义
B)南方和北方女婴出生体重的差别很大
C)由于P值太小,南方和北方女婴出生体重的差别无意义
D)南方和北方女婴出生体重的差别有统计学上的意义但无实际意义
21.完全随机设计的方差分析中的组间均方是( D )。P79
A)仅仅表示处理因素造成的差异
B)仅仅反映了个体差异和随机测量的误差
C)它是表示全部变量值总的离散程度的指标
D)反映了随机误差和可能存在的处理的综合结果
22.完全随机设计的方差分析中从总变异分出组间变异和组内变异是指( C )p78-79
A)从总均方中分出组间均方和组内均方
B)从组内离均差平方和分出各组的离均差平方和
C)从总离均差平方和分出组间离均差平方和和组内离均平方的(和)
D)从组间离均差平方和分出组间与组内的离均差平方和
23.方差分析的适用条件为( D )。P80
A)独立性B)正态性C)方差齐性D)以上都对24.四格表资料的卡方检验,其校正条件是( D )。P93
A)总例数大于40 B)有实际数为0
C)有实际数小于1 D)有一个理论数小于5大于1,且n>40
25.检验两年的菌型构成比有否差别,应选择的统计方法是( D )。类似p96例题
χ检验
A)完全随机设计方差分析B)配对计数资料2
χ检验D)行×列表资料2χ检验
C)四格表资料2
26.四格表资料的卡方检验时无需校正,应满足的条件是( D )。P93
A )总例数大于40
B )理论数大于5
C )实际数均大于1
D )总例数大于40且理论数均大于或等于5
27.某医师用A 药治疗9例病人,治愈7人,用B 药治疗10人例病人,治愈1人,比较两药疗效时,适宜的统计方法是( B )。P93
A )u 检验
B )直接计算概率法
C )2
χ检验 D )校正2
χ检验
28.多个率比较的卡方检验,其行×列表中的基本数字为( C )。P95 A )多个率的分子和分母 B )多个率的百分比
C )多个样本的实际阳性频数和阴性频数
D )多个样本的理论阳性频数和阴性频数 29.三个样本 比较的卡方检验,若P ≤,则结论是( D )。P96 A )三个样本率各不相同 B )总体率之间两两有差别
C )至少有两个总体率有差别
D )p 1、p 2、p 3不全相等或完全不相等 30.配对计数资料差别的卡方检验,其备择假设是( D )。P99 A )p 1=p 2 B )p 1≠p 2 C )B =C D )B ≠C
二、填空题(每小题1分,共10分)
1.在同一总体中随机抽取样本含量相同的若干样本时,_样本指标之间的差异_之间的差异以及样本指标_和_总体指标__的差异,称为抽样误差。P57
2.均数的标准误用符号___σx_______表示,它反映了_均数_之间的离散程度。P58 3.率的标准误用符号____σp______表示,它反映了_率与率_之间的离散程度。P58
4.T 分布与标准正态分布相比,其特征之一是自由度_v 越小_,则t 值 _越分散__,曲线变得_越低平__,尾部__翘得越高_。P59
5.参数估计有两种方法,即__点估计__和_区间估计_。P64
6.假设检验的目的是_判断两个(或多个)总体均数(或率)是否相等_。P87 7.检验假设有两种,即_无效假设(零假设)_和__被择假设__。P67 8.假设检验的前提是_确定检验水准(按一定的概率水准做出假设推断)。 9.2
χ值可反映___实际频数与理论频数的__符合程度。P92
10.四格表的四个基本数字是_两组资料的阳性频数、阴性频数(表中的a 、b 、c 、d )__。
三、名词解释(每小题2分,共12分)
1. 抽样误差P57
2.均数的抽样误差P57
3.检验水准P67
4.检验效能P76
5.四格表资料p91:两个样本率资料,即2行*2列的资料称为四个表资料,又称2*2表资料。
6.列联表资料p96:
四、简答题(每小题3分,共30分)
1.均数标准误的意义是什么与标准差有何区别
解答:
均数标准误是指在同一总体中随机抽取样本含量相同的若干样本时,样本均数之间的差异以及样本均数和总体均数的差异,是样本均数的标准差,反映抽样误差的大小。标准差是指个体指标值的离散程度指标,反映个体的变异程度。均数标准误与标准差比较:(1)计算公式不同;(2)在应用上,均数标准误主要用于对总体均数的参数估计和显著性检验,均数标准差主要用于医学参考值的确定。他们也有联系,一般而言,均数标准误根据标准差计算而得。
2.T分布的特征是什么
答题要点:T分布的特征包括:(1)以0为中心,左右对称的单峰分布;(2)自由度v=n-1越小,曲线变得越低平,尾部翘得越高;(3)随着自由度逐渐增大时,T分布逐渐逼迫标准正态分布;当自由度趋于∞时,T分布就完全成为标准正态分布。
3.为什么要做假设检验假设检验可以回答什么问题
答题要点:假设检验的目的是通过样本推断总体,即通过两个样本均数的比较来判断两个总体均数是否相等(以完全随机设计类型为例)。通过假设检验,可以回答两个样本均数的差异是由于抽样误差造成,还是由于两个总体均数不相等造成的。
4.T检验和u检验有何区别
解答:T检验和u检验有何区别
(1)适用对象有一定差别:T检验和u检验均适于样本均数与已知总体均数的比较、配对设计的比较、完全随机
设计的两样本均数的比较,但在样本率与总体率比较时,如果样本含量足够大,且p和(1-p)均不太小时
也可以应用率的u检验。
(2)适用条件不同:在计量资料的比较时:
t检验适用条件为总体标准差未知、样本含量较小(如小于或等于50)、样本来自正态分布总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。
U检验的适用条件为总体标准差未知但样本含量较大(如大于50),或者总体标准差已知时,选用u检验。
(3)计算的统计量不同:t检验计算统计量t,u检验计算统计量u。不同的资料和已知条件分别均有不同的计算公式。
5.怎样正确使用单侧检验与双侧检验p66
解答:在进行显著性检验时,应该根据专业知识来确定选择单侧检验或双侧检验。从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以选择单侧检验;在根据专业知识不能判断两种方法结果谁高谁低时,则选用双侧检验。
6.完全随机设计的两样本均数比较的t检验与方差分析之间的关系如何p84
解答:方差分析是用于多个样本均数比较的方法,而两个样本均数比较可以看作为多个样本均数比较的特例。完全随机设计的两个样本均数比较的t检验,可以用完全随机设计的方差分析代替,两者计算的结果有如下关系:F1/2=t。
7.请简述方差分析的基本思想。
答题要点:方差分析的基本思想就是将总变异分解成两个或多个部分。除随机误差外,其余每个部分的变异可以由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方,由F检验作出统计推断,从而了解该因素有无作用。
χ检验应用有何异同p89、90、94等
8.率的u检验和2
解答:
率的u检验适用于当样本含量足够大,且样本率p和(1-p)均不太小(如均大于5)时,样本率的分布近似正态分布,此时样本率与总体率差别的假设检验可以用率的u检验。当两个样本含量n1、n2均足够大,且两个样本率p1和(1-p1)、p2和(1-p2)均不太小(如均大于5)时,两个样本率差别的检验也可以选用率的u检验。
卡方检验则适用于两个或多个样本率差别检验。即主要适用于四个表资料、行*列表资料。
χ等于该资料的u检验的统计量u的平方,率的u检验、卡方检验的联系:对于四个表资料,自由度为1,统计量2
χ=u2。因此对于两个样本率的比较(四个表资料),应用卡方检验与应用率的u检验的检验结果应该相同。
即2
χ检验的适用条件是什么p93.
9.四格表资料2
解答
(1)当n>40,且有T>=5时,用卡方检验的基本公式或四个表专用公式。
(2)当n>40,且有1 (3) 当n=<40,或1= 10.行×列表资料一般包括哪些资料它们的检验目的有何不同 答题要点:行×列表资料一般包括多个样本率、多个构成比资料,其基本数据可整理成R 行C 列,称为R ×C 表,又称行×列表。多个样本率或构成比2 χ检验的目的是推断其总体率或构成比是否相同。对同一样本资料按其两个无序分类变量归纳成双向交叉排列的统计表,其行变量可分为R 类,列变量可分为C 类,这种表称为R ×C 列联表。列联表资料2 χ检验的目的是推断两变量之间分布是否相互独立,用列联表的独立性2 χ检验。尽管这两种行×列表检验目的和检验假设方面有所不同,但计算2 χ值和自由度的公式完全相同。 五、计算分析题(每小题3分,共18分) 1. 为了解某高原地区小学生血红蛋白含量的平均水平,某研究者随机抽取了该地区小学生800 名,算得其血红蛋白均数为105.0g/L ,标准差为10.0 g/L 。试求该地区小学生血红蛋白均数的95%可信区间。 分析:本题总体标准差未知,但n 足够大(n =800>50),可用u 分布方法估计总体均数的可信区间。 解答: 由已知条件可知: n =800 0.105=x s = g/L 故该地区小学生血红蛋白均数的95%可信区间为(,)g/L 2.某医师欲研究重点高中近视发生率,调查了400名中学生,近视人数为98人,试估计重点高中的学生近视发生率的95%可信区间。 分析:因为本题中的n 比较大,np =98>5,n(1-p)>5,所以本题可以用正态近似法估计总体率的95%的可信区间。 解答:样本率p =98/400= 即重点高中的学生近视发生率的95%可信区间为:%-%。 3.随机抽样调查129名上海市区男孩出生体重,均数为3.29Kg ,标准差为0.44Kg ,问: (1)估计全市男孩出生体重总体均数的95%可信区间 )69.105,31.104(800 .1096.10.1052/=? ±=±x a s u x 287 .0203.0400 ) 245.01(245.096.1245.0) 1(2 /2/-=-±=-±=±n p p u p s u p a p a (2)在郊区抽查100名男孩的出生体重,得均数为3.23Kg ,标准差为0.47Kg ,问市区和郊区男孩出生体重均数是否不同 (3)以前上海市区男孩平均出生体重为3 Kg ,问现在出生的男孩是否更重些了 分析:在解本题要注意两点:一是该题为双侧检验,其检验水准为;二是两样本含量较大,故在检验时应采用完全随机设计的两样本u 检验。答题步骤如下: (1) 故全市男孩出生体重总体均数的95%可信区间为(-)Kg 。 (2) (A )建立检验假设,确定检验水准 。 H 0:μ1=μ2,即市区和郊区男孩出生体重均数相同 H 1:μ1≠μ2,即市区和郊区男孩出生体重均数不同 本题中为双侧检验,则检验水准α= (B )计算检验统计量 两样本含量较大,故采用完全随机设计的两样本u 检验。 (C )确定P 值,作出推断结论。 因为双侧、2=,本题u=<,所以,P>,按α=水准,不拒绝H 0,尚不能认为市区和郊区男孩出生体重均数不同。 (3)(A )建立检验假设,确定检验水准。 H 0:μ1=μ2,即现在出生的男孩出生体重与以前相同 H 1:μ1≠μ2,即现在出生的男孩出生体重与以前不同 本题中为单侧检验,则检验水准α= (B )选定检验方法,计算检验统计量 已知n =129,平均体重=,s =,μ0=3 (C )确定P 值,作出推断结论。 本题u=>,所以,P<,按α=水准,拒绝H 0,接受H 1,认为现在出生的男孩出生体重比以前更重。 4.某医生研究使用麻醉剂前后患者血清LDH 活力变化情况,数据如下表: Kg s u x x a )37.321.3(129 44.096.129.32/-=?±=±985 .0100 47 .012944.023.329.32 2 2 22 121 21=+-= +-=n s n s x x u 49 .7129 /44.0329.3/0=-= -=n s x u μ 结论:与麻醉前比较,经完全随机设计的两样本均数比较的t检验,P> 问:该统计方法是否合理请说明理由。 分析:在解本题的关键是要准确理解t检验的应用条件。答题步骤如下: 该统计方法不合理。本题研究的研究目的是比较使用麻醉剂前后患者血清LDH活力。该情况为同一受试对象处理前后的结果进行比较,属于配对设计。因为总体标准差未知,样本含量 n(n=12)较小,所以应该使用配对设计t检验的方法。 5 分析:在解本题的关键是根据已知的统计分布表判断此资料属于正态分析。答题步骤如下: (1)根据该资料可以描述集中趋势的指标,即平均指标;描述离散趋势的指标,即标准差。 (2)根据该资料可以分性别估计FEV1的95%医学参考值范围。 (3)根据该资料可以分性别估计FEV1的95%可信区间。 (4)根据该资料可以比较男性和女性的FEV1是否不同。 6.用两种剂量的电离辐射照射小白鼠,第一种剂量照射30只,10天内死亡17只;第二种剂量照射31只,同期内死亡9只。问两种剂量对小白鼠的致死作用是否相同 解题要点 根据题意列表如下: 此资料属于四格表资料,据此做卡方检验 (1) 建立检验假设、确定检验水准 Ho: 两种剂量对小白鼠的致死作用相同,即π1=π2 H1: 两种剂量对小白鼠的致死作用不相同,即π1≠π2 α= (2) 计算统计量2 χ54 本例n>40,所有T>5,则 2χ=【(13*9-17*22)2 *61】/(30*31*22*39)= (3) 确定p 值,作出推断结论 V=1,查2 χ界值表,本题2 χ=>3,84,故p<,按α=水准,拒绝H0,接受H1,即可以认为两种电离辐射照射剂量对小白鼠的致死作用不相同。 《卫生统计学》第3次平时作业 一、选择题(每小题1分,共24分) 1.下列统计方法中属于非(参检验的)是( D )。P103 A )u 检验 B )t 检验 C )方差检验 D )秩和检验 2.配对计量资料,差值分布不接近正态分布,应选用( C )。P104 A )配对t 检验 B )2 χ检验 C )配对比较的符号秩和检验 D )两样本比较的秩和检验 3.作配对比较的符号秩和检验,其统计量是( B )。P105 A )F 值 B )T 值 C )H 值 D )M 值 4.两样本 比较的秩和检验中,备择假设是( B )。P108 A )两个样本的总体分布相同 B )两个样本的总体分布不同 C )两个样本的总体均数不同 D )差值总体的中位数不等于0 5.两个小样本计量资料的比较,首先应考虑( D )。P107 A )用t 检验 B )用秩和检验 C )t 检验或秩和检验均可 D )资料符合 t 检验还是符合秩和检验 6.秩和检验与t 检验比较,其优点是( D )。P103 A )检验效率较高 B )计算方法简便 C )公式更为合理 D )不受分布限制 7.如果能用t 检验处理的资料而用秩和检验,其缺点是( A )。P103 A )检验效率降低 B )求秩和不对 C )计算方法复杂 D )结果判断全错 8.散点呈直线趋势分布,当x 值增大,y 值则相应减少,可初步判断两变量为( C )。P118-119 A )散点完全在一条直线上 B )散点完全在一条直线上,且随x 值增大,y 值有增大趋势 C )散点分布大致呈直线,且随x 值增大,y 值减小 D )散点分布大致呈直线,且随x 值增大,y 值增大 9.散点密集于一条直线,且呈水平分布,可初步判断两变量为( C )。P118-119 A )正相关关系 B )负相关关系 C )无相关关系 D )不能确定 10.相关系数的取值范围是( B )。P119 A )-1 B )-1≤r ≤1 C )r 取值任意实数 D )r 取非负数 11.若r=,对r 作假设检验的结果为P>,则( A )。P121 A )认为两变量无直线相关 B )认为两变量有直线相关 C )证明两变量一定不存在直线相关 D )尚不确定两变量有无相关关系 12.样本相关系数的假设检验,其备择假设为( D )。P121 A )ρ=0 B )r ≠0 C )r =0 D )ρ≠0 13.根据样本算得相关系数r ,经t 检验表明相关系数r 具有高度的统计学意义(P<),则可以认为( D )。 A )样本来自高度相关的相关总体 B )两变量相关关系极为密切,即r> C )与P<比较而言,有更大的把握接受无效假设H 0,得出总体相关系数ρ=0的结论 D )与P<比较而言,有更大的把握得出两变量存在直线相关关系(即ρ≠0)的结论 14.对同总体连续抽取两次样本,分别计算其相关系数r 1与r 2,若直接查表法的检验结果为:)1(01.01'n r r ?, )2(05.02'n r r ?,则可认为( C ) 。 A )r 1>r 2 B )r 1 C )不能据此确定r 1与r 2的大小 D )两组资料的相关密切程度肯定不一样 15.对双变量资料作直线相关分析时,所建立的直线回归方程与各散点之间的关系是( B )。P123 A )各散点都将散落在由直线回归方程所确定的回归直线上 B )各散点与该回归直线的纵向距离平方和是最小的 C )要求各散点应尽量靠近该回归直线 D )以上都不对 16.直线回归系数假设检验,其自由度为( C )。P125 A )n B )n -1 C )n -2 D )2n -1 17.关于相关系数,下列说法错误的是( D )。P125-126 A)相关系数是说明两变量间相关关系的密切程度与相关方向的指标 B)相关系数没有单位 C)相关系数的绝对值小于或等于1 D)相关系数与回归系数的符号相同,且呈正比关系 18.下列有关等级相关的叙述,错误的是( C )。 A)等级相关是一种非参数统计分析方法 B)总体分布型未知的双变量资料适宜作等级相关分析 C)等级相关分析是用相关系数r来说明两变量相关关系的密切程度与相关方向.(r s) D)等级相关分析计算简便,适用面广 19.在缺乏有关历史资料,或指标难以数量化时,常用的筛选评价指标的方法是( C )。P133 A)文献资料分析优选法B)多元回归法 C)系统分析法D)指标聚类法 20.在掌握有关历史资料的条件下,对于可数量化的指标,常用的筛选评价指标的方法是( B )。P133 A)文献资料分析优选法B)多元回归法 C)系统分析法D)指标聚类法 21.下面的评价指标的权重估计方法中,哪一种是客观定权法(D )。P134 A)专家的个人判断B)专家会议法 C)Satty权重法D)相关系数法 22.可用于正态分布的资料的各评价指标诸等级分值的确定方法是( C )。P137 A)综合评分法B)专家评分法 C)离差法D)百分位法 23.可用于偏态或不明分布的资料的各评价指标诸等级分值的确定方法是( D )。P137 A)综合评分法B)专家评分法 C)离差法D)百分位法 24.在下列何种情况下,可认为判断矩阵具有较满意的一致( A )。P145 A)当CR<时B)当CR>时 C)当CR<1时 D)当CR>1时 二、填空题(每小题1分,共12分) 1.参数检验方法,如u检验,通常是在假定_样本来自正态总体__的基础上对总体参数进行的检验。P103 2.非参数检验的两个特点是:①非参数检验不要求对总体参数作出任何假设;②非参数检验不是直接对总体参数进行的估计和检验,而考察的是总体的分布情况。P103 3.非参数检验适用于任何分布的资料,如_严重偏态资料_,又如_分布形态不明__的资料。P103