第一套试卷及参考答案
一、选择题(40分)
1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )
A 条图
B 百分条图或圆图C线图D直方图
2、均数和标准差可全面描述 D 资料的特征
A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布
3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )
A 用该市五岁男孩的身高的95%或99%正常值范围来评价
B 用身高差别的假设检验来评价
C 用身高均数的95%或99%的可信区间来评价
D 不能作评价
4、比较身高与体重两组数据变异大小宜采用(A )
A 变异系数
B 方差
C 标准差
D 四分位间距
5、产生均数有抽样误差的根本原因是( A )
A.个体差异
B. 群体差异
C. 样本均数不同
D. 总体均数不同
6. 男性吸烟率是女性的10倍,该指标为(A )
(A)相对比(B)构成比(C)定基比(D)率
7、统计推断的内容为( D )
A.用样本指标估计相应的总体指标
B.检验统计上的“检验假设”
C. A和B均不是
D. A和B均是
8、两样本均数比较用t检验,其目的是检验( C )
A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同
9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )
(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2
10、标准误反映(A )
A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度
11、最小二乘法是指各实测点到回归直线的(C)
A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小
12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)
A t r>t b
B t r C t r= t b D二者大小关系不能肯定 13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D ) A分别按x1和x2从小到大编秩 B把x1和x2综合从小到大编秩 C把x1和x2综合按绝对值从小到大编秩 D把x1和x2的差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20.05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大 C 由于P值太小,南方和北方女婴出生体重差别无意义 D 南方和北方女婴出生体重差别有统计学意义但无实际意义。 17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(A ) A 两个样本率的差别 B 两个样本率的标准误 C 两个总体率的差别 D 两个总体率的标准差 18. 下列指标不属于相对数的是(D ) A 率 B 构成比 C 比D百分位数 19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:(D ) 表1 盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效 组别治愈显效进步无效合计 左西替利嗪片组49 8 5 2 64 西替利嗪片组44 10 9 3 66 A. 检验B. 成组t检验C. u检验D. 秩和检验 20、下列哪种说法是错误的(B ) A 计算相对数尤其是率时应有足够的观察单位或观察次数 B分析大样本数据时可以构成比代替率 C 应分别将分子和分母合计求合计率或平均率 D 样本率或构成比的比较应作假设检验 二、填空题(20分) 1、现有若干名儿童健康检查一览表的部分检测指标,见表2 表2 某年某地儿童健康检查部分检测结果 编号性别年龄(周岁)身高(cm)坐高(cm)血型表面抗原肝大 1 男7 116.7 66.3 A + ++ 2 女8 120.0 68. 3 AB - - 3 女10 126.8 71.5 O - + 4 男9 123.7 70.0 A - - . . . . . . . . . . . . . . . . 问: ①上述变量中能形成计数资料的指标有性别、血型、表抗 ②计量资料的指标有年龄、身高、体重 ③等级资料的指标有肝大 ④对于身高或坐高指标,在进行统计描述时宜计算均数和标准差表示其集中趋势和离散趋势。 ⑤对于血型指标宜计算构成比表示各种血型的构成 ⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的t检验 ⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方检验 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为341.48/10万 3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重复 三、简答题(20分) 1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分) 均数:正态或近似正态分布 几何均数:等比数列或对数正态分布资料 中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。 2、何谓假设检验?可以举例说明。(5分) 首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。 3、请你谈谈对假设检验结论的认识。(5分) 由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5分) 四、计算分析题10分*2=20 1、请将下列数据编制成合格的统计分析表。 表1 四种脐带消毒方法效果比较 组别总例数感染例数百分比,% 庆大霉素(8万单位/10毫升) 30 1 3.3 新洁尔灭(0.1%)30 3 10 生理盐水冲洗服四环素3天30 5 16.7 生理盐水冲洗30 8 26.7 2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。 某医院门诊沙眼病人年龄构成比 年龄组 (岁) 0- 10- 20- 30- 40- 50- 60- 70- 计 沙眼人数47 198 330 198 128 80 38 8 1027 沙眼百分 4.6 19.3 32.1 19.3 12.4 7.8 3.7 0.8 100.0 比(%) 问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标? 答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。 第二套试卷及参考答案 一、最佳选择题(40分) 1.均数是表示变量值_A_水平的指标。 (A) 平均(B)变化范围(C)频数分布(D)相互间差别大小 2.原始数据同乘以一个不等于0的常数后_D_。 (A) 均数不变、标准差变(B)均数、标准差均不变(C)均数变、标准差不变(D)均数、标准差均变 3.描述正态或近似正态分布资料特征的是__B____。 (A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距 4.描述偏态分布资料特征的是_A__。 (A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距 5.均数与标准差计算的数值A 。 (A)均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以 (C)两者都可以是负数(D)两者都不可以是负数 6、比较身高和体重两组资料的变异度大小宜采用___C___。 (A) 极差(B)标准差(C)变异系数(D)四分位间距 7.说明某事物内部各组成部分所占比例应选_B___。 (A) 率(B)构成比(C)相对比(D)标准差 8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。 (A)S (B)R (C)CV (D) 9. 已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是 C (A)5 (B)28 (C)29 (D)4 10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为 A (A)95% (B)49.5% (C)99% (D)97% 11.两样本均数间的差别的假设检验时,查t界值表的自由度为 C (A)n-1 (B)(r-1)(c-1)(C)n1+n2-2 (D)1 12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A (A)总体中个体值存在差别(B)样本中个体值存在差别(C)样本只含总体的一部分(D)总体均数不等于0 13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小 B (A)α=0.05 (B) α=0.20 (C) α=0.01 (D) α=0.10 14. 比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。 (A)线图(B)条图(C)半对数线图(D)圆图 15.构成比用来 C (A) 反映某现象发生的强度 (B) 表示两个同类指标的比 (C) 反映某事物内部各部分占全部的比重 (D) 表示某一现象在时间顺序的排列 16.某医院的资料计算各种疾病所占的比例,该指标为 D (A)发病率(B) 患病率(C) 相对比(D)构成比 17.等级资料的比较宜用 C (A) t检验(B) 检验(C) 秩和检验(D) 方差分析 18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于 C (A)T11(B)T12 (C) T21 (D)T22 19.四格表校正x2检验公式适用于 D (A)n<40, T>5 (B)n<40, 1 20.同一双变量资料,进行直线相关与回归分析,有 B (A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b 二、填空题12分 1、统计资料按其性质不同,通常将资料分为(计量、计数、等级) 三种类型。 2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为( 统计描述)与(统计推断)两个阶段。 3、计量资料,随着样本例数的增大,S逐渐趋向于( σ ),逐渐趋向于( 0 )。 4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。 5、( 相关分析)侧重于考察变量之间相关关系密切程度,(回归分析)则侧重于考察变量之间数量变化规律。 6、对某地一年级12名女大学生体重(x :单位kg)与肺活量(y:单位L)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:?=0.000419+0.058826X,这意味着体重每增加1kg ,肺活量平均增加(0.058826L );且两者之间为( 正)相关。 三、名词解释13分 1.参数和统计量 2.概率 3.计数资料 4.回归系数答案见书本相应的位置 四、简答题15分 1. 抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。 2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的? 答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异 因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么? 答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。 五、计算分析题 1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 修改表:某年某地1964-1968年某病住院期与急性期病死率比较 年份病例数住院期急性期 死亡总数总病死率(%)死亡数病死率(%) 1964 17 8 47.1 7 41.2 1965 13 5 38.5 4 30.8 1966 15 7 46.7 6 40.0 1967 15 6 40.0 6 40.0 1968 12 4 33.3 4 33.3 合计72 30 41.7 27 37.5 2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可) 表1 某新药临床试验部分指标 医院代码性别身高体重疗效组别 1 1 175.00 63.00 3 0 1 2 157.00 54.00 2 0 1 1 178.00 67.00 2 1 1 2 165.00 50.00 3 0 . 2 162.00 51.00 4 0 . 2 156.00 48.00 2 1 . 1 176.00 62.00 2 1 . 1 184.00 72.00 2 0 5 1 168.00 65.00 2 0 5 2 166.00 46.00 2 1 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。两组疗效比较可用秩和检验。 第三套试卷及参考答案 一、选择题20分 1.7人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为__C__ A.1:12.4 B.1:8 C.1:16 D.1:8~1:16 2.比较身高和体重两组数据变异度大小宜采用___A___ A.变异系数 B.方差 C.极差 D.标准差 3.下列关于个体变异说法不正确的是__C__ A.个体变异是生物体固有的。B.个体变异是有规律的。 C.增加样本含量,可以减小个体变异。 D.指标的分布类型反映的是个体的分布规律。 4.实验设计的原则是__C___ A.对照、随机、均衡B.随机、重复、均衡 C.对照、重复、随机D.随机、重复、齐同 5.说明某现象发生强度的指标为__B____ A.平均数B.率C.构成比D.相对比 6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C表后,其卡方值的自由度为__C_ A.8 B.1 C.3 D.跟样本含量有关 7.假设检验中的第一类错误是指_A__所犯的错误。 A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0D.不拒绝实际上不成立的H0 8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高__D___ A.B.C.D. 9.两样本均数的t检验对资料的要求是_D___ A.正态性、独立性、方差齐性B.资料具有代表性C.为定量资料D.以上均对 10.四个率的比较的卡方检验,P值小于0.01,则结论为_D__ A.四个总体率均不相等;B.四个样本率均不相等; C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。 二、名词解释10分 1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率;答案:见书上相应的地方 三、填空题10分 1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样(系统抽样),分层抽样,整群抽样 2、统计推断的内容主要包括参数估计和假设检验。 3、临床观察7名某病患者,其潜伏期(天)各为:3,7,9,5,6,9,16,则其全距为13天。 4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:⑴有效⑵无效⑶有效(4)有效……⒇无效,这种资料属于何种类型资料计数资料。 5、实验研究的基本要素是:处理因素、受试对象、实验效应 四、简答题20分 1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。 2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。 3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义? 答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95% 表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。为什么? 答:没有这个规律。相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。 五、分析计算题40分 1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。 男婴x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 女婴x2 7.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3 (1)该资料是数值变量资料还是分类资料?数值变量资料 (2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t检验 (3)经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。 答:H0:白种人男婴与女婴的出生体重是相同的即μ1=μ2 H1:μ1≠μ2α=0.05 t=2.16 ν=22t>t0.05/2,22=2.07 p<0.05 在α=0.05水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。 2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。 疗法治疗人数治愈人数未愈人数治愈率(%) 甲33 26 7 78.79 乙38 36 2 94.74 合计71 62 9 87.32 (1)请计算最小的理论数。T min=9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法?四格表校正卡方检验 (3)已知检验统计量为2.92,请下结论。 因χ2=2.92<3.84, P>0.05 结论:在α=0.05水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。 3 比较缺氧条件下猫和兔的生存时间(时间:分) 猫兔 生存时间秩次生存时间秩次 25 5.5 14 1 34 10 15 2 38 11 16 3 40 12 18 4 41 13 25 5.5 42 14 26 7 45 15 28 8 30 9 (1) 该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2) 对资料进行编秩;见表 (3) 该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组39.5 (4) 写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。 4. 请完成以下空白并进行描述性分析。 年龄(岁)人口数死亡总 数 恶性肿瘤死 亡数 恶性肿瘤死亡占总 死亡的% 恶性肿瘤死亡率 (1/10万) 年龄别死亡率 (‰) 0- 82920 ( ) 4 2.90 ( ) ( ) 20- ( ) 63 ( ) 19.05 25.73 ( ) 40- 28161 172 42 ( ) ( ) ( ) 60- ( ) ( ) 32 ( ) ( ) ( ) 合计167090 715 90 12.59 ( ) ( )