《卫生统计学》试卷(3)答案
- 格式:doc
- 大小:118.50 KB
- 文档页数:10
卫生统计学考试试题及答案一、选择题(每题2分,共20分)1. 卫生统计学研究的对象是()A. 疾病的发生与发展规律B. 疾病的流行规律C. 疾病的防治措施D. 疾病的统计方法答案:B2. 下列哪种分布类型属于偏态分布()A. 正态分布B. 二项分布C. Poisson分布D. 偏态分布答案:D3. 在卫生统计学中,下列哪种指标用于描述数据的离散程度()A. 平均数B. 中位数C. 极差答案:D4. 在卫生统计学中,下列哪种指标用于描述两个变量之间的关系()A. 相关系数B. 回归系数C. t检验D. χ²检验答案:A5. 下列哪种检验方法用于比较两个样本率的差异()A. t检验B. χ²检验C. F检验D. Z检验答案:B6. 在卫生统计学中,下列哪种检验方法用于比较两个独立样本的均数差异()A. t检验B. χ²检验D. Z检验答案:A7. 在卫生统计学中,下列哪种检验方法用于比较两个相关样本的均数差异()A. t检验B. χ²检验C. F检验D. 配对t检验答案:D8. 下列哪种情况适宜采用秩和检验()A. 数据分布未知B. 数据分布已知C. 数据为正态分布D. 数据为偏态分布答案:A9. 在卫生统计学中,下列哪种检验方法用于分析多因素对结果的影响()A. 单因素方差分析B. 多因素方差分析C. 多元回归分析D. 多重线性回归分析答案:C10. 下列哪种情况适宜采用logistic回归分析()A. 因变量为连续变量B. 因变量为分类变量C. 自变量为连续变量D. 自变量为分类变量答案:B二、填空题(每题2分,共20分)1. 卫生统计学中的基本任务包括:①数据的收集;②数据的整理;③数据的描述;④______。
答案:数据的分析2. 在卫生统计学中,描述数据集中趋势的指标有:平均数、中位数、众数,其中______是唯一一个位置平均数。
答案:中位数3. 在卫生统计学中,描述数据离散程度的指标有:极差、方差、标准差,其中______是方差的平方根。
自考卫生统计学试题及答案一、单项选择题(每题2分,共20分)1. 卫生统计学是一门应用______的学科。
A. 社会学B. 数学C. 医学D. 经济学答案:B2. 下列哪项不是卫生统计学的研究内容?A. 疾病流行情况B. 健康服务需求C. 医疗资源分配D. 文学创作答案:D3. 总体是指研究中所要考察研究对象的______。
A. 个体B. 群体C. 样本D. 全部答案:B4. 卫生统计中的样本容量是指______。
A. 样本中的个体数B. 总体中的个体数C. 样本的体积或重量D. 总体的体积或重量答案:A5. 描述集中趋势的统计量不包括以下哪项?A. 平均数B. 中位数C. 众数D. 极差答案:D二、多项选择题(每题3分,共15分)6. 卫生统计学中常用的数据类型包括()。
A. 分类数据B. 顺序数据C. 计数数据D. 连续数据E. 时间数据答案:A B C D7. 下列哪些是描述离散趋势的统计量?()A. 方差B. 标准差C. 极差D. 均数E. 四分位数间距答案:A B C E8. 在卫生统计学中,以下哪些因素会影响统计推断的可靠性?()A. 样本容量B. 抽样方法C. 数据质量D. 统计方法E. 研究目的答案:A B C D三、简答题(每题10分,共20分)9. 简述卫生统计学在医学研究中的应用。
答案:卫生统计学在医学研究中的应用主要包括:疾病流行病学的调查与分析、临床试验设计与评估、医疗质量的监控与改进、健康服务研究、医疗资源的规划与分配等。
10. 描述卫生统计学中标准正态分布的特点。
答案:标准正态分布是一种特殊的正态分布,其均数为0,标准差为1。
它具有以下特点:对称性,以均数为中心左右对称;连续性,连续分布在整个实数轴上;正态性,数据分布呈现钟形曲线;无偏性,均数、中位数和众数相等;稳定性,样本均数的分布接近正态分布。
四、计算题(每题15分,共30分)11. 某地区进行健康体检,随机抽取了100名成年人,测量了他们的血压。
2004 ~2005 学年第( 1)学期预防医学专业本科期末考试试卷(卫生统计学课程)姓名 ____________________班级 ____________________学号 ____________________考试时间: 200年月日午—(北京时间)一、选择题(每题 1 分,共 60 分)1、A1、A2 型题答题说明:每题均有A、B、C、D、E 五个备选答案,其中只有一个正确答案,将其选出,并在答题卡上将相应的字母涂黑。
..1.某 7 人体重( Kg)资料分别为 66 ,48,53,49,55, 52, 48,则该组数据的中位数为:A. B. 49.0 C. D .比较7岁男童与17 岁青年身高的变异程度,宜用:A.极差B. 四分位数间距C. 方差D. 标准差E. 变异系数3. 根据观测结果,已建立 y 关于 x 的回归方程?2.03.0x ,该回归方程表示x 每增加 1y个单位, y 平均增加几个单位A. 1B. 2C. 3D. 44. 设从11.5 的总体中作五次随机抽样(n= 5),问哪一个样本的数据既精确又准确A. 8 , 9, 10, 11, 12B. 6 , 8, 10, 12, 14C. 6 , 10, 12, 14, 18D. 8 , 10, 12,14, 16E.10 ,11, 12,13, 145.为表示某地近 20 年来婴儿死亡率的变化情况,宜绘制A. 散点图B.直条图C.百分条图D. 普通线图E.直方图6.临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗 5 例,问其中至少 2 例有效的概率约为A. B. 0.087 C. E.以上都不对7.二项分布、 Poisson 分布、正态分布各有几个参数A.1 ,1,2B. 2 ,1,2C. 1 ,2,2D.2 ,2,2E. 1,2,18. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为:A.18B.9C.3D.81E.279.对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的相关系数越大,回归系数也越大。
医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
卫⽣统计学试卷(含答案)卫⽣统计学试卷姓名:__________ 考试时间:_______ ___(本⼤题满分40分,每⼩题1分)1. 算术均数适⽤于:( )A. 偏态分布资料B. 分布类型不明的资料C. 对数正态分布资料D. 以上都不是E. 正态分布资料2. 某医⽣在进⾏科室病例资料统计时,拟⽤算术平均数表⽰平均⽔平,应当选⽤什么样的资料:( )A. 性质不同的变量值B. 差异相同的变量值C. 性质相同的变量值D. 个体差异较⼤的变量值E. 个体差异较⼩的变量值3. 均数与标准差适⽤于:( )A. 正态分布B. 正偏态分布C. 不对称分布D. 偏态分布E. 负偏态分布4. 样本含量的估计是( )。
A. 不必估计,调查整个总体最好B. 保证研究结论具有⼀定可靠性的前提下确定的最少例数C. 经济条件允许的情况下,越多越好D. 时间允许的情况下,越多越好E. 根据实际情况,能选多少是多少5. 标化后的总死亡率:( )A. 它反映了事物实际发⽣的强度B. 以上都不对C. 它反映了实际⽔平D. 它不随标准选择的变化⽽变化E. 仅仅作为⽐较的基础,它反映了⼀种相对⽔平6. 下⾯说法中不正确的是( )。
A. 抽样误差的⼤⼩⼀般⽤标准误来表⽰B. 好的抽样设计⽅法,可避免抽样误差的产⽣C. 没有个体差异就不会有抽样误差D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别E. 医学统计资料主要来⾃统计报表、医疗⼯作记录、专题调查或实验等7. 计算某⾎清⾎凝抑制抗体滴度的平均⽔平,宜⽤:( )A. 四分位数B. ⼏何均数C. 相对数D. 中位数E. 均数8. 变异系数是表⽰资料的:( )A. 对称分布B. 平均⽔平C. 相对变异D. 集中趋势E. 变异数9. 统计上所说的样本是指:( )A. 总体中的每⼀个个体B. 按照随机原则抽取总体中有代表性部分C. 按照研究者要求抽取总体中有意义的部分D. 有意识的抽取总体中有典型部分E. 随意抽取总体中任意部分10. ⼀群7岁男孩⾝⾼标准差为5cm,体重标准差为3kg,则⼆者变异程度⽐较:( )A. ⾝⾼变异⼩于体重B. ⾝⾼变异不等于体重C. ⾝⾼变异等于体重D. ⽆法⽐较E. ⾝⾼变异⼤于体重11. 某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:( )A. GB. CvC. XD. SE. M12. t<t0.05(v),统计上可认为:( )A. B、两样本均数,差别⽆显著性B. 两总体均数,差别有显著性C. 两样本均数,差别有显著性D. 两总体均数,差别⽆显著性E. 以上均不是13. 下列关于统计表的要求,叙述错误的是:( )A. 不宜有竖线及斜线B. 标题位于表的上⽅中央C. 线条要求三线式或四线式D. 备注不必列⼊表内E. ⽆数字时可以不填14. 四个样本率作⽐较,x2>x20.01(3),可以认为:( )A. 各总体率不同或不全相同B. 各总体率均不相同C. 样本率与总体率均不相同D. 各样本率均不相同E. 各样本率不同或不全相同15. 计算标化率的⽬的是:( )A. 起加权平均的作⽤B. 使率能更好的代表实际⽔平C. 使⼤的率变⼩,D. 消除资料内部构成不同的影响,使率具有可⽐性E. 使⼩的率变⼤16. 四格表资料在哪种情况下作χ2检验不必校正( )。
福建医科大学202 年第学期《卫生统计学》课程考试试题姓名年级层次专业学号、1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.A.大约有95人的潜伏期小于57.8小时B.大约有5人的潜伏期大于57.8小时C.大约有5人的潜伏期小于57.8小时D.大约有8人的潜伏期大于57.8小时E.大约有8人的潜伏期小于57.8小时9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.A.t值不变B.t值变小C.t值变大D.t值变小或变大E.不能判断11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计14.以下属于分类变量的是___________.A.IQ得分B.心率C.住院天数D.性别E.胸围15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于016.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄(岁):10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图【答案】E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
卫生统计学试卷姓名:__________ 考试时间:_______ ___一、单选题,以下各题有多个选项,其中只有一个选项是正确的,请选择正确答案(本大题满分40分,每小题1分)1. 算术均数适用于:( )A. 偏态分布资料B. 分布类型不明的资料C. 对数正态分布资料D. 以上都不是E. 正态分布资料2. 某医生在进行科室病例资料统计时,拟用算术平均数表示平均水平,应当选用什么样的资料:( )A. 性质不同的变量值B. 差异相同的变量值C. 性质相同的变量值D. 个体差异较大的变量值E. 个体差异较小的变量值3. 均数与标准差适用于:( )A. 正态分布B. 正偏态分布C. 不对称分布D. 偏态分布E. 负偏态分布4. 样本含量的估计是( )。
A. 不必估计,调查整个总体最好B. 保证研究结论具有一定可靠性的前提下确定的最少例数C. 经济条件允许的情况下,越多越好D. 时间允许的情况下,越多越好E. 根据实际情况,能选多少是多少5. 标化后的总死亡率:( )A. 它反映了事物实际发生的强度B. 以上都不对C. 它反映了实际水平D. 它不随标准选择的变化而变化E. 仅仅作为比较的基础,它反映了一种相对水平6. 下面说法中不正确的是( )。
A. 抽样误差的大小一般用标准误来表示B. 好的抽样设计方法,可避免抽样误差的产生C. 没有个体差异就不会有抽样误差D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别E. 医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等7. 计算某血清血凝抑制抗体滴度的平均水平,宜用:( )A. 四分位数B. 几何均数C. 相对数D. 中位数E. 均数8. 变异系数是表示资料的:( )A. 对称分布B. 平均水平C. 相对变异D. 集中趋势E. 变异数9. 统计上所说的样本是指:( )A. 总体中的每一个个体B. 按照随机原则抽取总体中有代表性部分C. 按照研究者要求抽取总体中有意义的部分D. 有意识的抽取总体中有典型部分E. 随意抽取总体中任意部分10. 一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:( )A. 身高变异小于体重B. 身高变异不等于体重C. 身高变异等于体重D. 无法比较E. 身高变异大于体重11. 某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:( )A. GB. CvC. XD. SE. M12. t<t0.05(v),统计上可认为:( )A. B、两样本均数,差别无显著性B. 两总体均数,差别有显著性C. 两样本均数,差别有显著性D. 两总体均数,差别无显著性E. 以上均不是13. 下列关于统计表的要求,叙述错误的是:( )A. 不宜有竖线及斜线B. 标题位于表的上方中央C. 线条要求三线式或四线式D. 备注不必列入表内E. 无数字时可以不填14. 四个样本率作比较,x2>x20.01(3),可以认为:( )A. 各总体率不同或不全相同B. 各总体率均不相同C. 样本率与总体率均不相同D. 各样本率均不相同E. 各样本率不同或不全相同15. 计算标化率的目的是:( )A. 起加权平均的作用B. 使率能更好的代表实际水平C. 使大的率变小,D. 消除资料内部构成不同的影响,使率具有可比性E. 使小的率变大16. 四格表资料在哪种情况下作χ2检验不必校正( )。
卫生统计学试卷适用范围:出题教师:(本大题满分40分,每小题1分)1.对两样本均数作t检验,n1=20,n2=20,其自由度等于:()A.19B.40C.38D.20E.392.临床研究的总体一般:()A.无限的B.有限的C.已知的D.有数量的3.在一项抽样研究中,当样本量逐渐增大时:()A.标准误逐渐增大B.标准差和标准误都逐渐增大C.标准误逐渐减少D.标准差逐渐增大E.标准差逐渐减少4.12名妇女分别用两种测量肺活量的仪器测最大呼气率(1∕min),比较两种方法检测结果有无差别,可进行:()A.X2检验B.配对设计t检验C.成组设计t检验D.配对设计U检验E.成组设计U检验5.对两个变量进行直线相关分析,=0.46,P>0.05,说明两变量之间()oA.有相关关系B.无直线相关关系C.无因果关系D.无任何关系E.有伴随关系6.对两地的结核病死亡率比较时作率的标准化,其目的是:()A.为了能更好地反映人群实际死亡水平B.消除各年龄组死亡率不同的影响C.消除两地总人数不同的影响D.以上都不对E.消除两地人口年龄构成不同的影响7.计算相对数的目的是:()A.为了进行显著性检验8.为了便于比较C.为了表示相对水平D.为了表示实际水平E.为了表示绝对水平8.均数与标准差适用于:()A.正态分布资料9.负偏态分布资料C.不对称分布的资料D.频数分布类型不明的资料E.正偏态分布资料10测量身高、体重等指标的原始资料叫:()A.等级资料B.分类资料C.计数资料D.有序分类资料E.计量资料10.对调查表考评的三个主要方面是()。
A.效度,反应度,可接受性B.信度,效度,可接受性C.信度,灵敏度,特异度D.信度,效度,反应度E.效度,灵敏度,特异度11.相对数使用时要注意以下几点,其中哪一项是不正确的:()A.分母不宜过小B.注意离散程度的影响C.不要把构成比当率分析D.比较时应做假设检验E.二者之间的可比性12.表示血清学滴度资料平均水平最常计算:()A.几何均数B.全距C.中位数D.算术均数E.率13.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为()oA.应进行假设检验后再下结论B.应进行标准化后再做比较C.以上都不对D.男童的肺炎发病率高于女童E.资料不具可比性,不能直接作比14.变异系数是表示资料的:()A.集中趋势B.正态分布C.相对变异D.对称分布E.平均水平15 .比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:(16 .表示均数的抽样误差大小的统计指标是:(17 .两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:()A.越有理由认为两样本均数不同B.越有理由认为两总体均数不同C.样本均数与总体均数不同D.两总体均数差别越大E.两样本均数差别越大18.说明一个地区死亡水平的指标主要是:()A.B.CD.E. 数 系差差异准差距 方变标极全系差标差差异准数方极变标均A.BαD.E.A.上述都不对B.死因顺位C.死因构成比D.病死率E.死亡率19.甲乙两地某病的死亡率进行标准化计算时,其标准的选择()oA.可用甲地或乙地的数据B.不能用甲地和乙地的合并数据C.不能用乙地的数据D.以上都不对E.不能用甲地的数据20.描述计量资料的主要统计指标是:()A.概率B.t值C.标准误D.相对数E.平均数21.实验设计中要求严格遵守四个基本原则,其目的是为了:()A.便于进行试验B.严格控制随机误差的影响C.便于统计处理D.以上都不对E.减少和抵消非实验因素的干扰22.某研究者对50份痰液标本,每份分别接种在甲乙培养基上,观察结核杆菌的生长情况并想比较两种培养基的培养效果是否一致,资料见下表。
《卫生统计学》一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假設检验中 P 含义22.I 型和 II 型错误23.检验效能24.检验水准25.方差分析26.随機区组設计27.相对数28.标准化法29.二项分布30.Yates 校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题1.观察单位为研究中( D ).A .样本B.全部对象C.影响因素D.个体2.总体是由(C) .A .个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样目是( B ) .A .研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指( B ) .A .参与个体数B.总体统计指标C.样本统计指标D.样本总和5.关于随機抽样 ,下列那一项说法是正确(A).A .抽样时应使得总体中每一个个体都有同等機会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随機抽样即随意抽取个体D.为确保样本具有更好代表性,样本量应越大越好6.各观察值均加(或减)同一数后( B ) .A .均数不变 ,标准差改变B.均数改变 ,标准差不变C.两者均不变 D .两者均改变7.比较身高和体重两组数据变异度大小宜采用(A).A .变异系数B .方差C.极差 D .标准差8.以下指标中( D )可用来描述计量资料离散程度.A .算术均数B.几何均数C.中位数D.标准差9.血清学滴度资料最常用来表示其平均水平指标是(C).A .算术平均数B.中位数C.几何均数D.平均数10.两样本均数比较,可用( C ) .A .方差分析B .t 检验C.两者均可 D .方差齐性检验11.配伍组設计方差分析中 ,配伍等于( D).A .总-误差B.总-处理C.总-处理 +误差D.总-处理 -误差12.在均数为, 标准差为正态总体中随機抽样,|X|( B )概率为 5%.A .1.96B. 1.96 X C.t0.052,s D.t0.05 2, S X13.完全随機設计方差分析检验假設是( D ) .A .各处理组样本均数相等B .各处理组总体均数相等C.各处理组样本均数不相等D.各处理组总体均数不全相等14.已知男性钩虫感染率高于女性.今欲比较甲乙两乡居民钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当比较方法是(D) .A .分别进行比较B.两个率比较χ 2 检验C .不具备可比性 ,不能比较D .对性别进行标准化后再比较 15.率 标准误 计算公式是( D) .A . p(1 p)B .p(1 p)C.p p(1 p)n 1D.nn16.非参数统计应用条件是( C ) .A .总体是正态分布B .若两组比较 ,要求两组 总体方差相等C .不依赖于总体分布D .要求样本例数很大17.下述哪些不是非参数统计特点( D ) .A .不受总体分布限定B .多数非参数统计方法简单,易于掌握C .适用于等级资料D .检验效能总是低于参数检验18.設 配对設 计资料 变量值为 X 1 和 X 2,则配对资料秩和检验( A ) .A .把 X 1 与 X 2 差数绝对值从小到大编秩B .把 X 1 和 X 2 综合从小到大编秩C .把 X 1 和 X 2 综合按绝对值从小到大编秩D .把 X 1 与 X 2 差数从小到大编秩19.秩和检验和 t 检验相比 ,其优点是(A ) .A .计算简便 ,不受分布限制B .公式更为合理C .检验效能高D .抽样误差小20.对两样本均数作比较时 ,已知 n 1 、n 2 均小于 30,总体方差不齐且分布呈偏态,宜用( C ).A . t 检验B . u 检验C .秩和检验D .F 检验21.等级资料 比较宜用( B ) .A . t 检验B .秩和检验C .F 检验D .四格表2X 检验 22.两个小样本比较 假設 检验 ,应首先考虑(D).A . t 检验B .秩和检验C .任选一种检验方法D .资料符合哪种检验 条件23.对于配对比较秩和检验 ,其检验假設 为( B) .A .样本 差数应来自均数为0 正态总体B.样本差数应来自均数为0非正态总体C.样本差数来自中位数为0总体D.样本差数来自方差齐性和正态分布总体24.用最小二乘法确定直线回归方程原则是各观察点 ( B ).A .距直线纵向距离相等B.距直线纵向距离平方和最小C.与直线垂直距离相等D.与直线垂直距离平方和最小25.实验設计三个基本要素是 D ).A .受试对象、实验效应、观察指标B .随機化、重复、設置对照C.齐同对比、均衡性、随機化 D .处理因素、受试对象、实验效应26.实验設计基本原则(D) .A .随機化、盲法、設置对照B .重复、随機化、配对C.随機化、盲法、配对 D .随機化、重复、設置对照27.实验設计和调查設计根本区别是( D ) .A .实验設计以动物为对象B .调查設计以人为对象C.实验設计可随機分组 D .实验設计可人为設置处理因素28.标准正态分布均数与标准差分别为 ( A ).A.0与1 B.1与0C.0与0D.1与129.正态分布有两个参数与,( C)相应正态曲线形状越扁平.A.越大 B .越小C.越大D.越小30.若X 服从以,为均数和标准差正态分布, 则X第 95 百分位数等于(B). A. 1.64B. 1.64C. 1.96D. 2.58三、简答题1.某年级甲班、乙班各有男生 50 人 .从两个班各抽取 10 人测量身高 ,并求其平均身高 .如果甲班平均身高大于乙班 ,能否推论甲班所有同学平均身高大于乙班?为什么?2.简述医学中参考值范围涵义及制定参考值范围一般步骤.3.假設检验时 , 当P 0.05 , 则拒绝H0 , 理论依据是什么?4.t 检验和方差分析应用条件?5.应用相对数时应注意哪些问题?6. 为什么不能以构成比代率?请联系实际加以说明.7.应用直线回归和相关分析时应注意哪些问题?8.统计表有哪些要素构成?制表注意事项有哪些?9.调查設计包含哪些内容?10.实验設计基本内容和步骤 .11.诊断试验設计主要包括哪些程序和内容?四、分析计算题1. 假定正常成年女性红细胞数12(10 /L标准差为 0.29 正态) 近似服从均值为 4.18,分布 . 令 X 代表随機抽取一名正常成年女性红细胞数 , 求 :( 1)变量 X 落在区间( 4.00,4.50)内概率;(2)正常成年女性红细胞数95%参考值范围 .2.某医生研究脑缺氧对脑组织中生化指标影响 ,将出生状况相近乳猪按出生体重配成7 对;随機接受两种处理 ,一组設为对照组 ,一组設为脑缺氧模型组 ,实验结果见表 1 第( 1)、(2)、( 3)栏 .试比较两组猪脑组织钙泵含量有无差别 .表 1两组乳猪脑组织钙泵含量( g/g)乳猪号对照组试验组差值 d(1)(2)(3)(4)=(2)-(3)10.35500.27550.079520.20000.2545-0.054530.31300.18000.133040.36300.32300.040050.35440.31130.043160.34500.29550.049570.30500.28700.0180合计0.30863.某医院比较几种疗法对慢性胃炎病人疗效:单纯西药组治疗79 例,有效 63 例;单纯中药组治疗54 例 ,有效 47 例;中西医结合组治疗68 例 ,有效 65 例 .问 :①该资料属何种资料?实验設计属何种設计?②欲比较 3 种疗法疗效差别,宜选用何种假設检验方法?③写出该种检验方法H 0与 H1;④若求得检验统计量为8.143,相应于0.05 检验统计量临界值为 5.99,伱如何做出结论?⑤根据伱结论,伱可能犯哪一类统计错误?4.为比较胃舒氨与西咪替丁治疗消化性溃疡疗效,以纤维胃镜检查结果作为判断标准,选20 名患者 , 以病人年龄、性别、病型和病情等条件进行配对 , 在纤维胃镜下观察每一患者溃疡面积减少百分率 , 面积减少百分率为 40%以上者为治疗有效 . 问 :(1) 如何将病人分组?(2)如何对结果进行统计分析处理?5.试就表 2 资料分析比较甲、乙两医院乳腺癌手术后5年生存率 .表 2甲、乙两医院乳腺癌手术后 5 年生存率( %)腋下淋巴甲医院乙医院结转移病例数生存数生存率病例数生存数生存率无453577.7730021571.67有71045068.38834250.60合计75548564.2438325767.106.某年某单位报告了果胶驱铅疗效观察,30名铅中毒工人脱离現場后住院治疗,治疗前测得尿铅均数为 0.116( mg/L ),血铅均数为 1.81( mg/L ).服用果胶 20 天后再测 ,尿铅均数降为0.087( mg/L ) ,血铅均数降为 0.73( mg/L ) ,说明果胶驱铅效果较好 .请评述以上研究 .参考答案一、名词解释1.计量资料 :对每个观察单位用定量方法测定某项指标量大小,所得资料称为计量资料( measurement data).计量资料亦称定量资料、测量资料..其变量值是定量,表現为数值大小 ,一般有度量衡单位.2.计数资料 :将观察单位按某种属性或类别分组 ,所得观察单位数称为计数资料( count data).计数资料亦称定性资料或分类资料 .其观察值是定性 ,表現为互不相容类别或属性 .3.等级资料 :将观察单位按测量结果某种属性不同程度分组 ,所得各组观察单位数 , 称为等级资料( ordinal data ).等级资料又称有序变量 .4.总体 :总体( population )指特定研究对象中所有观察单位测量值.5.样本 :从总体中随機抽取部分观察单位,其测量结果集合称为样本( sample) .6.抽样误差 : 抽样误差( sampling error )是指样本统计量与总体参数差别 .在总体确定情况下 ,总体参数是固定常数 ,统计量是在总体参数附近波动随機变量 .7.频数表 :用来表示一批数据各观察值在不同取值区间出現频繁程度(频数) .8.算术均数 :描述一组数据在数量上平均水平 .总体均数用表示 ,样本均数用X表示 .9.中位数 :将一组观察值由小到大排列 ,位次居中那个数 .10.极差 :亦称全距 , 即最大值与最小值之差 ,用于资料粗略分析 ,其计算简便但稳定性较差 .11.方差 :方差表示一组数据平均离散情况 ,由离均差平方和除以样本个数得到 .12.标准差 :是方差正平方根 ,使用量纲与原量纲相同 ,适用于近似正态分布资料 ,大样本、小样本均可 ,最为常用 .13.变异系数 :用于观察指标单位不同或均数相差较大时两组资料变异程度比较 .14.正态分布 : 若资料 X频率曲线对应于数学上正态曲线 , 则称该资料服从正态分布 .通常用记号 N ( ,2 ) 表示均数为,标准差为正态分布 .15.标准正态分布 : 均数为 0 、标准差为 1 正态分布被称为标准正态分布, 通常记为N (0,12 ) .16. 统计推断 :通过样本指标来说明总体特征,这种通过样本获取有关总体信息过程称为统计推断 .17. 抽样误差 :由个体变异产生 ,由于抽样造成样本统计量与总体参数差异 ,称为抽样误差 .18.标准误 :通常将样本统计量标准差称为标准误 .19.可信区间 :按预先给定概率确定包含未知总体参数可能范围 .20.参数估计 :指用样本统计量估计总体参数 .参数估计有两种方法 :点估计和区间估计 .21.假設检验中 P 含义 :指从 H0规定总体随機抽得等于及大于(或等于及小于)現有样本获得检验统计量值概率 .22.I 型和 II 型错误 :I型错误指拒绝了实际上成立H0,这类”弃真”错误称为 I 型错误 ,其概率大小用表示;II 型错误 ,指接受了实际上不成立H0,这类”存伪”错误称为 II 型错误 ,其概率大小用表示 .23.检验效能 :1-称为检验效能 ,它是指当两总体确有差别,按规定检验水准所能发現该差异能力 .24.检验水准 :是预先规定 ,当假設检验结果拒绝 H 0,接受 H1,下”有差别”结论时犯错误概率称为检验水准 ,记为 .25. 方差分析 : 就是根据资料設计类型 , 即变异不同来源将全部观察值总离均差平方和与自由度分解为两个或多个部分 , 除随機误差外 , 其余每个部分变异可由某个因素作用(或某几个因素交互作用)加以解释 . 通过各变异来源均方与误差均方比值大小 , 借助F分布作出统计推断 , 判断各因素对观测指标有无影响 .26.随機区组設计 : 事先将全部受试对象按自然属性分为若干区组,原则是各区组内受试对象特征相同或相近,且受试对象数与处理因素水平数相等.然后再将每个区组内观察对象随機地分配到各处理组,这种設计叫做随機区组設计 .27.相对数 :是两个有联系指标之比 ,是分类变量常用描述性统计指标 ,常用相对数有率、构成比、相对比 .28.标准化法是常用于内部构成不同两个或多个总率比较一种方法 .标准化法基本思想就是选定一个统一”标准”(标准人口构成比或标准人口数) ,然后按选定”标准”计算调整率 ,使之具备可比性以后再比较 ,以消除由于内部构成不同对总率比较带来影响 .29. 二项分布 : 若一个随機变量X, 它可能取值是0,1,⋯ ,n, 且相应取值概率为P( X k ) (k n )k (1)n k,则称此随機变量X 服从以n、为参数二项分布 .30. Yates 校正 : 英国统计学家Yates F 认为 ,由于2分布理论上是一连续性分布,而分类资料是间断性 ,由此计算出2值不连续 ,尤其是自由度为 1 四格表 ,求出概率 P 值可能偏小 ,此时需对2值作连续性校正( correction of continuity ),这一校正即所谓 Yates校正( Yates ’ correction) .31.非参数统计 :针对某些资料总体分布难以用某种函数式来表达, 或者资料总体分布函数式是未知 ,只知道总体分布是连续型或离散型,用于解决这类问题需要一种不依赖总体分布具体形式统计分析方法 .由于这类方法不受总体参数限制 ,故称非参数统计法( non-parametric statistics ),或称为不拘分布( distribution-free statistics )统计分析方法 ,又称为无分布型式假定( assumption free statistics )统计分析方法 .32.直线回归 :建立一个描述应变量依自变量变化而变化直线方程 ,并要求各点与该直线纵向距离平方和为最小 .直线回归是回归分析中最基本、最简单一种 ,故又称简单回归 .33. 直线相关 : 是用来描述具有直线关系两变量x、y间相互关系.34.相关系数 :又称积差相关系数 ,以符号 r 表示样本相关系数 ,ρ表示总体相关系数 .它是说明具有直线关系两个变量间 ,相关关系密切程度与相关方向指标 .35. 回归系数 :为直线斜率,其统计学意义是自变量x 改变一个单位时,应变量 y 平均变化 b 个单位.36.人口总数 : 人口总数 (population) 是指一个国家或地区在某特定时间点上存活人口和 .国际上统计人口数有两种办法:①实际制 (de facto): 即只统计标准时刻某地实际存总在人口数 (包括临时在该地人).② 法定制(de jure):只统计某地常住人口.37.老年人口系数:是指65岁及以上老年人口数占总人口数比重.老年人口系数65岁及以上的人口数100% .老年人口系数用于表明一个人口总数国家或地区人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健水平等因素影响 .38.围产儿死亡率 : 围产期是指胎儿体重达到 1000 克及以上、或孕期满 28 周 ,至出生后 7天以内时期.在此期间死亡称为围产儿死亡.计算式为:围产儿死亡率=同年围产期死胎数+死产数+出生 7天内的新生儿死亡数某年围产期死胎数+死产数+活产数1000%.围产儿死亡率是衡量孕期、产前、产后保健工作质量敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算.39.新生儿死亡率 : 新生儿死亡率 (neonatal mortality rate, NMR) 指某地平均每千名活产数中未满28 天新生儿死亡数.计算式 :同年未满28天的新生儿死亡数1000‰新生儿死亡率某年活产总数新生儿死亡在婴儿死亡中占很大比重 .死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制疾病 .40.婴儿死亡率: 指某年平均每千名活产中不满 1 周岁(婴儿) 死亡数.计算式同年未满岁婴儿死亡数为 : 婴儿死亡率‰1000某年活产总数41.孕产妇死亡率 : 指某年由于怀孕和分娩及并发症造成孕产妇死亡人数与同年出生活产数之比 ,常以万分率或十万分率表示,计算式为 :同年孕产妇死亡数孕产妇死亡率10000(或 10万)某年活产数42.死因顺位 :指按各类死因构成比从高到低排列位次 ,说明死因重要性 ,反映了各种死亡原因导致死亡严重程度 .43.人口金字塔 :将人口性别、年龄分组数据 ,以年龄 (或出生年份 )为纵轴 ,以人口数或年龄构成比为横轴 ,按男左女右绘制直方图 ,其形态如金字塔 ,故称为人口金字塔 .人口金字塔是对人口年龄、性别构成综合反映特殊统计图 ,指示了不同时期人口年龄、性别构成变化情况 ,是长期人口出生、死亡、迁入、迁出而形成,反映了历史痕迹和变动趋势 .二、单项选择题1.D2. C3. B4. B5. A6.B7. A8. D9. C10. C 11.D12. B13. D14. D15. D 16.C17. D18. A19. A20. C 21.B22. D23. B24. B25. D 26.D27. D28. A29. C30. B四、简答题1.答题要点: :不能.因为,从甲、乙两班分别抽取10 人 ,测量其身高 ,得到分别是甲、乙两班一个样本.样本平均身高只是甲、乙两班所有同学平均身高一个点估计值.既使是按随機化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等.因此 ,不能仅凭两个样本均数高低就作出两总体均数熟高熟低判断 ,而应通过统计分析,进行统计推断,才能作出判断.2.答题要点:医学中常把绝大多数正常人某资料范围称为该资料参考值范围,也叫正常值范围. 所谓”正常人”不是指完全健康人,而是指排除了所研究资料疾病和有关因素同质人群.制定参考值范围一般步骤 :(1)定义”正常人”,不同资料”正常人”定义也不同 .(2)选定足够数量正常人作为研究对象 .(3)用统一和准确方法测定相应资料 .(4)根据不同用途选定适当百分界限 , 常用 95%.(5)根据此资料实际意义 , 决定用单侧范围还是双侧范围 .(6)根据此资料分布决定计算方法 , 常用计算方法 : 正态分布法、百分位数法 .3.答题要点: P值系由H0所规定总体做随機抽样,获得等于及大于(或等于及小于)依据現有样本信息所计算得检验统计量概率 .当P0. 05时 ,说明在H 0成立条件下,得到現有检验结果概率小于,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0.同时 ,下”有差别”结论同时 ,我们能够知道可能犯错误概率不会大于,也就是说,有了概率保证.4.答题要点:t检验和方差分析均要求各样本来自相互独立正态总体且各总体方差齐.5.答题要点:应用相对数时应注意事项有:⑴计算相对数分母一般不宜过小.⑵分析时不能以构成比代替率.⑶不能用构成比动态分析代替率动态分析.⑷对观察单位数不等几个率,不能直接相加求其总率.⑸在比较相对数时应注意可比性.⑹对样本率(或构成比)比较应随機抽样,并做假設检验.6.答题要点:率和构成比所说明问题不同,因而绝不能以构成比代率. 构成比只能说明各组成部分比重或分布 , 而不能说明某現象发生频率或强度.例如:以男性各年龄组高血压分布为例 ,50 ~ 60 岁年龄组高血压病例占52.24%, 所占比重最大,60 ~岁组则只占到 6.74%.这是因为60~岁以上受检人数少, 造成患病数低于50~ 60 岁组 , 因而构成比相对较低. 但不能认为年龄在50~ 60 岁组高血压患病率最严重, 而 60 岁以上反而有所减轻. 若要比较高血压患病率, 应该计算患病率指标.7.答题要点: 注意以下五个问题,⑴作回归分析和相关分析时要有实际意义,不能把毫无关联两种現象作回归、相关分析必须对两种現象间内在联系有所认识.⑵在进行回归分析和相关分析之前,应绘制散点图 .但观察点分布有直线趋势时,才适宜作回归、相关分析 .如果散点图呈明显曲线趋势 ,应使之直线化再行分析 .散点图还能提示资料有无可疑异常点 .⑶直线回归方程应用范围一般以自变量取值范围为限.若无充分理由证明超过自变量取值范围外还是直线,应避免外延 .,⑷双变量小样本经t 检验只能推断两变量间有无直线关系,而不能推断相关紧密程度要推断相关紧密程度 ,样本含量必须很大.⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系.8.答题要点:一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注).编制统计表注意事项 :(1)标题概括表内容 , 写于表上方 , 通常需注明时间与地点 .(2)标目以横、纵标目分别说明主语与谓语, 文字简明 , 层次清楚 .(3)线条不宜过多 ,通常采用三条半线表示 ,即顶线、底线、纵标目下横隔线及合计上半条线 .(4)表内一律采用阿拉伯数字 . 同一指标小数点位数要一致, 数次要对齐 . 表内不留空格.(5)备注不要列于表内 ,如有必要 ,可在表内用”* “号标记 ,并在表外加以说明 .9.一个完整调查設计应包括以下内容: 确定明确调查目;确定调查对象和观察单位;确定调查方法;确定调查指标和变量;确定调查工具和設计调查表;确定样本含量;调查员选择和培训;调查组织计划;涉及伦理道德方面问题处理.10.答题要点 : 实验設计基本内容和步骤( 1)建立研究假設: 在选题时应当考虑题目科学性、新颖性、可行性以及所选课题是否是当前社会需要解决主要问题 . 根据研究目确定本研究需要解决主要问题及相应辅助问题.(2)明确研究范围 : 审慎考虑规定适当纳入标准和排除标准 , 选择适宜本次实验受试对象.(3)确立处理因素 : 分清处理因素和非处理因素 , 并注意处理因素标准化 .(4)明确观察指标 : 选用客观性较强 , 易于量化 , 灵敏性和特异性均较高指标.( 5)控制误差和偏倚:采取各种有效措施控制误差(error)和偏倚( bias),使处理措施效果能够真正体現出来 .11.答题要点 : 诊断试验設计主要包括哪些程序和内容 :(1)确定金标准 :诊断试验金标准是指目前公认最可靠、最准确、最好诊断方法 ,也称标准诊断方法,用来衡量新诊断试验是否符合真实情况 .临床上常用金标准有组织病理学检查( 活检、尸检 ) 、手术发現、影像诊断 (CT 、核磁共振、彩色 B 超 )、细菌培养以及长期随访所得结论 .(2)选择研究对象 :诊断试验研究对象应包括两组 :一组是用金标准确定为有某病病例组 ,另一组是用金标准证实为无该病患者或人群 ,作为对照组 .病例组应包括各种病例,如症状典型和非典型,病程早、中、晚期,病情轻、中、重型 ,年龄不同层次等 ,以便能反映该病全部特征 .对照组应包括确实无本病而患有易与本病相混淆疾病病例 ,这样对照才具有临床鉴别诊断价值.( 3)同步盲法测试 :经金标准确定病例与对照两组中受试者同步接受新诊断试验方法测定 ,将测定结果与金标准判定结果进行比较 ,计算新诊断试验与金标准符合和差异程度统计学指标 ,再根据这些指标对新诊断试验进行评价.在试验操作全过程和判定试验结果时 ,采用盲法 (尽可能用双盲法 ) 是保证诊断试验结果真实可靠关键 ,即观察者 (和受试者 )不能预先知道何为金标准确定病例或对照 ,以免发生人为偏差,过高或过低估计新诊断试验与金标准符合程度 .四、分析计算题1.解 :(1)根据题意 , 变量 X 近似服从正态分布 , 求变量 X 落在区间( 4.00,4.50 )内概率 , 即是求此区间内正态曲线下面积问题 , 因此 , 可以把变量X 进行标准化变换后, 借助标准正态分布表求其面积, 具体做法如下 :P(4.00X4.50) P(4.004.18 X 4.50 4.18 )0.290.29P( 0.62 u 1.10)1 ( 1.10)( 0.62)10.1357 0.26760.5967变量 X 落在区间 (4.00,4.50)内 概率为 0.5967.(2) 因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该资料过高、过低都不正常,所以应求双侧参考值范围 ,具体做法如下 :下限为 : X 1.96 4.18 1.96(0.29) 3.61( 1012/ L)上限为 : X 1.964.18 1.96(0.29) 4.75( 1012/ L)95% 正常成年女性红细胞数所在范围是3.61 ~4.75( 1012/ L) .2.解 : 本例属异体配对設计 , 所得数据为配对计量资料 , 用配对 t 检验进行处理 .( 1)建立检验假設 ,确定检验水准H 0: d = 0H 1: d ≠ 0=0.05.( 2)计算检验统计量n=7, dd n 0.3086 7 0.0441( g / g)d22nS ddn 10.05716( g / g )d0.04412.0412tS d n0.05716 7( 3)确定 P 值 ,作出推断结论按 = n-1=7-1=6 查 t 界值表 ,得 t 0.025,6=2.447,t<t 0.025,6,则 P>0.05,按 =0.05 水准不拒绝 H 0,差别无统计学意义 ,即按現有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同.3.解 :① 该资料属计数资料 ,实验設 计属完全随機設 计;。
2001级预防医学专业《卫生统计学》试卷2004年5月31日专业学号姓名得分一、单项选择题(每题2分,共40分)1.标准正态分布的中位数为________AA. 0B. 1C. 0.5D. 与标准差有关2. 2检验能分析 DA.两样本率差异有无统计学意义B. 多个样本率差异有无统计学意义C. 两有序分类变量的关联性D. 以上都对3.医学试验设计的基本原则是DA. 对照B. 随机C. 重复D. 以上均正确4.以下关于二项分布的说法,错误的是________ DA. 二项分布要求随机试验仅有两个互相对立的结果,每次试验间是互相独立的;B. 二项分布要求各次随机试验的阳性率是恒定不变的;C. 从一个装有10个白球和10个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后放回袋中,重复10次,作为一次试验。
若以摸出白球作为阳性,则每次试验的阳性率服从二项分布;D. 虽然二项分布要求各次随机试验的阳性率是不变的,但在样本含量比较大,且阳性率和阴性率均不太小时,也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。
如从一个装有5000个白球和5000个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后不放回袋中,重复10次,作为一次试验。
可以近似利用二项分布的有关原理来解决这样的问题。
5.关于正态分布,以下说法正确的是________ BA.仅仅标准正态分布其曲线下面积才为1;B.在横轴上,从负无限大到1.96所对应的曲线下面积为0.975;C.从服从正态分布的总体中抽样,不管其样本含量有多大,其样本均数均服从正态分布;D.以上都不对。
6.各观察值同时加上(或减去)同一不为0的常数后。
AA. 均数改变, 标准差不变B. 均数不变, 标准差改变C. 两者均不变D. 两者均改变7.要研究鼻咽癌患者、眼病患者和正常人血型的构成比是否有不同,采用三组构成比比较的卡方检验,构建一个3行4列的R*C表后,其卡方值的自由度为________BA.8 B.6 C.4 D.跟样本含量有关8.样本均数与总体均数比较的t检验,按照α=0.05的水准拒绝H0,此时若推断有错,则错误的概率为________ AA.0.05 B.0.10 C.0.95 D.0.909.下列分布中________的均数等于方差。
CA.标准正态分布B.二项分布C.Poisson分布D.F分布10.根据以往经验,新生儿染色体异常率为0.01,在某地随机抽查400名新生儿,至少有4人异常的概率为_______ CA.P(1)+P(2)+P(3)+P(4)B. P(0)+P(1)+P(2)+P(3)+P(4)C. 1-P(0)-P(1)-P(2)-P(3)D. 1-P(0)-P(1)-P(2)-P(3)-P(4)11.三组样本均数的比较,先进行单因素方差分析,P<0.05。
再进行两两比较,发现第一组与第二组差别无统计学意义,第二组与第三组差别也无统计学意义,但第一组与第三组之间差别有统计学意义,于是_______ BA.三组样本来自于同一总体B.第一组和第三组来自于两个不同的总体,但尚无法判断第二组究竟来自于哪个总体C.第二组来自的总体位于第一组和第三组所来自的总体之间D.该两两比较为模糊结论,说明计算中发生了错误。
12.下面关于直线相关与回归的说法,正确的是bA.回归系数越大,说明相关性越强B.相关系数为0,说明两个变量间无关C.两组资料,第一组相关系数小于第二组,说明第二组的相关程度强于第一组D.相关系数越大,说明在样本含量一定时,越有可能在对相关关系是否存在的假设检验中拒绝H0。
13.下面关于假设检验的说法,正确地是 DA.在P值大于检验水准时,我们可以接受H0B.在两个率比较的卡方检验中,P值越小,说明两个总体率差得越大。
C.若发现双侧检验不能拒绝H0,可以进行单侧检验提高检验效能D.以上说法都不对14.对两个方差分析中,组间变异主要反映的是________ AA. 处理因素的作用B. 抽样误差C. 测量误差D.随机误差,包括个体差异和测量误差15.关于样本含量的影响,以下说法正确的是DA.随着样本含量的增加,标准差逐渐变小B.随着样本含量的增加,标准误逐渐变大C.随着样本含量的增加,参考值范围越来越稳定D.随着样本含量的增加,可信区间越来越稳定16.R*C表周边合计不变时,实际频数若有改变,理论频数_______ C A.增加 B. 减少 C. 不变 D.不知道17.计算某地某时期某病的病死率,应注意DA.分母是该时期该地平均人口数B.分子是该时期该地所有死亡数C.分子是该时期该地该疾病病人的死亡数D. 分子是该时期该地该疾病病人的因该病的死亡数18.X1~Poisson(μ1),X2~Poisson(μ2),则________ CA.X1-X2~Poisson(μ1-μ2)B.X1+X2~Poisson(μ1+μ2)C.A与B均对D.A与B均不对19.比较身高与体重两组数据变异大小宜采用AA. 变异系数B. 方差C. 标准差D. 四分位间距20.正态分布曲线下,横轴上,从μ-1.96σ到μ+2.58σ的面积为________D A. 95% B. 49.5% C. 99% D. 97%二、分析计算题(共40分)1. (10分) 用克矽平雾化吸入治疗矽肺患者7人,疗前疗后分别测得血清粘蛋白,结果如下(单位mg/L)。
患者 1 2 3 4 5 6 7疗前65 73 73 30 73 56 73疗后34 36 37 26 43 37 50. ttest x1=x2Paired t test------------------------------------------------------------------------------Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+--------------------------------------------------------------------x1 | 7 63.28571 6.058109 16.02825 48.46206 78.10937x2 | 7 37.57143 2.81879 7.457818 30.6741 44.46876---------+--------------------------------------------------------------------diff | 7 25.71429 4.3737 11.57172 15.01223 36.41634------------------------------------------------------------------------------Ho: mean(x1 - x2) = mean(diff) = 0Ha: mean(diff) < 0 Ha: mean(diff) ~= 0 Ha: mean(diff) > 0t = 5.8793 t = 5.8793 t = 5.8793P < t = 0.9995 P > |t| = 0.0011 P > t = 0.0005(1) 该研究属于什么设计?配对设计(2) 该资料中,疗前、疗后的血清粘蛋白均数分别是多少?标准差为多少?疗前:均数68.28571,标准差16.02825疗后:37.57143 7.457818(3) 疗前、疗后的血清粘蛋白平均相差多少?差值的标准差为多少?差值均数的95%可信区间是多少?差值均数:25.71429,标准差11.57172,可信区间15.01223 36.41634 mg/l(3) 能否认为治疗会引起患者血清粘蛋白的改变?(列出详细步骤,并下结论)H0:治疗不会引起血清蛋白的改变H1:治疗会引起血清蛋白的改变α=0.05配对t检验t=5.8793P= 0.0011有统计学差异,拒绝H0,接受H1认为治疗会引起血清蛋白的改变2. (10分)要比较四种强心剂的毒性。
将稀释过的药物注入麻醉的豚鼠体内,记录导致豚鼠死亡时药物的剂量。
每种药物各进行了10次试验,事先已经采取了有关的措施以保证每只豚鼠试验时环境和测量方法尽量相同。
实验结果如下:药物样本含量豚鼠死亡时药物的剂量1 10 29,28,23,26,26,19,25,29,26,282 10 17,25,24,19,28,21,20,25,19,243 10 17,16,21,22,23,18,20,17,25,214 10 18,20,25,24,16,20,20,17,19,17(1)该实验属于什么设计?完全随机设计(2)完成方差分析表。
变异来源SS df MS F P 组间249.88 0.0002组内350.90 9.74总变异15.40(3)根据方差分析的结果,写出假设检验的检验假设,并下结论。
H0:四种强心剂的毒性相同H1:四种强心剂的毒性不同α=0.05采用单因素方差分析P=0.0002P<0.05,拒绝H0,接受H1,认为四种强心剂的毒性不同(4) 还能作什么分析两两比较3 (10分)10名79岁正常老年人的收缩压和舒张压的测定值如下(单位mmHg ),患者编号 12345678910舒张压(X) 76 76 80 81 84 84 89 91 87 78 收缩压(Yl)114 120 136 138 141 143 163 160 143 125散点图如下1001101201301401501601707580859095舒张压(X)收缩压(Y )Stata 的输出结果如下。
. corr y x| y x -------------+------------------ y | 1.0000x | 0.9578 1.0000. reg y xSource | SS df MS Number of obs = 10 -------------+------------------------------ F( 1, 8) = 88.83 Model | 2055.02393 1 2055.02393 Prob > F = 0.0000 Residual | 185.07607 8 23.1345087 R-squared = 0.9174 -------------+------------------------------ Adj R-squared = 0.9071 Total | 2240.1 9 248.9 Root MSE = 4.8098------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 2.853407 .3027509 *** **** 2.155262 3.551552 _cons | -97.39144 25.05344 -3.89 0.005 -155.1648 -39.61811 ------------------------------------------------------------------------------(1) X与Y间是否存在直线相关关系?(写出假设检验的详细步骤,并下结论)H 0:X与Y间不存在直线相关关系 H 1:X与Y间存在直线相关关系 α=0.05 r=0.9578 t= 9.4249585 P<0.05P<0.05,拒绝H 0,接受H 1,认为X与Y间存在直线相关关系(2) 写出回归方程。