《卫生统计学》 案例版丁元林课后思考题答案
- 格式:doc
- 大小:48.50 KB
- 文档页数:11
医学统计学思考练习第1章绪论思考与练习参考答案一、最佳选择题1. 研究中的基本单位是指 ( D )。
A.样本 B. 全部对象C.影响因素 D. 个体 E. 总体2. 从总体中抽取样本的目的是(B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指(B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数 B.住院天数C.门急诊就诊人数 D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制 B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小第2章统计描述思考与练习参考答案一、最佳选择题1. 编制频数表时错误的作法是(E )。
A. 用最大值减去最小值求全距B. 组距常取等组距,一般分为10~15组C. 第一个组段须包括最小值D. 最后一个组段须包括最大值E. 写组段,如“1.5~3,3~5, 5~6.5,…”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。
A. 中位数B. 几何均数C. 调和均数D. 算术均数E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。
A. 变异系数B. 全距C. 标准差D. 四分位数间距E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是(A)。
A. S越小,对样本中其他个体的代表性越好B. S越大,对样本中其他个体的代表性越好C.越小,S越大D.越大,S越小E.必小于5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。
A. 阳转人数B. 疫苗接种人数C. 乙肝患者数D. 乙肝病毒携带者数E. 易感人数6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于(C)。
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
护理《卫生统计学》作业(1)答案作者: 日期:样误差引起的。
2.简述频数分布表的用途?答:(1 )揭示资料的分布类型。
(2 )描述分布的集中趋势和离散趋势。
(3 )便于发现某些特大和特小的可疑值。
(4 )便于进一步计算指标和统计分析3•有两来自独立总体的小样本均数,现欲作假设检验,请根据资料特点列出假设检验方法的选择过程。
答:(1 )两样本所属总体方差相等且两总体均为正态分布时:选择t检验(2)两样本所属总体方差不等且两总体均为正态分布、可选择方差不齐时,两小样本均数的比较,以下方法:1)采用适当的变量变换,使达到方差齐的要求再进行t检验。
2 )米用秩和检验°3)采用近似法检验(它包括对临界值和自由度校正两种)・・t '检验O (3)当所两小样本均数的比较时,其总体分布不呈正态分布时,可选择的方法有两种即变量变换和秩和检验。
4•简述参数统计与非参数统计的区别?答:(1 )参数统计:许多统计推断方法,要求来自总体分布型是已知的,在这种假设基础上,对总体逬行统计推断(进行估计和检验)称为参数统计。
参数统计依赖于特定分布类型,比较的是参数。
(2)非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法称为非参数检验。
非参数检验不受分布类型的影响,比较的是总体分布位置。
四、应用题:解:(1)建立检验假设,确定检验水平。
Ho: B=C 两种方法的总体检出率相等Hi:B M C两种方法的总体检出率不相等a =0.05(2 )求检验统计量值已知b=17, c=66, b+c > 40(b c)217 66 22= =28.93be 17 66(3) (3)确定p值,作出结论查X 2界值表(附表8),得p V 0.005 °按a =0.05水准,拒绝H0,接受H1 ,差别有统计学意义。
故可认为两种方法的检查结果效果不同,乙法的检出率较高。
医学统计学课后习题答案医学统计学课后习题答案在医学领域中,统计学是一门非常重要的学科。
通过统计学的方法,我们可以对医学数据进行分析和解释,从而得出科学的结论和推断。
在医学统计学的学习过程中,课后习题是非常重要的一环。
通过解答习题,我们可以巩固所学的知识,并且更好地理解统计学的应用。
下面是一些医学统计学课后习题的答案,希望对大家的学习有所帮助。
1. 什么是样本均值和总体均值?它们之间有什么区别?样本均值是指从总体中抽取的一组样本数据的平均值。
总体均值是指整个总体中所有个体的平均值。
样本均值是对总体均值的估计。
区别:样本均值是通过抽样得到的估计值,而总体均值是真实的未知参数。
样本均值可以通过多次抽样得到不同的值,而总体均值是固定的。
2. 什么是标准差和方差?它们之间有什么关系?标准差是指一组数据的离散程度或者分散程度。
方差是标准差的平方。
关系:标准差是方差的平方根。
3. 什么是假设检验?在医学研究中有什么应用?假设检验是一种统计学方法,用于对两个或多个样本数据进行比较,从而判断它们之间是否存在显著差异。
在医学研究中,假设检验可以用于判断某种治疗方法是否有效,或者某种药物是否有副作用等。
4. 什么是P值?如何解释P值?P值是指在假设检验中,根据观察到的样本数据计算得到的一个概率值。
P值可以用来判断观察到的差异是否由随机因素引起。
解释P值:如果P值小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为观察到的差异是显著的。
如果P值大于显著性水平,则不能拒绝原假设,认为观察到的差异可能是由随机因素引起的。
5. 什么是置信区间?如何解释置信区间?置信区间是指对总体参数的一个估计范围。
置信区间由一个下限和一个上限组成。
解释置信区间:例如,对于一个置信水平为95%的置信区间,意味着在多次抽样中,有95%的置信区间会包含真实的总体参数值。
置信区间越窄,对总体参数的估计越准确。
6. 什么是卡方检验?在医学研究中有什么应用?卡方检验是一种用于比较两个或多个分类变量之间是否存在关联的统计方法。
卫生统计学复习题及参考答案《卫生统计学》课程复习资料一、名词解释:1.计量资料2.计数资料3.等级资料4.总体5.样本6.变异7.频数表 8.算术均数9.中位数 10.极差11.方差 12.标准差13.变异系数 14.正态分布15.标准正态分布 16.统计推断17.抽样误差 18.标准误19.可信区间 20.参数估计21.假设检验中P的含义 22.I型和II型错误23.检验效能 24.检验水准25.方差分析 26.随机区组设计27.相对数 28.标准化法29.构成比 30.Yates校正31.非参数统计 32.直线回归33.相关系数 34.统计图35.回归系数二、单项选择题:1.观察单位为研究中的 [ ]A.样本B.全部对象C.影响因素2.总体是由 [ ]A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是 [ ]A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指 [ ]A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和5.关于随机抽样,下列哪一项说法是正确的? [ ]A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后 [ ]A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用 [ ]A.变异系数B.方差C.极差8.以下指标中( )可用来描述计量资料的离散程度。
[ ]A.算术均数B.几何均数C.中位数D.标准差9.血清学滴度资料最常用来表示其平均水平的指标是 [ ]A.算术平均数B.中位数C.几何均数D.平均数10.两样本均数的比较,可用 [ ]A.方差分析B.t 检验C.两者均可D.方差齐性检验11.配伍组设计的方差分析中,ν配伍等于 [ ]A.ν总-ν误差B.ν总-ν处理C.ν总-ν处理+ν误差D.ν总-ν处理-ν误差12.在均数为μ,标准差为σ的正态总体中随机抽样,||X μ-≥( )的概率为5%。
1. 0101. 医学统计学研究的对象是:A.医学中的小概率事件B.各种类型的数据C.疾病的预防与治疗D.有变异的医学现象2. 0102. 用样本推论总体,具有代表性的样本通常指的是:A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.依照随机原则抽取总体中的部分个体3. 0103.下列观测结果属于有序数据的是:A.收缩压测量值B.脉搏数C.住院天数D.病情程度4. 0104.随机误差指的是:A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差5. 0105.系统误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差6. 0106.抽样误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差7. 0107.收集资料不可避免的误差是:A.随机误差B.系统误差C.过失误差D.记录误差8. 0108.统计学中所谓的总体通常指的是:A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据9. 0109.统计学中所谓的样本通常指的是:A.可测量的生物样品B.统计量C.数据中有代表性的一部分D.总体中有代表性的部分观察单位10. 0111统计学的主要作用是:A. 使分析更为简单B. 避免计算出现错误C. 改善数据质量D.探测随机现象的规律11. 0112概率描述的是:A.总体具有的特征B.数据具有的特征C.随机事件发生的可能性D.随机现象的规律性12. 0114.统计描述结果的主要表达方式是:A.统计指标、统计表和统计图B.描述数据特征C.概率分布D.抽样误差13. 0201.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A中位数 B.几何均数 C.均数 D.P百分位数9514. 0202.算术均数与中位数相比,其特点是:A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料15. 0203.将一组定量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.能够更精确地检验D. 描述数据的分布特征16. 0205. 变异系数主要用:A.比较不同计量指标的变异程度 B衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度17. 0206.对于正态或近似正态分布的资料,描述其变异程度应选用的指标A.变异系数B. 离均差平方和C.极差D. 标准差18. 0207.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应用:A. 四分位数间距B.标准差C.变异系数D.方差19. 0208.一组原始数据的分布呈正偏态分布,其数据的特点是:A.数值离散度大B.数值离散度小C.数值偏向较大的方向D.数值偏向较小的方向20. 0210在衡量数据的变异度时,标准差与方差相比,其主要特点是:A.标准差小于方差 C.标准差更容易计算C.标准差更为准确D. 标准差的计量单位与原始数据相同21. 0213.比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是:A.标准差B.百分位数C.极差D. 变异系数22. 0214.中位数与算数均数相比,其特点是:A.容易计算B.计算出的结果更为可靠C.不易受异常值影响D.更适合对称分布的数据23. 0301.正态曲线拐点所对应的横坐标为:A.⎺X±SB. μ±σC. X±2SD. μ±1.96σ24. 0302.标准正态分布的形状参数和位置参数分别为:A 0,1B 1,0C μ,σD σ,μ25. 0303.正态分布N(μ,σ2),当μ恒定时,σ越大则:A.曲线沿横轴越向左移动B. 曲线形状和位置不变C.曲线越“瘦高”D.曲线越“矮胖”26. 0305.正态曲线下,横轴上从均数到+∞的面积为A.50%B.95%C.97.5%D.99%27. 0306. 若随机变量X服从N(μ,σ2 )的正态分布,则X的第97.5百分位数等于()A. μ+1.96σB.μ-1.64σC.μ-σD.μ+1.64σ28. 0308.某项指标95%医学参考值范围表示的是:A.在此范围“异常"的概率大于或等于95%B.在此范围“正常"的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围29. 0309.确定某项指标的医学参考值范围时,“正常人”指的是:A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人30. 0311.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是:A.用均数来评价 B 用参考值范围来评价C.用几何均数来评价D.用变异系数来评价31. 0401 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是( )A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少32. 0402.计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数33. 0403.计算标准化死亡率的目的是( )A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响34. 0406.相对危险度RR的计算方法是( )A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同条件下某疾病发生的概率之比35. 0407.比数比OR值表示的是( )A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同条件下某疾病发生的危险性程度36. 0408.计算患病率时的平均人口数的计算方法是( )A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末的人口数D.生活满一年的总人口数37. 0409.死因构成比反映的是( )A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性38. 0410.患病率与发病率的区别是( )A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.患病率与病程有关39. 0412.某地某年肝炎发病人数占同年传染病人数的10.1%,该指标属于( )A.相对比B.构成比C.发病率D.传染率40. 0413.某医师对其所在科室近5年某病住院患者进行了统计,结果发现该病患者农村人口200人,城镇人口50人,分别占80%与20%,则结论为( )A.农村人容易患该病B.城镇人容易患该病C农村城镇都易患该病 D.尚不能得出结论41. 0501统计表的主要作用是()A.便于形象描述和表达结果B.客表达验的原始数据C. 代替冗长的文字述和便于分析对比D.容易进行统计述和推断42. 0502.述某疾病患者年龄(岁)的分布,采用的统计图是()A.线图B.条图C.百分条图D.直方图43. 0503.高血压临床试验分为试验组和对照组分析考治疗0周、2周、4周6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数图B.线图C.条图D.直方图44. 0505.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图45. 0506.下列统计图适用于构成比关系的()A.直方图B.箱式图C.误差条图、条图D.圆图、圆百分条46. 0507.对有些资料构造统计表时下列可以省略的是()A.标题B.标目 C线条 D.备注47. 0509.描述某现象频数分布情况应选择的是( )A.圆图B.百分条图C.箱式图D.直方图48. 0601.样本均数的标准误越小说明A.观察个体的变异越小B.由样本均数估计总体均数的可靠性越大C.由样本均数估计总体均数的可靠性越小D.抽样误差越大49. 0602抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C资料不是正态分布 D.个体差异及抽样50. 0603.要减少抽样误差,通常的做法是A.减小系统误差B.将个体变异控制在一定范围内C减小标准差 D.适当增加样本含量51. 0604.对于正偏态分布的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布52. 0606.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109-9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C. 该区间包含总体均数的可能性为95%D.该区间包含样本均数的可能性为95%53. 0607.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L该地正常成年人血清胆固醇均数95%的可信区间是A.3.64±1.96×1.20B.3.64±1.20C.3.64±1.96×1.20/√200D.3.64±2.58×1.20/√20054. 0609.假设检验差别有统计学意义时,P越小,说明A.样本均数差别越大B.总体均数差别越大C认为样本之间有差别的统计学证据越充分 D.认为总体之间有差别的统计学证据越充分55. 0610.关于假设检验,正确的说法是A检验水准必须设为0.05 B必须根据样本大小选择检验水准C必须采用双侧检验 D.必须建立无效假设56. 0611假设检验水准a指的是A.检验的置信度B.控制Ⅱ类错误的概率C.控制1类错误的概率D.无效假设的概率57. 0613.假设检验中的P值的含义是A.总体间有差别时出现现有样本及极端情况的概率B.总体间无差别时出现现有样本及极端情况的概率C.总体间有差别时H成立的概率D.总体间无差别时H成立的概率58. 0701.两样本均数之差的标准误反映的是A.两样本数据集中趋势的差别B. 两样本数据的变异程度C. 两样本均数之差的变异程度D. 数据的分布特征59. 0702. 两样本均数比较,检验结果P>0.05说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论60. 0706.增加t检验的检验效能,应该使用的方法是A.减小I类错误B.减小测量的系统误差C.减小测量的随机误差D. 增加样本量61. 0707. 以下不能用配对t检验方法的是(C)A比较15名肝癌患者癌组织和癌旁组织中Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者癌组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后后糖化血红蛋白的变化62. 0709. 对于配对设计的t检验,其检验假设H0是A. 两样本均数相同B. 配对数据的差值总体均数为0C.两总体均数相同D.两总体均数不同63. 0801.方差分析的基本思想是A.组间均方大于组内均方B.组内均方大于组件均方C.不同来源的方差必须相等D.总变异及其自由度可按不同来源分解64. 0802.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差等于组间方差D.总方差等于各组方差之和65. 0803.完全随机设计方差分析中的组间均方反映的是A.某因素效应大小B.随机测量误差大小C.全部数据的离散度D.处理因素效应与随机误差综合结果66. 0806 完全随机设计的多个样本均数比较,经方差分析,若P<0.05,则结论为:A 各样本均数全相等B 各样本均数全不相等C 至少有两个样本均数不等D 至少有两个总体均数不等67. 0814 在完全随机设计资料的方差分析中,已知总样本量为60,分为4个不同的处理组,则组内变异的自由度为A 3B 56C 57D 5968. 0901. 两样本率比较,差别具有统计学意义时,P值越小说明A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同69. 0907当四个表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是A 增大B 减小C 不变D 不确定70. 0911. 卡方检验的基本思想是A. 对总变异进行分解计算X2值B.根据总体间差别的大小计算X2值C.根据样本配对的情况计算X2值D.根据实际频数和理论频数的差异计算X2值71. 0912. 对三行四列表资料作X2检验,自由度为A. 1B. 2C. 6D. 372. 1001.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息73. 1010 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次为A 0.2B 1.0C 5.0D 3.074. 1011. 两样本比较的秩和检验,其应用条件是A. 两样本服从正态分布B. 两总体服从正态分布C. 两样本方差齐同D. 不受任何条件限制75. 1013.配对资料的符号秩和检验的无效假设是A. 两组配对的差值中位数为零B.两总体均数相同C.两总体分布位置相同D.两组配对的差值均数为零76. 1101,两数值变量的相关关系越强,对应的是A 相关系数越大B 回归系数越大C 相关系数的绝对值越大D 回归系数的绝对值越大77. 1105,1~17岁儿童可以用年龄(岁)估计体重(市斤)回归方程为y ^=14+4x,若将体重换成国际单位kg,则此方程A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变78. 1106,对同一资料进行线性回归与相关分析时,下列正确的情形是A ρ=0时,r=0B ρ>0时,b>0C r>0时,b<0D r<0时,b<079. 1107下列双变量中,适用于进行线性相关分析的是A年龄与体重 B民族与血型C体重与体表面积D母亲文化水平与子女的智商80. 1108 若直线回归系数的假设检验结果p<0.05,则可认为两变量间A有密切的关系 B有一定的因果关系C相关关系密切D存在数量依存关系81. 1111用最小二乘法建立线性回归方程的原则是保证各实测点到回归直线的(B)A纵向距离的离均差最小B纵向距离的平方和最小C垂直距离相等 D垂直距离的平方和最小82. 1112,进行线性回归分析,合理的直观分析方法是A计算回归系数 B做回归直线C计算截距或常数项D绘制散点图83. 1501实验性研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.提高检验效能D.保持各组的非处理因素均衡一致84. 1502.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响85. 1503.在临床试验设计选择对照时,最高效的对照形式是(D)A.历史对照B.空白对照C.标准对照D.安慰剂对照86. 1504.实验没计的三大原则是A.随机、对照、自法B.随机、均衡、重复C.随机、对照、均衡D. 随机、对照、重复87. 1505.某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效,对照组采用阳性药物溶栓胶囊,这属于A.空白对照B.历史对照C.标准对照D.安慰剂对照88. 1509.临床试验需要在设计阶段确定主要指标的目的是A.便于试验实施B.减少测量的随机误差C.减少非处理因素的影响D.避免结果的任意性89. 1511.观察性研究与实验性研究的主要区别是A.是否设立对照组B.是否以人为研究对象C.是否是抽样研究D.是否主动施加干预措施90. 1514.诊断试验中的灵敏度指的是(B)A.检测仪器的敏感性B.对患病的人检出的概率C.对未患病人检出的概率D.阳性预测值。
统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间就是如何转换得?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人得健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件得含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶得概率≤0、05,即可称该人一次打中靶得事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用得抽样方法各有什么特点?答:(1)单纯随机抽样:优点就是操作简单,统计量得计算较简便;缺点就是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点就是易于理解、操作简便,被抽到得观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点就是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点就是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点就是事先要进行分层,操作麻烦。
(4)整群抽样:优点就是易于组织与操作大规模抽样调查;缺点就是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目得与指标(2)确定调查对象与观察单位(3)选择调查方法与技术(4)估计样本大小(5)编制调查表(6)评价问卷得信度与效度(7)制定资料得收集计划(8)指定资料得整理与分析计划(9)制定调查得组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算得必须得内容;(2)备查项目保证分析项目填写得完整与准确得内容;(3)其她项目大型调查表得前言与表底附注。
第三章实验设计1、简述实验设计得特点。
答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平就是由随机分配而定得。
2、简述一般选择受试对象得原则。
答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以就是志愿者。
3、什么就是混杂因素?设计时怎样控制混杂因素?答:混杂因素就是指影响实验效应并与处理因素同时存在得非处理因素。
可以通过采取排除、平衡、或标准化得办法来控制混杂因素得影响。
4、什么就是随机化?怎样实现随机抽样与随机分组?答:随机化就就是使样本具有较好得代表性,使各组受试对象在重要得非处理因素方面具有较好得均衡性,提高实验结果得可比性。
一般用随机数字表、随机排列表或统计软件包来实现随机抽样与随机分组。
第四章定量资料得统计描述1、常用得平均数指标有哪些?各适用于何种类型资料?答:(1)有算术均数、几何均数与中位数、众数、调与数等。
(2)算术均数:适用于描述单峰对称分布,特别就是正态分布或近似正态分布资料得集中趋势几何均数:等比资料、对数正态分布资料中位数:偏态分布资料、分布类型不明确得资料、“开口资料”(即一端或两端无确切数值得资料) 2、如何描述定量资料得离散趋势?答:(1)极差:极差越大,单峰对称分布小样本资料得变异程度越大,只局限于初步描述;(2)四分位数间距:四分位数间距越大,偏态分布及分布得一端或两端无确切数值资料得离散程度越大,但不能全面概括所有观察值得变异情况;(3)方差与标准差:方差与标准差越大,对称分布特别就是正态分布或近似正态分布资料得变异程度越大;(4)变异系数:变异系数越大,不同度量衡单位或者均数相差悬殊得资料得变异度越大。
3、正态分布有哪些基本特征?答:(1)概率密度函数曲线在均数处最高;(2)以均数为中心左右对称,且逐渐减少;(3)正态分布有两个参数,即μ与σ;(4)曲线下得面积分布有一定规律。
第五章定性资料得统计描述1、相对数适用于何种类型得资料进行统计描述?答:相对数适用于定性资料得统计描述。
2、率与构成比在应用上主要区别就是什么?答:率反映事物发生得强度与频率;构成比表示事物内部各组成部分得频数所占得比重与分布。
3、什么情况下需要对率进行标准化?直接标准化法与间接标准化法在应用上有何区别?答:若要对比得两组对象内部构成得差别足以影响结论时,需要对率进行标准化。
直接法:已知被观察人群中各年龄组得患病率等资料,适用于两组资料中某事物发生率得互相对比间接法:适用于仅已知各年龄组得观察单位数与总患病率得资料4、什么就是动态数列?分析动态数列有哪些基本指标?答:动态数列(dynamic series)就是一系列按时间顺序排列起来得统计指标,用以说明事物在时间上得变化与发展趋势。
常用动态数列分析指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
第六章总体均数与总体率得估计1、样本均数得标准误得意义就是什么?答:反映抽样误差得大小。
越大,样本均数得分布越分散,样本均数与总体均数差别越大,由样本均数估计总体均数得可靠性就越小;反之,样本均数分布就越集中,样本均数与总体均数差别就越小,由样本均数估计总体均数可靠性就越大。
2、标准误与标准差有何区别?答:①意义不同:标准差:表示观测值得变异程度标准误:反映抽样误差得大小②用途不同:标准差:确定医学参考值范围标准误:用于统计推断(参数估计、假设检验)③公式不同:标准差:标准误:3、正常值范围与总体均数得可信区间有何区别?答:(1)意义不同:总体均数得可信区间就是按预先给定得概率,确定得未知参数得可能范围;正常值范围就是描述“正常人”得解剖、生理、生化、某项指标得波动范围(2)公式不同可信区间:σ已知:或σ未知但n ≥50:或σ未知:正常值范围:正态分布:或偏态分布:PX ~ P100-X(3)用途不同:总体均数得可信区间就是用于估计总体均数;正常值范围就是用于判断观察对象得某项指标正常与否。
4、二项分布、Poisson分布与正态分布之间有何区别与联系?答:区别:二项分布与Poisson分布就是离散型概率分布,用概率函数描述其分布状况;而正态分布就是连续性概率分布,用密度函数描述其分布状况。
联系:Poisson分布可以瞧作就是发生概率π很小而观察例数n很大得二项分布;在λ>20时,Poisson 分布得平均计数近似正态分布;在n较大,且nπ与n(1-π)均大于5时,二项分布接近于正态分布。
第七章假设检验1、假设检验得意义何在?应用假设检验时要注意哪些问题?答:意义:用样本指标估计总体指标,其结论有得完全可靠,有得只有不同程度得可靠性,需要进一步加以检验与证实。
通过假设检验来分析样本指标与总体指标之间就是否存在显著差异,从而作出判断就是否接受原假设。
应用假设检验时注意得问题:1应有严密得研究设计,即总体应有同质性,样本应有代表性及组间具有可比性;2正确理解a水准与P值得意义,P值越小,越有理由拒绝H0,而a就是说明P值小到何种程度才拒绝H0;3正确理解结论得统计学意义,有统计学意义并不一定有实际意义;4假设检验得结论不能绝对化。
2、答:(1)由抽样误差所致(2)由于两样本均数来自不同得总体,这两不同得总体参数之间存在显著性差异。
3、假设检验与区间估计有何区别及联系?答:区别:(1)可信区间用于说明量得大小,即推断总体均数得范围;假设检验用于推断质得不同,即判断两总体均数就是否不同;(2)可信区间比假设检验可提供更多得信息:可信区间不但能回答差别有无统计学意义,而且还能提示差别有无实际得专业意义。
联系:可信区间亦可回答假设检验得问题:可信区间包含H0,按α水准,不拒绝H0;若不包含H0,则按α水准,拒绝H0,接受H1。
4、I型错误与II型错误得区别及联系何在?检验效能得含义就是什么?答:(1)区别:I型错误就是H0实际上就是成立得,但由于抽样得原因,拒绝了H0,称“弃真”,概率用a表示;II型错误就是实际上就是不成立得,但假设检验没有拒绝它,称“取伪”,概率用β表示。
联系:当样本含量固定时,a增大,β减小;反之亦然;若同时减小a与β,则只能增大样本含量。
(2)检验效能得含义:当两总体参数确实有差别时,按a水准能够发现这种差别得能力。
5、怎样正确运用单侧检验与双侧检验?答:首先应考虑所要解决问题得目得,根据专业知识来确定。
若从专业知识判断一种方法得结果不可能低于或高于另一种方法得结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。
第八章t检验1、两样本均数比较时为什么要做统计检验?答:两样本均数分别代表得总体均数μ1与μ2相等时,也可能会因抽样误差而导致两样本均数不相等,因此需要做统计检验。
2、两样本均数检验比较得t检验中,什么情况下做单侧检验?什么情况下做双侧检验?答:若从专业知识判断一种方法得结果不可能低于或高于另一种方法得结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。
3、t检验要求满足哪些基本条件?答:(1)资料服从正态分布(2)方差齐性(3)未知且n 较小(n<50)4、在两样本t检验,如果方差不齐,但两组样本量相同并且很大,能否忽略t检验对方差不齐得要求?答:能。
n1与n2均大于50时,可不必做方差齐性检验;若两总体方差不具有齐性,可采用t’或者进行变量转换或者用秩与检验来处理。
5、对样本均数与某已知得总体均数或两样本均数得差别做统计检验,可信区间与t检验有什么关系?答:可信区间包含H0,按α水准,不拒绝H0;若不包含H0,则按α水准,拒绝H0,接受H1。
第九章方差分析1、为什么不能用两两比较得t检验进行多个样本均数得比较?答:用两两比较得t检验进行多个样本均数得比较时,需要进行多次检验,根据概率乘法法则,全部判断正确得概率大大降低,犯I类错误得概率也就增大,甚至远远大于检验水准。
因此,多组均数之间得两两比较不能直接用t检验。
取而代之得就是,必须在方差分析结果为拒绝H0接受H1得基础上,进行多个样本得两两比较。
2、方差分析为何就是单侧检验?答:F统计量(F=组间均方/组内均方)若原假设成立,即各处理组得样本来自于同一总体,则组间均方应与组内均方差不多,即F统计量在1附近波动;否则,若原假设不成立,即不同处理得作用不同时,组间均方(处理因素得作用)一般大于组内均方(随机误差),因此,F统计量一般往大于1得方向趋化,从而在作结论时,若F统计量大到一定程度,就拒绝原假设。