卫生统计学习题及答案(精华版)
- 格式:doc
- 大小:156.05 KB
- 文档页数:16
卫生统计学考试试题及答案一、选择题(每题2分,共20分)1. 卫生统计学研究的对象是()A. 疾病的发生与发展规律B. 疾病的流行规律C. 疾病的防治措施D. 疾病的统计方法答案:B2. 下列哪种分布类型属于偏态分布()A. 正态分布B. 二项分布C. Poisson分布D. 偏态分布答案:D3. 在卫生统计学中,下列哪种指标用于描述数据的离散程度()A. 平均数B. 中位数C. 极差答案:D4. 在卫生统计学中,下列哪种指标用于描述两个变量之间的关系()A. 相关系数B. 回归系数C. t检验D. χ²检验答案:A5. 下列哪种检验方法用于比较两个样本率的差异()A. t检验B. χ²检验C. F检验D. Z检验答案:B6. 在卫生统计学中,下列哪种检验方法用于比较两个独立样本的均数差异()A. t检验B. χ²检验D. Z检验答案:A7. 在卫生统计学中,下列哪种检验方法用于比较两个相关样本的均数差异()A. t检验B. χ²检验C. F检验D. 配对t检验答案:D8. 下列哪种情况适宜采用秩和检验()A. 数据分布未知B. 数据分布已知C. 数据为正态分布D. 数据为偏态分布答案:A9. 在卫生统计学中,下列哪种检验方法用于分析多因素对结果的影响()A. 单因素方差分析B. 多因素方差分析C. 多元回归分析D. 多重线性回归分析答案:C10. 下列哪种情况适宜采用logistic回归分析()A. 因变量为连续变量B. 因变量为分类变量C. 自变量为连续变量D. 自变量为分类变量答案:B二、填空题(每题2分,共20分)1. 卫生统计学中的基本任务包括:①数据的收集;②数据的整理;③数据的描述;④______。
答案:数据的分析2. 在卫生统计学中,描述数据集中趋势的指标有:平均数、中位数、众数,其中______是唯一一个位置平均数。
答案:中位数3. 在卫生统计学中,描述数据离散程度的指标有:极差、方差、标准差,其中______是方差的平方根。
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______。
A。
普通线图B.半对数线图C.直方图D.直条图E。
复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2。
为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A。
直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______。
A.直方图B。
普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C。
半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D。
直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C。
该研究的总体是300名易感儿童D。
该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5。
若要通过样本作统计推断,样本应是__________。
A。
总体中典型的一部分B.总体中任一部分C。
总体中随机抽取的一部分D.总体中选取的有意义的一部分E。
总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______。
A。
当样本含量增大时,均数也增大B.均数总大于中位数C。
均数总大于标准差D.均数是所有观察值的平均值E。
均数是最大和最小值的平均值【答案】D7。
某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A。
实用卫生统计学习题(含答案)一、单选题(共80题,每题1分,共80分)1、用于推断两数值变量间是否存在线性关系的统计方法是A、直线相关B、X2检验C、秩和检验D、直线回归正确答案:A2、132名教师血清胆固醇(mmol/L)值的资料类型属于A、计数资料B、等级资料C、计量资料D、分类资料正确答案:C3、构成比的特点是A、构成比总和必等于100%B、构成比总和必大于100%C、构成比总和不确定D、构成比总和必小于100%正确答案:A4、两个小样本均数,检验的无效假设是A、u1=u2B、u1≠u2C、x1=X2D、x1≠X2正确答案:A5、均数的标准误越大,表示样本的A、可靠程度越大B、抽样误差越大C、可比性越差D、系统误差越大正确答案:B6、推断统计包含的两个内容是A、统计描述和假设检验B、统计图表和假设检验C、统计描述和统计分析D、参数估计和假设检验正确答案:D7、关于假设检验,下面说法错误的是A、两个小样本均数比较时,要求总体方差齐性B、两个样本均数的比较可作t检验C、多个样本均数的比较可作F检验D、无论样本量大小均可作Z检验正确答案:D8、t检验的结果为A、两样本均数差别有统计学意义B、两样本均数有非常显著的差别C、两样本均数差别无统计学意义D、两样本均数无显著差别正确答案:A9、直线相关系数假设检验得P>α,可认为A、两变量无曲线关系B、两变量有关C、两变量无关D、两变量无直线关系正确答案:D10、正态分布的两个参数μ与σ,正态曲线愈趋高耸,数据愈集中,则A、σ愈小B、μ愈大C、σ愈大D、μ愈小正确答案:A11、单因素方差分析的三种变异分解正确的是A、SS总-SS组间=SS组内B、SS总+SS组内=SS组间C、SS总=SS组内D、SS组内=SS组间正确答案:A12、参数是指A、样本的总和B、随机变量C、样本的统计指标D、总体指标正确答案:D13、为了解某校锡克试验的阳性率,研究者从全校中抽取学号尾数是3和8的学生。
统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
卫生统计学试题及答案(附解释)卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.A.大约有95人的潜伏期小于57.8小时B.大约有5人的潜伏期大于57.8小时C.大约有5人的潜伏期小于57.8小时D.大约有8人的潜伏期大于57.8小时(全体的百分之五,即是约有8人)E.大约有8人的潜伏期小于57.8小时【答案】D9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内【答案】A10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.A.t值不变B.t值变小C.t值变大D.t值变小或变大E.不能判断【答案】A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对【答案】D12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数【答案】B13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计【答案】D14.以下属于分类变量的是___________.A.IQ得分B.心率C.住院天数D.性别E.胸围【答案】D15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0【答案】D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄(岁):10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图【答案】C17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小(某现象发生的强度大小用“概率”即“率”表示)C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%【答案】B18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究【答案】C19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对【答案】C20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同【答案】C卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义(r有统计学意义,b也有统计学意义)D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5<p<0.5< bdsfid="230" p=""></p<0.5<>【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P 越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
卫生统计学试题及答案一、选择题(每题1分,共10分)1. 卫生统计学是研究什么的科学?A. 疾病的预防和治疗B. 疾病的流行规律C. 卫生服务的管理和评价D. 卫生数据的收集、处理和分析2. 以下哪个不是卫生统计学中常用的数据类型?A. 计量资料B. 计数资料C. 排名资料D. 等级资料3. 卫生统计学中的描述性统计主要解决什么问题?A. 数据的收集B. 数据的描述C. 数据的推断D. 数据的预测4. 卫生统计学中的参数估计和假设检验的目的是什么?A. 描述数据分布B. 推断总体参数C. 预测未来趋势D. 判断数据的可靠性5. 以下哪个是卫生统计学中常用的分布?A. 正态分布B. 均匀分布C. 泊松分布D. 所有选项都是6. 卫生统计学中的相关分析和回归分析的区别是什么?A. 相关分析可以判断因果关系B. 回归分析可以判断因果关系C. 相关分析是描述性分析D. 回归分析是推断性分析7. 卫生统计学中的样本量计算的目的是?A. 减少数据收集的成本B. 确保研究结果的可靠性C. 提高数据收集的效率D. 减少数据收集的时间8. 在卫生统计学中,生存分析主要研究的是?A. 生存时间的分布B. 生存时间的预测C. 生存时间的比较D. 所有选项都是9. 卫生统计学中的多变量分析通常用于?A. 单因素分析B. 双因素分析C. 多个因素的分析D. 非线性因素的分析10. 卫生统计学中,哪个指标用于衡量疾病在人群中的分布?A. 发病率B. 死亡率C. 患病率D. 流行率答案:1-5 DCBDA 6-10 CDCCA二、简答题(每题5分,共20分)1. 简述卫生统计学在公共卫生领域中的应用。
答:卫生统计学在公共卫生领域中的应用主要包括疾病流行病学的调查研究、健康服务的评估、健康政策的制定与评价、健康数据的收集与分析等。
通过统计方法,可以对人群健康状况进行描述和分析,为预防控制疾病提供科学依据。
2. 解释什么是标准差,并说明其在卫生统计学中的意义。
卫生统计学试题及答案(一)1.用某地6〜16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C (6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则 .A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.下面关于均数的正确的说法是.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用 .A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
卫生统计学试题及答案(一)1。
用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E。
复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2。
为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A。
直方图B。
普通线图C。
半对数线图D。
直条图E。
复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______。
A。
直方图B。
普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______。
A。
该研究的样本是1000名易感儿童B。
该研究的样本是228名阳性儿童C。
该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E。
该研究的总体是228名阳性儿童【答案】D5。
若要通过样本作统计推断,样本应是__________。
A.总体中典型的一部分B。
总体中任一部分C.总体中随机抽取的一部分D。
总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A。
当样本含量增大时,均数也增大B.均数总大于中位数C。
均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7。
某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______。
卫生统计学试题及答案一、选择题(每题2分,共20分)1. 卫生统计学是研究什么的学科?A. 研究疾病发生的原因B. 研究疾病的治疗手段C. 研究数据收集、处理、分析和解释D. 研究疾病的预防措施2. 下列哪项不是卫生统计学中的常用统计指标?A. 均数B. 标准差C. 患病率D. 治愈率3. 抽样调查与普查的主要区别是什么?A. 抽样调查可以减少工作量B. 普查可以得到更准确的结果C. 抽样调查可以减少成本D. 普查可以提供更全面的数据4. 相对数指标通常用来反映什么?A. 总体的总量B. 总体的结构C. 总体的平均水平D. 总体的相对关系5. 以下哪个是描述数据分布集中趋势的指标?A. 方差B. 标准差C. 均数D. 极差6. 卫生统计学中,以下哪个概念与风险评估无关?A. 危险度B. 相对危险度C. 归因危险度D. 治愈率7. 以下哪个是卫生统计学中用于描述数据离散程度的指标?A. 众数B. 均数C. 方差D. 标准差8. 卫生统计学中,以下哪个指标用于描述两个变量之间的线性关系?A. 相关系数B. 回归系数C. 回归方程D. 相关指数9. 以下哪个统计图适合用来展示时间序列数据?A. 条形图B. 散点图C. 折线图D. 饼图10. 卫生统计学中,以下哪个概念用于衡量样本统计量与总体参数的接近程度?A. 标准误差B. 置信区间C. 抽样误差D. 抽样分布答案:1. C2. D3. A4. D5. C6. D7. C8. A9. C 10. A二、简答题(每题5分,共30分)1. 简述卫生统计学在公共卫生领域中的应用。
2. 解释什么是标准正态分布,并说明其在卫生统计学中的重要性。
3. 描述卫生统计学中常用的几种数据收集方法。
4. 阐述卫生统计学中抽样误差和非抽样误差的区别。
三、计算题(每题10分,共40分)1. 给出一组数据:23, 25, 27, 29, 31。
计算其均数、标准差和方差。
2. 如果一个研究的样本均数为45,样本标准差为10,样本量为100,求95%置信区间。
一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P 的含义22.I 型和 II 型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.二项分布30.Y ates 校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题I.观察单位为研究中的( D )。
A.样本C.影响因素2.总体是由(C)。
A.个体组成C.同质个体组成3.抽样的目的是( B )。
A.研究样本统计量C.研究典型案例研究误差4.参数是指(B)。
A.参与个体数C.样本的统计指标B.全部对象D.个体B.研究对象组成D.研究指标5.关于随机抽样,下列那一项说法是正确的( A )。
A .抽样时应使得总体中的每一个个体都有同等的机会被抽取B .研究者在抽样时应精心挑选个体,以使样本更能代表总体C .随机抽样即随意抽取个体D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( B ) 。
A .均数不变,标准差改变 B .均数改变,标准差不变 C .两者均不变D .两者均改变7.比较身高和体重两组数据变异度大小宜采用( A ) 。
A .变异系数 C .极差8.以下指标中( D )可用来描述计量资料的离散程度。
A .算术均数 B .几何均数 C .中位数D .标准差9.血清学滴度资料最常用来表示其平均水平的指标是( C ) 。
A .算术平均数 B .中位数 C .几何均数D .平均数10.两样本均数的比较,可用( C ) 。
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
4.简述应用相对数时的注意事项。
应用相对数应该注意:①防止概念混淆,避免以比代率的错误现象;②计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;③正确的计算频率(或强度)指标的合计值。
当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;④频率型指标的解释要紧扣总体和属性;⑤相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部结构是否一致、对比不同时期资料应注意客观条件是否相同;⑥正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。
5.说明率的标准化的基本思想及注意事项。
⑴标准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比较的方法,称为~。
其目的是统一内部构成,消除混杂因素,是资料具有可比性。
⑵应用标准化法的注意事项:①标准化法的应用范围很广。
当某个分类变量在两组中分布不同时,这两个分类变量就成为两组频率比较的混杂因素,标准化的目的是消除混杂因素。
②标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比较的资料间的相对水平。
③标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。
选择不同的标准,算出的标准化率也会不同,比较的结果也未必相同,因此报告比较结果时必须说明所选用的标准和理由。
④两样本标准化率是样本值,存在抽样误差。
比较两样本标准化率,当样本含量较小时,还应作假设检验。
6. 简述二项分布、Poisson 分布、正态分布三者的关系。
①二项分布与Poisson分布的关系:当n很大,发生概率π(或1-π)很小,二项分布B(n,π)近似于Poisson分布P(nπ);②二项分布与正态分布的关系:当n较大,π不接近0或1(特别是当nπ和n(1-π)均大于5时),二项分布B(n,π)近似于正态分布N(nπ,nπ(1-π));④Poisson分布与正态分布的关系:当λ≥20时,Poisson分布渐进正态分布N (λ,λ)。
7.试述假设检验中I型错误与II型错误的意义及关系。
关系:①α+β不一定等于1。
②在样本容量确定的情况下,α与β不能同时增加或减少。
③统计检验力(1-β)。
8.试比较完全随机设计和随机区组设计资料的方差分析基本思想。
9、参考值范围与总体均数置信区间的区别。
10.医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素。
实验设计的基本要素:受试对象、处理因素、实验效应;受试对象即为高血压患者,且应分实验组与对照组;处理因素至少应包括旧药治疗、新药治疗,最好设有安慰剂治疗;实验效应即疗程开始及结束时患者血压变化状况。
11.简述非参数检验的应用条件和优缺点。
非参数检验适用于:①有序变量资料;②总体分布类型不明的资料;③分布不对称且无法转化为正态分布资料;④对比组间方差不齐,有无适当变换方法达到方差齐性的资料;⑤一端或两端观察值不确切的资料;⑥等级资料。
优缺点:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,进行的是分布之间的检验。
一般不直接用样本观察值做分析,统计量的计算基于原数据在整个样本中按大小所占位次。
由于丢弃了观察值的具体数据,只保留了大小次序的信息,凡适合参数检验的资料,应首选参数检验。
12.举例简要说明随机区组设计资料秩和检验的编秩方法。
随机区组设计资料秩和检验的编秩方法为将每个区组的数据由小到大分别编秩,遇相同数据取平均秩次,按处理因素求秩和;T++T-=n(n+1)/2。
13.简述相关分析的步骤。
①进行相关分析前,应先绘制散点图。
只有散点有线性趋势时,才能进行直线相关分析。
②线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料;③出现离群值慎用相关;④相关关系不一定是因果关系;⑤分层资料盲目合并易出现假象;⑥样本的相关系数接近零并不意味着两变量间一定无相关性,有可能是非线性的曲线关系。
14.简述回归模型的适用条件。
线性回归模型的适用条件:①线性:因变量Y与自变量X称线性关系;②独立:每个个体观察值之间互相独立;③正态性:任意给定X值,对应的随机变量Y都服从正态分布;④等方差性:在一定范围内不同的X值所对应的随机变量Y的方差相等。
简记为LINE。
15. 试述直线相关与直线回归的区别与联系。
⑴区别:①单位:相关系数r没有单位,回归系数b有单位;所以,相关系数与单位无关,回归系数与单位有关;②应用目的:说明两变量间的关联性用相关分析,说明两者依存变化的数量关系则用回归分析;③对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服从双变量正态分布的随机变量。
④取值范围:-∞<b<+∞,-1≤r≤1;⑤意义:回归系数b表示X每增(减)一个单位,Y平均改变b个单位;相关系数r说明具有线性关联的两个变量间关系的密切程度与相关方向;⑤计算:⑵联系:①方向一致:r与b的正负号一致;②假设检验等价:tr=tb;;④用回归解释相关决定系数(coefficient of determination):回归平方和越接近总平方和,则r2越接近1,相关性越好。
三、分析题(不需要具体计算,给出大概计算步骤即可)1.某研究调查了山区、丘陵、平原和沿海地区居民饮用水中氟含量与氟骨症患病率如下表,试问:1)饮用水中氟含量与氟骨症患病率有无关系?2)有人说,如相关系数的检验结果为P<0.05,可认为,饮水中氟含量高是导致氟骨症高发的原因之一,对吗?氟含量(mg/l)0.480.64 4.00 1.48 1.60 2.86 3.21 4.71患病率(%) 22.37 23.3125.3222.2928.5935.0046.0746.08答:1)通过相关分析确定是否有关系:由于两个变量中患病率不能确定其正态性,本研究宜采用秩相关分析;首先对资料依次进行编秩,根据公式计算秩相关系数r s,然后进行秩相关系数的假设检验,H0: ρs=0相关系数为0,H1:ρs≠0相关系数不为0;α=0.05;通过查表或t检验的方法求得统计量与P值,按检验水准作出统计推断。
2)P<0.05只能说明他们有统计学上的关联,不能推断因果关系,同时,这个结果是从局域水平上说明两个指标之间的关系,可能存在生态学谬误。
2.某医生欲比较三种镇咳药的疗效, 分析三种镇咳药延迟咳嗽的时间。
结果经方差分析得下表。
(1)请补充并完成方差分析;(2)解释结果。
表X1 三种镇咳药延迟咳嗽时间的方差分析表答:方差分析步骤:(1)建立检验假设,确定检验水准H0:三种镇咳药疗效相同(误)H1:三种镇咳药疗效不同(误)H0:三种镇咳药延迟咳嗽的时间总体均数相同H1:三种镇咳药延迟咳嗽的时间总体均数不全相同α=0.05(2)计算检验统计量根据公式F=MS组间/MS组内,求得F=3.445(3)确定P值,作出推断根据ν1=ν组间=2,ν2=ν组内=37,查F界值表,可知P<0.05,按α=0.05水准,差异具有统计学意义,可认为三种镇咳药延迟咳嗽的时间总体均数不全相同。
3. 测得老年性慢性支气管炎病人与健康人的尿中17 酮类固醇排出量见下表, 比较两组均数差异是否有统计学意义并解释结果。
表X2 老年慢支病人与健康人尿中17 酮类固醇排出量(mg/24h)病人组 2.90 5.41 5.48 4.60 4.03 5.10 5.92 4.97 4.24 4.36 2.72 2.37 2.09 7.10健康组5.18 8.49 3.14 6.46 3.72 6.64 4.01 5.60 4.57 7.71 4.99答:该资料宜采用两独立样本t检验进行分析:(1)建立检验假设,确定检验水准H0:μ1=μ2,即慢性支气管炎病人组与健康人组的尿中17 酮类固醇排出量总体均数相同。
H1:μ1≠μ2,慢性支气管炎病人组与健康人组的尿中17 酮类固醇排出量总体均数不同。
α=0.05(2)计算检验统计量根据两组资料方差齐性检验确定用t检验或t’检验,根据公式求得统计量t(t’)(3)确定P值,作出推断根据ν=n1+n2-2,查t界值表,判断P值大小①若P>0.05,接受H0,可认为两组17 酮类固醇排出量总体均数无差异②若P<0.05,拒绝H0,接受H1认为两组类固醇排出量总体均数有差异。
4.在某地卫生服务调查中随机抽样调查了400户家庭,他们的平均年医疗费用支出是947元,标准差是291元。
设家庭医疗费用近似正态分布,请估计这些家庭的95%年医疗费用支出范围,并估计当地家庭年医疗费用平均支出。