医学统计学试题及答案27674教学文案
- 格式:doc
- 大小:98.50 KB
- 文档页数:8
医学统计学试题答案一、选择题1. 医学统计学中,用于描述数据分布集中趋势的指标是()。
A. 方差B. 标准差C. 均数D. 百分位数答案:C2. 下列哪项不是医学研究中的常见随机误差来源?()。
A. 测量误差B. 抽样误差C. 实验设计偏差D. 仪器误差答案:C3. 在医学统计分析中,卡方检验主要用于()。
A. 比较两组连续变量的均值B. 比较两组分类变量的分布C. 检验两组数据的一致性D. 评估变量间的相关性答案:B4. 回归分析的主要目的是()。
A. 确定变量间的因果关系B. 评估变量间的关系强度C. 预测未来数据的趋势D. 以上都是答案:D5. 灵敏度和特异度是评价()的重要指标。
A. 治疗效果B. 诊断试验C. 预防措施D. 病因关系答案:B二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________和________。
答案:方差,标准差2. 医学研究中,为了减少随机误差的影响,常采用的方法有________、________和________。
答案:重复测量,随机化,盲法3. 医学统计分析中,用于评估两组连续变量间差异的非参数检验包括________、________等。
答案:Mann-Whitney U检验,Wilcoxon符号秩检验4. 逻辑回归分析可以用来处理变量间的________和________关系。
答案:线性,非线性5. 医学研究中,为了评估治疗效果的一致性,常用的统计方法是________。
答案:Meta分析三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用十分广泛,它通过使用各种统计方法和技术来分析和解释临床数据,帮助研究者得出科学的结论。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者设计合理的研究方案,如随机对照试验,以减少偏倚和误差。
其次,在数据收集阶段,统计学原理可以指导如何进行有效的数据采集和处理缺失数据。
医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-医学统计学试题及答案习??题《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题1.观察单位为研究中的( d??)。
A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。
A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成3.抽样的目的是(b??)。
A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数C.研究典型案例研究误差? ???D. 研究总体统计量4.参数是指(b? ?)。
A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变? ?? ?B.均数改变,标准差不变C.两者均不变? ?? ?? ?? ?? ???D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a??)。
A.变异系数? ??B.差C.极差? ?? ?? ?D.标准差8.以下指标中(? ?d)可用来描述计量资料的离散程度。
A.算术均数? ?B.几何均数C.中位数? ?? ?D.标准差9.偏态分布宜用(? ?c)描述其分布的集中趋势。
A.算术均数? ??B.标准差C.中位数? ??D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。
A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数11.( a??)分布的资料,均数等于中位数。
《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
医学统计学试题及答案医学统计学试题及答案第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性口血病患者构成调查所获得的资料应绘制(B )A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计•方法是(A )A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的93%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A )A.个体差异B.群体差异C.样本均数不同D.总体均数不同6、男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D )A.用样本指标佔计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其日的是检验(C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为阳和n“在进行成组设计资料的t检验时,自由度是(D)(A)n x+ n:(B)n:+ n: - 1(C)ni+ n: +1(D)ni+ n: -210、标准误反映(A )A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,乂作直线相关分析。
令对相关系数检验的t值为匚,对回归系数检验的t值为饥,二者之间具有什么关系(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为X’和艾,则配对资料的秩和检验(D )A分别按xl和x2从小到大编秩B把xl和x2综合从小到大编秩C把xl和x2综合按绝对值从小到大编秩D把xl和x2的差数按绝对值从小到大编秩14、四个样本率作比较,x=>x.v可认为(A )A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35 人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》课程考试试题(A卷)(评卷总分: 100分, 考试时间: 120分钟, 考核方式: □开卷V闭卷)一、选择题(每题1分, 共62分, 只选一个正确答案)1.医学科研设计包括( D )A. 物力和财力设计B. 数据与方法设计C. 理论和资料设计D. 专业与统计设计2.医学统计资料的分析包括( D )A. 数据分析与结果分析B. 资料分析与统计分析C. 变量分析与变量值分析D. 统计描述与统计推断3.医学资料的同质性指的是( D )A. 个体之间没有差异B. 对比组间没有差异C. 变量值之间没有差异D. 研究事物存在的共性4.离散型定量变量的测量值指的是( D )A. 可取某区间内的任何值B.可取某区间内的个别值C. 测量值只取小数的情况D. 测量值只取整数的情况5.变量的观察结果表现为相互对立的两种情况是( A )A. 无序二分类变量B.定量变量.C. 等级变量D. 无序多分类变量6.计量资料编制频数表时, 组距的选择( D )A. 越大越好B. 越小越好C. 与变量值的个数无关D. 与变量值的个数有关7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A. 极差B. 方差C. 标准差D. 变异系数8、若要用方差描述一组资料的离散趋势, 对资料的要求是( D )A. 未知分布类型的资料B. 等级资料C. 呈倍数关系的资料D. 正态分布资料9、频数分布两端没有超限值时, 描述其集中趋势的指标也可用( D )A. 标准差B. 几何均数C. 相关系数D.中位数10、医学统计工作的步骤是( A )A.研究设计、收集资料、整理资料和分析资料B.计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析, 统计描述和统计推断D.选择对象、计算均数、参数估计和假设检验11、下列关于变异系数的说法, 其正确的是( A )A.没有度量衡单位的系数B.描述多组资料的离散趋势C.其度量衡单位与变量值的度量衡单位一致D.其度量衡单位与方差的度量衡单位一致12.10名食物中毒的病人潜伏时间(小时)分别为3, 4, 5, 3, 2, 5.5, 2.5, 6, 6.5, 7,其中位数是( B )A. 4B. 4.5C. 3D. 213.调查一组正常成年女性的血红蛋白, 如果资料属于正态分布, 描述这组资料离散趋势的指标最好为( C )A. 全距B. 四分位数间距C. 标准差D. 方差14.正态分布曲线下, 当μ不变, σ变大时, ( D )A. 曲线形态不变, 中心位置向左移B. 曲线形态不变, 中心位置向右移C.曲线形态变的瘦高, 中心位置不变 D.曲线形态变的矮胖, 中心位置不变15.用于描述一组对称分布资料全部观察值变异程度大小的指标是( A )A. SB. RC.D. CV16.下列指标中, 不属于集中趋势指标的是( A )A. 变异系数B. 中位数C. 算术均数D. 几何均数17、总体是由( A )组成A. 同质个体的所有变量值B. 全部个体C. 相同的观察指标D. 部分个体18、随着样本例数的增大, 样本均数( A )A、与总体均数更加接近. B. 减小 C. 不变 D. 增大19、抽样误差产生的原因是( A )A. 个体变异B. 工作人员责任心不强C. 仪器测量不准确D. 观察对象不纯20、观察单位为研究中的( A )A. 个体B. 全部对象C. 样本D. 观察指标21.变异系数CV是( B )A. 整数B. 百分数C. 小数D. 率22、各观察值同加上一个不等于0的常数后, ( B )不变A.算术均数B.标准差C.几何均数D.变异系数23.下列资料( B )为等级资料A.体重B.病人的病情分级C.某病发病率D.血型24.标准正态分布曲线下, 0到2.58的面积为( B )A. 90%B. 49.5%C. 95%D. 50%25.测定一组人群的听力, 已知听力过低为异常, 若制定其医学参考值范围, 应选择( B )A. 单侧上限B. 单侧下限C. 双侧D. 单侧26.关于医学参考值范围的制定, 下列说法正确的是( A )A. 样本例数不能太少B. 只能选95%的百分界限C. 不受资料分布类型的限制D. 选择单侧和双侧的结果是一样的27、正常成年男子收缩压的医学参考值范围一般指( B )A.所有正常成年男子收缩压的最小值到最大值范围B.绝大多数正常成年男子收缩压的波动范围C.所有正常成年男子收缩压的波动范围D.少部分正常成年男子收缩压的波动范围28、有关样本均数的标准误, 下列说法正确的是( B )A. 与样本例数的大小无关B. 表示样本均数离散趋势的大小C. 表示样本变量值差异的大小D. 与样本所代表的总体变量值的离散趋势无关29、下列哪项不是样本均数标准误的用途( C )A. 可用来计算总体均数的可信区间B. 可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D.可用于均数假设检验的计算.30. t分布曲线随自由度的增大( D )A. 曲线下的总面积变小B. 曲线的中心位置向左移C. 曲线的高峰变低, 尾部翘得较高D. 曲线的高峰变高, 尾部翘得较低31.自由度一定的t分布曲线, 当t值增大时, 其尾部面积( A )A. 变小B. 变大C. 不变D. 不清楚32.总体均数95%的可信区间主要是用于( A )A. 估计总体均数有95%的可能性在此区间内B. 反映某指标的可能取值范围C. 95%的样本均数在此范围内D. 确定医学参考值范围33.要提高总体均数可信区间的把握度与精确度, 最好的方法是( B )A. 改变计算公式B. 增加样本例数C. 减小样本例数D. 样本例数保持不变34.假设检验中, 同一资料, 作单侧检验与双侧检验( D )A. 结论一致B. 结论不清楚C. 作单侧检验更容易接受无效假设D.作单侧检验更容易接受备择假设35.假设检验中, 同一资料, 作单侧检验与双侧检验( C )A. 结论一致B. 结论不清楚C. 作双侧检验更容易接受无效假设D.作双侧检验更容易接受备择假设36. 单样本t检验的目的是( B )A. 推断未知总体均数是否小于零B. 推断已知总体均数与未知总体均数是否相等C. 推断样本均数与未知总体均数是否相等D. 推断未知总体均数是否为负数37、配对设计的目的是( A )A. 提高组间可比性B. 计算简便C. 易于理解D. 为了结论更可靠38、配对设计t检验的目的是( A )A. 推断差数的总体均数是否等于零B. 推断差数的样本均数是否等于零C. 推断差数的总体均数是否大于1D. 推断差数的样本均数是否大于139、两样本均数t检验的目的是( A )A. 推断两总体均数是否相等.B. 推断两样本均数是否相等.C. 推断两总体方差是否相等.D. 推断两样本方差是否相等.40、甲乙两人分别从同一总体中各抽得30个与50个变量值作为两个样本, 求得、S12,、S22, 则有( D )A.做两样本t检验, 必然得差别无统计学意义的结论B.做两样本t检验, 必然得差别有统计学意义的结论C.分别有甲、乙两样本求出的总体均数的95%的可信区间, 必然有重叠D.分别有甲、乙两样本求出的总体均数的95%的可信区间, 很可能有重叠41.两样本均数的t检验, 若两样本例数分别为n1和n2, 自由度为( D )A. n1+n2B. n1+n2-1C. n1+n2+1D. n1+n2-242.若同时减少第一类错误与第二类错误, 最佳的方法为( A )A. 增加样本例数B. 减少样本例数C. 样本例数不变D.改变检验水准43.拒绝无效假设, 只可能犯( A )A.第一类错误.B. 第二类错误C. 推断结论不可靠的错误D. 检验水准不一致的错误44.反映事物内部某一组成部分所占的比重宜采用( A )A. 构成比B. 标准化率C. 相对比D. 率45.某地某年乙脑的发病人数占同年传染病病人数的20%, 该指标为( A )A. 构成比B. 率C. 相对比D. 发病率46.甲乙两地进行冠心病发病率的比较, 需要进行率的标准化的情况有( A )A. 年龄内部构成不同B. 年龄内部构成相同C. 两地的发病率相差太大D. 两地各年龄组的发病率相差不大47、甲、乙两组资料进行率的标准化时, 选择标准人口数或选择该标准人口数换算成相应的标准人口构成比, 两方法得出的结论( A )A. 相同 B. 甲组标化率大于乙组标化率C. 不同D. 甲组标化率小于乙组标化率48、某医师给某地全部的麻疹易感儿童进行免疫接种, 共有2000人, 一个月后, 从中随机抽取400人进行抗体水平的测定, 其中阳性人数是300人, 若计算该疫苗接种的阳性率, 其数值为( B )A. 10%B. 75%C. 50%D. 60%49、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究, 样本例数为n1.n2 , 高血压的患病人数为x1.x2 , 则两样本合计的高血压发病率为( D )A. x1/ n1B. x2 / n2C. x1 / n1+ x2 / n2D. (x1+x2) / (n1+n2)50、有关样本率的标准误, 下例错误的是( D )A. 表示样本率围绕总体率的离散趋势B. 表示样本率相互之间的离散趋势C. 表示样本率抽样误差的大小D. 表示样本阳性率与样本阴性率之间的差异51.总体率估计的最佳方法是( B )A. 点值估计B. 区间估计C. 概率估计D. 频率估计52. 值是反映实际频数与理论频数( B )A. 相差多少的指标B. 吻合程度的指标C. 是否相等的指标D. 以上均不对53.四格表检验时, 不需要进行连续性校正的条件是( A )A. n≥40, T≥5B. n<40,1≤T<5C. n≥40, T<1D. n≥40,1≤T<554.四格表资料的检验, 理论频数T的计算是根据( A )A. π1 =π2B. π1≠π2C. π1<π2D. π1 >π255.用甲乙两种方法检查已确诊的鼻咽癌患者100名, 甲法阳性者80名, 乙法阳性者60名, 两法均为阳性者50名, 欲检验两法结果有无差别, 宜选用( B )A. 行X列表资料的检验B. 配对设计四格表检验C. t检验D. 两样本率比较的四格表检验56.3个样本率作比较, < 0.05, 2, 则在α=0.05检验水准下, 可认为( B )A. 各总体率不等或不全相等B. 各总体率均相等C. 各样本率均相等D. 各样本率不全相等57、相关系数是表示两变量x与y之间( D )A .有无数量关系的指标 B. 那个变量较大的指标C. 有无依存关系的指标D. 相关关系的密切程度与相关方向的指标58、相关系数假设检验的无效假设是( B )A .ρ≠0 B. ρ=0 C. β≠0 D. β=059、相关系数假设检验的自由度为( B )A. n - 1B. n - 2C. nD. n + 160. 最小二乘法原理是( C )A. 各实测点距所求直线的纵向距离最小B. 各实测点距所求直线的纵向距离相等C. 各实测点距所求直线的纵向距离平方和最小D. 各实测点距所求直线的垂直距离平方和最小61.对于同一资料的直线相关系数和直线回归系数, 下列论断正确的是( C )A. 相关系数越小, 回归系数也越小B. 相关系数与回归系数无关系C. 回归系数有单位, 相关系数没有单位D. 样本相关系数为0时, 样本回归系数也为062.关于回归系数b, 下列说法错误的是( B )A. 是直线回归方程的斜率B. 同一资料x作自变量与y作自变量计算的b相等C. 取值范围为 (-∞,+∞)D. b>0时, 随x的增大y也增大二、判断题(若正确, 请在答题卡上涂A, 若错误, 请在答题卡上涂B, 每题1分, 共10分)63.绘制定量资料的频数表时, 各组段的组距一定要相等。
医学统计学题库及答案1. 描述统计1.1 以下哪个是描述统计的目的?A. 通过样本数据估计总体参数B. 通过总体数据估计样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:C1.2 描述统计法可以通过以下哪种途径进行?A. 经验法B. 理论法C. 实证法D. 推理法答案:C1.3 描述统计研究的内容主要包括以下哪些方面?A. 数据的整理和分类B. 数据的测量和统计描述C. 数据的分析和解释D. 数据的比较和推断答案:A、B、C、D1.4 描述统计法分为以下哪两类?A. 单变量描述统计B. 双变量描述统计C. 多变量描述统计D. 多重描述统计答案:A、B、C、D2. 分布统计2.1 以下哪种回答正确描述了正态分布?A. 均值等于0,标准差等于1B. 均值等于1,标准差等于0C. 均值等于0,标准差大于1D. 均值等于1,标准差大于0答案:A2.2 正态分布的特点包括以下哪些?A. 对称分布B. 峰态分布C. 均匀分布D. 尖峰分布答案:A、D2.3 正态分布的标准差决定了以下哪个特征?A. 数据的离散程度B. 数据的集中程度C. 数据的偏斜程度D. 数据的峰态程度答案:A2.4 正态分布的特征值z是根据以下哪个公式计算得出的?A. z = (x - μ) / σB. z = (x - σ) / μC. z = (μ - x) / σD. z = (σ - x) / μ答案:A3. 推断统计3.1 推断统计的目的是什么?A. 通过样本数据推断总体参数B. 通过总体数据推断样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:A3.2 推断统计的方法主要包括以下哪些?A. 参数估计B. 假设检验C. 方差分析D. 相关分析答案:A、B、C3.3 参数估计的目的是什么?A. 估计总体参数B. 估计样本参数C. 估计总体样本参数D. 估计样本总体参数答案:A3.4 假设检验的步骤包括以下哪些?A. 对原假设提出对立假设B. 利用样本数据计算统计量的值C. 比较统计量的值与临界值D. 根据比较结果得出结论答案:A、B、C、D4. 相关分析4.1 以下哪个参数可以反映两个变量之间的关系强度?A. 相关系数B. 偏度C. 标准差D. 峰度答案:A4.2 相关系数的取值范围是什么?A. [-1, 0]B. [0, 1]C. [-∞, +∞]D. [0, +∞]答案:A、B4.3 相关系数绝对值越大表示什么?A. 两个变量之间的关系越强B. 两个变量之间的关系越弱C. 两个变量之间没有关系D. 无法确定两个变量之间的关系强弱答案:A4.4 相关分析需要满足以下哪些前提?A. 两个变量之间存在线性关系B. 两个变量之间呈正态分布C. 样本容量充足D. 数据来自独立样本答案:A、B、D这是一个医学统计学题库及答案的文档,包含了描述统计、分布统计、推断统计和相关分析等方面的问题和答案。
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学试题(含部分答案)⼀、最佳选择题(每题1分,共40分)1.直⽅图可⽤于表⽰ D 。
A.某现象内部构成B.某现象地理分布C.各现象的⽐较D.某现象的频数分布E.某现象的发展速度2.求正常⼈某个指标的正常值范围在理论上要求。
A.正态分布不能⽤均数标准差法B.正态分布不能⽤百分位数法C.偏态分布不能⽤均数标准差法D.偏态分布不能⽤百分位数法E.对称分布不能⽤百分位数法3.统计推断的主要内容为 B 。
A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测4.t分布与正态分布存在如下哪⼀种关系。
A.⼆者均以0为中⼼,左右对称B.曲线下中间95%⾯积对应的分位点均为±1.96C.当样本含量⽆限⼤时,⼆都分布⼀致D.当样本含量⽆限⼤时,t分布与标准正态分布⼀致E.当总体均数增⼤时,分布曲线的中⼼位置均向右移5.三个样本率⽐较得到χ2>χ2(0.01,2),可以为 A 。
A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同A.发⽣概率为0的事件B.发⽣概率为1的事件C.发⽣概率未知的事件D.发⽣概率为0E.发⽣概率为0.01或0.05的事件7.下列哪⼀指标为相对⽐ E 。
A.中位数B.⼏何均数C.均数D.标准差E.变异系数8.正态分布的特点有 B 。
A.算术均数=⼏何均数B.算术均数=中位数C.⼏何均数=中位数D.算术均数=⼏何均数=中位数E.以上都没有9.下列有关四分位数间距描述中不正确的是 D 。
A.四分位数间距=P75-P25B.四分位数间距⽐极差稳定C.四分位数间距即中间50%观察值的极差D.可⽤于描述正态分布资料的变异度E.四分位数间距越⼤,表⽰变异度越⼤10.某市2008年⿇疹疫情暴发,为期1个⽉,在1600名易感者中共查出患者160⼈,则该病在该时期的为10%。
A.发病率B.患病率C.罹患率D.续发率E.感染率11.调查1000名湖北民院在校⼥⽣的⾝⾼与体重,有0<r<1,则b A 。
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。
医学统计学练习题与答案一、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4. 假设检验的目的是 D.检验总体参数是否不同5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料1. 利用2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用C.Fisher 确切概率法 二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
卫生统计学试题(含答案)医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
该资料宜选用的统计方法为( A )A.四格表检验 B. 四格表校正检验 C t检验 D U检验16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D )A 南方和北方女婴出生体重的差别无统计学意义B 南方和北方女婴出生体重差别很大C 由于P值太小,南方和北方女婴出生体重差别无意义D 南方和北方女婴出生体重差别有统计学意义但无实际意义。
17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(A )A 两个样本率的差别B 两个样本率的标准误C 两个总体率的差别D 两个总体率的标准差18. 下列指标不属于相对数的是(D )A 率B 构成比C 比D百分位数19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:(D )表1 盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效组别治愈显效进步无效合计左西替利嗪片组49 8 5 2 64西替利嗪片组44 10 9 3 66A. 检验B. 成组t检验C. u检验D. 秩和检验20、下列哪种说法是错误的(B )A 计算相对数尤其是率时应有足够的观察单位或观察次数B分析大样本数据时可以构成比代替率C 应分别将分子和分母合计求合计率或平均率D 样本率或构成比的比较应作假设检验二、填空题(20分)1、现有若干名儿童健康检查一览表的部分检测指标,见表2表2 某年某地儿童健康检查部分检测结果编号性别年龄(周岁)身高(cm)坐高(cm)血型表面抗原肝大1 男7 116.7 66.3 A + ++2 女8 120.0 68.3 AB - -3 女10 126.8 71.5 O - +4 男9 123.7 70.0 A - -. . . . . . . .. . . . . . . .问:①上述变量中能形成计数资料的指标有性别、血型、表抗②计量资料的指标有年龄、身高、体重③等级资料的指标有肝大④对于身高或坐高指标,在进行统计描述时宜计算均数和标准差表示其集中趋势和离散趋势。
⑤对于血型指标宜计算构成比表示各种血型的构成⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的t检验⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方检验2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为341.48/10万3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重复三、简答题(20分)1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分)均数:正态或近似正态分布几何均数:等比数列或对数正态分布资料中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。
2、何谓假设检验?可以举例说明。
(5分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、计算分析题10分*2=201、请将下列数据编制成合格的统计分析表。
表1 四种脐带消毒方法效果比较组别总例数感染例数百分比,%庆大霉素(8万单位/10毫升) 30 1 3.3新洁尔灭(0.1%)30 3 10生理盐水冲洗服四环素3天30 5 16.7生理盐水冲洗30 8 26.72、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。
某医院门诊沙眼病人年龄构成比年龄组(岁) 0- 10- 20- 30- 40- 50- 60- 70- 计沙眼人数47 198 330 198 128 80 38 8 1027沙眼百分4.6 19.3 32.1 19.3 12.4 7.8 3.7 0.8 100.0比(%)问以上结论是否合理?说明理由。
要达到作者的目的,应计算什么相对数指标?答:不合理。
沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。
应计算患病率,即患者数与该年龄段总人口数之比。
第二套试卷及参考答案一、最佳选择题(40分)1.均数是表示变量值_A_水平的指标。
(A) 平均(B)变化范围(C)频数分布(D)相互间差别大小2.原始数据同乘以一个不等于0的常数后_D_。
(A) 均数不变、标准差变(B)均数、标准差均不变(C)均数变、标准差不变(D)均数、标准差均变3.描述正态或近似正态分布资料特征的是__B____。
(A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距4.描述偏态分布资料特征的是_A__。
(A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距5.均数与标准差计算的数值A 。
(A)均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以(C)两者都可以是负数(D)两者都不可以是负数6、比较身高和体重两组资料的变异度大小宜采用___C___。
(A) 极差(B)标准差(C)变异系数(D)四分位间距7.说明某事物内部各组成部分所占比例应选_B___。
(A) 率(B)构成比(C)相对比(D)标准差8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。
(A)S (B)R (C)CV (D)9. 已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是 C(A)5 (B)28 (C)29 (D)410.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为 A(A)95% (B)49.5% (C)99% (D)97%11.两样本均数间的差别的假设检验时,查t界值表的自由度为 C(A)n-1 (B)(r-1)(c-1)(C)n1+n2-2 (D)112.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A(A)总体中个体值存在差别(B)样本中个体值存在差别(C)样本只含总体的一部分(D)总体均数不等于0 13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小 B(A)α=0.05 (B) α=0.20 (C) α=0.01 (D) α=0.1014. 比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。
(A)线图(B)条图(C)半对数线图(D)圆图15.构成比用来 C(A) 反映某现象发生的强度(B) 表示两个同类指标的比(C) 反映某事物内部各部分占全部的比重(D) 表示某一现象在时间顺序的排列16.某医院的资料计算各种疾病所占的比例,该指标为 D(A)发病率(B) 患病率(C) 相对比(D)构成比17.等级资料的比较宜用 C(A) t检验(B) 检验(C) 秩和检验(D) 方差分析18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于 C(A)T11(B)T12 (C) T21 (D)T2219.四格表校正x2检验公式适用于 D(A)n<40, T>5 (B)n<40, 1<T<5 (C)n>40, T<5 (D)n>40, 1<T<520.同一双变量资料,进行直线相关与回归分析,有 B(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b二、填空题12分1、统计资料按其性质不同,通常将资料分为(计量、计数、等级) 三种类型。