医学统计学练习题与答案
- 格式:doc
- 大小:291.00 KB
- 文档页数:6
医学统计学书本练习题答案一、选择题1. 在医学统计学中,以下哪个选项不是描述数据分布的指标?A. 均数B. 标准差C. 方差D. 样本量答案:D2. 以下哪个统计量用于描述数据的集中趋势?A. 极差B. 均数C. 标准差D. 变异系数答案:B3. 假设检验中,P值小于0.05表示:A. 拒绝原假设B. 接受原假设C. 无法判断D. 需要更多数据答案:A4. 以下哪个选项是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 曼-惠特尼U检验答案:D5. 相关系数的取值范围是:A. (-1, 1)B. (0, 1)C. [-1, 1]D. (-∞, ∞)答案:C二、填空题6. 医学统计学中的正态分布具有两个参数,分别是________和________。
答案:均数标准差7. 医学研究中,为了控制实验误差,常常采用________设计。
答案:随机对照8. 医学统计学中,样本均数的标准误差是________除以样本量的平方根。
答案:标准差9. 医学研究中,为了减少偏倚,常常采用________方法。
答案:盲法10. 医学统计学中,卡方检验主要用于检验________。
答案:分类变量的独立性三、简答题11. 简述医学统计学中,为什么需要进行数据的正态性检验?答案:正态性检验是确保数据满足某些统计方法的前提条件,如t 检验和方差分析等。
如果数据不满足正态分布,使用这些方法可能会得到错误的结论。
12. 解释医学统计学中的“效应量”是什么,并说明其重要性。
答案:效应量是衡量实验处理效果大小的指标,它提供了实验结果的量化度量。
效应量的大小可以反映实验的临床意义或实际意义,有助于判断实验结果的显著性。
四、计算题13. 假设有一组数据:23, 25, 27, 29, 31。
请计算这组数据的均数和标准差。
答案:均数 = (23+25+27+29+31)/5 = 27;标准差 = sqrt(((23-27)^2+(25-27)^2+(27-27)^2+(29-27)^2+(31-27)^2)/5) = 2.83(保留两位小数)14. 某研究中,两组患者的平均血压分别为120mmHg和130mmHg,标准差分别为10mmHg和15mmHg,样本量分别为50和40。
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学练习题与答案⼀、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. ⽤样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1.某医学资料数据⼤的⼀端没有确定数值,描述其集中趋势适⽤的统计指标是A. 中位数2. 算术均数与中位数相⽐,其特点是 B.能充分利⽤数据的信息3. ⼀组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较⼩⼀侧4. 将⼀组计量资料整理成频数表的主要⽬的是E.提供数据和描述数据的分布特征1. 变异系数主要⽤于 A .⽐较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选⽤的指标是E. 标准差3.某项指标95%医学参考值范围表⽰的是D.在“正常”总体中有95%的⼈在此范围4.应⽤百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋⽩B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使⽤ E .四分位数间距1.样本均数的标准误越⼩说明 E.由样本均数估计总体均数的可靠性越⼤2. 抽样误差产⽣的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量⾜够⼤时,样本均数的分布近似为C.正态分布4. 假设检验的⽬的是 D.检验总体参数是否不同5. 根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数⽐较,检验结果05.0 P 说明 D.不⽀持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E. 有理由认为两总体均数有差别3. 两样本均数⽐较,差别具有统计学意义时,P 值越⼩说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使⽤的⽅法是 E.增加样本含量5.两样本均数⽐较的t 检验和u 检验的主要差别是B.u 检验要求⼤样本资料1. 利⽤2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲⽐较两组阳性反应率, 在样本量⾮常⼩的情况下(如1210,10n n <<), 应采⽤C.Fisher 确切概率法⼆、简答题1.抽样中要求每⼀个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
医学统计学试题及答案医学统计学试题及答案第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性口血病患者构成调查所获得的资料应绘制(B )A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计•方法是(A )A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的93%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A )A.个体差异B.群体差异C.样本均数不同D.总体均数不同6、男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D )A.用样本指标佔计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其日的是检验(C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为阳和n“在进行成组设计资料的t检验时,自由度是(D)(A)n x+ n:(B)n:+ n: - 1(C)ni+ n: +1(D)ni+ n: -210、标准误反映(A )A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,乂作直线相关分析。
令对相关系数检验的t值为匚,对回归系数检验的t值为饥,二者之间具有什么关系(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为X’和艾,则配对资料的秩和检验(D )A分别按xl和x2从小到大编秩B把xl和x2综合从小到大编秩C把xl和x2综合按绝对值从小到大编秩D把xl和x2的差数按绝对值从小到大编秩14、四个样本率作比较,x=>x.v可认为(A )A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35 人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学练习题及答案汇总练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
一、单向选择题1。
医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E 。
依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E 。
由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1。
某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A 。
中位数2. 算术均数与中位数相比,其特点是 B 。
能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D 。
数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E 。
提供数据和描述数据的分布特征1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3.某项指标95%医学参考值范围表示的是D 。
在“正常"总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl )呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明 E 。
由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D 。
个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4。
假设检验的目的是 D 。
检验总体参数是否不同5。
根据样本资料算得健康成人白细胞计数的95%可信区间为7。
2×109/L ~9。
1×109/L ,其含义是 E 。
该区间包含总体均数的可能性为95%1. 两样本均数比较,检验结果05.0 P 说明 D 。
不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4。
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学试题及答案试题一1.下列哪个指标可以用来描述一个集团的离散程度?A. 平均数B. 标准差C. 方差D. 中位数正确答案:B. 标准差2.下列哪个检验方法可以用来比较两组样本均数是否有显著差异?A. T检验B. 方差分析C. 卡方检验D. 相关分析正确答案:A. T检验3.在一项研究中,两组患者的年龄分别是25岁和45岁,求这两组患者的平均年龄。
正确答案:(25 + 45) / 2 = 35岁4.下列哪个指标可以表示两个变量之间的相关性?A. 相关系数B. t值C. p值D. 标准差正确答案:A. 相关系数5.下列哪个概念用于解释样本误差和总体误差之间的关系?A. 抽样误差B. 总体误差C. 推论统计学D. 样本误差正确答案:D. 样本误差试题二1.下列哪个指标可以用来度量一个诊所每周门诊量的离散程度?A. 四分位数B. 中位数C. 标准差D. 方差正确答案:C. 标准差2.如果两组样本均数的差异非常小,是否可以得出它们没有显著差异的结论?正确答案:不能。
只有在进行统计检验之后,才能得出显著差异的结论。
3.在一项抗癌药物的临床试验中,病人被随机分配到药物组和安慰剂组。
下列哪个检验方法可以用来比较两组病人的生存率?A. T检验B. 方差分析C. Log-rank检验D. 卡方检验正确答案:C. Log-rank检验4.下列哪个指标可以用来描述数据的离散程度?A. 标准差B. 相关系数C. 中位数D. 平均数正确答案:A. 标准差5.一个样本调查得出的结论是否可以推广到整个总体?正确答案:是。
通过抽样方法,对样本进行分析可以得出关于总体的推论。
试题三1.下列哪个指标可以用来度量数据的离散程度?A. 标准差B. 平均数C. Z值D. T值正确答案:A. 标准差2.在一项医学研究中,两组患者的性别比例分别是男性60%和女性40%,请问这两组患者的性别比例是否有显著差异?正确答案:可以使用卡方检验来比较两组患者的性别比例是否有显著差异。
(一)单项选择题3.抽样的目的是( b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于 1B.一定小于 1C. 可大于1,也可小于 1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
医学统计学习题及答案医学统计学是一门应用广泛的学科,它在医学研究和临床实践中扮演着重要的角色。
以下是一些医学统计学的基础习题及答案,供学习者参考。
习题一:描述性统计问题:某医院对100名患者的体重进行了测量,测得的平均体重为70公斤,标准差为10公斤。
请计算该组数据的变异系数。
答案:变异系数(Coefficient of Variation, CV)的计算公式为:\[ CV = \frac{标准差}{平均值} \times 100\% \]代入数据得:\[ CV = \frac{10}{70} \times 100\% \approx 14.29\% \]习题二:概率分布问题:假设某疾病的发病率为0.01,即每1000人中有1人患病。
如果随机抽取100人,求至少有1人患病的概率。
答案:使用二项分布的补数原理,计算没有人患病的概率,然后求其补数。
没有人患病的概率为:\[ P(0) = (1 - 0.01)^{100} \]至少有1人患病的概率为:\[ P(\geq 1) = 1 - P(0) \]习题三:假设检验问题:某药物对降低血压有显著效果。
在一项研究中,研究人员将100名高血压患者随机分为两组,每组50人。
一组接受药物治疗,另一组接受安慰剂。
治疗后,药物治疗组的平均血压降低了10毫米汞柱,而安慰剂组的平均血压降低了2毫米汞柱。
假设两组的血压降低量服从正态分布,标准差均为5毫米汞柱。
请问药物治疗是否显著优于安慰剂?答案:使用独立样本t检验来比较两组的血压降低量。
首先计算t值:\[ t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s^2}{n_1} +\frac{s^2}{n_2}}} \]其中,\(\bar{X}_1\) 和 \(\bar{X}_2\) 分别是两组的平均血压降低量,\(s\) 是标准差,\(n_1\) 和 \(n_2\) 是样本大小。
代入数据得:\[ t = \frac{10 - 2}{\sqrt{\frac{5^2}{50} + \frac{5^2}{50}}} \]计算t值后,与t分布的临界值进行比较,如果t值大于临界值,则拒绝原假设,认为药物治疗显著优于安慰剂。
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学练习题及答案汇总练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。
医学统计学练习题及答案一、单向选择题1.医学统计学研究的对象是E.有变异的医学事件2.用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体4.随机误差指的是E.由偶然因素引起的误差A.中位数2.算术均数与中位数相比,其特点是B.能充分利用数据的信息3.一组原始数据呈正偏态分布,其数据的特点是D.数值分布偏向较小一侧1.变异系数主要用于A.比较不同计量指标的变异程度3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用E.四分位数间距1.样本均数的标准误越小说明E.由样本均数估计总体均数的可靠性越大2.抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4.假设检验的目的是D.检验总体参数是否不同义是E.该区间包含总体均数的可能性为95%1.两样本均数比较,检验结果P0.05说明D.不支持两总体有差别的结论2.由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指E.有理由认为两总体均数有差别3.两样本均数比较,差别具有统计学意义时,P值越小说明D.越有理由认为两总体均数不同4.减少假设检验的Ⅱ类误差,应该使用的方法是E.增加样本含量1.利用2检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲比较两组阳性反应率,在样本量非常小的情况下(如n110,n210),应采用C.Fiher确切概率法二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性:就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性:就是要保证总体中的每个个体均有相同的几率被抽作样本。
一、单向选择题
1. 医学统计学研究的对象是 E.有变异的医学事件
2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体
3. 下列观测结果属于等级资料的是 D.病情程度
4. 随机误差指的是 E. 由偶然因素引起的误差
5. 收集资料不可避免的误差是 A.随机误差
1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是
A. 中位数
2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息
3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧
4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征
1. 变异系数主要用于 A .比较不同计量指标的变异程度
2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差
3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围
4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布
5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统
计指标应使用 E .四分位数间距
1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大
2. 抽样误差产生的原因是D.个体差异
3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布
4. 假设检验的目的是 D.检验总体参数是否不同
5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109
/L ,
其含义是 E.该区间包含总体均数的可能性为95%
1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论
2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指
E. 有理由认为两总体均数有差别
3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数
不同
4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量
5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料
1. 利用2
χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效
2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用
C.Fisher 确切概率法
二、简答题
1.抽样中要求每一个样本应该具有哪三性?
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
第三章 离散程度的统计描述
1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。
[参考答案]血催乳素浓度术前均值=672.4 ng/ml ,术后均值=127.2 ng/ml 。
手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比
较合适。
术前:672.4X =,564.65S = 564.65100%83.98%672.4
CV =
⨯= 术后:127.2X =,101.27S = 101.27100%79.61%127.2CV =⨯= 2. 某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为
4.95mmol/L ,标准差为0.85mmol/L 的正态分布。
①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于
5.72mmol/L 的正常成年男子约占其总体的百分之多少?
[参考答案]①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可
按正态分布法处理。
又因血清总胆固醇测量值过高或过低均属异常,所以应计算
双侧参考值范围。
下限: 1.96 4.95 1.960.85 3.28X S -=-⨯=(mol/L) 上限: 1.96 4.95 1.960.85 6.62X S +=+⨯=(mmol/L)
②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L ,标准差为
0.85mmol/L 的正态分布,计算5.72mmol/L 对应的标准正态分布u 值:
5.72 4.950.910.85
u -=≈ 问题转化为求u 值大于0.91的概率。
由于标准正态分布具有对称性,所以u 值大于0.91的概率与u 值小于-0.91的概率相同。
查附表1得,()0.1814u Φ-=,所以说血清总胆固醇大于5.72mmol/L 的正常成年男子约占其总体的18.14%。
第四章 抽样误差与假设检验
1.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl ,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl ,标准差为30mg/dl 。
问题:如何衡量这100名儿童总胆固醇样本平均数的抽样误差?
1)均数的标准误可以用来衡量样本均数的抽样误差大小,即
30S =mg/dl,100n = 30 3.0100
X S S n =
== 第五章 t 检验
一.单个样本t 检验 以往通过大规模调查已知某地新生儿出生体重为 3.30kg.从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?本例已知总体均数
0=3.30kg ,但总体标准差未知,n=35为
小样本,,S=0.40kg ,故选用单样本t 检验。
二.配对样本均数t 检验
例5.2 有12名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径
(mm)如表5-1所示,问两种结核菌素的反应性有无差别。
三.两独立样本t检验—随机分成两组
25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L) 问两种疗法治疗后患者血糖值是否相同?
第七章 相对数及其应用
1. 某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性 219人,占80%,男性55人,占20%。
所以女性易患慢性病”,你认为是否正确?为什么? [参考答案]不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病需知道946名工人中的男女比例,然后计算男女患病率。
第八章 2χ检验
1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?[参考答案]本题是两组频数分布的比较,资料课整理成下表的形式。
两组疗法病人的死亡率的比较
组别
死亡 存活 合计 西医疗法
13 89 102 西医疗法加中医疗法
9 180 189 合计 22 269 291
(1)建立检验假设并确定检验水准
0H :21ππ=,即两组病人的死亡率相等
1H :21ππ≠,即两组病人的死亡率不等
05.0=α
(2)用四个表的专用公式,计算2χ检验统计量2
χ值 ))()()(()(22d b c a d c b a n bc ad ++++-=χ=()18910226922291989180132
⨯⨯⨯⨯⨯-⨯=6.041 (3)确定P 值,作出推断结论
以ν=1查附表7的2
χ界值表,得05.0<P 。
按05.0=α水准,拒绝0H ,接受1H ,可以认为两组病人的死亡率不等。
6.某医院147例大肠杆菌标本分别在A ,B 两种培养基上培养,然后进行检验,资料见下表,试分析两种培养基的检验结果是否有显著性差别?
表 A 、B 两种培养基上培养大肠杆菌标本结果
A 培养基
B 培养基 合 计 + - +
59 36 95 -
15 37 52 合 计
74 73 147
[参考答案] 本题是一个配对设计的二分类资料,采用配对四格表资料的2χ检验。
(1)建立检验假设并确定检验水准 0H :C B =,即两种培养基的阳性培养率相等
1H :C B ≠,即两种培养基的阳性培养率不相等
05.0=α
(2)计算检验统计量
本例b +c =36+15=51> 40 ,用配对四个表2χ检验公式,计算检验统计量2
χ值 c b c b +-=22
)(χ=()65.8153615362=+-, 1=ν 3. 确定P 值,作出推断结论 查2
χ界值表得P < 0.05。
按0.05α=水准,拒绝0H 。
认为两种培养基的阳性培养率不同。