医学统计学考题
- 格式:doc
- 大小:57.00 KB
- 文档页数:8
《医学统计学》试题一、选择题(1—13题为单选,每小题2分;14—16题为多选,每小题3分,共35分)(一)单选题(选一个最佳答案;共15题)1.比较身高和体重的变异度,应采用的指标是A.标准差 B. 方差 C. 变异系数 D. 四分位数间距 E. 全距2.某地100名健康人血清总胆固醇的95%可信区间为4.804 ~ 5.196 mmol/L,则相应的双侧95%正常值范围是A. 5.00±1.645×10B. 5.00±1.645×10C. 5.00±1.96×10D. 5.00±1.960×1E. 5.00±1.645×13. 比较两药的疗效时,哪种情况应做单侧检验A. 已知甲乙两药均有效B. 不知甲乙两药哪种好C. 已知甲药不会优于乙药D. 不知甲乙两药是否有效E. 当α= 0.01时4. 将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级划分为治愈、好转、有效和无效。
欲知两种方案的疗效何者较优,宜作A.两样本均数比较的t检验 B.两组多类构成比比较的χ2检验C.两样本率比较的假设检验 D.两样本比较的秩和检验E.线性相关分析5. 作符号秩和检验时, 记统计量R为较小的秩和, 则正确的是A. R值越大P值越小B. R值越大越有理由拒绝H0C. P值与R值毫无联系D. R值越小P值越小E. 以上都不对6. 以下不是析因分析的特点A. 2个以上因素B. 2个以上水平C. 2个以上重复D. 每次试验涉及全部因素,因素同时施加E. 观测值为计数资料7. 从样本得到变量X与Y的相关系数r=0.92, 则A. X与Y之间一定存在因果关系B. 若对此份资料作回归分析, 其回归系数是正值C. 若对此份资料作回归分析, 其回归系数是负值D. 表明总体相关系数ρ≠0E. 表明总体相关系数ρ=08. 根据样本算得两个随机变量X与Y的相关系数r, 经t检验, P<0.01, 可认为A. X与Y间密切相关B. 总体相关系数ρ很大C. 总体相关系数ρ=0D. 总体相关系数ρ≠0E. 总体相关系数ρ>09. 表示某地死亡率随时间变化情况可选用A. 线图B. 半对数线图C. 圆图D. 百分条图E. 散点图10. 欲比较某地区两年的三种死因别死亡率, 若用统计图表示宜选用A. 复式线图B. 百分直条图C. 复式直条图D. 直方图E. 统计地图11. 实验设计的三个基本要素是A. 实验对象、实验效应、观察指标B. 随机化、重复、设置对照C. 随机化、均衡性、齐同对比D. 处理因素、受试对象、实验效应E. 设置对照、重复、盲法12.实验设计与调查设计的根本区别是A. 调查设计比较简便B. 实验设计可人为设置处理因素C. 实验设计以动物为对象D. 调查设计以人为对象E. 两者无区别13.对三行四列表资料作χ2检验,自由度等于A. 1B. 2C. 3D. 6E. 1214.某资料的观察值呈正态分布,则理论上有A. 算术均数与几何均数相等B. 算术均数与中位数相等C. 分布的集中趋势用表示D. 分布的离散趋势用S表示E.(-1.96S,+1.96S)范围内含95%的观察个体值15.关于两样本均数比较的t检验,正确的说法是A. 要求两样本来自同一总体B. 要求两总体均服从正态分布C. 两样本含量可以不同D. 要求两总体方差相等E. 查t界值表时的自由度为两样本大小之和,即n1+n216. 比较两样本计量资料的平均水平时, 可用的假设检验方法有A. t检验B. u检验C. χ2检验D. 秩和检验E. 以上都可以二、是非题(每小题2分, 共20分)(在括号内打“√”或“╳”符号)1. 个体间的变异是抽样误差的主要来源。
医学统计学试题及答案医学统计学试题及答案第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性口血病患者构成调查所获得的资料应绘制(B )A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计•方法是(A )A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的93%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A )A.个体差异B.群体差异C.样本均数不同D.总体均数不同6、男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D )A.用样本指标佔计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其日的是检验(C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为阳和n“在进行成组设计资料的t检验时,自由度是(D)(A)n x+ n:(B)n:+ n: - 1(C)ni+ n: +1(D)ni+ n: -210、标准误反映(A )A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,乂作直线相关分析。
令对相关系数检验的t值为匚,对回归系数检验的t值为饥,二者之间具有什么关系(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为X’和艾,则配对资料的秩和检验(D )A分别按xl和x2从小到大编秩B把xl和x2综合从小到大编秩C把xl和x2综合按绝对值从小到大编秩D把xl和x2的差数按绝对值从小到大编秩14、四个样本率作比较,x=>x.v可认为(A )A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35 人,阳性人数4人;乙年级调查40人,阳性人数8人。
第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A. 调查、录入数据、分析资料、撰写论文B. 实验、录入数据、分析资料、撰写论文 C 。
调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A 。
10.0≤P B 。
05.0≤P 或01.0≤P C 。
005.0≤PD 。
05.0≤PE 。
01.0≤P3~8A.计数资料 B 。
等级资料 C.计量资料 D 。
名义资料 E.角度资料3。
某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C ). 5。
空腹血糖测量值,属于( C)资料.6。
用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人.该资料的类型是(B ).7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641.该资料的类型是(D )。
8。
100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本. 2.举例说明同质与变异的概念答:同质与变异是两个相对的概念.对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
一、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是D.病情程度4. 随机误差指的是E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A.随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. 中位数2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 E. 标准差3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明E.由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为 C.正态分布4. 假设检验的目的是 D.检验总体参数是否不同5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0P 说明 D.不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料1. 利用2检验公式不适合解决的实际问题是 C.两组有序试验结果的药物疗效2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n ), 应采用C.Fisher 确切概率法二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示 BA某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对3.抽签的方法属于 DA分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数 8 23 6 31该资料的类型是: DA计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 CA有价值的部分 B有意义的部分 C有代表性的部分D任意一部分 E典型部分7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:CA统计设计 B收集资料 C整理资料 D分析资料 E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对10.以下何者不是实验设计应遵循的原则 DA对照的原则 B随机原则 C重复原则D交叉的原则 E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数 B几何均数 C中位数 D全距 E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变 E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? CA 5B 5.5C 6D 10E 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是 BA观察个体之间变异越大 B观察个体之间变异越小C样本的抽样误差可能越大 D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是 BA从未患过病的人 B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是20.均数与标准差之间的关系是 EA标准差越大,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是 AA总体中个体之间存在变异 B抽样未遵循随机化原则C被抽取的个体不同质 D组成样本的个体较少 E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
《医学统计学习题》一、名词解释题:(20分)1、总体:根据研究目的确定的同质的观察单位其变量值的集合。
2、计量资料:又称为定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
3、抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
4、总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。
常用的可信度为95%和99%,故常用95%和99%的可信区间。
二、选择题:(20分)1、某地5人接种某疫苗后抗体滴度为:1:20、1:40、1:80、1:160、1:320。
为求平均滴度,最好选用:A、中位数B、几何均数C、算术平均数D、平均数2、为了直观地比较化疗后相同时间点上一组乳癌患者血清肌酐和血液尿素氮两项指标观察值的变异程度的大小,可选用的变异指标是:A、标准差B、标准误C、相关系数D、变异系数3、某疗养院测得1096名飞行员红细胞数(万/mm2),经检验该资料服从正态分布,其均数值为414.1,标准差为42.8,求得的区间(414.1-1.96×42.8,414.1+1.96×42.8),称为红细胞数的:A、99%正常值范围B、95%正常值范围C、99%可信区间D、95%可信区间4、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下:年龄(岁)10~20~30~40~50~60~人数 6 40 50 85 20 1为了形象表达该资料,适合选用:A、线图B、条图C、直方图D、圆图5、有资料如下表:甲、乙两个医院某传染病各型治愈率病型患者数治愈率(%)甲乙甲乙普通型300 100 60.0 65.0重型100 300 40.0 45.0暴发型100 100 20.0 25.0合计500 500 48.0 45.0由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是:A、重新计算,多保留几位小数B、对率进行标准化C、对各医院分别求平均治愈率D、增大样本含量,重新计算4.率的标准化当2组定性资料的内部构成明显不同时,不宜直接比较2组的总率(即平均率),否则有时会出现究结果与整体结果相矛盾的现象。
[例1.3.9]仔细观察表1.3.7,不难发现:乙医院各型治愈率都高于甲医院, 但合计的结果却正好相反;当统一标准后再进行计算,这种矛盾的现象便会消失,如表1.3.7所示。
这里所用的方法称为直接标准化法。
具体方法见表1.3.8及其后的内容。
表1.3.7甲、乙2医院某传染病各型治愈率━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人数治愈数治愈率(%)病型━━━━━━━━━━━━━━━━━━━━━━━━━━━━甲乙甲乙甲乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━普通型3001001806560.065.0 重型1003004013540.045.0 暴发型100100202520.025.0 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━合计50050024022548.045.0 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━表1.3.8对表1.3.7资料用直接标准化法进行标准化所需的数值━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━标准病治愈率(%)预期治愈率(%)病型━━━━━━━━━━━━━━━━━━━━━━━━━人数甲乙甲乙(1)(2)(3)(4)=(1)×(2)(5)=(1)×(3)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━普通型40060.065.0240260重型40040.045.0160180暴发型20020.025.04050 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━合计1000┅┅440490━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━注: 表中选择的标准病人数分别为甲、乙2医院各型病人数之和。
根据表1.3.8的最后2栏数据,可求得甲、乙2两医院标准化治愈率P1、P2分别为:P1=(440/1000)×100%=44%;P2=(490/1000)×100%=49%。
[结论]显然,乙医院标准化后的治愈率与各型治愈率都高于甲医院,但这诸别在统计学上是否有显著意义,还需对2个总体标准化治愈率进行显著性检验。
2总体标准化率的假设检验2样本标准化率虽然不等,但这可能是由于抽样误差所致。
为了排除其影响, 必须进行假设检验。
检验统计量按式(1.3.28)计算, 该式的分母称为2标准化率之差的标准误差, 按式(1.3.29)计算。
(1.3.28)(1.3.29)式(1.3.28)中的U~N(0,1),即拒绝域为:U≥Uα,P≤α。
当α=0.05时,U0.05=1.96;当α=0.01时,U0.01=2.576。
[例1.3.9]根据上例求得的2个样本标准化率,推断它们所代表的2总体标准化率之间的是否有显著差别。
[分析与解答]H0:2总体标准化率相等, H1:2总体标准化率不等,α=0.05。
表1.3.9对表1.3.7资料进行直接标准化后再作假设检验所需的中间结果━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人数两医院治愈合并N2iPci(1-Pci)(1/n1i+1/n2i)病型━━━━━━━━即:甲乙合计人数之合计治愈率(4)2(6)[1-(6)][1/(2)+1/(3)]n1i n2i Ni Pci(1)(2)(3)(4)(5)(6)=(5)/(4)(7)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━普通型3001004002450.6125506.333333重型1003004001750.4375525.000000暴发型100100200450.2250139.500000━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━合计500500 1000465...1170.833333━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━利用表1.3.8中的有关数据和前例的结果,代入式(1.3.29)和式(1.3.28),得:Sp1-p2==0.034217,U=1.46因为U=1.46<U0.05=1.96,故P>0.05,接受H0。
[专业结论]虽然乙医院的标准化治愈率49%大于甲医院的标准化治愈率44%, 但这诸别可能是由于抽样误差所致,因二者之间的差别在统计学上尚未达到显著的临界值,故可以认为甲、乙2医院对该病的治愈率基本相同。
6、5个样本率作比较,χ2>χ20.01,4,则在α=0.05检验水准下,可认为:A、各总体率不全等B、各总体率均不等C、各样本率均不等D、各样本率不全等7、两个独立小样本计量资料比较的假设检验,首先应考虑:A、用t检验B、用Wilcoxon秩和检验C、t检验或Wilcoxon秩和检验均可D、资料符合t检验还是Wilcoxon秩和检验条件8、标准正态分布曲线下,0到1.96的面积为:A、90%B、95%C、47.5%D、50%9、均数与标准差的关系是:A、均数大于标准差B、均数越大,标准差越大C、标准差越大,均数的代表性越大D、标准差越小,均数的代表性越大10、某临床医生测得900例正常成年男子高密度脂蛋白(g/L)的数据,用统计公式求出了该指标的95%的正常值范围,问这900人中约有多少人的高密度脂蛋白(g/L )的测定值在所求范围之内?A、855B、755C、781D、891三、简答题:(40分)1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
2、标准差与标准误有何区别和联系?•区别:1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。
⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
2.与n的关系不同:n增大时,⑴s 。
⑵标准误减少并趋于0(不存在抽样误差)。
3.用途不同: ⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵:参数估计和假设检验。
•联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
3、应用相对数时的注意事项有哪些?P394、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
四、计算分析题:(20分)用甲、乙两种培养基培养结核杆菌45份,得资料如下表,问甲、乙两种培养基的培养效果有无差异?要求:详细写出检验步骤。
甲乙两种培养基培养结核杆菌的结果乙的结果甲的结果合计+-+12 16 28 -4 13 17 合计 16 29 45 注:χ20.05,1=3.841、 建立假设:H 0:B=C ;H 1:B ≠C2、 确定α:α=0.053、 选择检验方法、计算统计量:222(||1)(|164|1) 6.05164b c b c χ----===++ 4、 确定P 值:6.05>3.84,故P<0.055、 统计推断:按α=0.05,拒绝H 0假设,接受H 1假设,可以认为甲乙两种培养基的培养结果的差别有统计学意义。