医学统计学-非参数检验秩和检验
- 格式:ppt
- 大小:6.17 MB
- 文档页数:156
医学统计学 1 1。变异:同质事物之间的差别。 2.频数分布的两个特征:集中位置,离散趋势 3。数据分布的类型:对称分布和非对称分布.非对称分布又称偏态分布,包括正偏态和负偏态。单峰分布,双峰分布,多峰分布。
4。统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。 5。集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件? (1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料 (2)几何平均数:适用于①等比资料 ②对数正态分布资料 (3)中位数和百分位数:适用于①偏态分布的资料 ②开口资料 ③资料分布不明等 6.离散趋势的描述 (1)全距亦称极差,适用于单峰小样本资料 (2)四分位数间距,适用于单峰小样本资料 (3)方差和标准差,适用于对称分布尤其是正态分布资料 (4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度 ②比较均数相差悬殊的两组或多组资料的变异度
7.常用相对数(1)率,是二分类指标(2)构成比(3)比 8.正确应用相对数应注意几个问题: (1)计算相对数的分母不宜过小 (2)分析时不能以构成比代替率 (3)对观察单位数不等的几个率,不能直接相加求其总率 (4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性 医学统计学 2 (5)也有抽样误差,需要假设检验. 9.率的标准法 (1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性.
(2)目的:控制混杂因素对研究结果的影响. 10.正态分布 (1)概念P16 (2)标准正态分布,u变换:u=,u是标准正态离差,μ是均数,σ是标准差。 u~N(0,1) (3)正态分布的特征: ①是单峰分布,高峰位置在均数X=μ处。 ②以均数为中心,左右完全对称。 ③取决于两个参数,均数μ和标准差σ。μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高";σ大,则曲线形态“矮胖”。
统计名词解释1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
《医学统计学》完整课件完整版一、教学内容本节课的教学内容来自于《医学统计学》的第五章,主要内容包括:t检验、方差分析、秩和检验。
二、教学目标1. 使学生了解并掌握t检验、方差分析、秩和检验的基本原理和应用。
2. 培养学生运用医学统计学方法分析和解决实际问题的能力。
3. 帮助学生建立正确的统计学思维方式,提高科学研究素养。
三、教学难点与重点1. 教学难点:t检验、方差分析、秩和检验的计算方法和应用。
2. 教学重点:t检验、方差分析、秩和检验的基本原理和操作步骤。
四、教具与学具准备1. 教具:多媒体教学设备、黑板、粉笔。
2. 学具:教材、笔记本、计算器。
五、教学过程1. 实践情景引入:以一项临床试验为例,介绍t检验在医学研究中的应用。
2. t检验:(1)讲解t检验的基本原理和适用条件。
(2)演示t检验的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成t检验的计算和分析。
3. 方差分析:(1)介绍方差分析的基本原理和适用条件。
(2)演示方差分析的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成方差分析的计算和分析。
4. 秩和检验:(1)讲解秩和检验的基本原理和适用条件。
(2)演示秩和检验的计算过程,并列举实例进行分析。
(3)引导学生通过教材示例,自行完成秩和检验的计算和分析。
六、板书设计板书内容主要包括t检验、方差分析、秩和检验的基本原理、适用条件、计算方法和实例分析。
七、作业设计1. 题目:某临床试验中,研究者比较了两种药物的治疗效果,随机抽取了60名患者,分别给予甲药和乙药治疗,疗程为4周。
治疗结束后,对患者的疗效进行了评价。
假设评价结果如下:甲药组:痊愈20人,显效15人,有效10人,无效5人。
乙药组:痊愈18人,显效12人,有效8人,无效12人。
请运用t检验分析两种药物的治疗效果是否存在显著性差异。
答案:(略)2. 题目:某研究者对某疾病的治疗方法进行了临床试验,随机抽取了80名患者,分别给予甲法和乙法治疗,疗程为6个月。
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
《医学统计学》单项选择题摘自:马斌荣主编.医学统计学.第5版.北京:人民卫生出版社,2008第一章医学统计中的基本概念1.医学统计学研究的对象是A.医学中的小概率事件B.各种类型的数据C.动物和人的本质D.疾病的预防与治疗E.有变异的医学事件2.用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3.下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4.随机误差指的是A.测量不准引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.选择总体不当引起的误差E.由偶然因素引起的误差5.收集资料不可避免的误差是A.随机误差B.系统误差C.过失误差D.记录误差E.仪器故障误差答案:EEDEA第二章集中趋势的统计描述1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A.中位数B.几何均数P百分位数C.均数D.95E.频数分布2.算术均数与中位数相比,其特点是A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.一组原始数据呈正偏态分布,其数据的特点是A.数值离散度较小B.数值离散度较大C.数值分布偏向较大一侧D.数值分布偏向较小一侧E.数值分布不均匀4.将一组计量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.形象描述数据的特点D.为了能够更精确地检验E.提供数据和描述数据的分布特征人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B.几何均数C.中位数D.百分位数E.倒数的均数答案:ABDEB第三章离散程度的统计描述1.变异系数主要用于A.比较不同计量指标的变异程度B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽样误差的大小2.对于近似正态分布的资料,描述其变异程度应选用的指标是A.变异系数B.离均差平方和C.极差D.四分位数间距E.标准差3.某项指标95%医学参考值范围表示的是A.检测指标在此范围,判断“异常”正确的概率大于或等于95%B.检测指标在此范围,判断“正常”正确的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围E.检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”4.应用百分位数法估计参考值范围的条件是A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A.全距B.标准差C.变异系数D.方差E.四分位数间距答案:AEDBE第四章抽样误差与假设检验1.样本均数的标准误越小说明A.观察个体的变异越小B.观察个体的变异越大C.抽样误差越大D.由样本均数估计总体均数的可靠性越小E.由样本均数估计总体均数的可靠性越大2.抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C.资料不是正态分布D.个体差异E.统计指标选择不当3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布分布E.标准正态分布4.假设检验的目的是A.检验参数估计的准确度B.检验样本统计量是否不同C.检验样本统计量与总体参数是否不同D.检验总体参数是否不同E.检验样本的P 值是否为小概率5.根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%答案:EDCDE第五章t 检验1.两样本均数比较,检验结果05.0 P 说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别2.由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别3.两样本均数比较,差别具有统计学意义时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同E.越有理由认为两样本均数相同4.减少假设检验的Ⅱ类误差,应该使用的方法是A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值E.增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是检验只能用于小样本资料检验要求大样本资料检验要求数据方差相同检验的检验效能更高检验能用于两大样本均数比较答案:DEDEB第六章方差分析1.方差分析的基本思想和要点是A.组间均方大于组内均方B.组内均方大于组间均方C.不同来源的方差必须相等D.两方差之比服从F分布E.总变异及其自由度可按不同来源分解2.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差=组间方差D.总方差=各组方差之和E.总方差=组内方差+组间方差3.完全随机设计方差分析中的组间均方反映的是A.随机测量误差大小B.某因素效应大小C.处理因素效应与随机误差综合结果D.全部数据的离散度E.各组方差的平均水平4.对于两组资料的比较,方差分析与t检验的关系是检验结果更准确B.方差分析结果更准确检验对数据的要求更为严格D.近似等价E.完全等价P ,则应该进一步做的是5.多组均数比较的方差分析,如果0.05A.两均数的t检验B.区组方差分析C.方差齐性检验D.q检验E.确定单独效应答案:EBCED第七章相对数及其应用1.如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少E.该疾病的死因构成比增加2.计算乙肝疫苗接种后血清学检查的阳转率,分母为A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数E.乙肝疫苗接种后的阳转人数3.计算标准化死亡率的目的是A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响E.便于进行不同时间死亡率的比较4.影响总体率估计的抽样误差大小的因素是A.总体率估计的容许误差B.样本率估计的容许误差C.检验水准和样本含量D.检验的把握度和样本含量E.总体率和样本含量5.研究某种新药的降压效果,对100人进行试验,其显效率的95%可信区间为~,表示A.样本显效率在~之间的概率是95%B.有95%的把握说总体显效率在此范围内波动C.有95%的患者显效率在此范围D.样本率估计的抽样误差有95%的可能在此范围E.该区间包括总体显效率的可能性为95%答案:ACDEE第八章2χ检验1.利用2χ检验公式不适合解决的实际问题是A.比较两种药物的有效率B.检验某种疾病与基因多态性的关系C.两组有序试验结果的药物疗效D.药物三种不同剂量显效率有无差别E.两组病情“轻、中、重”的构成比例2.欲比较两组阳性反应率,在样本量非常小的情况下(如1210,10n n <<),应采用A.四格表2χ检验B.校正四格表2χ检验确切概率法D.配对2χ检验E.校正配对2χ检验3.进行四组样本率比较的2χ检验,如220.01,3χχ>,可认为A.四组样本率均不相同B.四组总体率均不相同C.四组样本率相差较大D.至少有两组样本率不相同E. 至少有两组总体率不相同4.从甲、乙两文中,查到同类研究的两个率比较的2χ检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为A.两文结果有矛盾B.两文结果完全相同C.甲文结果更为可信D.乙文结果更为可信E.甲文说明总体的差异较大5.下列哪一项不是两组有效率比较检验功效的相关因素(原题的选项设置不合适,已进行了修改)型错误B.理论频数C.样本含量D.总体率差别型错误答案:CCECB 第九章非参数检验1.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是A.适用范围广B.检验效能高C .检验结果更准确D.充分利用资料信息E.不易出现假阴性错误2.对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是A.增加Ⅰ类错误B.增加Ⅱ类错误C.减少Ⅰ类错误D.减少Ⅱ类错误E.两类错误都增加3.两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A.两总体的差别越大B.两总体的差别越小C.两样本的差别可能越大D.越有理由说明两总体有差别E.越有理由说明两总体无差别4.多个计量资料的比较,当分布类型不清时,应选择的统计方法是A.方差分析检验-Wallis H 检验检验E.2χ检验5.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是秩和检验 B.24⨯列联表2χ检验C.四格表2χ检验确切概率法E.计算标准化率答案:ABDCA 第十章线性相关与回归1.使用最小二乘法确定直线回归方程的原则是A.各观察点距回归直线的纵向距离之和最小B.各观察点距回归直线的横向距离之和最小C.各观察点距回归直线的垂直距离平方和最小D.各观察点距回归直线的纵向距离平方和最小E.各观察点距回归直线的横向距离平方和最小2.两数值变量相关关系越强,表示A.相关系数越大B.相关系数的绝对值越大B.回归系数越大C.回归系数的绝对值越大E.相关系数检验统计量的t 值越大3.回归分析的决定系数2R 越接近于1,说明A.相关系数越大B.回归方程的显着程度越高C.应变量的变异越大D.应变量的变异越小E.自变量对应变量的影响越大4.两组资料作回归分析,直线回归系数b 较大的一组,表示A .两变量关系密切的可能性较大B .检验显着的可能性较大C .决定系数2R 较大D .决定系数2R 可能大也可能小E .数量依存关系更密切 —7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为ˆ144YX =+,若将体重换成国际单位kg ,则此方程A .常数项改变B .回归系数改变C .常数项和回归系数都改变D .常数项和回归系数都不改变E.决定系数改变答案:DBEDC第十一章多元线性回归与多元逐步回归1.在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是A.节省样本B.提高分析效率C.克服共线影响D.减少异常值的影响E.减少混杂的影响2.多元线性回归分析中,反映回归平方和在应变量Y的总离均差平方和中所占比重的统计量是A.简单相关系数B.复相关系数C.偏回归系数D.回归均方RE.决定系数23.对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是A.决定系数B.相关系数C.偏回归平方和D.校正决定系数E.复相关系数4.多元线性回归分析,对回归方程作方差分析,检验统计量F值反映的是A.所有自变量与应变量间是否存在线性回归关系B.部分自变量与应变量间是否存在线性回归关系C.自变量与应变量间存在的线性回归关系是否较强D.自变量之间是否存在共线E.回归方程的拟合优度c ),则5.在多元回归分析中,若对某个自变量的值都乘以一个常数c(0A.偏回归系数不变、标准回归系数改变B.偏回归系数改变、标准回归系数不变C.偏回归系数与标准回归系数均不改变D.偏回归系数与标准回归系数均改变E.偏回归系数和决定系数均改变答案:EEDAB第十二章统计表与统计图1.统计表的主要作用是A.便于形象描述和表达结果B.客观表达实验的原始数据C.减少论文篇幅D.容易进行统计描述和推断E.代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是A.线图B.条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是A.半对数图B.线图C.条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是A.复式条图B.复式线图C.散点图D.直方图E.箱式图5.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是A.直方图B.箱式图C.线图D.散点图E.条图答案:EDBED第十三章医学实验设计与诊断试验的评价1.实验研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.保证客观D.提高检验准确度E.保持各组的非处理因素均衡一致2.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响E.精密度包含准确度3.在临床新药疗效试验设计选择对照时,最可靠的对照形式是(在原题中增加了“新药疗效”)A.历史对照B.空白对照C.标准对照D.安慰剂对照E.自身对照4.两名医生分别阅读同一组CT片诊断某种疾病,Kappa值越大说明A.观察个体的变异越大B.观察个体的变异越小C.观察一致性越大D.机遇一致性越大E.实际一致性越大5.下列叙述正确的有A.特异度高说明测量的稳定性好B.敏感度必须大于特异度才有实际意义C.要兼顾敏感度和特异度都比较高才有实际意义(原题的这个选项是“增大样本含量可以同时提高敏感度和特异度”,并作为正确的选项。
第二单元医学统计学方法一、基本概念和基本步骤(一)统计学中的几个基本概念1.总体的类型总体:是根据研究目的而确定的同质的研究对象的集合。
分为有限总体和无限总体。
样本:是指从总体中随机抽取的有代表性的一部分观察单位的集合。
2.同质和变异同质:指被研究指标的影响因素完全相同。
是科学研究的基础,是相对的。
变异:是同质基础上的个体差异。
是绝对的。
统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。
统计数据具有变异的特征。
3.变量和变量值变量:观察对象的特征。
变量分为定量变量、定性变量、有序数据。
变量值:对变量观察或测量的结果。
4.参数和统计量参数:总体的统计指标。
μ,π,σ统计量:样本的统计指标。
,p,s【例如】研究北京2012年正常成年男性的血压值。
研究对象观察单位变量变量值同质变异有限总体总体参数样本统计量5.误差误差:观察值与实际值的差别称为误差。
误差包括抽样误差和非抽样误差。
抽样误差:由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异。
非抽样误差包括过失误差和系统误差。
6.概率概率:随机事件发生可能性大小的度量。
常用P表示,P值范围在0~1之间。
小概率事件:P<0.05为小概率。
统计学认为小概率事件在一次试验中不大可能发生。
(二)统计学工作基本步骤1.统计设计。
2.数据整理。
3.统计描述。
4.统计推断。
二、定量资料的统计描述描述统计是通过图表或统计指标,对数据资料进行整理、分析,并对数据的分布状态、数字特征进行估计和描述的方法。
(一)集中趋势指标1.算数均数μ,适用于正态分布或近似正态分布资料。
2.几何均数(G)适用于对数正态分布或等比资料。
3.中位数(M)与百分位数(P)中位数:是一组由小到大按顺序排列的观察值中位次居中的数值,用M表示。
百分位数(P X):是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。
《医学统计学》考试试题及答案一.单选题(每题Label分)1.下列关于非参数检验的叙述错误的是()。
A.非参数检验不依赖于总体的分布类型B.非参数检验仅用于等级资料比较C.适合参数检验的资料采用非参数检验会降低检验效能D.非参数检验会损失部分样本信息E.秩和检验是一种非参数检验方法正确答案:B2.两种药物疗效(治愈、显效、好转、无效)比较,宜用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:C3.用大剂量Vit.E治疗产后缺乳,以安慰剂作对照,Vit.E 组中有效者24例,无效者6例,安慰剂组有效者4例,无效者12例。
欲分析Vit.E是否有效,应用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:A4.定量资料多组比较,满足参数检验条件,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:B5.定量资料多组比较,当分布类型不清时,宜用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A6.对于多组独立有序多分类变量资料比较,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A7.非参数统计的应用条件为()。
A.样本数据来自正态总体B.若两组比较,要求两样本方差相等C.总体分布类型未知D.要求样本例数很大E.总体属于某种已知的分布类型正确答案:C8.设配对设计资料的变量为X和X2,则配对设计的符号秩检验,如何编秩()。
A.把X1与X2的差数绝对值从小到大编秩,排好后秩次保持原差数的正负号B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号C.把X1和X2综合按绝对值从小到大编秩D.把X1与X2的差数从小到大编秩E.把X1和X2综合从小到大编秩正确答案:A9.用两种方法检查已确诊的乳腺癌患者120名。
甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致检出率为35%,试问两种方法何者为优,宜用()。
医学统计学总结第一篇:医学统计学总结医学统计学总结一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2.四格表资料1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验3.2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon 秩和检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验4.R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验三、Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
在统计学中,排列检验是一种非参数检验方法,用于比较两个或多个群体的中位数或者分布差异。
与参数检验相比,排列检验不需要对数据的分布做出任何假设,因此在数据分布未知或者不满足正态分布时,排列检验是一种非常有效的统计方法。
一、排列检验的基本思想排列检验的基本思想是通过对样本数据进行重新排列,生成所有可能的排列组合,然后计算排列组合下的检验统计量。
通过比较原始数据的检验统计量与所有排列组合的检验统计量,可以得出原假设的显著性水平。
二、排列检验的步骤1. 提出假设:首先提出需要检验的假设,如两个群体的中位数是否相等。
2. 计算检验统计量:根据需要比较的问题,选择适当的检验统计量,如Wilcoxon秩和检验中的秩和统计量。
3. 生成排列组合:将样本数据进行重新排列,生成所有可能的排列组合。
4. 计算检验统计量:对每一种排列组合,计算出相应的检验统计量。
5. 比较检验统计量:将原始数据的检验统计量与所有排列组合的检验统计量进行比较,得出显著性水平。
三、排列检验的应用排列检验广泛应用于生物统计学、医学统计学等领域。
例如,在临床试验中,排列检验常用于比较不同治疗方案的疗效;在生物学研究中,排列检验常用于比较不同基因的表达水平等。
四、排列检验的优缺点排列检验的优点在于不对数据分布做出任何假设,因此适用于各种类型的数据。
此外,排列检验还具有较好的鲁棒性,对异常值不敏感。
然而,排列检验的缺点在于计算量较大,在样本量较大时,可能需要较长的计算时间。
五、排列检验的举例假设需要比较两组医疗方案的疗效,其中一组为药物治疗,另一组为安慰剂。
在进行排列检验时,首先提出研究假设,即药物治疗组的疗效是否显著优于安慰剂组。
然后选择适当的检验统计量,如Wilcoxon秩和检验中的秩和统计量,对样本数据进行重新排列,生成所有可能的排列组合。
接着计算每一种排列组合下的秩和统计量,并与原始数据的秩和统计量进行比较,得出显著性水平。
通过排列检验的结果,可以得出药物治疗组的疗效是否显著优于安慰剂组。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
1.总体:是根据研究目的确定的同质研究对象所有观察单位某变量的集合。
2.样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分称为样本。
3.变异:同一性质的事物,其观察值(变量值)之间的差异。
4.概率:是指某事件出现可能性大小的度量,以符号P表示。
5.医学参考值范围:又称正常值范围。
指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围6.正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
7.可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
8.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
9.标准误:表示样本均数间变异程度。
10.率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
11.可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
12.I型错误:拒绝了实际撒谎能够成立的H0,这类“弃真”的错误称为I型错误。
13.II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。
14.参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。
15.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
16.秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。
17.直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。
相关系数没有单位,取值范围是-1〈=r〈=1,r的绝对值越大表明两变量的关系越密切。
1、总体(population):是根据研究目的确定的同质研究对象的全体.2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标.11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数.14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。