医学统计工作基本步骤(详细)
- 格式:doc
- 大小:46.50 KB
- 文档页数:6
循证医学考试题库100题1.医学统计工作的基本步骤是A .调查、搜集资料、整理资料、分析资料B .统计资料收集、整理资料、统计描述、统计推断C .设计、搜集资料、整理资料、分析资料D .调查、统计描述、统计推断、统计图表E. 设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A. 描述性统计和统计学检验B.总体估计与假设检验C.统计图表和统计报告D.描述性统计和分析性统计E.描述性统计和统计图表3.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别)C.由于抽样产生的观测值之间的差别D.样本中每个个体之间的差别E.随机测量误差与过失误差的总称4.概率是描述某随机事件发生可能性大小的数值,以下对概率的描述哪项是错误的A. 其值的大小在0和1之间B.当样本含量n充分大时,我们有理由将频率近似为概率C.随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不可能发生D.必然事件发生的概率为1E.其值必须由某一统计量对应的概率分布表中得到5.统计学中所说的总体是指A. 任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体E.根据地区划分的研究对象的全体6.均数和标准差的关系是A. 愈大,s愈大B. 愈大,s愈小C. s愈大,对各变量值的代表性愈好D. s愈小,与总体均数的距离愈大E. s愈小,对各变量值的代表性愈好7、对于均数为μ,标准差为σ的正态分布,95%的变量值分别范围为:A、µ-σ~µ+σB、µ-1.96σ~µ+1.96σC、0~µ+1.96σD、-∞~µ+1.96σE、µ-2.58σ~µ+2.58σ8、设x符合均数为µ标准差为σ的正态分布,作 z =(x-µ)/σ的变量转换,则:A、z符合正态分布,且均数不变B、z符合正态分布,且标准差不变C、z符合正态分布,且均数和标准差都不变D、z符合正态分布,但均数和标准差都改变E、z不符合正态分布;9、从一个数值变量资料的总体中抽样,产生抽样误差的原因是:A、总体中的个体值存在差别;B、总体均数不等于零;C、样本中的个体值存在差别;D、样本均数不等于零;E、样本只包含总体的一部分。
医学统计学基本概念1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。
2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。
3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。
它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo)上的一切值。
4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。
它是指变量的取值有限的,至多是可列多个。
附:无序分类:二项分类、多项分类5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。
特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值大小,故等级之间不可度量。
6.个体individual:即每个观察单位。
7.总体population:根据研究目的确定的同质观察单位的全体。
8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。
样本包含的观察单位数称为样本含量或样本大小。
9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。
如总体均数、总体标准差等。
特点:参数是未知的,固有的,不变的!10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。
特点:统计量是已知的,变化的,有误差的!11.概率probability:是描述随机事件发生的可能性大小的数值。
常用P表示。
它的大小界于0和1之间。
12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。
13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。
医学统计学(statistics of medicine ):医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。
医学统计工作的基本步骤:1、研究设计2、收集资料3、整理(sorting data)资料4、分析(analysis of data)资料研究单位(unit):研究中的个体(individual),是根据研究目的确定的。
观察单位可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。
变量(variable):研究单位的研究特征。
例如:研究7岁男孩身高的正常值范围变量:身高变量可分为:数值变量和分类变量变量之间可以互相转换。
变量值(value of variable):变量的观察结果大小或属性。
数值变量:变量值是可以定量测量并有数值大小的变量。
分类变量:变量值为变量的属性或类别的变量。
同质(homogeneity):根据研究目的给研究单位确定的相同性质。
注意:同质实质上是指有条件的相同,不是全部相同。
只是一个相对的概念,不是绝对的相同。
变异(variation):同质研究单位中变量值间的差异。
总体(population):是根据研究目的确定的同质研究单位的全体。
更确切地说是同质研究单位某种变量值的集合。
例如:调查某地2002年正常成年男子的红细胞数的正常值范围研究单位:一个人变量:红细胞数同质:同某地、同2002年、同成年男子、同正常。
总体:1)某地所有的正常成年男子2)某地所有的正常成年男子的红细胞数样本(sample):是总体中抽取的有代表性的一部分。
注意:随机抽样(无主观性)参数(parameter):根据总体个体值统计计算出来的描述总体的特征量。
(一般用希腊字母表示)统计量(statistic):根据样本个体值统计计算出来的描述样本的特征量。
(一般用拉丁字母表示)注意:总体参数一般是不知道的统计学抽样研究的目的就是:样本统计量→总体参数误差(error)是指实际观察值与观察真值之差、样本指标与总体指标之差。
医学统计工作步骤医学统计是医学研究中非常重要的一个环节,它可以帮助研究者对数据进行分析和解读,得出准确的结论,并从中推导出相应的医学决策和治疗方案。
医学统计的工作步骤主要包括以下几个方面:1.确定研究设计:医学统计的第一步是根据研究目的确定研究的基本设计,包括研究类型(观察性研究或实验性研究)、研究对象(人群还是个体)、观察时间和研究变量等。
研究设计的选择对于后续数据收集和分析的方法都有直接影响。
2.数据收集:数据收集是医学统计的重要环节,研究者需要根据研究设计,采用适当的方法和工具来收集研究所需的数据。
在数据收集过程中需要严格遵守伦理规范,确保数据的可靠性和完整性。
3.数据清洗和整理:收集到的原始数据往往需要进行清洗和整理,以便后续的分析。
数据清洗包括检查和修正数据的错误、缺失值和异常值处理等步骤,而数据整理则包括合并和转换数据的格式和结构,以适应不同的分析方法和软件。
4.描述性统计:描述性统计是对收集的数据进行总结和描述的过程。
它包括计算数据的中心趋势(如平均值、中位数和众数)、数据的离散程度(如标准差和变异系数)以及数据的分布和关联性等方面。
描述性统计可以帮助研究者了解数据的基本情况,为后续的推论统计提供基础。
5.推论统计:推论统计是根据样本数据对总体进行推断的过程。
它包括假设检验、置信区间估计和回归分析等方法。
假设检验可以帮助研究者判断样本结果与总体差异的显著性;置信区间估计可以提供总体参数的估计范围;回归分析可以用于建立和解释变量之间的关系模型。
在医学统计中,除了以上的基本步骤外,还有一些辅助的工作,如样本容量计算、数据挖掘和生存分析等方法。
这些方法可以进一步提高数据分析的准确性和解释性。
此外,医学统计工作还需要一些专业的统计软件和工具,如SPSS、R和Python等,以方便数据分析和结果的报告输出。
总之,医学统计是医学研究中的重要环节,它可以帮助研究者对数据进行全面和深入的分析和解读,并从中得出准确的结论。
医学统计学(安徽中医药大学)智慧树知到课后章节答案2023年下安徽中医药大学第一章测试1.医学统计工作的步骤为( )A:统计研究调查、统计描述、统计推断、统计图表B:统计资料收集、整理资料、统计描述、统计推断 C:统计研究设计、统计描述、统计推断、统计图表 D:统计研究调查、搜集资料、整理资料、分析资料 E:统计研究设计、搜集资料、整理资料、分析资料答案:统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有( )A:区间估计与假设检验 B:统计图表和统计报告 C:统计描述和统计推断 D:统计描述和统计图表 E:统计描述和统计学检验答案:统计描述和统计推断3.医学统计学研究的对象是( )A:医学中的小概率事件 B:疾病的预防与治疗 C:动物和人的本质 D:有变异的医学事件 E:各种类型的数据答案:疾病的预防与治疗4.用样本推论总体,具有代表性的样本指的是( )A:总体中最容易获得的部分个体 B:在总体中随意抽取任意个体 C:用配对方法抽取的部分个体 D:依照随机原则抽取总体中的部分个体 E:挑选总体中的有代表性的部分个体答案:依照随机原则抽取总体中的部分个体5.下列观测结果属于等级资料的是( )A:病情程度 B:四种血型 C:住院天数 D:脉搏数 E:收缩压测量值答案:收缩压测量值6.对于无限总体我们采用抽样方式进行研究,而对于有限总体,不用抽样()A:对 B:错答案:错7.统计量是随机的,会随着抽样方法、样本量和测量方法而发生变化()A:对B:错答案:对8.系统误差不可以避免,也没有倾向性()A:错 B:对答案:错9.随机误差因为随机而没有规律,因此无法估计和控制()A:错 B:对答案:对10.小概率事件原理是统计推断的基础,基于其推断的结果,依然会出错的可能性()A:错 B:对答案:对11.同一变量的不同数据类型是可以转换的()A:对 B:错答案:对12.只要进行随机化抽样,得到的样本统计量就有很好的代表性A:对 B:错答案:对第二章测试1.从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布()A:近似正态分布 B: 近似对称分布 C:仍为偏态分布 D: 近似对数正态分布答案:仍为偏态分布2.医学中确定参考值范围时应注意()A:正态分布资料不能用均数标准差法 B:偏态分布资料不能用百分位数法 C:正态分布资料不能用百分位数法 D:偏态分布资料不能用均数标准差法答案:偏态分布资料不能用百分位数法3.计算样本资料的标准差这个指标()A:不会比均数小 B:不会比均数大 C:决定于均数 D:不决定于均数答案:决定于均数4.中位数永远等于均数A:错 B:对答案:对5.中位数永远等于P50A:对 B:错答案:错6.标准差大于标准误A:对 B:错答案:错7.标准误大,则抽样误差大A:错 B:对答案:对8.数值变量分布包括集中趋势和离散趋势两方面A:对 B:错答案:错第三章测试1.影响总体率估计的抽样误差大小的因素是()A: 检验的把握度和样本含量 B:总体率估计的容许误差 C:总体率和样本含量 D: 样本率估计的容许误差 E: 检验水准和样本含量答案: 检验的把握度和样本含量2.检验效能是指如果总体间确实存在差异,按照检验水准α能够发现该差异的能力()A:错 B:对答案:错3.如果H0假设为μ1=μ2,那么H1假设可能为( )A:μ1 B:μ1>μ2 C:μ1≠μ2D:μ1≥μ2 E:μ1≤μ2 答案:μ1;μ1≠μ2;μ1≥μ24.假设检验中α和β是跷跷板的关系A:错 B:对答案:错5.参数估计和假设检验均可以进行总体参数是否有差异的判定方法()A:对 B:错答案:错6.总体率参数估计肯定可以用正态分布法A:对 B:错答案:错7.在抽样研究中,当样本例数逐渐增多时()A:标准误逐渐减小 B:标准误逐渐加大 C:标准差逐渐加大 D:标准差逐渐减小答案:标准误逐渐减小8.当n足够大,且np和n(1-p)均大于5时,总体率的95%可信区间用()式求出。
*医学统计工作的基本步骤1设计主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。
内容包括对资料搜集,整顿和分析全过程的设想与安排。
实验设计的三大原则:随机化,重复,对照。
2搜集资料:目的指应采取措施使能取得准确可靠的原始数据。
来源:统计报表,工作记录,专题调查或实验研究,统计年鉴和统计数据专辑。
要求:随机性和样本含量足够大3整顿资料:将原始数据净化,系统化和条理化,为下一步计算和分析打好基础过程。
4分析资料:在表达数据特征的基础上,阐明事物的内在联系和规律性,包括两方面:统计描叙和统计推断17均数的可信区间与参考值范围的区别?均数的可信区间与参考值范围的区别主要体现在含义,计算公式和用途三个方面的不同。
(1)意义:均数的可信区间是按预先给定的概率,确定的未知参数的可能范围。
实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。
但可以说:该区间可多大(如当a=0.05时为95%)的可能包含了总体均数。
而参考值范围是指‘正常人’的解剖,生理生化某项指标的波动范围。
均数的可信区间计算公式(1)σ未知:X±指均数可信区间的用途:估计总体均数,参考值范围是指判断观察对象的某项指标是否正常。
7.假设检验与区间估计的关系:置信区间具有假设检验的主要功能;置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义;假设检验可以报告确切的P值,还可以对检验的功效做出估计。
1.标准差与标准误的区别:标准差是衡量观察值的离散趋势,描述正态分布资料的频数。
标准误是样本均数的变异程度,表示抽样误差的大小,用于总体均数区间估计。
两者联系:两者都是变异指标。
在样本含量一定时,S越大标准误也越大,即在抽取相同例数的前提下,标准差越大,抽到的样本均数的抽样误差也越大。
2.P值和α:P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率,反映样本信息是否支持H0,也反映做出拒绝或不拒绝H0决定的理由充分程度。
α时人为确定的小概率,容许犯第二类错误的概率,用作门槛,称检验水平。
在假设检验中,通常时将P与α对比来得到结论,。
3.标准正态分布与t分布有何不同:t分布为抽样分布,标准正态分布为理论分布。
t分布比标准正态分布的峰值低,且尾部瞧得更高。
随着自由度的增大,t分布逐渐趋于标准正态分布。
当自由度趋于无穷大时,t分布趋近于标准正态分布。
4.假设检验中,当P<0.05时,拒绝H0的理论依据。
P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。
当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。
因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现在样本信息不支持H0,所以怀疑原假设H0不成立,拒绝H0。
5.t检验应用的条件:对单样本t检验要求资料服从正态分布;配对t检验要求差值服从正态分布;对两样本t检验则要求数据均服从正太分布,且两样本对应的两总体方差相等。
6.I型错误和Ⅱ型错误得区别与联系:I型错误是指拒绝了实际成立的H0所犯的弃真的错误,其概率大小用α表示,Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误,其概率用β表示。
当样本含量N确定时,α越小β越大,反之,α越大β越小。
了解这两类错误的实际意义在于,若在应用中要重点减少α,则取α=0.05;若要在应用中要重点减少β,则取α=0.10或-。
20甚至更高。
7.假设检验和区间估计有何联系:假设检验用于推断质的不同即判断两个或多个总体参数是否不等,而可信区间用于说明量的大小即推断总体参数的范围。
两者有联系也有区别,假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题,若算得的可信区间若包含了H0,则按α水准,不拒绝H0,若不包含H0,则按照α水准,拒绝H0,接受H1。
也就是说在判断两个总体参数不等时,假设检验和可信区间时完全等价的。
1.方差分析的基本思想和应用条件是什么。
方差分析的基本思想时根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的编译可由某个因素的作用加以解释。
通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。
应用条件:各样本是互相独立的随机样本,均服从正态分布;相互比较的各样本的具有方差齐性。
2.SS组间和SS组内各表示什么含义。
SS组间表示组内变异,指各处理组样本拘束大小不等,是由处理因素和随机误差造成的,SS组内表示组内变异,指各组处理组内变量值大小不等,是由随机误差造成的。
3.为什么在方差分析中的结果为拒绝H0、接受H1之后,对多个样本均数的两辆比较要用多重比较的方法:方差分析的备择假设H1时g各总体均数不全像等,拒绝H0,接受H1,只说明g各总体均数总的来说有差别,并不能说明两辆总体均数有差别。
若要进一步了解两辆总体均数不等,则需进行多个样本均数间的多重比较。
1常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。
有强度相对数(率)、结构相对数、相似比。
率的含义:某种现象实际发生得例数与可能发生的总体例数之比,说明某现象发生的频率或强度。
构成比的含义:食物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明个构成部分在总体中所占比重或分布,又称百分比。
相对比:是两个有关指标之比,说明两指标间的比例关系。
2.何为标注化法,描述直接标准化法与间接标准化法的区别?采用某影响因素的统一标准构成,然后计算标准化率的方法称为标准化法,其目的时消除原样本内部某影响因素构成不同对合计率的影响,使通过标准化后的标准化和纪律具有可比性。
直接标准化法和间接标准化法的区别在于:如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法,选择一个标准年龄人口构成直接计算标准化率;若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率时,宜用间接法,选择一个标准年龄别死亡率,先计算标准化死亡比,再用标准化死亡比乘以标准总死亡率得到标准化死亡率。
3.应用标准化率进行比较时要注意什么问题。
①标准化法只适用与因两组内不构成不同,并有可能影响两组总率比较的情况,对与其他因其他条件不同而产生的可比性问题,标准化法不能解决;②由于选择的标准人口不同,算出的标准化率也不同,因此,当比较几个标准化率时,应采用同一标准人口;③标准化后的标准化率,已经不再反映当时当地的实际水平,他只是表示相互比较的资料间的相对水平;④两样本标准化率时样本值,存在抽样误差。
比较两样本的标准化率,还应做假设检验。
4.相对数的动态指标有哪几种?各有何用处?相对数的动态指标及其动态数列分布指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量时说明其相对数在一定时期增长的绝对值;发展速度与增长速度均为相对比,说明某相对数在一定时期的速度变化;平均发展速度时各环比发展速度的集合均数,说明某相对数在一个较长时期中逐期平均发展变化的程度。
1 二项分布、Poisson分布和正态分布间的联系(1);当N很大,π很小,且Nπ=λ为常数时,二项分布近似Poisson分布(2)在n很大、π不接近0也不接近1时,二项分布B(n,π)近似正态分布,而相应的样本率p的分布也近似正态分布N(3)当λ增大时,Poisson分布渐进正态分布,当λ≥20时,Poisson 分布资料可做正态分布处理2 二项分布的应用条件是什么?答:(1)每次实验只有发生两种互斥的可能结构之一,即两种互斥结果的概率之和恒等于1; (2)每次实验产生某种结果(如阳性)的概率固定不变;(3)重复实验是相互独立的,即任何一次实验结果的出现不会影响其他实验结果出现的概率。
3.Poisson分布的性质特征是什么?①总体均数与总体方差相等;②当N很大,π很小,且Nπ=λ为常数时,二项分布近似Poisson分布;③当λ增大时,Poisson分布渐进正态分布,当λ≥20时,Poisson分布资料可做正态分布处理;④Poisson分布具有可加性。
即对于服从poisson分布的m个相互独立的随机变量X1X2…..Xm,它们之和也服从poisson分布,且其均数也这m个随机变量的均数之和。
问答:1.对于四表格资料,如何正确选用检验方法?①首先应分清时两样本率比较的四表格还是配对设计的四表格资料;②对于两样本率比较的四表格资料,应根据各格的理论值T和总例数N的大小选择不同的卡方检验计算公式。
2.说明行X列资料卡方检验应注意的事项:①行X列表中的理论频数不应小于1,或1≤T<5的格子数不宜超过格子总数的1/5。
②多个样本率比较,若所得统计推断为拒绝H0,接受H1,只能人为各总体率之间总的来说有差别,但不能说明任两个总体率之间皆有差别。
要进一步推断哪两个总体率之间有差别,需进一步做多个样本率的多重比较③对于有序的RXC表资料不宜用卡方检验。
对于RXC表的资料要根据其分类类型和研究目的选用恰当的检验方法。
3说明X2检验的用途:答:X2 检验的用途比较的广,通常多用于推断两个总体率或构成比之间有无差别,推断多个总体率或构成比之间有无差别,多个样本率比较的X2分割,两个分类变量之间有无关联性,频数分布拟合优度的X2检验。
4.两样本率比较的u检验与X2 检验有何异同?两样本率比较时,若对同一资料进行t检验与X2 检验,在不校正的情况下X2 =U2 ,但u检验通常用于大样本,而X2 检验用于或小样本。
1.直线回归分析中应注意哪些问题?①两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析,其中哪一个作为应变量主要是根绝专业上的要求而定,同时直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以时能够精确测量和严格控制的非随机变量②进行直线回归分析前应绘制散点图,以检查数据是否满足模型基本假设,发现离散点并进行进一步处理③对结果应有正确解释。
反映两变量间数量上影响大小的统计量应该是回归系数的绝对值,而不是建设检验的P值。
P值越小只能说约有理由人为变量间的直线关系存在,而不能说关系越密切或越显著。
直线回归用于预测时应尽量不合理的外延。
结果中的决定系数可以表示两变量关系的实际效果。
2.简述直线回归与直线相关的区别与联系。
两者的联系:①对于即可做相关又可做回归分析的同一组数据,算出的相关系数和回归系数正负号一致②相关系数与回归系数得假设检验等价③同一组数据的相关系数和回归系数可以相互换算④用回归解释相,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则决定系数越接近1,说明相关的效果越好。