医学统计学总结-精选文档
- 格式:ppt
- 大小:213.00 KB
- 文档页数:97
医学统计学总结一、绪论1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。
2,医学统计学得主要内容:1) 统计研究设计调查研究设计与实验研究设计2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。
A:资料得搜集与整理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。
3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3,统计工作步骤:1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2) 搜集材料A, 搜集材料得原则及时、准确、完整B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。
一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。
C, 资料贮存3) 整理资料 a检查核对b设计分组c拟定整理表d归表4) 分析资料统计分析包括统计描述与统计推断4,同质(homogeneity):指被研究指标得影响因素相同。
变异(variation):同质基础上得各观察单位间得差异。
变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项特征进行测量或观察,这种特征称为变量变量值:变量得观察结果或测量值。
5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。
总体具有得基本特征就是:同质性样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。
样本必须具有代表性。
代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。
统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。
九、非参数秩和检验1、非参数统计:有许多资料不符合参数统计的要求,分布是未知,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检验,成为非参数检验2、参数检验与非参数检验的比较3、秩和检验:是非参数统计中一种常用的检验方法,其中“秩”又称等级、即按数据大小排定的次序号,上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法4、配对资料符号的秩和检验(1)基本思想假定两种处理效应相同,则差值的总体分布对称,总体中位数为0,也就是说样本的正负秩和绝对值应相近;反之,若两种处理效应不同,则差值总体中位数不为0,中位数偏离0越明显,样本的正负秩和绝对值就会相差越大,原假设H0成立的可能性越小(2)适用条件:1)配对设计的计量资料,但不服从正态分布或分布未知2)配对设计的等级资料(3)一般步骤:1)建立检验假设,确定检验水准H0:差值的总体中位数为0H1:差值的总体中位数不为0a=0.052)编秩次并求秩和统计量先算出各对值的代数差,根据差值绝对值的大小编秩,将秩次冠以正负号;若差值为“0”,舍去不计,总的对子数也要减去此对子数(记为n);若遇到相同数值在不同组,要取平均秩次;最后分别计算正负秩次之和T+和T-,任取其中一个作为检验统计量T(习惯取较小者)3)确定P值,作出推断①当5<n≦50时,可根据n和T查配对设计用的T界值表,若检验统计量T值在上下界值范围内,则P值大于表上方对应的概率值,即0.05;若T值在上下界值外,则P值小于表上方对应的概率值②当n>50时,无法查表,可利用秩和分布的近似正态分布法进行检验;当相同秩次较多时,应采用校正公式进行校正(公式不用记)5、两独立样本比较的秩和检验(1)基本思想如果H0成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差较小;含量为n1的样本的秩和T1应在n1(N+1)/2的左右变化;若T 值偏离此值太远,H0发生的可能性就很小;若偏离出给定的a值所确定的范围内,即P<a,拒绝H0(2)适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法;两个等级资料比较(3)查表法1)建立假设检验,确定检验水准H0:两总体分布相同H1:两总体分布不同a=0.052)确定秩和检验统计量T首先编秩号,排序时若有相同数据,取平均秩次,进而将两组数据的秩次分别求和,若两组例数相同,则任取一组的秩和作为统计量;若两组秩次不同,则以例数较小者对应的秩和作为统计量3)确定P值,作出推断结论当n1≦10,n2-n1≦10时,查两样本比较的T界值表,将检验统计量T值与T的临界值作为比较,如果T在界值范围内,则P值大于表上方的概率值(0.05),;若T等于界值或在界值范围外,则P值等于或小于表上方的概率值(4)正态近似法当n1或n2-n1超过10时,可用正态近似法计算z值进行z检验;当相同秩次较多时(尤其等级资料),z值需进行校正(公式不用记)6、多个独立样本比较的秩和检验(1)基本思想:如果总体分布位置相同,各组的秩和应该相差不大(2)适用条件:不满足参数检验的应用条件的完全随机设计的多个样本比较;多个等级资料比较(3)一般步骤:1)建立假设,确定检验水准H0:多个总体分布相同H1:多个总体分布不全相同2)计算检验统计量H将多组数据从小到大混合编秩,如有相等数值则取平均秩次;然后分别计算各组的秩和;最后计算H如果相同秩次较多,使用校正公式更加准确3)确定P值,作出推断结论①当k=3,每组例数≦5,查H界值表②k>3,ni>5,近似服从v=k-1的X2分布,查X2界值表7、参数统计和非参数统计的优缺点十、线性相关与回归1、相关:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关;两个变量有共变现象,称为有相关关系;相关关系不一定是因果关系,有可能是伴随关系2、直线相关的资料要求:双变量正态分布3、相关系数:是指衡量两个连续变量之间关联的强度的指标,样本的相关系数用r表示,总体的相关系数用表示;取值范围:-1≦相关系数≦1(1)正相关:0<r≦1,散点云图是斜向上的,这时一个变量增加,另一个变量将增加(2)负相关:-1≦r<0,散点云图是斜向下的,这时一个变量增加,另一个变量将减少(3)相关系数的绝对值越接近1,两变量的关联程度越强;相关系数的绝对值越接近0,两变量的关联程度越弱4、相关系数的显著性检验(1)查表法:当n≦52,v=n-2,查r界值表得到P值1)建立检验假设,确定检验水准H0:=0,XX与XX之间不存在相关关系H1:≠0,XX与XX之间存在相关关系a=0.052)计算统计量3)确定P值,作出结论查r界值表(2)t检验法:当n>52,计算检验统计量tr,查t界值表得到P值1)建立检验假设,确定检验水准2)计算统计量3)确定P值,作出结论查t界值表5、相关注意事项(1)线性相关的前提条件是X、Y都服从正态分布(双变量正态分布)(2)必须在假设检验认为相关的前提下才能以r的大小判断相关程度(3)相关关系并不一定是因果关系,有可能是伴随关系6、自变量(X):原因、容易得到的、变化小的7、因变量(Y):结果、不容易得到的、变化大的8、线性回归:当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系,但在实际生活当中,由于其他因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归——Y^=a+bX(1)式中的Y^是由自变量X推算因变量Y的估计值,a是回归直线在Y轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y 平均变动b个单位(2)计算原理:最小二乘法,该方法的原则是保证各实测点到回归直线的纵向距离的平方和最小,从而使计算出的回归直线最能代表实测数据所反映出的直线趋势9、回归方程的假设检验:总体的回归系数一般用β表示(1)方差分析基本思想:如果X与Y之间无线性回归关系,则SS回归与SS残差都只包含随机因素对Y的影响,因此其均方MS回归与MS残差应近似相等,如果两者差别较大,并超出能够用随机波动解释的程度,则认为回归方程具有统计学意义1)建立检验假设,确定检验水准H0:β=0,即XX与XX间无线性回归关系H1:β≠0,即XX与XX间有线性回归关系a=0.052)计算统计量3)确定P值,得出统计结论查F界值表(2)t检验1)建立检验假设,确定检验水准2)计算统计量Sb是样本回归系数b的标准误,反映样本回归系数与总体回归系数之间的抽样误差Sy|x是剩余标准差,表示因变量Y对于回归直线的离散程度3)确定P值,作出结论10、线性回归分析的注意事项(1)只有将两个内在有联系的变量放在一起进行回归分析才是有意义的(2)作回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果的关系,那么应该以“因”的变量为X,以“果“的变量为Y;如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为X(3)在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布),如果数据不符合要求,在进行回归分析前,必须先进行变量的变换(4)回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义(5)使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围外11、线性相关和回归的区别和联系(1)相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布)(2)线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系是单向的(3)如果对同一资料进行相关与回归分析,则得到的相关系数r与回归方程中的b正负号是相同的(4)无论是相关分析还是回归分析,求出r或b后都要进行假设检验;实际上,对同一样本可以得出r与b互化的公式,同一样本的两种假设检验也是等价的r与b的符号一致,检验等价——t r=t b=(5)相关回归可以相互解释R的平方称为确定系数;R2=r2=SS回归/SS总;R2表示回归平方和在总平方和中所占的比重,即R2越接近1,说明回归效果越好十一、统计表与统计图1、统计表:是把统计资料和统计分析结果用表格的形式进行表达,其目的是简洁、清晰和直观,方便对比和阅读2、统计表的编制原则(1)重点突出,简单明了(2)主谓分明,层次清楚(3)格式规范3、统计表的结构(1)外形上包括:标题、标目、线条、数字及备注(注释)(2)内容上包括:1)主语:被研究的事物,在表的左边作为横标目2)宾语:说明主语的各项指标,在表的右侧3)定语:在标题内4、制作统计表的基本要求(1)标题:是统计表的总名称,放在表的上方中间位置,简明扼要地说明表的主要内容,包括时间、地点和研究内容(2)标目:用来说明表内数据涵义的文字;横标目位于表的左侧;纵标目位于表头右侧;总标目主要是对纵标目内容的概况,在需要时才设置;标目要尽可能简单、明了,指标的单位标示需清楚(3)线条:一般采用“三线表”的格式;表的顶线和底线把表的主要内容与标题分隔开,中间一条线把纵标目与数据分隔开,不宜使用竖线和斜线;如果某些标目或数据需要分层显示,可用短横线分隔(4)数字:用阿拉伯数字表示,位数对齐,小数位数一致;表内不留空格,无数字用“-”表示,缺失数字用“...”表示,并最好以备注的形式进行说明;若数字是“0”,则填写“0”(5)备注:位于表的下方,不列入表内5、统计图:是把数据资料以图示的形式表达,使数据对比更加形象、直观、一目了然6、统计图的制作原则(1)必须根据资料的性质、分析目的及表达效果选用适当的统计图(2)一个图通常只表达一个中心内容和一个主题,即一个统计学指标(3)绘制图形应注意准确、美观,图线粗细适当,定点准确,不同事物用不同线条或颜色表示,给人以清晰的印象7、绘制统计图的基本要求(1)标题:其作用是简明扼要地说明统计资料的内容、时间和地点,一般位于图的下方中央位置并编号,便于引用和说明(2)图域:一般用直角坐标系第一象限的位置表示图域,或者用长方形框架表示;纵横轴长度比例为5:7(3)标目:分为纵标目和横标目,分别表示纵轴和横轴数字刻度的意义,如有度衡量单位则要标出(4)图例:对图中不同颜色或图案代表的指标注释;通常放在横标目与标题之间(5)刻度:刻度可在内侧或外侧,其数值一般按从小到大的顺序,纵轴由下向上,横轴由左向右8、直方图:用直条矩形面积代表各组频数,各矩形面积总和代表频数的总和;主要用于表示连续变量频数分布情况9、线图:是通过线段的上升或下降来表示指标(变量)的连续变化过程,适用于描述一个变量随另一个变量变化的趋势和波动情况;通常纵坐标是统计指标,横坐标是时间变量10、半对数线图:是一种特殊的线图,纵坐标按对数尺度(通常采用常用对数)给出,横坐标仍按算术尺度,适用于描述研究指标变化的速度,比较事物之间相对的变化速度11、箱式图:用于比较两组或多组数据的平均水平和变异程度,各组数据均可呈现其平均水平、四分位间距、最小值和最大值,主要适用于描述偏态分布的资料;中间的横线表示中位数,箱体的长度表示四分位间距,两端分别是P75和P2512、散点图:用点的密集程度和变化趋势表示两指标之间的直线或曲线关系;适用于双变量资料13、直条图:又称条图,即用等宽直条的长短来表示相互独立的统计指标数值大小和它们之间的对比关系,统计指标既可以是绝对数也可以是相对数;纵轴坐标刻度必须从“0”开始;适用于各组统计指标的比较14、误差条图:用于比较多组资料的均值和标准差(或标准误、可信区间)15、百分条图:适用于描述一个计数资料的构成比或比较多个计数资料的构成比;以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例16、圆图:把圆的总面积作为100%,表示事物的全部,而圆内各扇形面积用来表示全体中各部分所占的比例;适用于构成比资料十二、研究设计1、实验设计:是指研究者根据研究目的和条件,结合统计学要求,合理安排各种实验因素,严格控制实验误差,最大限度地获得丰富而可靠的数据;周密的研究设计,可以节省人力、物力、财力和时间,使研究因素的效应得以充分体现2、实验设计三要素(1)研究对象:是指根据研究目的而确定的观察总体,也称为受试对象/受试者或实验对象在实验开始前应对研究对象的条件做出严格的规定,以保证其同质性:1)研究对象应具有明确的纳入标准和排除标准2)选择对处理因素敏感的研究对象3)选择依从性好的受试者作为研究对象4)注意医学伦理学问题(2)处理因素:又称研究因素,是指根据研究目的施加于研究对象的干预措施处理水平:处理因素在实验中所处的状态称为因素的水平混杂因素:在实验过程中,除处理因素外也能使受试对象产生效应的因素(非处理因素),它可能干扰处理因素与效应间的关系在确定处理因素时,需注意以下两点:1)处理因素要标准化:处理因素在整个实验过程中应始终保持不变,有利于分析处理因素与实验结果之间的关系2)明确处理因素和非处理因素(3)实验效应:是处理因素作用于受试对象产生的反应和结果,通过具体的观察指标来表达1)主观指标和客观指标:选用的指标要尽量客观,客观指标不易受主观因素影响2)选择灵敏度和特异度高的指标①灵敏度:是指某处理因素存在时,所选指标能够反映处理因素的效应程度,即反映指标检出真阳性的能力②特异度:是指某处理因素不存在时所选指标不显示处理效应的程度,即反映指标鉴别真阴性的能力3)观察指标的准确度和精密度①准确度:是指研究结果与相应测定事物真实情况符合或接近的程度,主要受系统误差的影响②精密度:是指相同条件下对同一对象的某项指标进行重复测量时,观测值与其均值的接近程度,主要受随机因素的影响3、实验设计四原则(1)对照原则:对照是指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小;只有设立了对照组,才能消除非处理因素对实验结果的影响,使处理因素的效应得以体现1)空白对照:指对照组不给予任何处理;临床上一般不宜使用2)安慰剂对照:指对照组使用一种不含药物有效成分的“伪药物”,即安慰剂,其外观、气味、剂型和处置上均与实验药物相同,不能为受试对象所识别,常用于临床试验3)标准对照:对照组采用现有标准方法或常规方法,或不专门设立对照组,而以标准值或正常值作为对照,即为标准对照4)实验对照:对照组不施加处理因素,但施加某种有关的实验因素,其目的是使两组受试对象所受到的刺激、损伤相同,以避免施加处理的方式可能对其产生的影响5)自身对照:是指对照与实验在同一受试对象身上进行,可以是同一受试对象处理前后,也可以是同一受试对象同期接受不同处理6)相互对照:指各实验组之间互为对照7)历史对照(2)随机化原则:随机化是指每个受试对象有相同的概率或机会被分配到不同的处理组;随机化分组可以使各处理组的受试对象具有相近的特征,可比性好,避免研究者的主观因素对实验效应的影响(3)重复原则:重复是指在相同实验条件下重复进行多次观察;重复是消除非处理因素影响的重要方法,表现为样本量的大小和重复次数的多少为了保证研究结论具有一定可靠性,需要在设计阶段估算所需的最少实验单位数,即样本含量(4)均衡原则:均衡是指某因素各水平组中的受试对象所受到的非实验因素的影响是完全平衡的,即这些组之间的差别完全是由于该因素采取了不同水平所致,而并非其他因素取值不同所造成的影响。
医学统计学总结一.绪论1,医学统计学:运用概率论和数理统计学的原理和方式,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而说明其客观规律性的一门应用科学。
2,医学统计学的要紧内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的大体原理和方式研究设计和数据处置中的大体统计理论和方式。
A:资料的搜集与整理 B:经常使用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估量和假设查验。
3)医学多元统计方式多元线性回归和慢慢回归分析、判别分析、聚类分析、主成份分析、因子分析、logistic回归与Cox 回归分析。
3,统计工作步骤:1)设计明确研究目的和研究假说,确信观看对象与观看单位,样本含量和抽样方式,拟定研究方案,预期分析指标,误差操纵方法,进度与费用。
2)搜集材料A,搜集材料的原那么及时、准确、完整B,统计资料的来源医学领域的统计资料的来源要紧有三个方面。
一是统计报表,二是常常性工作记录,三是专题调查或专题实验。
C,资料贮存3)整理资料 a检查查对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的阻碍因素相同。
变异(variation):同质基础上的各观看单位间的不同。
变量(variable):搜集资料进程中,依照研究目的确信同质观看单位,再对每一个观看单位的某项特点进行测量或观看,这种特点称为变量变量值:变量的观看结果或测量值。
5,整体(population)依照研究目的所确信的同质研究对象中所有观看单位某变量值的集合。
整体具有的大体特点是:同质性样本(sample)从整体中随机抽取部份观看单位,其变量值的集合组成样本。
样本必需具有代表性。
代表性是指样本来自同质整体,足够的样本含量和随机抽样的前提。
统计量(statistics)描述样本变量值特点的指标(样本率,样本均数,样本标准差)。
医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。
(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-a的可信区间,又称置信区间。
3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。
医学统计学常用方法小结5篇第一篇:医学统计学常用方法小结一、两组或多组计量资料的比较 1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2.四格表资料1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验3)n£40或存在理论数<1,则用Fisher’s 检验3.2×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验4.R×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验三、Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
绪论进和维护健康,预防疾病、失能和早逝二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。
三.健康决定因素:指决定个体和人群健康状态的因素。
包括:1、社会经济环境。
2、物质环境3.个人因素。
4卫生服务。
四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。
2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。
3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。
第一章流行病学概论进健康的策略和措施的科学。
流行病学定义内涵:1.流行病学的研究对象时人群。
2.流行病学关注的事件包括疾病与健康状况。
3.流行病学主要研究内容是:(1)揭示现象(2)找出原因(3)评价效果。
4.流行病学研究和实践的目的是防治疾病、促进健康。
二.流行病学基本原理:1.分布论。
2.病因论。
3.健康-疾病连续带。
4预防控制理论(三级预防理论)5.数理模型。
6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则三.流行病学的用途:1.描述疾病及健康状况的分布。
2.探讨疾病的病因。
3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。
4.疾病的预防控制及其效果评价。
5.流行病学分支。
第二章疾病分布的存在方式及其发生、发展规律。
二.疾病分布的测量指标:1.发病率:指在一定期间内(一般为1年)特定群中某病新病例出现的频率。
疾病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。
比例。
患病率=发病率*病程。
病的人数占所有易感接触者总数的百分率。
5.死亡率:指在一定时间期间(通常为1年)内,某人群中死于某病(或死于所有原因)的频率。
名词解释1、一类错误:拒绝了实际上成立的H。
,这类“弃真”的错误称为I型错误或第一类错误。
2、参数和统计量:这些总体的统计指标或特征值称为参数。
由样本所算出的统计指标或特征值称为统计量。
3、变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。
4、P值:即概率,反映某一事件发生的可能性大小。
5、检验效能:B称为检验效能或把握度,即两总体却有差别,按α水准能发现它们有差别的能力。
简答题1、描述数值变量资料(统计资料)的集中程度有哪些指标,有何运用条件?算数均数:单峰对称分布的资料几何均数:对数变换后的单峰对称的资料中位数:偏态分布,分布不明资料,有不确定值的资料。
百分位数:当样本含量较少时不宜用靠近俩端的百分位数来估计频数分布范围。
2、实验研究的基本要素和基本原则是什么?基本要素:处理因素、受试对象和实验效应。
基本原则:对照原则、随机化原则和重狂原则大题1、(1)变量资料(2)成组t检验对立性正态性方差齐性(3)H0ιμ1=μ2,新药与常规药物的疗效相同H1rμ1≠μ2,新药与常规药物的疗效不同α=0.05T=1.0195V=n1+n2-2=18(2)t<t0.05z18,p>0.05,按a=0.05水准,不拒绝H0,差别无统计学意义。
结论:t检验结果表明,故尚不能认为新药与常规药物的疗效相同。
2、(1)T=13×17/47=4.7(2)x2检验(3)X2>X2(0.05,1),p<0.05,按a=0.05水准,拒绝H0,接受HQ差别有统计学意义。
结论:x2检验结果表明,乙疗法比甲疗法好。
3、(1)成组设计两样本比较的秩和检验(2)实验组秩次:13、I15、8.5、14、15.5、15.5、17、18对照组秩次:1、2、4、3、5、6、8.5、7、10、11.5(3)H0:两组局部温热的疗效总体分布相同H1:两组局部温热的疗效总体分布不同4(1)Ho:P=O,即母体内时间与体重无线性相关关系H1:P≠0,即母体内时间与体重有线性相关关系a=0.05F>5.23,拒绝HO,接受HI,相关系数有统计学意义。
医学统计学基础知识总结统计学是一门重要的科学分支,对于医学领域也具有重要的应用。
通过对医学数据的分析和解释,统计学可以帮助医学工作者更好地理解疾病的发病机制、评估治疗效果以及预测疾病的发展趋势。
本文将总结医学统计学的基础知识,以便读者更好地理解和应用统计学在医学领域中的重要性。
一、数据类型和测量尺度在医学统计学中,常见的数据类型包括定量数据和定性数据。
定量数据是可以进行度量和计数的数据,如年龄、体重等,而定性数据则是描述性质的分类数据,如性别、病情等。
根据测量尺度的不同,数据可以分为四个层次:名义尺度、序数尺度、区间尺度和比例尺度。
名义尺度是最基本的测量尺度,只能进行分类,如性别、民族等;序数尺度在名义尺度的基础上增加了顺序关系,如疼痛程度的评估;区间尺度则增加了数据之间的等距性,如温度、pH值等;比例尺度是最高级别的测量尺度,具备等距性和绝对零点,如身高、体重等。
二、统计描述和推断统计描述是对数据进行整理和概括的方法,其目的是为了更好地理解数据的中心趋势、变异程度和分布形态。
常见的统计描述方法包括均值、中位数、众数、标准差、方差等。
通过统计描述,医学工作者可以对数据进行初步的了解,在后续的分析中提供基础信息。
统计推断是基于抽样数据对总体进行推断的方法。
通过对样本数据的分析,可以对总体参数进行估计和假设检验。
其中,估计是对总体参数进行点估计(如均值、比例等)或区间估计(如置信区间);假设检验则是通过对总体参数提出假设,并对其进行验证。
统计推断能够帮助医学工作者从样本中获取总体信息,并根据所得结论做出相应的决策。
三、概率论和假设检验概率论是统计学的基础,通过对不确定性的量化,可以为统计推断提供理论依据。
概率是描述事件发生可能性的数值,常用的概率分布包括正态分布、泊松分布、二项分布等。
在医学领域中,概率论常用于疾病的风险评估、样本大小的确定以及实验设计等方面。
假设检验是统计学中重要的方法之一,用于验证研究假设的真实性。
医学统计学知识点医学统计学是医学中的重要分支,通过对医学数据的收集、整理、分析和解释,帮助医生和研究人员更好地理解疾病的发病规律和治疗效果。
下面将介绍一些医学统计学中常见的知识点。
一、数据类型在医学统计学中,数据通常分为定性数据和定量数据两种类型。
定性数据是指具有类别属性的数据,如性别、疾病类型等;定量数据是指可进行加减乘除等运算的数据,如血压、体重等。
二、描述统计学描述统计学是对收集到的数据进行整理、汇总和描述的过程,包括频数分布、中心趋势和离散程度等指标。
通过描述统计学可以更直观地了解疾病的流行病学特征。
三、推断统计学推断统计学是通过对小样本数据进行推断,得出对总体的推断结论。
常见的方法包括假设检验、置信区间估计和方差分析等。
推断统计学在临床研究和药物试验中有重要应用。
四、生存分析生存分析是研究事件发生时间和生存时间的统计方法,常用于临床预后评估和生存曲线绘制。
生存分析可以帮助医生评估疾病的进展速度和治疗效果。
五、因子分析因子分析是研究多个变量之间的关联性和内在结构的统计方法,常用于疾病危险因素的筛选和分类。
通过因子分析可以揭示疾病的复杂发病机制和影响因素。
六、线性回归线性回归是研究两个或多个变量之间线性关系的统计方法,可用于分析疾病风险因素和疗效预测。
线性回归可以帮助医生更好地控制干预措施,提高治疗效果。
综上所述,医学统计学是医学研究和临床实践中不可或缺的工具,掌握相关知识点可以更好地帮助医生理解和解释医学数据,促进疾病防控和治疗水平的提高。
希望本文介绍的医学统计学知识点能够为医学工作者提供参考和帮助。
感谢阅读!。
医学统计学第一章 绪言研究设计、资料分析、结论定量资料:以定量值表达每个观察单位的某项观察指标,如血脂心率等。
定性资料:以定性方式表达每个观察单位的某项观察指标,如血型性别等。
等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效分级等。
总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
(以上均可能考名解)描述某总体特征的指标称为总体参数,简称参数;描述某样本特征的指标称为样本统计量,简称统计量。
概率是随机事件发生可能性大小的一个度量,概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
定量资料的统计指标(大题):算术均数,几何均数,中位数和百分位数。
同质性与异质性:同质是指观察单位具有相同的性质,是构成研究总体的必备条件;异质性是指性质不同,研究内容不同,对同质性的要求不同。
第二章 个体变异与变量分布变异(名解):是以具有同质性的观察单位为载体,某项观察指标在观察单位之间显示的差别。
【在同质的基础上各观察单位(或个体)之间的差异】 正偏态与负偏态【2.3节为重点,尤其是统计指标与图的关系】几何均数应用于比值数据,中位数适用于偏态分布离散趋势指标(重点简答):全距,四分位数间距,方差,标准差和变异系数,其中常用的是标准差和变异系数。
变异系数(名解):亦称离散系数,是标准差s 与均数x 之比,即XS CV X100%,变异系数常用于比较度量衡单位不同的两组或多组资料的变异度、比较均数相差悬殊的两组或多组资料的变异度。
如何正确使用相对数(选择或简答):1,计算相对数的分母不宜过小。
2,分析时不能以构成比代替率。
3,对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)。
4,计算率时要注意资料的同质性,对比分析时应注意资料的可比性。
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P≤0.05事件称为小概率事件。
6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P25 P50P75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计知识点总结在医学领域中,统计学的应用非常广泛,它可以帮助医生和研究人员分析和解释医学数据,研究疾病的发病机制以及评估治疗方法的有效性。
本文将重点总结医学统计学中的重要知识点,包括描述统计学和推论统计学。
描述统计学描述统计学是研究数据集中各变量的集中趋势和离散程度的方法。
主要包括以下几个方面的内容。
1. 数据的整理和呈现在医学研究中,首先需要对收集到的数据进行整理和呈现。
常用的方法包括频数分布表、直方图、饼图、条形图等,这些方法可以直观地展示各变量的分布情况。
2. 中心趋势的度量中心趋势代表着数据集中值的位置,主要包括均值、中位数和众数。
均值是各观测值之和除以观测次数,中位数是按数值大小排列后位于中间位置的值,众数是出现次数最多的值。
3. 离散程度的度量离散程度描述了数据集中值的分散程度,通过方差和标准差进行度量。
方差是各观测值与均值之差的平方和的平均值,标准差是方差的平方根。
推论统计学推论统计学可以根据样本数据推断总体的特征,包括参数估计和假设检验两个方面。
1. 参数估计参数估计是根据样本数据估计总体特征的值,主要包括点估计和区间估计。
点估计是用样本数据求得总体参数的估计值,例如用样本均值估计总体均值。
区间估计是用样本数据求得总体参数的估计区间,例如用置信区间估计总体均值。
2. 假设检验假设检验是通过样本数据推断总体参数是否符合某种假设,主要包括参数检验和非参数检验。
参数检验是对总体参数进行检验,例如对总体均值或总体比例进行检验。
非参数检验是不对总体参数进行具体假设的检验,例如对数据分布进行检验。
医学研究设计医学研究设计是医学统计学中非常重要的一部分,它关系到研究的可靠性和准确性。
主要包括以下几种设计。
1. 随机化对照试验随机化对照试验是医学研究设计中最可靠的一种设计,它可以有效地减少随机误差和系统误差。
研究对象被随机分配到不同的处理组中,其中一个组作为对照组,另一个组接受实验处理。
2. 横断面研究横断面研究是在特定时间点对研究对象进行一次观察,了解其疾病或特征的分布情况。