医学统计复习(基础知识)-8年制第2版
- 格式:docx
- 大小:159.90 KB
- 文档页数:18
习题《医学统计学》第二版(七年制临床医学用)(一)最佳选择题1。
描述一组偏态分布资料的变异度,以( )指标较好。
A。
全距 B。
标准差C。
变异系数 D. 四分位数间距E.方差2.用均数和标准差可以全面描述( )资料的特征.A。
正偏态分布 B. 负偏态分布C. 正态分布 D。
对称分布E.对数正态分布3。
各观察值均加(或减)同一数后()。
A. 均数不变,标准差改变B. 均数改变,标准差不变C。
两者均不变 D。
两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用().A. 变异系数B. 方差C. 极差D. 标准差E.四分位数间距5.偏态分布宜用( )描述其分布的集中趋势。
A。
算术均数 B。
标准差C. 中位数D. 四分位数间距E.方差6。
各观察值同乘以一个不等于0的常数后,( )不变.A.算术均数 B. 标准差C。
几何均数 D. 中位数E.变异系数7。
()分布的资料,均数等于中位数.A. 对数正态 B。
正偏态C. 负偏态 D。
偏态E.正态8。
对数正态分布是一种( )分布.(说明:设X变量经Y=lg X变换后服从正态分布,问X变量属何种分布?)A. 正态B. 近似正态C. 左偏态D. 右偏态E.对称9。
最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A. 均数 B。
标准差C。
中位数 D. 四分位数间距E.几何均数10。
血清学滴度资料最常用来表示其平均水平的指标是()。
A。
算术平均数 B。
中位数C。
几何均数 D.变异系数E.标准差11.( )小,表示用该样本均数估计总体均数的可靠性大。
A. CVB. S R E 。
四分位数间距12.两样本均数比较的t 检验,差别有统计学意义时,P 越小,说明( )。
A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E 。
越有理由认为两总体均数相同13. 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( )。
医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
全科医学一、健康:健康不仅仅是没有疾病或虚弱,而且包括在躯体,精神和社会适应方面的完好状态。
二、影响健康的因素有哪些?答:1、环境因素:(1)自然因素:水、空气、土壤、食品。
(2)社会环境:经济收入,居住条件,营养状况、文化程度、人际关系、人口流动、工作节奏等。
2、生活方式及行为因素:吸烟、醉酒、饮食不当、缺乏运动。
3、生物遗传因素4、医疗卫生服务因素:医疗网点布局、费用承担方式、医疗服务设施、服务态度和质量。
三、亚健康状态:亦称第三状态或灰色状态,指人的机体无明显疾病,但呈现活力降低,适应能力呈不同程度减退的一种生理状态,是介于健康和疾病之间的一种生理功能降低的状态。
(有症状,但检查没有异常)四、亚临床状态:亦称无症状疾病,没有临床症状和体征,但存在着生理性代偿或病理性反应的临床检测证据。
五、初级卫生保健的四个方面是:健康促进、预防保健、合理治疗、社区康复六、全科医学:(是一面向社区与家庭,整合临床医学,预防医学,康复医学以及人文社会科学相关内容于一体的综合性医学专业学科,是一个临床二级学科)。
其范围涵盖了各种年龄、性别、各个器官系统以及各类疾病,其宗旨是强调以人为中心,以家庭为单位,以整体健康的维护与促进为方向的长期负责或照顾并将个体与群体健康照顾融为一体。
七、全科医学在中国的发展:1、概念引入时期(20世纪80年代末至90年代初)2、理论研究与实践时期(20世纪90年代初至1996年)3、全面实施时期(1996年后)制定和颁布。
八、全科医学的基本原则与特点:1、是基层医疗保健2、个体化保健3、综合性保健(服务内容)(1)广泛性(服务对象):是社区中的全体居民。
服务不分年龄、性别、病种。
(2)综合性(服务内容)由预防、保健、医疗、健康教育、计划生育技术服务等综合而成(六位一体)并涉及健康的生物、心理、社会各个方面。
4、连续性保健(时间)(1)人生的各个阶段(2)健康—疾病—康复的各个阶段(3)不分时间、地点对其服务对象随时提供其需要的服务。
医学遗传学医学遗传学是一门涉及数千种疾病的基础理论和临床实践科学对于医学来说有一定难度,为了巩固学生所学的理论知识和培养综合分析能力的能力,我们编了这套习题,希望有助于医学生自我检查学习效果,再次复习课程的重点内容,也有助于学生联系有关知识,以融会贯通。
第一章遗传学与医学学习指导:本章要求大家重点掌握遗传学的概念和遗传性疾病的分类及其依据,一般了解医学遗传学发展简史和任务。
一、填空题:1、遗传性疾病分为_____。
2、单基因病起源于_,多基因病起因于_和_,线粒体病呈_遗传。
二、名词解释:1、遗传病2、单基因病3、染色体病4、体细胞遗传病第二章遗传信息的结构与功能学习指导:本章要求大家重点掌握核基因及其表达与调控、遗传信息的传递方式及遗传的基本规律,一般掌握DNA的结构及其序列分类,突变和修复。
其中的难点是减数分裂,同时也是重要的基础内容。
一、填空题1、人类细胞有丝分裂中期的一条染色体由两条_构成,彼此互称为_。
2、DNA分子的复制发生在细胞间期的_期。
3、DNA的组成单位是_,后者由____组成。
4、基因中核苷酸链上插入或丢失一两个碱基时,可导致_突变。
5、由于进化趋异的复制使具有_的基因成簇或分散在基因组中,构成基因家族。
6、基因两侧的调控序列主要有___。
7、人体中在许多细胞中都表达的基因称_。
8、转录因子与DNA的结构域分为____四种。
9、细胞周期包括__。
10、联会发生在减数分裂前期的_期,交叉开始于_期。
11、_是最常见的突变,发生在基因编码序列的突变根据其不同突变效应分为___。
12、人类DNA突变修复的主要方式是_二、选择题:1、下列不属于启动子序列的是:()A、TA TAAATB、AATAAAC、GGGCCAA TCAD、GGCGGG2、增强子()A、是一短序列元件B、位置相对恒定C、可以特异性结合转录因子D、有助于增强基因转录活性3、关于基因表达调控不正确的是:()A、无转录活性的染色质DNA甲基化的程度较高B、组蛋白乙酰化适合基因表达C、转录因子最常见的结构是螺旋-转角-螺旋D、RNA的加工是基因表达调控的关键步骤4、在DNA复制中,下列那些步骤是不正确的:()A、复制过程是半保留的B、冈崎片段以5’—3’DNA为模板的C、真核生物有多个复制起始点D、原核生物双向复制形成复制叉5、有关细胞有丝分裂周期不正确的是:()A、间期可分为G1期、S期和G2期B、S期主要进行RNA和蛋白质的合成C、M期分为前、中、后、末四期D、G2期为细胞进入分裂期准备物质条件6、下列那些不符合减数分裂特点:()A、DNA复制一次,细胞分裂两次。
一.综合考核题库(共 35 题)1.下列哪些疾病常用病死率A、关节炎B、消化道溃疡C、流行性出血热D、结核病E、心机梗死正确答案:C,D,E2.对待队列研究中的失访,下列那些叙述是正确的A、应尽可能减少失访B、若发现有失访,应迅速选择类似的对象补充到研究中来C、应尽可能获得失访者的基线资料甚至结局D、可将失访者与未失访者的基线资料进行比较E、应设法估计失访可能导致的影响的大小正确答案:A,C,D,E3.下列哪项不符合病例对照研究的定义和内涵A、选择患有某病和未患有某病的人群为研究对象B、调查病例组与对照组既往暴露于某个或某些危险因素的情况C、分析相对危险度、特异危险度和暴露人群等指标D、探讨病例组与对照组之间对某些因素暴露的差别E、概括和检验病因假说正确答案:C4.分析疾病的年龄分布可用A、标点地图B、横断面分析C、直方图D、出生队列分析E、病例-对照调查正确答案:B,D5.影响人群易感性下降的主要原因有A、流行后免疫人口增加B、通过预防接种C、新生儿的增加D、隐性感染后免疫人口增加E、易感人群的迁入正确答案:A,B,D6.暴露因素的说法正确的是:A、与疾病发生有关的危险因素B、与疾病可能有关的研究者关注的因素C、在任何研究中都不是混杂因子的因素D、暴露与结局可能是正关联、负关联或无关联的关系正确答案:B,D7.病例对照研究中的信息偏倚的主要来源有A、回忆偏倚B、病例诊断错误C、调查者偏倚D、无应答E、仪器测量误差正确答案:A,B,C8.流行病学描述性研究不包括A、检测B、抽查C、队列研究D、现患调查E、生态学研究正确答案:C9.研究疾病分布的意义在于A、提供病因线索B、帮助认识疾病特征C、提出治疗方案D、有助于制定防制策略E、可以确定病因正确答案:A,B,D10.病例对照研究的结构模式是A、研究人群中已发生的疾病与已经发生暴露的关系B、先确定病人,再追溯可能与疾病有关系的因素C、必须确认暴露是发生在疾病之前D、对照必须没有可疑暴露E、病例必须对可疑因子有暴露正确答案:A,B,C11.队列研究中的累积发病率具有如下一些特征A、适应于样本较大的固定人群B、单位是时间-1C、量值变化 0~1D、因本身有时间单位,故报告中不必报告时段E、表示一个人在特定时期内发生该病的概率正确答案:A,C,E12.流行病学研究的对象是疾病正确答案:错误13.下列哪项不属于病例对照研究的特点是A、相对经济B、根据所得结果可以估计相对危险度C、可计算发病率D、选择无病者作为对照E、对暴露因素的估计可能存在偏性正确答案:C14.我国规定甲类传染病有A、乙型病毒性肝炎B、麻风病C、霍乱D、炭疽E、鼠疫正确答案:C,E15.影响筛检效果评价的偏倚有A、选择性偏倚B、信息偏倚C、混杂偏倚D、领先时间偏倚E、病程长短偏倚正确答案:A,D,E16.现接到有食物中毒发生报告,作为一名医务人员到达现场后首先要做的工作是( ),( )。
预防医学习题1. 职业病的概念、有几类多少种?如何进行职业病诊断?2。
铅对机体产生何种毒作用?3。
传染病的三个环节是什么?4。
疫源地消灭的条件是什么?5。
简述食物中毒的概念、特征。
6。
标准差与标准误有何区别和联系?7. 均数、几何均数和中位数的适用范围是什么?8.参考值范围与可信区间有何区别?9.何谓假设检验?其一般步骤是什么?10.方差分析的基本思想是什么?11.t检验、u检验和F检验的应用条件各是什么?12.常用统计图的适用范围是什么?13. 简述应用相对数的注意事项14. 简述率的标准化法的基本思想15。
描述率的u检验的适用条件检验有何联系与区别?16。
四格表的u检验和217。
.参数检验与非参数检验有何区别,各有何优缺点?18。
简述非参数检验的适用资料.19。
直线相关与回归有何联系与区别?20。
现代流行病学的定义是什么?21.流行病学研究方法可分为哪几种?22. 流行病学在医学科学中有何作用和地位?22.描述疾病分布的指标主要有哪些,其意义是什么?24. 什么叫现况研究?它有何作用,包括哪几类型?25。
什么叫随机化抽样?,医学研究中常见的抽样方法有哪些?26.简述队列研究的基本设计原理。
27.在队列研究中,相对动态人群或静态人群,其危险度估计方法有何异同?28.试述病例对照研究的基本原理以及在病因研究中的优缺点。
29。
何谓匹配,它有什么作用?常见的匹配方法有哪些?30。
临床试验与前瞻性队列研究有何异同点?31. 临床试验的原则包括哪些?32. 流行病学病因研究的步骤有哪些?33. 形成病因假设的方法有哪些?34.诊断试验和筛检试验有何不同?35。
如何对一个试验方法进行评价?36。
诊断试验评价主要包括哪些方面,评价的指标有哪些,如何计算,其意义如何?1.统计学中所说的总体是指A。
任意想象的研究对象的全体B。
根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体2.对于由一个错误实验设计所产生的实验数据,在进行数据处理前,其补救办法靠A.统计方法 B.数学方法C.重做实验 D.重新设计,重做实验3.为了由样本推断总体,样本应该是A。
高中数学必修2《统计》知识点讲义一、引言高中数学必修2中的《统计》部分是我们在日常生活中应用广泛的数学知识。
通过学习统计,我们可以更好地理解世界,做出更明智的决策。
本篇文章将详细讲解统计部分的重要知识点。
二、知识点概述1、描述性统计描述性统计是统计学的基石,它主要研究如何用图表和数值来描述数据的基本特征。
这部分内容将介绍如何制作频数分布表、绘制条形图、饼图和折线图等。
2、概率论基础概率论是统计学的核心,它研究随机事件发生的可能性。
在本部分,我们将学习如何计算事件的概率,了解独立事件与互斥事件的概念。
3、分布论基础分布论是研究随机变量及其分布的数学分支。
本部分将介绍如何计算随机变量的期望和方差,了解正态分布的特点及其在日常生活中的应用。
三、知识点详解1、描述性统计本文1)频数分布表:频数分布表是一种用于表示数据分布情况的表格,其中每一列表示数据的一个取值,每一行表示该取值的频数。
通过频数分布表,我们可以直观地看到数据分布的集中趋势和离散程度。
本文2)图表:图表是描述数据的一种有效方式。
通过绘制条形图、饼图和折线图,我们可以直观地展示数据的数量关系和变化趋势。
2、概率论基础本文1)概率:概率是指事件发生的可能性,通常用P表示。
P(A)表示事件A发生的概率,其值在0和1之间,其中0表示事件不可能发生,1表示事件一定会发生。
本文2)独立事件与互斥事件:独立事件是指两个事件不相互影响,即一个事件的发生不影响另一个事件的概率;互斥事件是指两个事件不包括共同的事件,即两个事件不可能同时发生。
3、分布论基础本文1)期望:期望是随机变量的平均值,通常用E表示。
E(X)表示随机变量X的期望,它是所有可能取值的概率加权平均值。
期望对于预测随机变量的行为非常有用。
本文2)方差:方差是衡量随机变量取值分散程度的指标,通常用D表示。
D(X)表示随机变量X的方差,它是每个取值与期望之差的平方的平均值。
方差越大,随机变量的取值越分散;方差越小,取值越集中。
医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。
变量 无序分类变量:所分类别或属性之间无顺序和程度上的差异 分类变量 :定性变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。
可以分为有限总体和无限总体。
5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
样本代表性的前提:同质总体,足够的观察单位数,随机抽样(随机抽样是样本客观反映总体情况的前提。
)。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。
6、概率:描述随机事件发生的可能性大小的一个度量。
若P (A )=1,则称A 为必然事件;若P (A )=0,则称A 为不可能事件;随机事件A 的概率为0<P <1.小概率事件:若随机事件A 的概率P ≤α,则称随机事件A 为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。
7. 随机抽样的方法:1.单纯随机抽样2.系统(机械)随机抽样3.整群随机抽样4.分层随机8. 变量变换 平方根反正弦变换——适用于二项分布率(比例)数据。
平方根变换——适用于泊松分布的计数资料对数变换——适用于对数正态分布资料1.抽样调查的样本含量估算——保证研究结果可靠前提下,估计所需的最少样本例数:(1)估计方法:①直接查表②采用公式计算(2)估计依据:①总体中个体的变异程度(CV )②精度:通常用最大的相对误差(ε)反映精度的要求 ③置信程度 (决定Z α/2)(3)样本含量估算: ①定量变量:22/).(εαCVn Z =②定性变量: P=0.2~0.8时:PP n Z 222/)1(εα-=P ¢(0.2,0.8)时:22/}])1(/arcsin[3.57{P P P n Z -=εα统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。
医学统计学一、基本概念1同质:是指被研究指标的主要影响因素相同2变异:指同质事物间的差异。
3频率:某变量值出现的次数(频数)/重复观察的总次数。
4概率:表示随机事件发生可能性大小的数值。
(用P表示)通常由频率的稳定值反映。
确定性事件:(1)必然事件P=1,(2)不可能事件P=0;随机性事件概率取值介于0~1之间;概率越接近0,表明事件发生的可能性越小。
概率越接近1,表明事件发生的可能性越大。
5概率和频率有区别:频率是已经进行试验的结果,描述的是样本中事件出现的可能性大小(样本信息),样本不同,其值也不同,具有偶然性;概率刻画的则是总体中随机事件出现的可能性大小(总体信息),是一种客观存在,是个确定数值,具有必然性。
6小概率原理:概率很小的随机事件在一次或少量实际观察中是不可能发生的(尽管理论上有发生的可能)小概率:P≤0.05或P≤0.017 假设检验:先对总体的参数或分布作出某种假设,然后用适当的方法根据样本对总体提供的信息,运用“小概率原理”推断假设是否成立。
8 假设检验两类错误:Ⅰ型错误:拒绝实际成立的H0 (弃真);Ⅱ型错误:不拒绝实际不成立的H0(存伪)。
要同时降低犯两类错误的概率,唯一的办法就是增大样本含量进行观察.9 标准误:是统计量(如样本均数、样本率)的标准差,1 反映样本均数间的离散程度2反映样本均数与总体均数间的离散程度(即抽样误差的大小)。
10 t分布:从同一总体中抽出许多样本(n相同),就可得到许多t值,将这些t值绘成直方图,当样本数无限多时,就得到一条光滑的曲线,这就是t分布曲线,这种t值的分布就称为t分布。
11 t界值表临界值 t α, ϒ【α = 0.05 (检验水准) ϒ = n-1 (自由度)】在 t界值表中:每一个t 值都对应着一个P值;在相同自由度时,t 值越大,概率P值越小;在相同自由度及相同t 值时,双侧概率P值是单侧概率的两倍。
12 检验假设:一、建立假设,确定检验水准1、检验假设(无效假设)H0:µ1= µ2(或µd= 0)(备择假设)H1:µ1≠µ2(或µd ≠ 0)µ1<µ2(µd < 0)2、检验水准α,它作为假设检验时预先确定的判断小概率事件的水准,以便由P值和α的关系决定是拒绝H0还是不拒绝H0作为判断小概率的标准,α常取0.05或0.01。
二、计算相应的检验统计量根据设计的类型、资料的类型和分布情况、统计推断目的以及n 的大小选用不同的检验方法,计算相应的检验统计量。
如完全随机设计实验中,两样本均数比较可计算统计量t 值(即作t 检验)。
三、确定P 值,作出推断结论:P 值是指在H0所规定的总体(例如µ1= µ2)中作随机抽样,获得等于及大于(或等于及小于)现有样本统计量(如t 值)的概率;亦即这种样本差异( )来自抽样误差的概率。
推断结论:统计结论:1 对H0如何推断?2 对H1如何推断?3 对差异如何推断? 专业结论 1 正确;2 明确;3 符合医学逻辑第一章1 医学统计学是运用概率论和数理统计的原理、方法, 结合医学实践,研究医学数字资料的搜集、整理、推断的一门学科。
2 科研设计包括专业设计和统计设计3 专业设计主要包括 :选题或立题,确定研究对象、处理因素、实验方法、实验材料和实验设备、实验效应(特异性指标)等。
4动物实验:以动物或生物材料为研究对象,研究者对研究对象施加各种干预,比较不同干预间之效果。
5临床试验:以病人为研究对象,研究者对研究对象施加各种干预,比较不同干预间之效果。
6实验设计三要素:1 处理因素 2 实验对象 3 实验效应7设计内容:确定统计分析方法、实验分组方法、样本含量估计、数据质量控制(误差和偏倚)等。
8设计原则 :1)对照原则在均衡可比条件下进行实验组与对照组的对比,以真实反映处理因素的效应。
均衡可比性:在各对比组中,除处理因素不同外,其他能够影响实验效应的主要非处理因素要尽量齐同一致。
具备三个条件:(1)对等:除处理因素外,对照组具备与实验组对等的一切因素。
(2)同步:在研究过程中实验组与对照组始终同时进行。
(3)专设:对照组为相应的实验组专门设置。
2)随机化原则(1) 随机抽样:总体中的每一个观察单位都有同等机会进入样本。
(2)分组随机:样本中的每一个受试对象都有同等机会进入处理组和对照组或进入各个处理组。
(3)顺序随机:每一个受试对象按时间先后顺序接受处理的机会同等。
3)重复原则(确定样本含量原则)在预实验或大量调查的基础上,以预先规定的检验水准(ᵊ)和检验效能( ᵝ )达到预期效果所需要的最少观察单位数。
(1)结论的重复:实验效应必须具有可重复性(2)样本含量的重复:足够的观察单位数量(3)观察的重复:同一观察动物多次观察21x x9 统计设计目的:确保专业设计布局合理、实验结果可靠10 分析资料:1)统计描述:对统计资料数量特征及分布特征进行描述研究和描述表达2)统计推断:指根据样本信息(样本统计量)推断总体信息(总体参数)11数值变量资料(计量资料)对每个观察单位(观察对象)某个变量用定量的方法(仪器、实验)进行测量所得到的数值(有度量单位、可以是小数、连续性资料)。
12 分类变量资料:是将观察单位按某种属性或类别分组,然后计数各组观察单位的个数所得的数据(无度量单位、整数、离散性资料)分类变量又可分为无序分类和有序分类两种情况:1、无序分类变量资料(计数资料)(1)二项分类:按属性或类别分组时,分成对立的两种属性或类别;如阳性与阴性、有效与无效(2)多项分类:按属性或类别分组时,分成互不相容的几种属性或类别;如血型A型、B型、O型、AB型2、有序分类变量资料(等级资料):将观察单位按某种属性的不同程度、档次或等级分类,然后清点各等级类别所得的观察单位数。
13 有序分类变量资料与多项分类资料的区别:各等级类别有程度上的差别(这种差别按顺序排列,任何两类别的排序不能替换)*根据分析需要:各类变量资料之间可以互相转化第三章统计描述第一节频数发布1 频数表:频数( f ) :相同观察值(或观察结果)出现的次数观察值及其相应的频数按一定顺序排列的表格.2 频数表编制步骤如下:1)、求全距(R) :本例R= Xmax- Xmin=3.62最大值(Xmax=6.34)和最小值(Xmin=2.72)2)、定组段数与组距: 组段指各组的起止范围;组数指组段的个数(用k)表示样本量n大于100设10~15个组段样本量n小于100设 6~10个组段组距(i):等距分组时i=R/k3)、确定组限:(1)每个组段的起点为下限,终止点为上限(2)第一组段下限取等于或略小于Xmin的整数或方便数,其余各个组段依次累加I作下(3)第一组段包括最小值,最后组段包括最大值4)、划记各组段频数3 频数图:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度,各组限由横轴标度,条段的宽度表示组距4 频数分布特征(两方面特征)1)、集中趋势:(图9—1)14~组段(居中组段)频数最多,其它组段的频数分布向其靠拢.2)、离散趋势:居中组段两侧的频数逐渐减少5 频数分布的类型1、对称分布:集中位置居中,两侧基本对称的频数分布(2) 一端或两端无确切界值的开口资料2. 离散趋势描述用以反映一组同质观察值的离散性或变异程度。
1)极差(R):用于反映个体变异的范围1、未顾及全部数据间的变异,2、例数越多,R可能越大。
(不稳定)2)四分位数间距(Q,QR):上下四分位数之差即Q = QU-QLQ = P75-P25min maxxxR-=(四分位数间距可以看成一半变量值的极差)Q的主要用途:(1)Q适用于任何分布的资料,结果比极差稳定,尤其适用于大样本偏态分布的资料。
(2)与M共同描述偏态分布资料的分布特征,简写成M(Q);(3)计算参考值范围(百分位数P2.5,P97.5的范围)自由度的概念:一定条件下能自由取值的变量个数。
以符号ν表示。
ν=N-限制条件个数3)方差:也叫均方,就是将离均差平方和再取平均,用S 2 或MS表示(3)RR<1,说明暴露因素与疾病有“负”的关联,暴露越多,疾病越少,具有保护意义。
6 比数比( OR)是指某事物发生概率与不发生的概率之比。
OR数值的意义:当OR=1时,表示暴露与疾病无关联;当OR>1时,说明暴露使疾病的危险度增加,称为“正”关联,暴露是疾病的危险因素;当OR<1时,说明暴露使疾病的危险度减少,称为“负”关联,即暴露因素对疾病有保护作用。
7 标准化法的概念:对两组或多组率进行比较,当其内部构成不同时,需要按统一的标准进行调整,使之具有可比性,称为标准化法。
用统一标准后计算的率,称为标准化率。
如年龄、性别、工龄、病性等有明显的不同时,则不能直接进行比较。
8 卡方(χ2)检验χ2值的意义:(1) 2值小 O与E相差足够小 接受H0,拒绝H1甲法乙法合计+-+25227-111526合计36175374 .2(一)检验差异有无统计学意义1、建立检验假设,确定检验水准:H0:两种方法的总体检出率相同H1:两种方法的总体检出率不同α=0.052、计算检验统计量χ2 值:c b 〈+2,值进行校正需对其,40若χ0.62200761247.386238240.504020206.81981880(%)合计腰痛穴人中穴后溪穴有效率合计未治愈数治愈数穴位(1)建立假设,确定检验水准H0:π1=π2 =π3 三种穴位针刺的总体治愈率相等H1:π1、π2 、π3 三种穴位针刺的总体治愈率不全相等α=0.05。
(2)计算检验统计量2 = 32.75(3)确定P值,作出推断结论P < 0.05,按α=0.05水准,拒绝H0 ,接受H1 ,差异有统计学意义。
三种穴位针刺治疗急性腰扭伤的治愈率不全相等。
(必要时做两两比较)多个样本率的多重比较(两两比较)Bonferroni法1 进行 2分割,分割成多个四格表。
2 对每一个四格表进行 2检验3 计算校正检验水准a′4 以a′作为检验水准,作出推断结论第七章两样本均数比较的假设检验 -----比较差异----处理因素、抽样误差第一节单样本均数t检验(样本均数与总体均数比较)总体均数:理论值、标准值或经大量观测所得的稳定值。
前提条件:正态分布或大样本。
分析目的:推断样本所代表的未知总体均数 与已知的总体均数 0是否相等( = 0 )。
资料类型:(1)给定一个已知的总体均数和一个随机抽取的样本,(2)该随机样本服从正态分布(若原数据是非正态分布,要通过数据变换使之服从正态分布)第二节成对资料均数的t检验成对(配对)比较的t检验适用于下列情况:自身配对:1 同一受试对象处理前后的比较2 同一受试对象接受两种不同处理异体配对:3 将两个受试者配成对子,施予两种不同处理要求:1 配对资料(差值d 符合正态分布)2 假设成对资料差数的总体均数为0( d = 0 ),检验样本差数的均数与0之间差别有无显著性第三节 两独立样本均数t 比较(成组t 检验)目的是推断两样本分别代表的两总体均数是否相等( u1= u2 )。