医学统计学
- 格式:docx
- 大小:26.75 KB
- 文档页数:8
第一章绪论(一)名词解释1.总体与样本2. 随机抽样3. 变异4. 等级资料5. 概率与频率6. 随机误差7. 系统误差8. 随机变量9.参数10. 统计量(二)单项选择题1.观察单位为研究中的( )。
A.样本B. 全部对象C.影响因素D. 个体2.总体是由()。
A.个体组成B. 研究对象组成C.同质个体组成D. 研究指标组成3.抽样的目的是()。
A.研究样本统计量B. 由样本统计量推断总体参数C.研究典型案例研究误差D. 研究总体统计量4.参数是指()。
A.参与个体数B. 总体的统计指标C.样本的统计指标D. 样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好(三)是非题1.研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。
2.统计分析包括统计描述和统计推断。
3.计量资料、计数资料和等级资料可根据分析需要相互转化。
(四)简答题某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽?第二章计量资料的统计描述(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距5.各观察值同乘以一个不等于0的常数后,()不变。
医学统计学一、介绍医学统计学是医学领域中一门重要的学科,它通过收集、整理和分析医学数据,为医学研究和临床决策提供科学依据。
医学统计学的主要任务是使用统计方法分析各种医学数据,从中提取有意义的信息,并对结果的可靠性和有效性进行评估。
在医学研究中,医学统计学起着至关重要的作用,帮助研究人员通过数据分析对疾病的发病机制、病理生理过程和治疗效果等进行评估。
二、常见统计方法1. 描述统计学描述统计学是医学统计学的基础,它主要用于对医学数据的数量特征进行描述和总结。
常见的描述统计学方法包括:•平均值:用于描述数据的中心趋势。
•标准差:用于描述数据的离散程度。
•百分位数:用于描述数据的分布情况。
2. 推断统计学推断统计学是医学统计学的核心,它基于样本数据对总体进行推断。
常见的推断统计学方法包括:•假设检验:用于检验研究假设的真实性。
•置信区间:用于估计总体参数的范围。
•方差分析:用于比较多个样本的均值差异。
3. 生存分析生存分析是医学统计学中的一项重要内容,它主要用于研究患者的生存时间和相关因素。
常见的生存分析方法包括:•生存曲线:用于描述患者生存时间的分布情况。
•生存率:用于描述患者在某一时间点存活的概率。
•Cox比例风险模型:用于研究生存时间和危险因素的关系。
三、应用领域医学统计学广泛应用于医学研究和临床实践中,对于评估疾病的风险因素、制定预防策略、确定诊断标准和评估治疗效果等方面都起着至关重要的作用。
以下是医学统计学在不同领域的应用示例:1. 流行病学研究医学统计学在流行病学研究中发挥着重要作用。
通过收集大量的样本数据,并运用相关的统计方法,可以研究疾病的发病规律、危险因素和暴露因素等,为疾病的预防和控制提供科学依据。
2. 临床试验医学统计学在临床试验中的应用也非常重要。
通过对试验组和对照组的数据进行比较分析,可以评估新药物或治疗方法的疗效和安全性,为临床决策提供可靠依据。
3. 医疗质量评估医学统计学可以用于医疗质量评估,通过对不同医疗机构之间的数据进行比较分析,评估医疗服务的质量,为改善医疗质量提供参考。
医学统计学的基本内容第一章医学统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。
2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。
3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。
第二节、统计学的几个重要概念一(资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。
一般有度量衡单位,每个对象之间有量的区别。
2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。
每个对象之间没有量的差异,只有质的不同。
3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。
注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。
二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。
2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。
从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。
四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。
亦称偶然事件。
五、概率描述随机事件发生可能性大小的数值,记作,,其取值范围0?P?1,一般用小数表示。
,,0,事件不可能发生必然事件(随机事件的特例);,,1,事件必然发生;,?0,事件发生的可能性愈小;,?1,事件发生的可能性愈大六、小概率事件习惯上将,?0.05或,?0.01 的随机事件称小概率事件。
表示某事件发生的可能性很小。
七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。
医学统计学医学统计学是应用统计学原理和方法来分析、解释医学数据的学科。
医学统计学涉及的内容有很多,包括疾病的发病率、死亡率、治疗效果、药物试验、临床试验等。
医学统计学的应用范围非常广泛,它可以帮助医生和研究者更好地了解疾病的发病机制、诊断标准、治疗效果和预后预测等方面,从而更好地开展医学研究和医疗工作。
医学统计学的基本概念在医学统计学中,有许多基本概念需要了解,以便更好地理解数据的含义。
以下是一些常见的医学统计学概念:1. 样本和总体在医学研究中,我们通常不可能研究每一个人,因此我们只能从总体中抽取一部分人作为样本,然后对它们进行研究。
所以,在医学统计学中,样本就是从总体中抽取的一部分人或物体。
2. 变量变量是研究中需要测量和分析的事物,例如人的年龄、身高、体重等,还有许多与医学有关的变量,如血糖、血压、胆固醇、白细胞计数等。
3. 参数参数是描述总体的特征的量,例如总体的平均数、标准差等。
4. 统计量统计量是描述样本的特征的量,例如样本的平均数、标准差等。
5. 分布分布是指变量在总体或样本中的出现频率和分布情况,可以利用概率分布来描述。
医学统计学的基本方法在医学研究中,我们通常采用以下几种方法来分析数据:1. 描述统计描述统计是对样本的基本特征进行总结和描述的方法,包括常见的测量指标如平均数、中位数、众数、方差和标准差等。
2. 推断统计推断统计是通过样本估计总体参数的方法。
常见的推断统计方法包括假设检验、置信区间和方差分析等。
3. 多元统计多元统计是通过同时考虑多个变量来分析数据的方法。
它包括回归分析、因子分析、聚类分析等方法。
临床试验临床试验是指为了评价新药物或治疗方法在人体中的疗效和安全性而进行的研究。
在临床试验中,医学统计学起着非常重要的作用。
医学统计学可以帮助选择合适的样本、制定合理的试验方案、确定研究指标、提高数据质量、分析数据等。
例如,在药物研发中,我们需要先进行前期实验,确定药物的毒性、吸收、分布、代谢和排泄等特性。
医学统计学(statistics of medicine ):医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。
医学统计工作的基本步骤:1、研究设计2、收集资料3、整理(sorting data)资料4、分析(analysis of data)资料研究单位(unit):研究中的个体(individual),是根据研究目的确定的。
观察单位可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。
变量(variable):研究单位的研究特征。
例如:研究7岁男孩身高的正常值范围变量:身高变量可分为:数值变量和分类变量变量之间可以互相转换。
变量值(value of variable):变量的观察结果大小或属性。
数值变量:变量值是可以定量测量并有数值大小的变量。
分类变量:变量值为变量的属性或类别的变量。
同质(homogeneity):根据研究目的给研究单位确定的相同性质。
注意:同质实质上是指有条件的相同,不是全部相同。
只是一个相对的概念,不是绝对的相同。
变异(variation):同质研究单位中变量值间的差异。
总体(population):是根据研究目的确定的同质研究单位的全体。
更确切地说是同质研究单位某种变量值的集合。
例如:调查某地2002年正常成年男子的红细胞数的正常值范围研究单位:一个人变量:红细胞数同质:同某地、同2002年、同成年男子、同正常。
总体:1)某地所有的正常成年男子2)某地所有的正常成年男子的红细胞数样本(sample):是总体中抽取的有代表性的一部分。
注意:随机抽样(无主观性)参数(parameter):根据总体个体值统计计算出来的描述总体的特征量。
(一般用希腊字母表示)统计量(statistic):根据样本个体值统计计算出来的描述样本的特征量。
(一般用拉丁字母表示)注意:总体参数一般是不知道的统计学抽样研究的目的就是:样本统计量→总体参数误差(error)是指实际观察值与观察真值之差、样本指标与总体指标之差。
医学统计学方法1. 引言医学统计学是医学研究中不可或缺的一门学科,它通过应用统计学的原理和方法,对医学数据进行收集、整理、分析和解释,从而为医学研究提供可靠的依据。
本文将介绍医学统计学的基本概念、常用方法以及在医学研究中的应用。
2. 医学统计学的基本概念2.1 总体与样本在医学研究中,我们通常关注的是一个特定人群或物体的某种特征。
这个人群或物体称为总体,而从总体中选取出来的一部分个体则称为样本。
通过对样本进行观察和测量,我们可以对总体进行推断。
2.2 参数与统计量参数是描述总体特征的数值,例如总体均值、方差等。
由于很难获得总体所有个体的数据,我们通常通过样本来估计参数。
样本所得到的数值称为统计量,例如样本均值、样本方差等。
2.3 假设检验与置信区间在医学研究中,我们经常需要判断某种治疗方法是否有效、某种因素是否与疾病有关等。
假设检验是一种常用的统计方法,它通过对样本数据进行分析,判断总体参数是否符合某种假设。
置信区间则是对总体参数的估计范围。
3. 常用的医学统计学方法3.1 描述统计学描述统计学是对数据进行整理、总结和展示的方法。
常用的描述统计学方法包括:频数分布表、直方图、散点图等。
这些方法可以帮助我们了解数据的分布特征、集中趋势和离散程度。
3.2 推断统计学推断统计学是根据样本数据对总体进行推断的方法。
常用的推断统计学方法包括:参数估计和假设检验。
参数估计可以帮助我们估计总体参数,并给出其置信区间;假设检验可以帮助我们判断某个假设是否成立。
3.3 生存分析生存分析是研究个体发生某个事件(如死亡、复发)所需时间的方法。
常用的生存分析方法包括:生存函数曲线、危险比(hazard ratio)等。
生存分析可以帮助我们评估治疗效果、预测疾病进展等。
3.4 回归分析回归分析是研究因变量与自变量之间关系的方法。
常用的回归分析方法包括:线性回归、 logistic回归等。
回归分析可以帮助我们探索影响因素、预测结果等。
医学统计学基础医学统计学是一门研究医学中数据的收集、分析和解释的科学。
它在医学研究中扮演着至关重要的角色,并且对医学实践和决策具有深远影响。
本文将介绍医学统计学的基本概念、常用的统计方法以及其在医学领域的应用。
一、基本概念1.1 总体与样本在医学统计学中,我们常常需要研究某个感兴趣的群体,这个群体被称为总体。
总体可以是人群中的所有个体,也可以是其他单位,如医院、地区等。
由于总体往往很大,我们无法对其进行全面的研究,因此我们从总体中选取一部分个体进行研究,这部分个体称为样本。
1.2 数据类型医学研究中常见的数据类型包括定性数据和定量数据。
定性数据是描述性质或属性的数据,如性别、病情分类等;定量数据是可度量或计数的数据,如年龄、生命体征等。
了解数据类型对选择合适的统计方法至关重要。
1.3 描述统计学与推断统计学描述统计学用于总结和描述已有数据的特征,如均值、中位数、标准差等。
推断统计学则是通过对样本进行分析,推断总体的特征,并对结果进行估计和推断。
推断统计学可通过假设检验和置信区间来实现。
二、常用统计方法2.1 均值与标准差均值是用来描述一组数据集中趋势的指标,一般用于定量数据。
标准差则衡量了数据的离散程度,即数据的波动情况。
2.2 相关分析相关分析用于研究两个变量之间的关系。
通过计算相关系数,可以了解两个变量是正相关、负相关还是无关。
2.3 生存分析生存分析是用来研究事件发生和持续时间的统计方法。
在医学中,生存分析常用于研究患者的生存时间、复发时间等。
2.4 方差分析方差分析用于比较两个或多个组的均值是否存在显著差异。
它适用于一组分类变量和一个连续变量的比较。
三、医学统计学的应用3.1 临床试验设计与分析临床试验是评价药物疗效的重要手段。
医学统计学在临床试验的设计和分析中起到关键作用,如确定样本量、随机分组、双盲试验等。
3.2 流行病学研究流行病学研究可以揭示疾病的发病原因、预后以及控制策略。
医学统计学的方法可以帮助研究者分析大量数据,确定疾病的危险因素和相关性。
医学统计学的概念和作用
医学统计学是研究在医学领域中的统计方法和技术的学科,它的主要目标是使用统计学的原则和技巧来分析和解释医学数据。
医学统计学的概念和作用如下:
1. 数据分析和解释:医学统计学可以帮助医学研究人员对医学数据进行分析和解释,以了解疾病的发病机制、治疗效果和预后预测等。
2. 研究设计和样本量计算:医学统计学可以为医学研究提供研究设计方法和样本量计算的理论基础,以确保研究结果的可靠性和统计效果的有效性。
3. 验证和推论:医学统计学可以通过假设检验和置信区间等方法对医学研究结果进行验证和推论,从而判断是否存在显著差异或关联。
4. 预测和预测模型:医学统计学可以使用回归分析、生存分析和机器学习等方法来构建预测模型,以预测患者的预后、疾病风险和治疗效果等。
5. 患者群体分析:医学统计学可以帮助医学研究人员对患者群体进行分类、描述和比较,从而揭示不同患者群体的特点和差异。
6. 基因组学和遗传学研究:医学统计学在基因组学和遗传学研究中起着重要作用,可以通过遗传连锁、基因频率和基因关联等统计方法来揭示基因与疾病之间的关系。
7. 临床决策和指南制定:医学统计学可以为临床医生提供统计数据和证据,帮助他们做出准确的诊断和治疗决策,并为临床指南的制定提供科学依据。
总体而言,医学统计学在医学研究和临床实践中的作用非常重要,可以帮助人们更好地理解和应用医学数据,以提高医疗质量和患者的健康状况。
一、名词解释:定量数据:用仪器、工具等方法获得的数据。
定性数据:按某种属性分类,然后清点每类的数据。
有序分类资料:半定性或半定量的观察结果,有大小顺序。
统计学:是收集、分析、解释与呈现数据资料的一门科学。
同质:指事物的性质、影响条件或背景相同或非常相近。
变异:指同质的个体之间的差异。
参数:总体的统计指标。
统计量:样本的统计指标。
总体:根据研究目的而确定的同质单位。
样本:从总体中随机抽取部分观察单位某变量值的集合。
变量:是观测单位的某种特征或属性,变量的观测值就是变量值。
概率:是度量随机事件发生可能性大小的数值。
分类变量:其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组然后汇总各组个数所得到的数值。
数值变量:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位,所得资料称为计量资料。
普查:就是全面调查,即调查目标总体中全部观察对象。
抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。
极差:及全距,是全部数据中最低值与最小值之差。
上下限:每个组段的起点称为该组的下限,终点称为该组的上限。
平均数:反映资料的集中趋势的指标。
几何均数:变量对数值的算术平均数的反对数。
中位数:是一个位置指标,它是将一组观察值按大小顺序排列后位次居中的数值。
百分位数:是指将观察值从小到大排列后处于第X百分位置上的数值。
方差:样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。
标准差:将方差开方即得到标准差。
变异系数:是极差和方差一样都是反映数据离散程度的绝对值。
正态分布:就是一种重要的连续型随机变量的分布类型。
率:是指某种现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比:即比例,是指事物内部某一组成部分观察单位数与同一事物各组成分的观察单位总数之比。
相对比:简称比,是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。
第一单元概述1. 研究设计应包括那几方面内容?答:包括:专业设计和统计设计。
专业设计是针对专业问题进行的研究设计,如选题、形成假说等。
统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。
统计设计是统计分析的基础。
任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。
第二单元资料描述性统计1. 描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:集中趋势的指标有:算术均数、几何均数、中位数。
算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。
描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。
极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。
2. 变异系数和标准差有何区别和联系?答:区别: 1.计算公式不同:CV=S/X*100% ,标准差是方差的平方根。
2.单位不同:变异系数无量纲,标准差量纲和原指标一致。
3.用途不同。
联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV 与s 呈正比。
3. 频数表的用途有哪些?答: 1.描述资料的频数分布的特征; 2.便于发现一些特大或特小的可疑值; 3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理; 4.当样本量足够大时,可以以频数表作为概率的估计值。
4. 用相对数时应注意哪些问题?答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。
2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。
3.正确计算频数指标的合并值。
4.相对数的比较具有可比性。
5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。
第三单元医学统计推断基础1. 正态分布和标准正态分布的联系和区别?答:联系:均为连续型随机变量分布。
区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。
一般正态分布变量经标准化转换后的新变量服从标准正态分布。
4. 简述二项的应用条件?答:条件为: 1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变; 3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。
5. 简述Q-Q 图法的基本原理?答:U-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,U-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。
Q-Q 图法实际上就是首先求的小于某个x 的积累频率,再通过该积累频率求得相应的u 值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u —变换直线),否则(u, x)不会近似在一条直线上。
Q —Q图法正是根据(u, x)是否近似在一条直线上来判断是否为正态分布。
第四单元参数估计与参考值范围的估计1. 均数的标准差和标准误的区别和联系?答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,间接反映了均数的抽样误差大小。
2. 简述t分布和标准正态分布间的区别与联系?答:t分布是进行小样本总体参数区间估计和假设检验的理论基础,t分布比标准正态分布的峰值低,且尾部翘的要高。
此外随着自由度的增大,t分布逐渐趋近于标准正态分布,即为自由度趋于无穷时,t分布就是标准正态分布。
3简述医学中参考值范围的含义和制定参考值范围的一般步骤?答:含义:医学中把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
步骤:1.定义“正常人”,不同的指标“正常人”的定义也不同; 2.选定足够数量的正常人作为研究对象;3.用统一和准确的方法测定相应的指标; 4.根据不同的用途选定适当的百分界限,常用95%和99% ; 5.根据此指标的实际意义,决定用单侧范围还是双侧范围; 6.根据此指标的分布决定计算方法,常用的计算方法有正态分布法、百分位数法。
第五单元t检验与单因素方差分析1.1型错误和II型错误有何区别与联系,这两种错位有何实际意义?答:I型错误是指实际上成立的H0所犯的“弃真”错误,其概率大小用a表示。
II型错误则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用B表示。
当样本含量n确定时,a愈小,B愈大,反之亦然。
意义:若在应用中要重点减少a, 则取a= 0.01 ;若在应用中要重点减少则取a= 0.05, 0.10 , 0.20甚至更高。
2. 假设检验和区间估计有何联系?答:联系在于可信区间亦可以回答假设检验的问题,在判断两个或多个总体参数是否相等时,假设检验和可信区间是完全等价的。
3. 为什么假设检验的结论不能绝对化?答:因为通过假设检验的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝H0是可能犯I型错误;接受H0时可能犯II型错误。
因此不能在结论中使用绝对化字词如“肯定”等。
5. 如何正确选取单侧或双侧检验?答:单双侧检验首先应根据专业知识来确定,同时也应该考虑所要解决问题的目的。
1. 若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;2.在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验;3.若研究者对低于或高于两种结果都关系,用双侧检验;若只关系其中一种可能,用单侧检验。
一般认为双侧检验较保守和稳妥;单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。
6. 两样本t检验的应用条件?答:条件为:两样本相互独立的;所来自的总体为正态总体;两总体方差相等。
7. 方差分析的应用条件?答:条件是:1.各样本是相互独立的随机样本,均服从正态分布; 2.相互比较的各样本的总体方差相等,即具有方差齐性。
第六单元列联表分析1. R*C表的卡方检验中,对于理论频数太小的情况应如何处理?答:处理方法:1.增加样本含量,以达到增大理论频数的目的,该方法为首先; 2.根据专业知识,删除理论频数太小的格子所对应的行或列,可能损失样本信息或随机性,慎用; 3.根据专业知识,将理论频数太小的格子所对应的行或列与性质相近的或邻列合并,使重新计算的理论频数变大,但要合并的合理; 4.改用双向无序的R*C表的Fisher确切概率法,该方法计算复杂,需要SAS软件实现。
第七单元非参数统计分析方法1•简述非参数检验的应用条件?答:条件:1•资料不符合参数统计法的应用条件或总体分布类型未知; 2.等级资料;3•个别数值偏大或某一端为不确定数如<0.01 ; 4.在资料满足参数统计的要求时,应首选参数法,以免降低检验效能。
4. 对同一资料,又出自同一研究目的,用参数统计和非参数统计所得结果不一致时,应以何种结果为准?答:两种方法各有适用的条件。
如果资料符合参数统计的要求,如满足正态、方差齐性等条件,以参数统计的结果为准;如果资料不符合参数统计的应用条件,如总体为非正态或分布类型不明确等,以非参数统计的结果为准。
第八单元回归与相关1. 试总结从样本数据判断总体回归关系是否成立的统计方法有哪些?答:用tb、tr作t检验,用F 对b作方差分析,直接查r界值表。
2. 直线相关与秩相关的区别与联系:答:二者的联系(1):两者嗦解决的应用问题相同,都可用来表示两个数值变量间关系的方向和密切程度;(2):两个相关系数都没有单位,取值在【-1,1】之间;(3):计算上用秩次作直线相关得到的就是秩相关系数数。
二者的区别:(1):资料要求不同,直线相关系数要求x、y从正态分布,秩相关可以是任意分布;(2):对于资料要求不同,二者分属于参数和非参数统计方法,所以符合分布条件时,直线相关的效率高于秩相关;(3):二者假设检验方法不同。
3. 简述直线回归和直线相关的区别与联系答:区别:(1)资料要求不同,直线回归要求Y服从正态分布,进行回归分析时成为2型回归,直线相关要求XY都服从正态分布,进行回归分析时成为2型回归;(2):应用目的不同,说明两变量的数量关系用回归分析,说明其关联用相关分析;(3):意义不同;(4):计算方法不同;(5):取值范围不同;(6):单位不同;二者联系:(1):方向一致;(2):假设检验等价;(3):用回归解释相关,回归平方和越接近总平方和,r2越接近1,说明相关性越好。
4. 经检验认为回归方程有意义,是否表明两变量间存在因果关系?答:两变量间不一定存在因果关系,直线回归定量考察应变量与自变量间的线性关系,统计学检验表明回归方程有意义,只是说明二者数量上的线性关系存在, 至于内在联系的性质尚需借助医学专业知识确定。
5. 秩相关特别适用于哪些资料?答:(1):不服从双变量正态分布而不宜作直线相关分析的资料;(2):总体分布类型未知的资料;(3):用等级表示的资料;(4):分布端点无确定数值的资料;(5):用相对数表示的资料。
第九章实验设计与调查设计1. 简述试验中对照设立的形式答:(1):空白对照是在不施加任何处理的“空白”条件下进行观察的对照;(2):实验对照是在某种与处理因素有关的实验条件下进行观察的对照;(3):标准对照是以标准值或正常值作为对照,或对照组采用的处理方法为现有标准方法或常规方法;(4):潜在对照是不专门设立对照组,而是已过去的间就结果作为对照;(5):相互对照是不专门设立对照组,各实验组之间互为对照;(6):安慰剂对照是指对照组采用一种无药理作用的物质,但其剂量或处置上不能为受试者识别,这种物质成为安慰剂。
2. 什么是随机化?随机化作用是什么?在整个实验设计和实验过程中如何实验随机化?答:随机化是使各种对比组间在大量不可控制的非研究因素的分布方面尽量保持均衡一致的重要措施,随机化保证了各对比组间的均衡可比性,也是资料统计分析时进行统计推断的前提。
随机化既机会均等,应贯穿实验设计和实施的全过程,具体体现在三方面(1)抽样随机,(2)分组随机;(3 )实验顺序随机。
3•常用的抽样方法有那些?答:(1)单纯随机抽样又称简单随机抽样,其抽样原则是使调查总体中每个观察单位被选入的概率完全相同;(2)系统抽样又称机械抽样或等距抽样,即先将调查总体中得所有观察单位排序后按样本例数分段,并从第一段随机抽取一个单位作为起始点,然后以相同间隔机械的从其他段中各抽取一个观察单位构成样本;(3)分层抽样又称类型抽样或分类抽样,即先将总体中所有观察单位按某项特征或标志划分为若干类型或组别,然后再按随机原则从每一层中抽取若干观察单位组成样本;(4)整群抽样是将总体中所有观察单位按某种属性分成若干群体,然后以“群”为初级抽样单位,从所有群体中随机抽取若干群体,由这些群体中的观察单位构成样本。