医学统计学知识点汇总
- 格式:docx
- 大小:49.70 KB
- 文档页数:32
医学统计学1. 对定量资料进行统计描述时,如何选择适宜的指标定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平;均数个体的平均值·对称分布几何均数平均倍数取对数后对称分布中位数[位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析?调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距?居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。
¥2. 应用相对数时应注意哪些问题答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。
(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。
(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。
(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。
3. 常用统计图有哪些分别适用于什么分析目的常用统计图的适用资料及实施方法<图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图用直条的面积表示各组段的频数或频率(定量资料的分布百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系、线图半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图}双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布'用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
医学统计学知识点汇总(精华)一.概论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
2,医学统计学的主要内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。
A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。
3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3,统计工作步骤:1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2)搜集材料A,搜集材料的原则及时、准确、完整B,统计资料的来源医学领域的统计资料的来源主要有三个方面。
一是统计报表,二是经常性工作记录,三是专题调查或专题实验。
C,资料贮存3)整理资料 a检查核对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的影响因素相同。
变异(variation):同质基础上的各观察单位间的差异。
变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。
变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别(男女)计数资料多分类不相容的多类属性血型(A,B,O,AB)有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
新版医学统计学知识点归纳总结医学统计学是医学研究中不可或缺的一部分,它涉及到数据的收集、分析和解释,帮助医学工作者从大量数据中提取有价值的信息。
以下是新版医学统计学的知识点归纳总结:1. 研究设计:研究设计是统计分析的前提,包括观察性研究和实验性研究。
观察性研究如队列研究、病例对照研究,而实验性研究如随机对照试验(RCT)。
2. 数据类型:医学统计学中的数据可分为定性数据和定量数据。
定性数据如性别、血型,定量数据如血压、体重。
3. 描述性统计:描述性统计用于描述数据集的特征,包括集中趋势(均值、中位数、众数)和离散程度(方差、标准差、极差)。
4. 概率分布:在统计学中,概率分布描述了随机变量取值的概率。
常见的分布有正态分布、二项分布和泊松分布。
5. 假设检验:假设检验是统计推断的核心,用于判断样本数据是否支持某个假设。
常见的检验方法有t检验、卡方检验和F检验。
6. 置信区间:置信区间提供了一个范围,用以估计总体参数的可能值。
95%的置信区间意味着有95%的把握认为总体参数落在这个区间内。
7. 回归分析:回归分析用于研究一个或多个自变量对因变量的影响。
简单线性回归和多元线性回归是常见的回归分析方法。
8. 生存分析:生存分析关注个体生存时间的分布和相关因素,常用于肿瘤学和流行病学研究。
Kaplan-Meier估计和Cox比例风险模型是生存分析中的重要工具。
9. 诊断试验评价:诊断试验评价涉及敏感性、特异性、阳性预测值和阴性预测值等指标,用于评估诊断方法的准确性。
10. 样本量计算:样本量计算是研究设计的重要环节,它决定了研究的可行性和结果的可靠性。
样本量计算需要考虑效应大小、显著性水平和检验力。
11. 多变量分析:多变量分析用于同时考虑多个变量对结果的影响,如多元回归分析和判别分析。
12. 统计软件的应用:统计软件如SPSS、SAS和R在医学统计分析中扮演着重要角色,它们提供了数据处理和统计分析的功能。
医学统计学知识点医学统计学是一门应用统计学方法和原理,研究医学领域中数据的收集、整理、分析和解释的科学。
它为医学研究、临床实践和公共卫生决策提供了重要的工具和方法。
下面让我们来了解一些关键的医学统计学知识点。
一、数据类型在医学研究中,我们会遇到不同类型的数据。
主要包括:1、定量数据:也称为数值数据,是可以用数字进行测量和记录的数据,如身高、体重、血压等。
定量数据又可分为连续型数据(可以在一定区间内取任意值,如身高)和离散型数据(只能取整数,如白细胞计数)。
2、定性数据:也称分类数据,是按照某种属性或类别进行划分的数据,如性别(男、女)、疾病的诊断(是、否)等。
定性数据又分为无序分类数据(各类别之间没有顺序关系,如血型)和有序分类数据(各类别之间有顺序关系,如疾病的严重程度分为轻、中、重)。
二、数据的收集为了获得准确和有用的数据,我们需要遵循科学的方法进行收集。
1、抽样方法:包括简单随机抽样、系统抽样、分层抽样和整群抽样等。
简单随机抽样是从总体中随机抽取个体;系统抽样是按照一定的间隔抽取样本;分层抽样是将总体按照某些特征分层,然后从各层中抽样;整群抽样则是以群体为单位进行抽样。
2、样本量的确定:样本量的大小取决于研究的目的、总体的变异程度、研究的精度和检验效能等因素。
一般来说,样本量越大,结果的准确性越高,但研究成本也会增加。
三、数据的整理收集到数据后,需要对其进行整理,以便后续的分析。
1、频数分布:将数据按照不同的类别或区间进行分组,计算每组的频数(出现的次数)和频率(频数与总例数的比值),可以了解数据的分布特征。
2、统计图表:常用的图表有直方图、折线图、饼图等,用于直观地展示数据的分布和趋势。
四、描述性统计描述性统计是对数据的基本特征进行概括和描述。
1、集中趋势的描述:包括算术均数、中位数和众数。
算术均数适用于正态分布的数据;中位数适用于偏态分布或分布不明的数据;众数是出现次数最多的数据值。
2、离散程度的描述:常用的指标有标准差、方差和极差。
医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。
医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。
以下是医学统计学知识点的一些精华汇总。
1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。
2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。
3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。
4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。
5.参数估计:常用的参数估计方法有点估计和区间估计。
点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。
6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。
常用的假设检验方法有t检验、卡方检验、方差分析等。
7.数据分析:包括描述性统计分析和推断性统计分析。
描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。
8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。
9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。
10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。
11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。
12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。
以上是医学统计学的一些精华知识点的汇总。
医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。
(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
医学统计学知识点1.数据类型:医学研究中使用的数据包括定类数据和定量数据。
定类数据是非数值型的数据,例如性别、种族等;定量数据是数值型的数据,例如年龄、体重等。
了解数据类型是分析数据的第一步。
2.数据收集:医学研究中的数据可以通过不同的方式收集,例如问卷调查、实验研究、观察等。
在数据收集过程中,需要注意样本的选择、数据的完整性和准确性。
3.描述统计学:描述统计学包括对数据的整体特征进行描述和总结。
常用的描述统计学方法包括中心趋势度量(例如均值、中位数、众数)、离散程度度量(例如标准差、方差)和数据分布描述等。
4.推断统计学:推断统计学是从样本数据推断总体特征的一种方法。
通过推断统计学,可以根据样本数据的统计量(例如样本均值、样本比例)来推断总体参数的区间估计或假设检验。
5.假设检验:假设检验是根据样本数据对总体参数提出假设,并通过计算概率值来判断是否接受或拒绝该假设。
常用的假设检验方法包括t检验、卡方检验、方差分析等。
6.相关分析:相关分析用于研究两个或多个变量之间的关系。
常见的相关分析方法有皮尔逊相关系数、斯皮尔曼相关系数等。
相关分析可以帮助研究者了解变量之间的线性关系和方向。
7. 回归分析:回归分析用于研究因变量与自变量之间的关系,并可用于预测因变量的数值。
常用的回归分析方法有简单线性回归分析、多元线性回归分析和 logistic 回归分析等。
8. 生存分析:生存分析用于研究时间相关的数据,例如疾病患者的生存时间或事件发生的时间。
生存分析方法包括 Kaplan-Meier 曲线、Cox 比例风险模型等。
9.双盲试验和随机分组:在医学研究中,双盲试验和随机分组是常用的研究设计方法。
双盲试验是指研究中既不知道接受治疗的病人,也不知道给予治疗的医生;随机分组是指将研究对象随机分配到不同的治疗组和对照组。
10.统计软件:为了进行医学统计分析,研究者可以使用专业的统计软件,例如SPSS、SAS、R等。
医学统计学知识点汇总医学统计学是一门关于医学研究中数据收集、数据分析和推理的学科,它对医学领域的决策和实践具有重要的指导作用。
本文将对医学统计学的一些重要知识点进行汇总和介绍。
一、数据类型在医学统计学中,常见的数据类型包括定类(分类)数据和定量(数量)数据。
定类数据表示事物的属性或者类别,如性别、病情分级等;而定量数据表示具体的数量或测量结果,如年龄、血压等。
正确理解和分析数据类型对于进行准确的统计分析是至关重要的。
二、描述统计学描述统计学是对数据进行整理、总结和描述的方法和技术。
常见的描述统计学方法包括中心趋势的度量、离散程度的度量以及数据的分布形态。
1.中心趋势的度量中心趋势是指数据集中的中间位置,常用的度量包括平均值、中位数和众数。
平均值是所有观测值的总和除以观测值的个数,中位数是将数据按升序排列,找出中间位置的数值,众数是出现频率最高的数值。
2.离散程度的度量离散程度是指数据的分散程度,常用的度量包括方差、标准差和极差。
方差是观测值与平均值之差的平方的平均值,标准差是方差的平方根,极差是数据集中最大值与最小值之差。
3.数据的分布形态数据的分布形态可以通过绘制直方图和概率密度曲线来进行可视化。
直方图可以显示数据的频数分布情况,概率密度曲线可以反映数据的分布密度。
三、推论统计学推论统计学是根据样本数据对总体进行推断的方法和技术。
主要包括参数估计和假设检验两个方面。
1.参数估计参数估计是通过样本数据来估计总体参数的值。
常用的参数估计方法包括点估计和区间估计。
点估计是通过样本数据来估计总体参数的唯一值,如样本均值估计总体均值;区间估计是通过样本数据来估计总体参数的范围,如置信区间估计总体均值。
2.假设检验假设检验是用来判断总体参数是否符合某个特定的假设。
它涉及到原假设和备择假设的设定,以及根据样本数据进行统计推断的过程。
常用的假设检验方法包括t检验、卡方检验和方差分析等。
四、相关分析相关分析研究两个或多个变量之间的关系。
医学统计学知识点汇总医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。
变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量:定性变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。
可以分为有限总体和无限总体。
5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
样本代表性的前提:同质总体,足够的观察单位数,随机抽样。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。
6、概率:描述随机事件发生的可能性大小的一个度量。
若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。
统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。
频数分布有对称分布和偏态分布之分。
后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。
2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。
样本均数用x表示,总体均数用μ表示。
几何均数:适用于等比级数资料和对数呈正态分布的资料。
注意观察值中不能有零,一组观察值中不能同时有正值和负值。
中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。
3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。
全距:任何资料,一组中最大值与最小值的差。
四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。
方差和标准差:正态分布资料。
标准差表示观察值的变异度的大小。
变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。
4、标准正态分布:对正态分布的(X-μ)/σ进行u的变换,u=(X-μ)/σ,则正态分布变换为μ=0,σ=1的标准正态分布,亦称u分布。
u被称为标准正态变量或标准正态离差。
两个参数:μ是位置参数,σ是形状参数。
用N(0,1)表示标准正态分布。
常用估计医学参考值范围的方法有:(1)正态分布方法:适用于正态或近似正态分布的资料。
双侧界值:X ±u σ/2S 单侧上界:X+u σS ,或单侧下界:X-u σS (2)对数正态分布方法:适用于对数正态分布资料。
双侧界值:Lg -1(X lgx ±uσ/2S lgx )单侧上界:Lg -1(X lgx +u σS lgx ),或单侧下界:Lg -1(X lgx -u σS lgx )(3)百分位数法:用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧上界:P 2.5和P 97.5;单侧上界:P 95,或单侧下界:P 55、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。
率:说明某现象发生的频率或强度。
(病死率不等于死亡率)构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。
相对比:亦称比,是A 、B 2个有关指标之比,说明A 为B 的若干倍或百分之几。
两个指标可以性质相同,也可以性质不同。
应用相对数时的注意事项:1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验。
6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。
其基本思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具有可比性。
标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时。
通常可从下列3种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标准组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他人资料比较的标准作为标准组。
7、统计表:结构:由标题、标目、线条和数字构成。
编制统计表的要求:①标题:概括表的内容,列于表的上方居中,应注明时间和地点;②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。
横标目列于表的左侧,通常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。
③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左上角不宜用斜线。
④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别用“…”或“-”表示,数字为0者要记作“0”,不应空项,为方便核实和分析,应有合计。
80 0.842 1.28290 1.282 1.64595 1.645 1.9699 2.326 2.576⑤备注:一般不列入表内,必要时可用“*”标出,列于表下。
8、统计图:①条图:用于相互对比关系的资料;②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动的情况;④直方图:表示连续性资料的频数分布;⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。
抽样分布与参数估计抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。
1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。
常用标准误x σ反映均数抽样误差的大小;用率的标准误σp 反映率的抽样误差的大小;用Possion 计数的标准误μ反映其抽样误差的大小。
2、中心极限定理和正态分布推理:从正态分布N (μ,σ2)总体中以固定n 随机抽取样本,样本均数x 的分布仍服从正态分布,即使是从偏态分布总体中随机抽样,只要n 足够大,x 的分布也近似正态分布。
样本均数的均数仍为μ,样本均数的标准差为x σ。
样本均数的抽样误差x σ(简称标准误)是反映均数抽样误差大小的指标。
x σ =nσ 用样本均数S 作为σ的估计值,则x s =nS3、t 分布:将x 看成变量值,那么可将正态变量进行u 变换(u=x -μ/σ)后,也可将N (μ,σ2x)变换成标准正态分布N (0,1)。
常用s 作为σ的估计值,统计量为t ,此分布为t 分布。
统计量 t=xs x μ- t 曲线的形态变化与自由度v 的大小有关。
v 越小,t 值越分散,曲线越低当v=无穷大时,t 分布即为u 分布。
x 估计总体均数μ;二是区间估计,亦称可信区间。
(1)σ未知且n 小:x -t α/2,v s x <μ<x +t α/2,v s x(2)σ未知,但n 足够大,t 分布逼近u 分布:x -u α/2s x <μ<x +u α/2s x (3)σ已知:x -u α/2σx <μ<x +u α/2σx标准差和标准误的比较标准差标准误 S=1)(2--∑n x x x s =ns表示观察值的变异程度大小估计均数的抽样误差大小计算变异系数CV=?xs100% 估计总体均数可信区间x -t α/2,v s x <μ<x +t α/2,v s x确定医学参考值的范围进行假设检验计算标准误数值变量资料的假设检验1、假设检验的原理:假设在一次抽样研究中得出了u ≥1.96,则P ≤0.05,此为小概率事件,依据“小概率事件在一次随机试验中认为是不可能发生的”的定理,可认为此样本不是来自该总体。
2、步骤:①建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假设,记为H 0,假设样本所代表的总体参数与已知总体参数相等;另一种是备择假设,记为H 1,是与H 0相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝H 0,也是允许犯Ⅰ型错误的概率,通常用0.05。
②选定检验方法和计算统计量③确定P 值,做出推断结论。
P 值是指从H 0所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率。
3、t 检验:适用于:①样本均数与总体均数比较(σ未知且n <50或n <30);②成组设计的两小样本均数的比较(n 1,n 2均小于30或50);③配对设计的两样本均数比较。
应用条件:①当样本含量较小(n <50或n <30)时,要求样本来自正态分布总体;②用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。
4、单样本t 检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体均数μ与已知总体均数μ0有无差别。
统计量t=n/s 0μ-x v=n-15、配对t 检验:用于配对设计资料的两均数的比较。
其研究目的是推断某种处理有无作用,或两种处理的效果有无差别。
配对设计类型有3种:①先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同的处理组;②同一对象分别接受2种不同处理;③同一对象处理前后。
t= n/s d d (d 是差值的样本均数)v=n-16、两样本t 检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。
t=2121x x S x x --=)11(21221n n s x x c +-=)11(2)1()1(212122212121n n n n n s n s x x +-+-+-- v=n 1+n 2-27、单样本u 检验:用于样本均数与已知总体均数比较,其研究目的同t 检验。
研究目的是推断样本所代表的总体均数μ与已知总体均数μ0有无差别。
其统计量 u=n/s 0μ-x8、两样本的u 检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。
其统计量为: u=2121x x s x x --=22212121//n s n s x x +-9、正态性检验和方差齐性检验:资料在做假设检验之前首先应该检验资料是否来自正态总体,并且它们的方差是否齐。
10、两类错误:Ⅰ型错误:拒绝了实际上成立的H 0,即样本来自μ=μ0的总体,由于抽样的偶然性,按α=0.05检验水准拒绝了H 0,接受H 1。