医学统计学 重点 终极笔记
- 格式:docx
- 大小:123.61 KB
- 文档页数:11
医学统计学知识点汇总(精华)一.概论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
2,医学统计学的主要内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。
A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。
3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3,统计工作步骤:1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2)搜集材料A,搜集材料的原则及时、准确、完整B,统计资料的来源医学领域的统计资料的来源主要有三个方面。
一是统计报表,二是经常性工作记录,三是专题调查或专题实验。
C,资料贮存3)整理资料 a检查核对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的影响因素相同。
变异(variation):同质基础上的各观察单位间的差异。
变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。
变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别(男女)计数资料多分类不相容的多类属性血型(A,B,O,AB)有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。
第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。
医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。
变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。
注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。
有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。
样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。
在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。
第一章2选1总体:总体(population)是根据研究目的拟定的同质观测单位(研究对象)的全体,事实上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都可以标记者为有限总体,反之为无限总体。
总体population根据研究目的而拟定的同质观测单位的全体。
样本:从总体中随机抽取部分观测单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观测单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量反复实验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的也许性大小。
记录学根据显著性检查方法所得到的P 值反映结果真实限度,一般以P ≤ 0.05 认为有记录学意义, P ≤0.01 认为有高度记录学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观测样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观测到的(实例的) 显著性水平。
4) 表达对原假设的支持限度,是用于拟定是否应当拒绝原假设的另一种方法。
小概率原理:一个事件假如发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不也许性原理。
记录学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观测单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观测单位某项指标的大小,而获得的资料。
医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
2012 级临床五年五班 LCM勤医学统计学笔记——xxx 级临床x 年x 班整理一.绪论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
2,医学统计学的主要内容:1)统计研究设计 调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。
A :资料的搜集与整理B :常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图C : 统计推断,如参数估计和假设检验。
3)医学多元统计方法 多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic 回归与Cox 回归分析。
3,统计工作步骤:1)设计 明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2)搜集材料A , 搜集材料的原则 及时、准确、完整B , 统计资料的来源医学领域的统计资料的来源主要有三个方面。
一是统计报表,二是经常性工作记录,三是专题调查或专题实验。
C , 资料贮存3)整理资料 a 检查核对b 设计分组c 拟定整理表d 归表4)分析资料 统计分析包括统计描述和统计推断4,同质(homogeneity ):指被研究指标的影响因素相同。
变异(variation):同质基础上的各观察单位间的差异。
变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。
变量类型变量值表现实例资料类型离散型产前检查次数计量资料数值变量连续型定量测量值,有计量单位身高二分类对立的两类属性性别(男女)无序多分类不相容的多类属性血型(A,B,O,AB )计数资料分类变量有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population )根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。
医学统计学重点终极笔记Medical Statistics【Introduction】医学统计工作的内容⒈实验设计:最关键、最重要⒉收集资料:最基础[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断资料的类型⑴计量资料:定量方法测定数值大小所得的资料⑵计数资料:按性质或类别分组,然后计数⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示)变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异总体:同质的个体所构成的全体。
[同质性,大量性,差异性]样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。
样本包含的个体数目称为样本含量样本的特征:⑴代表性⑵随机性⑶可靠性*抽样的要求:代表性,随机性,可靠性,可比性完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。
可为两样本或多样本得比较,但样本含量不宜相差太大。
随机区组设计:也称配伍设计,是配对设计的扩展。
配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。
误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌握等因素,造成观察结果倾向性的偏大活偏小。
要尽量查明原因,必须克服。
⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。
譬如操作员技术、电压、环境温度的差异。
没有固定的倾向,时高时低;应采取措施加以控制。
⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。
原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。
Medical Statistics【Introduction】医学统计工作的内容⒈实验设计:最关键、最重要⒉收集资料:最基础[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断资料的类型⑴计量资料:定量方法测定数值大小所得的资料⑵计数资料:按性质或类别分组,然后计数⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示)变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异总体:同质的个体所构成的全体。
[同质性,大量性,差异性]样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。
样本包含的个体数目称为样本含量样本的特征:⑴代表性⑵随机性⑶可靠性*抽样的要求:代表性,随机性,可靠性,可比性完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。
可为两样本或多样本得比较,但样本含量不宜相差太大。
随机区组设计:也称配伍设计,是配对设计的扩展。
配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。
误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌握等因素,造成观察结果倾向性的偏大活偏小。
要尽量查明原因,必须克服。
⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。
譬如操作员技术、电压、环境温度的差异。
没有固定的倾向,时高时低;应采取措施加以控制。
⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。
原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。
医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。
医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。
以下是医学统计学知识点的一些精华汇总。
1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。
2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。
3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。
4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。
5.参数估计:常用的参数估计方法有点估计和区间估计。
点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。
6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。
常用的假设检验方法有t检验、卡方检验、方差分析等。
7.数据分析:包括描述性统计分析和推断性统计分析。
描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。
8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。
9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。
10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。
11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。
12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。
以上是医学统计学的一些精华知识点的汇总。
医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。
Medical Statistics【Introduction】医学统计工作的内容⒈实验设计:最关键、最重要⒉收集资料:最基础[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断资料的类型⑴计量资料:定量方法测定数值大小所得的资料⑵计数资料:按性质或类别分组,然后计数⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示)变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异总体:同质的个体所构成的全体。
[同质性,大量性,差异性]样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。
样本包含的个体数目称为样本含量样本的特征:⑴代表性⑵随机性⑶可靠性*抽样的要求:代表性,随机性,可靠性,可比性完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。
可为两样本或多样本得比较,但样本含量不宜相差太大。
随机区组设计:也称配伍设计,是配对设计的扩展。
配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。
误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌握等因素,造成观察结果倾向性的偏大活偏小。
要尽量查明原因,必须克服。
⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。
譬如操作员技术、电压、环境温度的差异。
没有固定的倾向,时高时低;应采取措施加以控制。
⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。
原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。
不可避免,要用统计方法进行正确分析。
概率:描写某一事件发生可能性大小的一个度量。
频率:样本实际发生率小概率事件:P<=0.05(差别有统计学意义)或P<=0.01(差别有高度统计意义)的事件变量:观察单位的某些特征变量值:观察、测定的结果【集中趋势的统计描述】频数表(计量资料):同时列出观察指标的可能取值区间及各区间的频数集中趋势:变量值的集中位置离散趋势:变量值围绕集中位置的分散情况平均数:描述一组观察值集中位置或平均水平的统计指标。
常作为一组数据的代表值用于分析或进行组间比较。
[适用条件]:对称分布或偏度不大的资料,尤其适合正态分布算术均数(X):简称均数,说明一组观察值平均水平或集中趋势(描述计量资料)几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、血清效价、细菌计数。
中位数(M):观察值按从小到大排列时,居于中心位置的数值。
n为奇数时,M=第(n+1)/2项n为偶数时,M=第n/2项和第(n/2+1)项的平均值[适用条件]:分布明显呈偏态;频数分布的一端或两端无确切值百分位数(P):在一组数据中找到一个数值Px,全部观察值的x%小于Px。
P25, P75描述资料的离散程度P2.5, P97.5规定医学95%的参考值范围【变异程度的统计描述】极差(R):即全距,观察值中最大值与最小值之差。
不适用于开口资料四分位数间距(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段观察值占总例数的25%,去掉两端含有极端数值的25%,取中间50%的数据范围即为Q 。
(适用于偏态分布&开口资料)[Q=P75 - P25] Q 越大,则数据变异越大平均偏差:各观察值偏离平均数的平均差距。
即各观察值与均数之差的绝对值之和的平均。
X X n-∑平均偏差=离均差平方和:通过取平方避免正负抵消 ()2SS X X =-∑方差:离均差平方和再取平均,分母用自由度v=n-1代替*自由度(v):在所有的n 个离均差平方项中,只有n-1个是独立的。
标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度 (反映样本值的离散程度)S =标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较100%S CV X=⨯ (百分数,可能大于1)正态分布曲线下的面积横轴:()f μσ± f=2.58, 1.96, 1, 0(居中) 对应99%, 95%, 68.3%单侧,f=2.33,1,645, 1, 0正态分布的特征均数处最高,以均数为中心,两端对称中心μ对应的f(x)最大;x 越远离μ,f(x)越趋近于0,但不会为0永远不与x 轴相交的钟型曲线有两个参数:均数——位置参数;标准差——形状(变异度)参数正态曲线下的面积分布有一定规律正态分布具有可加性标准正态分布:均数μ=0,标准差σ=1的正态分布。
转化公式:X u μσ-= ☆适用条件总结:①样本标准差 正态,对数正态②变异系数 单位不同或均数相差较大③四分位数间距 偏态医学参考范围:也称正常值范围,正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各数据的波动范围。
(习惯上是包含95%参照总体的范围)制定方法[单侧] [双侧]参考范围对应的百分位数 (Px=) 5 , 95; 1 , 99 2.5 , 97.5; 0.5 , 99.5 参考范围对应的正态分布区间(f=) 1.65; 2.33 1.96; 2.58[X fS ±]【抽样误差与假设检验】抽样误差:由抽样造成的样本均数和总体均数的差异。
是不可避免的☆中心极限定理:在样本含量n 很大(>=50)的情况下,无论原始测量变量服从什么分布,X ̅的抽样分布都近似服从正态分布N (μ,2n σ)标准误:反映样本均数间变异的标准差。
(反映样本均数间的离散程度,也反映样本均数与总体均数的差异)理论值 X σ=估计值 X S =参数估计:由样本统计量估计总体参数。
点估计:使用单一的数值直接作为总体参数的估计值。
如用X 估计相应的μ (未考虑抽样误差的影响)区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
可信度:事先给定的概率1-α(通常取0.95或0.99);计算得到的是可信区间 95%可信区间 ( 1.96X X σ-, 1.96X X σ+)假设检验:即显著性检验,是统计推断的重要内容,比较总体参数之间有无差别。
首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推断是否拒绝这一假设。
基本步骤:⑴建立假设和确定检验水准⑵选择检验方法和计算检验计量⑶确定P 值,作出统计推断无效假设:H0,指需要检验的假设,如**值治疗前后无差别即H0:μd=0通常与我们要验证的结论相反,是计算检验统计量和P值的依据备择假设:是在H0成立证据不足的情况下而被接受的假设即H1:μd≠0双侧检验:无论正或负方向的误差,若显著超出检验水准则拒绝H0单侧检验:仅在正方向或负方向误差超出规定的水准时拒绝H0P值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。
P>0.05 不显著0.01<P<=0.05 显著P<=0.01 非常显著【t检验】单样本的t检验1Xt v n==-配对样本均数t检验:受试对象依特征配对,随机分别分配到两个实验组t=两独立样本均数t检验:两总体服从正态分布,且总体方差齐方差齐性:两独立样本的总体方差2212σσ=()2211222121(1)2cn S n SSn n-+-=+-方差不齐时两样本均数的t’检验方差齐性检验211222()F1,1()Sv n v nS==-=-较大,较小(P>0.05,可认为总体方差齐)t ’检验u 检验:总体标准差已知,或样本量较大时,样本均数与总体均数的比较t 检验中的注意事项⒈样本资料必须能代表相应总体⒉t 检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验 ⒊完全随机设计的两样本均数比较,要求两组方差齐⒋对同一资料作单侧检验更容易获得显著结果⒌假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围☆假设检验中的两类错误第一类错误:当0H 为真时,拒绝0H 接受1H 。
又称假阳性错误,,阳性指两者总体参数有差异。
检验水准α是预先规定的犯错概率的最大值第二类错误:当0H 为假时,不拒绝0H 。
又称假阴性错误。
概率大小用β表示,只取单侧,一般未知。
可证,α越大β越小,α越小β越大。
增大样本含量可同时减小两类错误。
【方差分析】方差分析:将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。
条件:来自于正态分布总体,且总体方差相等的k 个样本均数的比较(k>=3)完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法。
只考虑一个处理因素总变异 T SS :n 个观测值的离均差平方和组间变异 TR SS :组内均值与总均值之差的平方和组内变异 E SS :组内各个观测值与本组内均值之差的平方和(反映各组内样本的随机波动)完全随机设计的方差分析表(自由度 )F=2t随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成m 个区组,每个区组中有k 个受试对象,再将其随机地分到k 个处理组中。
(属于无重复数据的两因素方差分析)随机区组设计的方差分析表(自由度ν)【相对数及其应用】相对数:比较分析现象间的发展关系。
把基数化作相等,便于比较*绝对数:研究事物现象的基本资料率构成比100%=⨯某一事物的观察单位数构成比同一事物各组成部分的观察单位总数相对比☆相对数使用的注意事项⒈构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和概率。
⒉分母过小时相对数不稳定⒊用以比较的资料应是同质的⒋要考虑存在的抽样误差,对总体进行推断时应作统计学检验率的标准化:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(年龄、性别、工龄、病程长短等)的影响。
标准构成:⑴选取有代表性、较稳定、数量较大的人群构成为标准⑵选择相互比较的各组例数合计为标准构成⑶从比较的各组中任选其一作为标准构成死亡率:某地某年每1000人中的死亡率年龄别死亡率:某地某年龄组每1000人口中的死亡数死因别死亡率:某年每10万人中,由于患某疾病死亡的人数死因构成:相对死亡比,某种死因引起的死亡人数占总死亡人数的百分比发病率:某一时期内特定人群中患某病新病例的频率患病率:某一时点某人群中患某病的频率(可大于100%)病死率:某期间内,某病患者因某病死亡的频率治愈率:接受治疗的病人中治愈的频率【2χ检验】2χ检验:英国统计学家Peason 提出的一种用途广泛的假设检验方法。