医学统计学名词解释概念总结
- 格式:doc
- 大小:66.50 KB
- 文档页数:8
医学统计学名词解释总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
分层抽样:先按对主要研究指标影响较大的某种特征,将总体分为若干类别再从每一层随机抽取一定数量的观察单位,合起来组成样本。
随机抽样:总体中的每一个观察单位都有同等机会进入样本。
整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。
系统抽样:又称为等间隔抽样或机械抽样。
首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r个观察单位组成样本。
抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。
调整后的率未标准化率,简称标化率,亦称调整率。
Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
1.同质:指符合研究目的所确定的纳入对象和排除对象的条件组合。
观察单位性质大致相同2.变异:同质研究对象某种效应指标测量值的波动性。
性质相同的同质对象的某个或某几个特征的差异,而使得测量结果不同,这种个体间的差异即为变异。
3.计量资料(定量数据):通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
4.计数资料(定性数据):将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
5.总体:根据研究目的确定的同质研究对象测量值的全体,其某种变量值的集合。
6.样本:从总体中随机抽取的部分观察单位,其实测值的集合。
7.参数:总体的统计指标。
8.统计量:样本的统计指标,如样本均数、标准差。
9.系统误差:大小恒定、倾向性、周期性、累加性的偏离真值。
可以通过严格的实验设计预防和技术措施消除。
10.随机误差:排除系统误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小方向不一的随机变化,客观不可避免。
11.小概率事件:P ≤0.05的随机事件称为小概率事件。
12.小概率原理:在统计学上,小概率事件在一次抽样或一次实验中当作不发生。
13.统计描述:用适当的统计统计图(表)和统计指标对原始数据的分布规律及其数量特征进行测定和描述。
14.统计推断:用样本信息推论总体特征的过程。
15.正态分布:是统计学中一种最常见、最重要的连续型变量的对称分布,中间组段频数最多,两侧对称,规律下降。
16.偏态分布:指集中位置偏向一侧,频数分布不对称。
17.标准差:表示每一个数对均值的离散程度,是绝对变异指标。
18.标准误:样本统计量的标准差。
19.95%医学参考值范围:参考值范围是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
习惯确定包括95%的人的界值即95%医学参考值范围。
20.95%可信区间:表示该区间包括总体均数的概率为95%。
21.率:说明某现象发生的频率或强度。
医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
16.方差(variance):又称均方差,反映一组数据的平均离散水平。
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
医学统计学名词解释医学统计学是一门研究医学领域中数据收集、分析和解释的科学,它广泛应用于医疗研究、临床试验和流行病学研究等领域。
以下是一些医学统计学中常用的名词解释。
1. 随机化:随机化是一种将研究对象随机分配到不同组别的方法,以减少样本偏差和实验结果的误差。
2. 试验组和对照组:在临床试验中,试验组接受新的治疗或干预措施,对照组接受已有的标准治疗或安慰剂,用于比较两种不同治疗方式的效果。
3. 双盲试验:在临床试验中,双盲试验是指研究人员和参与者都不知道所接受的治疗或干预措施是试验组还是对照组,以消除人为偏见的影响。
4. 抽样:抽样是收集研究数据的方法,通过从总体中选择一部分样本进行观察和测量,以推断总体的特征。
5. 样本量:样本量是指在研究中所使用的观察单元的数量,样本量的大小对于研究结果的可靠性和推广性具有重要影响。
6. 方差和标准差:方差是对数据分布离散程度的度量,标准差是方差的平方根,用于衡量数据的变异程度。
7. 显著性水平:显著性水平是在统计假设检验中所设定的接受或拒绝原假设的界限,通常用P值表示。
一般而言,如果P值小于设定的显著水平(通常为0.05),则拒绝原假设。
8. 效应大小:效应大小是用于衡量两组之间差异的大小,常用的度量指标包括风险比、相对危险度和绝对风险差等。
9. 相关性和因果关系:相关性是指两个变量之间存在某种关联,而因果关系则是指一个变量的改变导致另一个变量的改变,需要通过更严格的研究设计来确定因果关系。
10. 生存分析:生存分析是一种用于评估时间至事件发生的统计方法,常用于研究患者生存时间、复发概率和生存率等。
总之,医学统计学中的这些名词是为了帮助研究人员更好地理解、分析和解释医学数据,并进行科学的决策和推断。
1、总体:指所有同质观察单位某种观察值的全体。
分为有限总体和无限总体。
2、样本:是从总体中抽取部分观察单位的观测值的集合。
误差:泛指实测值与真实值之差。
统计量:根据样本算得的某些数值特征。
3参数:是关于总体的某些数值特征。
4、抽样误差:即便采用概率抽样方法抽取样本,但样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。
小概率事件原理:当某事件发生概率小于等于0.05时,统计学习惯上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不能发生。
普查:就是全面调查即调查目标总体中全部调查对象。
抽样调查:是一种非全面调查即从总体中抽取一定数量的观察单位组成样本对样本进行调查。
5、常用的概率抽样方法:单纯随机抽样、系统抽样、整群抽样、分层抽样、具体抽样。
非概率抽样方法:偶遇抽样、立意抽样、定额抽样、雪球抽样等。
6、偶遇抽样:又称便利抽样,是指研究者根据实际现实情况,使用最便利的方法来选取样本,可以抽取偶然遇到的人或选择那些距离最近的、最容易找到的人作为调查对象。
7、根据受试对象的不同,实验可分为动物实验、临床试验和现场试验三类。
8、实验设计的基本原则:对照原则、随机化原则和重复原则。
9随机化原则:是指采用随机的方式,使每个受试对象均有同等机会被抽取或分配到实验组和对照组。
10、重复原则:指在相同实验条件下进行多次实验或观察,以提高实验结果的可靠性。
重复原则主要包括:(1)对多个受试对象进行实验。
(2)对同一受试对象进行重复观测。
准确度:指观察值与真值的接近程度,主要受系统误差的影响。
精密度:指在相同条件下对同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。
灵敏度:反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应比较敏感地显示出来。
特异度:反映鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。
11、完全随机设计:是采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察各组的实验效应,是一种考察单因素两水平或多水平效应的实验设计方法。
医学统计学名词解释1.总体与样本:总体是根据研究目的确定的同质研究对象的全体。
样本是总体中具有代表性的一部分个体。
2.交叉设计:一种特殊的自身对照设计。
克服了实验前后自身对照由于观察期间各种非实验因素造成的偏倚。
即将观察对象随机分为两组,并使一组对象先接受处理方式A,再接受处理方式B;另一组先接受B,再接受A,两种处理方式在研究过程中交叉进行。
3.方差:离均差平方和与观测例数之比,反映一组数据的平均变异。
4.检验效能:1-β,也称把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
5.相对比:表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
6.参数与统计量:总体的指标称为参数,用希腊字母表示;样本的指标称为统计量,用英文字母表示。
7.抽样研究与抽样误差:抽样研究是从总体中随机抽取样本,对样本信息进行研究,从而推断总体的研究方法。
抽样误差是由随机抽样造成的样本指标和总体指标之间、样本指标和样本指标之间的差异;其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本指标直接下结论。
8.概率:概率是某随机事件发生可能性大小(或机会大小)的数值度量。
小概率事件是指P ≤0.05的随机事件。
9.统计推断:根据已知的样本信息来推断总体特征的过程称为统计推断。
10.抽样误差:由个体差异和抽样所导致的样本均数和样本均数之间、样本均数和总体均数之间的差异称为均数的抽样误差。
11.第I类错误:指检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。
其发生的概率为α,为已知。
12.第II类错误:指假设检验H0本来不成立,经过检验后被接受了,即“取伪”。
其发生概率为β,为未知。
13.区间估计:区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。
14.随机化原则:随机化原则包括随机抽样和随机分组。
随机抽样是指保证总体中的每一个个体都有同等的机会被抽出来作为样本。
1.标准化法:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成的影响。
2.总体与样本:总体是同质的个体所构成的全体。
样本是指从总体中抽取的一部分个体(或按随机化原则从总体中抽出的部分观察单位的某变量值的集合)。
3.负偏态分布:频数分布的高峰向右偏移,长尾向左侧延伸的偏态分布,称为负偏态分布。
4.计数资料与计量资料:计数资料是先将研究对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料;计量资料是对每个观察对象德观察指标用定量方法测定其数值大小所得的资料。
5.均数的标准误:由抽样而造成的样本均数与总体均数之差异称为均数的抽样误差。
6.齐同可比性:两组间除处理因素不同外,其他可能影响实验结果的因素要求基本齐同。
7.参数与统计量:总体的指标值称为参数。
样本的指标值称为统计量。
8.正偏态分布:频数分布的高峰向左偏移,长尾向右侧延伸的偏态分布,称为正偏态分布。
9.区间估计与点估计:按预先给定的的概率估计未知总体均数的可能范围称为区间估计,用样本统计量直接作为总体参数的估计值称为点估计。
10.standard error of rate:率的标准误。
由抽样而造成的样本率与总体率之差异或各样本率之差异称为率的抽样误差。
11.P值:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率。
(或拒绝H0时可能犯错误的实际概率大小)12.均数抽样误差:由抽样造成的样本均数与总体均数的差异。
13.率和构成比:构成比表示一事物内部各组成部分所占整体的比重。
率为表示某事物发生频率或强度的指标。
14.非参数检验:不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验的统计方法。
15.P值与检验水准:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率(或拒绝H0时可能犯错误的实际概率大小);检验水准是指在检验前预先人为规定的拒绝H0时可能犯错误的最大概率。
1.总体(population ):根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
描述总体特征的指标称为参数(parameter)2.样本(sample):从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。
描述样本特征的指标称为统计量(statistic)。
3.参数:4.统计量5.同质(homogeneity):指根据研究目的所确定的观察单位其性质应大致相同。
6.变异(variation):性质相同的事物,如果观察同一指标,各观察单位之间由于存在个体差异,也会使测量结果不同。
7.定量数据(quantitative data ):也称计量资料。
变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。
根据变量的取值特征可分为连续型数据和离散型数据。
8.定性数据:也称计数资料。
变量的观测值是定性的,表现为互不相容的类别或属性。
血型分为A、B、O、AB等。
9.有序数据:也称半定量数据或等级资料。
变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别,如尿糖的化验结果分为-、+、++、+++。
10.统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。
统计描述结果的表达方式主要是统计指标、统计表和统计图。
11.统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
参数估计的重要性在于可以给出区间估计;假设检验重点则是比较参数的大小。
12.集中趋势:描述一组观察值集中位置或平均水平的统计指标。
13.离散趋势14.统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的标准误(standard error of the mean)。
15.区间估计(interval estimation)是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
医学统计学名词解释1、总体:指所有同质观察单位某种观察值的全体。
分为有限总体和⽆限总体。
2、样本:是从总体中抽取部分观察单位的观测值的集合。
误差:泛指实测值与真实值之差。
统计量:根据样本算得的某些数值特征。
3参数:是关于总体的某些数值特征。
4、抽样误差:即便采⽤概率抽样⽅法抽取样本,但样本只是总体的⼀部分,这就存在着误差,统计学上将其称为抽样误差。
⼩概率事件原理:当某事件发⽣概率⼩于等于0.05时,统计学习惯上称该事件为⼩概率事件,其含义是该事件发⽣的可能性很⼩,进⽽认为它在⼀次抽样中不能发⽣。
普查:就是全⾯调查即调查⽬标总体中全部调查对象。
抽样调查:是⼀种⾮全⾯调查即从总体中抽取⼀定数量的观察单位组成样本对样本进⾏调查。
5、常⽤的概率抽样⽅法:单纯随机抽样、系统抽样、整群抽样、分层抽样、具体抽样。
⾮概率抽样⽅法:偶遇抽样、⽴意抽样、定额抽样、雪球抽样等。
6、偶遇抽样:⼜称便利抽样,是指研究者根据实际现实情况,使⽤最便利的⽅法来选取样本,可以抽取偶然遇到的⼈或选择那些距离最近的、最容易找到的⼈作为调查对象。
7、根据受试对象的不同,实验可分为动物实验、临床试验和现场试验三类。
8、实验设计的基本原则:对照原则、随机化原则和重复原则。
9随机化原则:是指采⽤随机的⽅式,使每个受试对象均有同等机会被抽取或分配到实验组和对照组。
10、重复原则:指在相同实验条件下进⾏多次实验或观察,以提⾼实验结果的可靠性。
重复原则主要包括:(1)对多个受试对象进⾏实验。
(2)对同⼀受试对象进⾏重复观测。
准确度:指观察值与真值的接近程度,主要受系统误差的影响。
精密度:指在相同条件下对同⼀指标进⾏重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。
灵敏度:反映其检出真阳性的能⼒,灵敏度⾼的指标能将处理因素的效应⽐较敏感地显⽰出来。
特异度:反映鉴别真阴性的能⼒,特异度⾼的指标不易受混杂因素的⼲扰。
11、完全随机设计:是采⽤完全随机化的⽅法将同质的受试对象分配到各处理组,然后观察各组的实验效应,是⼀种考察单因素两⽔平或多⽔平效应的实验设计⽅法。
一、名词解释:定量数据:用仪器、工具等方法获得的数据。
定性数据:按某种属性分类,然后清点每类的数据。
有序分类资料:半定性或半定量的观察结果,有大小顺序。
统计学:是收集、分析、解释与呈现数据资料的一门科学。
同质:指事物的性质、影响条件或背景相同或非常相近。
变异:指同质的个体之间的差异。
参数:总体的统计指标。
统计量:样本的统计指标。
总体:根据研究目的而确定的同质单位。
样本:从总体中随机抽取部分观察单位某变量值的集合。
变量:是观测单位的某种特征或属性,变量的观测值就是变量值。
概率:是度量随机事件发生可能性大小的数值。
分类变量:其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组然后汇总各组个数所得到的数值。
数值变量:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位,所得资料称为计量资料。
普查:就是全面调查,即调查目标总体中全部观察对象。
抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。
极差:及全距,是全部数据中最低值与最小值之差。
上下限:每个组段的起点称为该组的下限,终点称为该组的上限。
平均数:反映资料的集中趋势的指标。
几何均数:变量对数值的算术平均数的反对数。
中位数:是一个位置指标,它是将一组观察值按大小顺序排列后位次居中的数值。
百分位数:是指将观察值从小到大排列后处于第X百分位置上的数值。
方差:样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。
标准差:将方差开方即得到标准差。
变异系数:是极差和方差一样都是反映数据离散程度的绝对值。
正态分布:就是一种重要的连续型随机变量的分布类型。
率:是指某种现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比:即比例,是指事物内部某一组成部分观察单位数与同一事物各组成分的观察单位总数之比。
相对比:简称比,是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。
1、总体(population):是根据研究目的确定的同质研究对象的全体.2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标.11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数.14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学的名词解释1. 平均数:哎呀呀,平均数就是一组数据的平均值啦!就好像一家人的平均身高,把所有人的身高加起来再除以人数,这就是平均数呀!比如咱班同学这次考试的成绩,算出来的平均成绩就是平均数呢。
2. 标准差:嘿,标准差可重要啦!它就像是衡量一组数据离散程度的尺子。
比如说一堆苹果大小不一,标准差就能告诉你它们大小的差异有多大。
像不同班级的考试成绩波动情况,标准差就能体现出来呀。
3. 方差:哇塞,方差其实就是标准差的平方呀!可以理解为对数据离散程度的一种更强烈的表达。
好比不同球队比赛得分的差异情况,方差就能清楚地显示出来呢。
4. 中位数:哟呵,中位数就是按顺序排列的一组数据中居于中间位置的那个数呀!就像排队中间的那个人一样。
比如统计大家的工资水平,中位数能给你一个中间的参考呢。
5. 众数:嘿呀,众数就是一组数据中出现次数最多的那个数呀!好比大家都喜欢的一种颜色,那这个颜色就是众数嘛。
像大家都爱点的一道菜,它就是众数呀。
6. 概率:哇哦,概率就是某件事情发生的可能性大小呀!就像明天会不会下雨,有多大的概率会下。
比如抽奖中一等奖的概率,这就是概率呀。
7. 相关系数:哎呀呀,相关系数就是衡量两个变量之间关系密切程度的指标呀!就好像朋友之间关系好不好一样。
像身高和体重之间的关系,相关系数就能告诉你呢。
8. 卡方检验:嘿,卡方检验可厉害啦!它能帮我们判断两个分类变量之间有没有关系。
就像看看男生和女生对某种活动的喜好是不是不一样,卡方检验就能知道啦。
9. t 检验:哇塞,t 检验能用来比较两组数据有没有显著差异呢!好比两组病人治疗效果的对比,t 检验就能发现不同哦。
10. 回归分析:哟呵,回归分析就是找出变量之间关系的一种方法呀!就像根据天气预测农作物的产量,回归分析就能做到呢。
我的观点结论:医学统计学的这些名词真的都好重要呀,能让我们更科学地分析和理解医学数据呢!。
一名解医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。
他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。
统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。
统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:①参数估计:用样本的指标去推断总体相应的指标②假设检验:由样本的差异推断总体之间是否可能存在的差异同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。
总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别。
在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
算术均数(arithmetic mean)描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示。
几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
反映一批观察值在位次上的平均水平。
极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值范围。
四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示。
计算:标准差/均数*100%统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。
抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error)。
标准误及X s :通常将样本统计量的标准差称为标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用α表示。
II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。
检验效能:1-β称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。
率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。
计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。
构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。
比(ratio)又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。
计算公式为:A/B ,表示方式有:倍数或分数等。
非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。
参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics)秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。
秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。
直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。
回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。
相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。
二相关概念医学科研数据统计分析大致分以下4个步骤。
1.1 数据整理1.2 统计描述1.3 统计推断1.4 结果表达频数表的制作∙求全距R∙找到资料中的最大值A和最小值B∙计算全距R,∙划分组段∙确定组数∙确定组距∙确定各组段的上下限∙下限(lower limit)上限(upper limit)∙第一组段,其下限可取小于最小观察值得数∙半开半闭区间[ -- ,-- )∙画表频数分布表和频数分布图的用途∙揭示频数分布的特征∙集中趋势∙集中趋势是指一组数据向某一个位置聚集或集中的倾向。
∙离散趋势∙离散趋势反映的是一组数据的分散性和变异度,即各个数据离开集中位置的程度。
∙便于观察数据的分布类型∙正态分布∙集中趋势的指标:均数∙离散趋势的指标:标准差∙偏态分布∙集中趋势的指标:中位数∙离散趋势的指标:四分位间距标准差的意义和用途1.说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差.标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。
1.用于计算变异系数2.用于计算标准误3.结合均值与正态分布的规律,估计参考值的范围。
变异系数(coefficient of variation)适用范围1观察指标单位不同,如身高、体重——不同单位资料2均数相差悬殊变异系数的特点及相应的用途∙没有单位n 反映标准差占均数的百分比或标准差是均数的几倍n 可用来比较度量衡单位不同的资料的变异度∙不受平均水平的影响n 反映的是以均数为基数的相对变异的大小n 比较均数相差悬殊的资料的变异度变异指标小结1.极差较粗,适合于任何分布2.标准差与均数的单位相同,最常用,适合于近似正态分布3.变异系数主要用于单位不同或均数相差悬殊资料4.平均指标和变异指标分别反映资料的不同特征,常配套使用如——正态分布:均数、标准差;偏态分布:中位数、四分位间距相对数使用应注意的问题1.根据需要正确选择相对数,常见错误是以构成比代率。