医学统计学考试必会名词解释
- 格式:doc
- 大小:41.50 KB
- 文档页数:2
第一章总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
1.统计学( Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体( population )是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数( paramater )是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量( statistic )是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样( random sampling )是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11. 变异:在自然状态下,个体间测量结果的差异称为变异( variation )。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学期末考试--名词解释10、测定某地 107 名正常人尿铅含量(mol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。
12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。
13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。
16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。
19、正态分布是以为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。
25、正态分布的形态由决定,t 分布的形态由自由度决定。
20、正态分布和 t 分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t 界值比 u 界值大,而且自由度越小,二者相差越大。
22、计算正态分布资料 95%正常值范围的公式是 X X 1.96S ;估计总体均数 95%可信区间的公式是 X X 1.96Sx 。
26、在抽样研究中,当样本含量趋向无穷大时,X 趋向等于,Sx 趋向于 0 ,t (0.05,v) 趋向于 1.96 。
1 / 18① 选有代表性的、较稳定的、数量较大的人群做标准;② 将相互比较的各组数据合并作标准;③ 选择相互比较的各组中的一组作为标准。
一、名词解释 1、、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。
根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。
2、、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学名词解释及问答题1、总体(population ):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation ):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic ):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error ):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability ):某事件发生的可能性大小。
9、正态分布(normal distribution ):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical referenee range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(varianee ):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation ):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用b 表示。
15、标准误(standard error ):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean ):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing ):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学-名词解释1.总体和样本总体:根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体。
假想的,无时间和空间概念的,称为无限总体。
样本:从总体中随机抽取的部分个体。
2.随机抽样:总体中的每一个观察单位都有同等机会进入样本。
3. 同质:除了实验因素外影响被研究指标的非实验因素相同变异:同质事物间的差别。
由于观察单位通常即为观察个体,故变异亦称为个体变异。
4.抽样误差:由个体变异和抽样造成的统计量与参数之间的差别,称为抽样误差。
5.概率与频率频率:在 n 次随机试验中,事件 A 发生了 m 次,则比值试验的总次数发生的试验次数A==nmf称为事件A在n次试验中出现的频率。
m 称为出现的频数。
1 / 15概率:在重复试验中,事件 A 的频率,随着试验次数的不断增加将愈来愈接近一个常数 p,这个常数 p 就称为事件 A 出现的概率,记作 P(A)或P。
描述随机事件发生的可能性大小的数值,常用 P 来表示。
6.随机变量变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
7.参数和统计量 (总体)参数:描述总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
统计量:由样本所算出的统计指标或特征值。
(统计量描述样本的统计指标) 8.百分位数:是一种位置指标,以 Px表示,一个百分位数 Px 将全部观察值分为两个部分,理论上有 x%的观察值小于 Px 小,有(1-x%)的观察值大于 Px。
10.变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。
1.总体:总体(population)是根据研究目的确定的。
同质的所有观察单位某种观察值(变量值)的集合。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
2.随机抽样:(random sampling)是指按照随机化的原则,从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异(variation):在自然状态下,个体间测量结果的差异称为变异。
变异是生物医学研究领域普遍存在的现象。
4.计量资料(measurement data):对每个观察单位用定量的方法测定某项指标量的大小,一般有度量衡单位。
计数资料(count data):将观察单位按某种属性或类别分组,所得的观察单位。
其观察值是定性的,表现为互不相容的类别或属性。
等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P (A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
6. 随机误差:(random error)又称偶然误差,是指排除了系统误差后尚存的差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别统计量是在总体参数附近波动的随机变量。
7.系统误差: (systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
实用卫生统计学中经常考到的一些名词解释1. 总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
例如,研究某地区成年人的血压情况,该地区的所有成年人的血压值就构成了一个总体。
2. 样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
比如从上述某地区成年人中随机抽取的一部分人的血压值,就是一个样本。
3. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
例如,身高、体重、血压等的测量值资料。
4. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
如某班级学生的性别(男、女),某种疾病的患病情况(患病、未患病)等资料。
5. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
比如,临床疗效分为治愈、显效、好转、无效等不同等级的资料。
6. 变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。
在自然状态下,个体间测量结果存在差异是普遍现象。
7. 算术均数:描述一组数据在数量上的平均水平。
总体均数用希腊字母μ表示,样本均数用$\bar{x}$表示。
8. 几何均数:可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平,适用于对数正态分布或数据呈倍数变化的资料。
9. 中位数:将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;n 为偶数时,取位次居中的两个变量的平均值。
10. 四分位数间距:是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,用于描述偏态分布资料的分布特征,比极差稳定。
11. 方差:表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,可用来描述数据的离散趋势。
13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
医学统计学名词解释ANOV A 方差分析:,又称变异数分析或F 检验,它是一种以F 值为统计量的计量资料的假设检验方法。
它是以总方差分解为两(多)个部分方差和总自由度分解成相应各部分自由度为手段,目的在于推断两组或多组的总体均数是否相同或检验两个或者多个样本均数间的差异是否具有与统计学意义。
average 平均数:常用于描述一批观察值分布集中位置的一组统计指标,常用的有算数均数、几何均数和中位数三种。
Censored data 删失数据:规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,称为生存时间的删失数据。
complete data 完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据。
coefficient of product-moment correlation 线性相关系数:又称Peaeson 积差相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。
总体相关系数用ρ表示,样本相关系数用r 表示。
coefficient of variation CV 即变异系数:主要用于量纲不同的变量间,或均数相差较大的变量间的变异程度的比较。
Coefficient of determination 决定系数:即为复相关系数的平方,表示回归平方和回归SS 占总离均差平方和总SS 的比例。
即总回归SS 2SS R 。
用2R 可以定量评价在y 的变异中由x 变量组建立的线性回归方程所能解释的比例。
confidence interval CI 置信区间指按预先给定的概率确定的包含未知总体参数的可能范围。
确切含义是指随机变化的置信空间包含总体参数的可能性是1-a 。
homogeneity 同质:指被研究指标的影响因素相同,但在医学研究中有些影响因素往往是难以控制的甚至是未知的linear correlation 线性相关:两个随机变量X 、Y 之间呈线性趋势的关系称为线性相关,又称简单相关(simple correlation ),简称相关。
医学统计学-名词解释统计学1.医学统计学:是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。
(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素)2.同质:性质相同的事物成为同质的,否则成为异质的或间杂的。
(观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)3.变异:是指在同质的基础上各观察单位(或个体)之间的差异。
4.总体:总体是根据研究目的所确定的同质观察单位的全体。
5.样本:样本是从总体中随机抽取的部分个体。
(样本中包含的个体数称为样本含量)6.随机:即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。
(包括抽样随机、分组随机、实验顺序随机)7.统计量:由样本所算出的统计指标或特征值称为统计量。
(反映样本特性的有关指标)8.参数:总体的统计指标或特征值称为参数。
(总体参数是事物本身固有的、不变的,为常数)9.抽样误差:从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
这种在抽样研究中不可避免。
(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率:描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。
11.频率:用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。
显然有 f = m / n12.小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。
(为进行统计推断的依据)13.定量资料:以定量值表达每个观察单位的某项观察指标,如血脂,心率等。
统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
16.方差(variance):又称均方差,反映一组数据的平均离散水平。
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右x表演示样本均数。
R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。
=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。
医学统计学必考的名词解释医学统计学是一门研究医学数据收集、分析和解释的学科。
在这个领域中,有许多重要的名词需要被掌握和理解。
本文将对其中几个必考的名词进行解释,以助于读者更好地理解医学统计学的核心概念。
一、样本和总体在医学统计学中,样本和总体是两个基本的概念。
总体是指我们想要了解的整个群体,而样本是从总体中选择的一小部分个体。
通过研究样本,我们可以推断总体的特征。
样本应该是有代表性的,并且选择要符合一定的随机原则,以避免观察误差和抽样偏差。
二、建立假设在医学统计学中,我们通常需要提出一个假设来研究和探索问题。
这个假设可以是一个关于总体参数的陈述,我们可以利用样本数据来判断这个假设是否成立。
一般来说,我们提出两个对立的假设,即原假设和备择假设。
原假设通常是一个无关或无差异的假设,而备择假设则是相反的。
三、显著性水平和P值显著性水平是用来评估某个观察结果是否由于偶然误差所导致的概率。
通常情况下,我们会将显著性水平设定为0.05或0.01,代表了我们对接受原假设的程度的容忍度。
而P值则是用来衡量观察结果的统计显著性。
如果P值小于设定的显著性水平,我们就可以拒绝原假设,认为观察结果是有统计学意义的。
四、置信区间置信区间是用来估计总体参数的一种方法。
它给出了一个范围,其中包含了总体参数的真实值的可能性。
置信区间的计算通常基于样本统计量和抽样误差的大小。
一般来说,置信区间的置信水平为95%或99%,意味着在重复抽样的情况下,有95%或99%的置信区间会包含真实值。
五、回归分析回归分析是医学统计学中常用的一种分析方法。
它可以用来探索和预测两个或多个变量之间的关系。
在回归分析中,我们通过建立一个数学模型来描述因变量和自变量之间的关系,并通过拟合该模型来预测未知观测值。
回归分析可以帮助我们理解和解释变量之间的相互作用,对于研究和应用医学中的复杂问题有着重要的意义。
六、生存分析生存分析是一种特殊的统计方法,用于研究在给定时间内发生某个事件的概率。
1.总体:是根据研究目的确定的同质研究对象所有观察单位某变量的集合。
2.样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分称为样本。
3.变异:同一性质的事物,其观察值(变量值)之间的差异。
4.概率:是指某事件出现可能性大小的度量,以符号P表示。
5.医学参考值范围:又称正常值范围。
指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围6.正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
7.可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
8.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
9.标准误:表示样本均数间变异程度。
10.率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
11.可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
12.I型错误:拒绝了实际撒谎能够成立的H0,这类“弃真”的错误称为I型错误。
13.II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。
14.参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。
15.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
16.秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。
17.直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。
相关系数没有单位,取值范围是-1〈=r〈=1,r的绝对值越大表明两变量的关系越密切。
观察单位某种观察值(变量值)的集合。
这种特征称为变量。
大小所得的资料,一般用度量衡单位。
进行分组,然后计数各组该观察指标的数目所得的资料。
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素是测量仪器或方法的灵敏度。
一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),称为负偏态。
用的平均数有算术均数、几何均数及中位数。
母μ表示总体均数,用x表演示样本均数。
态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。
即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X ×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2)比较均数相差悬殊的几组资料的离散程度。
及生化指标常数,也称正常值。
波动。
称为抽样误差。
本均数的标准差称为标准误,其计算公式为。
面。
般取α=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为0.05。
H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。
组观察单位数。
等级资料又称为有序资料。
或偏低。
取值服从特定的概率分布。
X服从正态分布N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
构成比、相对比。
频率或强度,又称频率指标。
常用百分率、千分率、万分率或十万分率等表示。
比,说明事物内部各部分所占的比重。
常用百分数表示。
倍或几分之几。
两个指标可以是绝对数、相对数或平均数;或以性质相同,也可以性质不同。
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右
x表演示样本均数。
R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。
=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为
H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记
X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数
M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相
r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。