常用医学统计学符号
- 格式:doc
- 大小:31.50 KB
- 文档页数:1
医学统计学符号公式重点在医学统计学中,符号和公式起着至关重要的作用,用于表达和传递统计学概念、方法和结果。
了解这些符号和公式的含义和应用是医学研究和实践中必不可少的一部分。
本文将重点介绍一些常用的医学统计学符号和公式。
一、描述性统计符号1. 样本均值:用x表示,表示样本中各个观察值的平均数。
2. 总体均值:用μ表示,表示总体中各个观察值的平均数。
3. 样本标准差:用s表示,表示样本数据与其均值之间的离散程度。
4. 总体标准差:用σ表示,表示总体数据与其均值之间的离散程度。
5. 样本方差:用s^2表示,表示样本数据的离散程度。
6. 总体方差:用σ^2表示,表示总体数据的离散程度。
7. 样本协方差:用sxy表示,表示两个变量之间的关联程度。
8. 总体协方差:用σxy表示,表示两个变量之间的关联程度。
9. 样本相关系数:用r表示,表示两个变量之间的相关程度。
10. 总体相关系数:用ρ表示,表示两个变量之间的相关程度。
二、推断统计符号1. 样本容量:用n表示,表示样本中观察值的个数。
2. 总体容量:用N表示,表示总体中观察值的个数。
3. 统计量:用T表示,表示根据样本数据计算得出的用于推断总体特征的指标。
4. 标准误差:用SE表示,表示样本统计量与总体参数之间的估计误差。
5. 自由度:用df表示,表示样本数据中独立和能够随机变化的观察值的个数。
6. 置信区间:用CI表示,表示对总体参数的一个估计区间,给出了一个置信水平下的估计结果。
7. 假设检验:用H0和H1表示,分别表示原假设和备择假设。
8. 显著性水平:用α表示,表示拒绝原假设的临界点,通常设置为0.05。
9. P值:表示假设检验中拒绝原假设的概率,通常与显著性水平进行比较来进行判断。
三、统计学公式1. 样本均值的计算公式:x= (x1 + x2 + … + xn) / n2. 样本标准差的计算公式:s = sqrt((Σ(xi - x)^2) / (n - 1))3. Z分数的计算公式:Z = (x - μ) / σ4. 标准误差的计算公式:SE = s / sqrt(n)5. t分数的计算公式:t = (x - μ) / (s / sqrt(n))6. 置信区间的计算公式:CI = x ± (Z * (s / sqrt(n)))7. 相关系数的计算公式:r = Σ((xi - x) * (yi - ȳ)) / sqrt(Σ(xi - x)^2 * Σ(yi - ȳ)^2)以上是医学统计学中常用的一些符号和公式,它们在研究、分析和解释医学数据和结果时起到了重要的作用。
1.总体(p o p u l a t i o n):根据研究目的确定的同质观察单位的全体。
2.样本(s a mp l e):3.抽样(s a mp l i n g):从总体中抽取部分观察样本的过程。
4.计量资料(m e a s u r e m e n t d a t a):又称定量资料或数值变量。
观测每个观察单位某项指标大小而获得的资料。
变量值是定量的。
一般有度量单位,可分为连续型或离散型。
5.计数资料(e n u m e r a t i o n d a t a):又称定性资料或无序分类变量资料,名义变量资料。
观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
变量值是定性的,表现为互不兼容的属性或类别:●二分类:药物疗效:治愈未治愈;●多分类:人群血型分布,AB OA B互不兼容。
6.等级资料(r a n k e d d a t a):半定量资料或有序分类变量资料。
变量值具有半定量性质,表现为等级大小或属性程度。
7.同质(H o m o g e n e i t y):医学研究对象具有的某种共性。
8.变异(V a r i a t i o n):同质研究对象变量值之间的差异。
9.总体(P o p u l a t i o n):根据研究目的确定的所有同质的观察单位某项观测值的全体称为总体。
10.样本(S a m p l e):来自于总体的部分观察单位的观测值称为样本。
11.参数(P a r a m e t e r):由总体中全部观测值所计算出的反映总体特征的统计指标。
12.统计量(S t a t i s t i c):由样本观测值所计算出的反映样本特征的统计指标。
13.变量(V a r i a b l e):指观察单位的某项特征。
它能表现观察单位的变异性。
14.概率(P r o b a b i l i t y):是随机事件发生可能性大小,用P表示,其取值为[0,1]。
15.频率(F r e q u e n c y):在相同的条件下,独立地重复做n次试验,随机事件A出现m次,则比值m/n为随机事件A出现的频率。
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取部分有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差误差,指观测值与真实值、统计量与参数之间的差别。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
抽样误差主要来源于个体的变异。
医学统计学符号医学统计中的基本概念1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。
2、个体:研究的基本观察单位。
3、变量:用于观察研究对象的指标。
4、观察值:个体变量的数值。
5、资料:又称为数据,由变量的观察值构成。
¢ 变异:个体观察值之间具有的差异。
¢ 变异和同质是对统计学数据的要求!¢ 变异是统计学研究的真正对象!¢ 统计学是研究变异规律的科学!¢ 同质:个体观察值之间的变异在允许范围内。
¢ 异质:个体观察值之间的变异超出允许范围。
一、总体、抽样、样本、参数、统计量总体:同质的个体所构成的全体研究对象。
总体同时具有同质和变异两个特点。
有限总体:总体中的个体数量是有限的。
无限总体:总体中的个体数量是无限的。
¢ 样本:从总体中随机抽取的部分个体。
¢ 样本量:样本所包含的个体数目。
¢ 参数:刻画总体特征的指标。
¢ 统计量:刻画样本特征的指标。
抽样:从总体中随机抽取部分个体的过程。
抽样具有代表性、随机性、可靠性、可比性;原则:代表性:样本能充分反映总体特征。
随机性:保证总体中每个个体都有相同的几率被抽样。
随机性是代表性的保证;生活中随机性的例子(思考题);¢ 计量资料:由连续变量的观察值构成的资料。
对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位,例如年龄、身高、血糖。
¢ 计数资料:由离散变量的观察值构成的资料。
先将观察对象的观测指标按性质或类别进行分组,然后计数各组的数目所得的资料,例如性别、患病、血型。
¢ 等级分组资料:由等级变量的观测值构成的资料。
具有计数资料的特征,同时又具有半定量性质的资料,例如细菌培养阳性结果。
二、3种设计类型:完全随机设计;配对设计;配伍组设计。
三、抽样误差、概率和小概率事件¢ 抽样误差:由抽样引起的样本统计量与总体参数之间的差异。