第2讲计量资料统计描述
- 格式:ppt
- 大小:559.00 KB
- 文档页数:62
2计量资料的统计描述指标介绍计量资料的统计描述指标是对数据集合进行概括和描述的方法,可帮助我们了解数据的分布、集中趋势和离散程度,以及可能存在的异常值。
常用的统计描述指标包括均值、中位数、众数、极差、标准差、方差、四分位数和百分位数等。
1. 均值(Mean):均值是一组数据的总和除以数据的个数。
均值可以反映数据的集中程度,但容易受到异常值的影响。
2. 中位数(Median):中位数是一组数据按大小排序后,位于中间位置的数值。
中位数可以反映数据的中间位置,不受异常值的影响。
3. 众数(Mode):众数是一组数据中出现次数最多的数值。
众数可以反映数据集中的特点。
4. 极差(Range):极差是一组数据的最大值与最小值之差。
极差可以反映数据的全面分布。
5. 标准差(Standard Deviation):标准差测量数据的离散程度。
标准差越大,数据的离散程度越大。
6. 方差(Variance):方差是标准差的平方。
方差可以反映数据的离散程度,但单位是原数据的平方。
7. 四分位数(Quartiles):四分位数将一组数据按大小排序后,分为四等分,分位点分别是Q1(25%分位点)、Q2(中位数)和Q3(75%分位点)。
四分位数可以帮助我们了解数据集的分布情况。
8. 百分位数(Percentiles):百分位数是将一组数据按大小排序后,分为100等分,每个等分对应一个百分位数。
百分位数可以帮助我们了解数据的分布情况,例如第75百分位数表示排在该位置的数据值大约有75%的数据小于它。
这些统计描述指标都是通过对数据进行运算得出的,可以帮助我们了解数据的分布情况和特点。
在实际应用中,我们可以根据具体的问题选取适当的统计描述指标进行分析,帮助我们更好地理解数据。
同时,还需要注意统计描述指标的局限性,例如均值容易受到异常值的影响,中位数和众数不能反映数据的离散程度等,因此在使用时需要结合具体情况进行综合分析。
基本统计方法第一章概论1。
总体(Population):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。
2。
参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章计量资料统计描述1. 集中趋势:均数(算术、几何)、中位数、众数2。
离散趋势:极差、四分位间距(QR=P75—P25)、标准差(或方差)、变异系数(CV)3。
正态分布特征:①X轴上方关于X=μ对称的钟形曲线;②X=μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2。
58σ的面积为99。
00%。
4. 医学参考值范围的制定方法:正态近似法:;百分位数法:P2.5-P97.5。
第三章总体均数估计和假设检验1。
抽样误差(Sampling Error):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性.2。
均数的标准误(Standard error of Mean, SEM):样本均数的标准差,计算公式:.反映样本均数间的离散程度,说明抽样误差的大小。
3。
降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S。
4。
t分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度ν,ν越小,t值越分散,t分布的峰部越矮而尾部翘得越高;③当ν逼近∞,逼近,t分布逼近u分布,故标准正态分布是t分布的特例.5. 置信区间(Confidence Interval,CI):按预先给定的概率(1—α)确定的包含总体参数的一个范围,计算公式:或。