2.计量资料(定量资料)的统计描述
- 格式:ppt
- 大小:808.50 KB
- 文档页数:85
①②③④⑤第一章绪论1、统计工作的基本步骤:研究设计-搜集资料-整理资料-分析资料设计是整个研究过程中最关键的一环;研究设计是统计工作的基础和关键。
统计推断包括参数估计和假设检验。
2.计量资料(定量资料):是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
其变量值是定量的,表现为数值大小,一般具有度量衡单位。
可分为离散型变量(如现有子女数、儿童龋齿数、胎次)和连续型变量(身高、体重、血红蛋白)。
计数资料(定性资料、分类资料):是把观察单位按某种属性(性质)或类别进行分组、清点各组观察单位数所得资料。
各观察数值是定性的,一般无度量衡单位。
各属性之间互不相容(只有“阴、阳”性或···)例:性别、职业、血型。
等级资料:是把观察单位按属性程度或等级顺序分组,清点各组观察单位所得资料。
医学领域的三类资料可以相互转换。
3、同质:是指所研究的观察对象具有某些相同的性质或特征。
变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。
总体:是根据研究目的确定的同质研究对象的全体(或全部同质观察单位)。
观察单位优先的总体称为有限总体;无法确定数量的总体称为无限总体。
样本:从总体中具有代表性的一部分个体。
抽样误差:由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异称为抽样误差。
抽样误差的根源在于个体变异,在抽样研究中是不可避免的。
概率(P):是随机事件发生的可能性大小的数值度量。
P=1的事件称为必然事件;P=0的事件为不可能的事件;0<P<1的事件称为随机事件;P≤0.05的随机事件称为小概率事件。
第二章计量资料的统计描述1、频数表和频数分布图的用途:①揭示计量资料的分布类型;②揭示计量资料分布的重要特征——集中趋势与离散趋势;③便于发现特大或特小的可疑值;④作为陈述资料的形式。
例数大时可以频率估计概率;⑤便于资料的进一步统计分析。
2、集中趋势:①(算数)均数:总体均数μ和样本均数x ;用于计量资料的正态分布或近似正态分布资料②几何均数G:应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。
医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。
统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。
概率为参数,频率为统计量。
4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。
不能用于开口型资料。
u(总体均数),X(样本均数)。
b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。
观察值不能为0 、不能同时有正有负。
同一资料算得的几何均数小于算术均数。
c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。
当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。
用频数表法计算百分位数时,组距不一定要相等。
P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。
计算方法为求倒数的均值后再取其倒数。
SPSS:在Transform中输入公式。
2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。
b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。