医学统计学——变量的分类与统计资料的类型
- 格式:ppt
- 大小:1.52 MB
- 文档页数:67
第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量.为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P表示.3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range):也称全距,即最大值和最小值之差,记作R;②、确定组段数和组距,组段数通常取10—15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统一定为L≤X<U,最后一组包括下限。
④、分组划记并统计频数。
医学统计学的基本内容第一章医学统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。
2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。
3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。
第二节、统计学的几个重要概念一(资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。
一般有度量衡单位,每个对象之间有量的区别。
2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。
每个对象之间没有量的差异,只有质的不同。
3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。
注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。
二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。
2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。
从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。
四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。
亦称偶然事件。
五、概率描述随机事件发生可能性大小的数值,记作,,其取值范围0?P?1,一般用小数表示。
,,0,事件不可能发生必然事件(随机事件的特例);,,1,事件必然发生;,?0,事件发生的可能性愈小;,?1,事件发生的可能性愈大六、小概率事件习惯上将,?0.05或,?0.01 的随机事件称小概率事件。
表示某事件发生的可能性很小。
七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。
实用标准文案精彩文档第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取部分有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差误差,指观测值与真实值、统计量与参数之间的差别。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
在医学统计学中,常见的资料类型包括:
人口统计学资料:这些资料描述了研究对象的人口学特征,如年龄、性别、种族、教育水平等。
人口统计学资料可用于描绘研究样本的特征,并对研究结果进行分层或亚组分析。
临床资料:这些资料来自医学临床研究,包括病人的病史、体征、症状、实验室检查结果、诊断和治疗等信息。
临床资料用于研究疾病的发病机制、治疗效果和预后等方面。
测量资料:这些资料是通过测量或观察得到的连续性变量,如身高、体重、血压、血糖水平等。
测量资料可以进行统计描述和推断性统计分析,用于评估变量之间的关联和差异。
分类资料:这些资料是通过分类或计数得到的离散变量,如性别、疾病类型、治疗组别等。
分类资料常用于描述研究对象的特征分布、计算比例和比率,以及进行卡方检验等统计分析。
存活资料:这些资料记录了患者的存活时间或事件发生时间,如生存时间、复发时间、死亡时间等。
存活资料可用于构建生存曲线、进行生存分析和风险估计等。
实验资料:这些资料来自实验设计研究,包括实验组和对照组的观察结果。
实验资料用于比较不同处理组之间的效果差异,评估干预措施的效果和安全性。
以上是医学统计学中常见的资料类型,每种类型的资料都需要适当的统计方法和分析技术来处理和解释。
根据研究目的和数据特征,选择合适的统计方法对不同类型的资料进行分析,可以为医学研究提供科学的依据和结论。
医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。
统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。
概率为参数,频率为统计量。
4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。
不能用于开口型资料。
u(总体均数),X(样本均数)。
b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。
观察值不能为0 、不能同时有正有负。
同一资料算得的几何均数小于算术均数。
c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。
当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。
用频数表法计算百分位数时,组距不一定要相等。
P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。
计算方法为求倒数的均值后再取其倒数。
SPSS:在Transform中输入公式。
2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。
b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。
医学统计学变量类型
在医学统计学中,变量可以分为两种类型:定量变量和定性变量。
1. 定量变量:也称连续变量,是指能够以数值方式度量的变量。
常见的定量变量包括身高、体重、血压、心率等。
定量变量可以进一步分为离散变量和连续变量两种类型。
- 离散变量:取有限个数的数值,例如某个地区的感染人数,人数只能是整数。
- 连续变量:取无限个数的数值,例如血压值可以是任意的实数。
2. 定性变量:也称分类变量,是指不能用数值方式度量的变量。
常见的定性变量包括性别、病种、治疗方案等。
定性变量可以进一步分为有序变量和无序变量两种类型。
- 有序变量:具有一定的顺序和等级关系,例如疾病的分期、疼痛的程度等。
- 无序变量:没有顺序和等级关系,例如患者的民族、婚姻状况等。
医学统计学中对于不同类型的变量,常采用不同的统计方法进行分析和描述。
福建中医药大学医学统计学第二章资料收集与整理主要内容资料类型资料收集与整理第一节第二节第一节资料类型•统计学中需要处理的数据统称为资料(data)。
•资料由变量及其变量值组成。
•变量(variable)表示随机现象的某种特征或属性,即研究的项目或指标。
•变量值(value of variable)又称观察值(observed value),是指变量的测定结果。
一、变量类型●变量类型的划分方法有多种●不同的划分方法产生不同的变量类型一、变量类型按取值结果分连续型变量(continuous variable)离散型变量(discrete variable)该变量的可取值为某个区间的任何数值。
数字的特点:可取小数该变量的可取值为有限个或可列无穷个。
数字的特点:正整数一、变量类型----连续型变量正常人血清铜含量(pg/L)20.216.519.923.420.021.315.516.818.917.016.119.218.116.818.414.721.917.413.018.317.422.815.617.119.918.519.523.023.217.4 19.122.421.019.516.517.817.212.415.021.1 17.718.414.915.914.916.014.221.014.218.5身高、体重、血常规、肝功能、肾功能等,各种生理生化检测指标一、变量类型----离散型变量某年甲、乙两县人口资料(人)细胞数、人口数、治疗有效例数等一、变量类型按在统计分析中所起的作用分标识变量分析变量自变量因变量协变量如编号、住院号,用于对数据进行管理一、变量类型按观察指标的性质分类定量变量分类变量无序变量,名义变量数值变量,尺度变量需用一定的仪器或尺度测量的变量有序变量,名义变量二、资料类型对应于变量按观察指标性质的分类。
计量资料(定量资料)计数资料等级资料由定量变量及其观测值组成由无序变量及其观测值组成由有序变量及其观测值组成分类资料二、资料类型资料类型特点变量类型实例计量资料(定量资料) 每个个体都能观察到一个观察指标的数值,有度量衡单位连续型或离散型,数值变量身高(cm),体重(kg),细胞数(个),人口数(人)分类资料(定性资料)无序分类资料(计数资料) 每个个体观察结果的属性或分类间无大小顺序之分。