第三章 分类变量的统计描述 第一节 常用相对数
- 格式:ppt
- 大小:235.50 KB
- 文档页数:8
卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
《实用医学统计学与SAS应用》在线开放课程分类变量资料的统计描述1主要内容概念常用的相对数应用注意事项总结1. 概念:什么是分类变量资料?•分类变量资料又称定性资料、计数资料,它的测量或观察的结果表现为某种属性或者类别。
怎样描述分类变量资料?在医学研究中清点分类资料得到的数据被称为绝对数。
绝对数是研究某客观事物或某现象本质的基本信息,但不便于相互之间进行比较。
例如2017年5月甲小学学生手足口病发病人数为50人,而同期乙小学学生发病人数为40人,但是不能据此认为甲小学的学生手足口病发病情况比乙小学严重,因为该年两个小学的学生人数不一定相等。
因此,根据绝对数提供的资料计算相应的相对数指标,以便进行统计学描述及比较。
2.常用相对数相对数的定义相对数(relative number):两个有联系的指标之比。
医学研究中常用于描述分类资料的相对数包括率、构成比及相对比等统计指标。
(1).率率(rate )是说明某现象发生的频率或强度的指标,其计算为:k =⨯某段时间内实际发生某现象的观察单位数率同时期内可能发生某现象的观察单位数k 为比例基数,可以是100%,也可以是1000‰、100000/10万。
例1 某市2013年平均人口数为6 538 372人,其中男性年中平均人口为3 215 645,因恶性肿瘤而死亡的人数有15 783人,女性平均人口为3 322 727,因恶性肿瘤而死亡的人数有12 235人,试分析该市2013年男性以及女性的恶性肿瘤死亡的严重程度。
157********/10490.82/103215645⨯=万万12235100000/10368.22/103322727⨯=万万男性:女性:(2).构成比构成比(proportion)表示事物内部各组成部分所占的比重,常以百分数表示,因此又称为百分比。
构成比的计算方法如下:100 该事物内部某一组成部分的观察单位数构成比=%某事物内部各组成部分的观察单位总数事物中某部分的构成比大,说明事物中以该部分的频数为多。
北京大学公共卫生学院考研《762卫生综合》保分辅导课程介绍:一、适用人群:2015年报考北京大学以下专业的考研同学,需要学习此内部课程提升专业课竞争力,提升复试竞争力,超越本校本专业考生公共卫生学院:流行病与卫生统计学专业营养与食品卫生学专业劳动卫生与环境卫生专业儿少卫生与妇幼保健学专业卫生毒理学专业社会医学与卫生事业管理学专业101思想政治理论①201英语一②762 卫生综合(一):含流行病学、卫生统计学、劳动卫生与职业病学、环境卫生学、营养与食品卫生学。
另外,公共卫生硕士卫生综合的考试内容有所不同为:卫生综合(353):含公共卫生基本知识、流行病学基础、社会医学。
二、课程主讲内容:1、院校专业考研介绍:2014年北京大学公共卫生学院总体报录比约为4.5:1,各科目初试实际要求的分数单独划线,2014年分数线为英语50,政治50,专业课210.初试达到学校的复试分数线均有资格参加复试,进入复试的与录取人数比约为1.4:1,学院内专业,及校内可以进行调剂,不接受外校调剂。
公共卫生学院六大专业方向较多,就业情况良好。
具体情况视每年情况有所不同。
2、专业课资料及知识点串讲:专业课参考书有五本:①.《流行病学》作者:李立明人民卫生出版社第6版②.《卫生统计学教程》作者:王燕北京大学医学出版社 2006年版③.《职业卫生与职业医学》作者:金泰廙人民卫生出版社第6版④.《环境卫生学》作者:杨克敌人民卫生出版社第6版⑤.《营养与食品卫生学》作者:孙长颢人民卫生出版社第6版三大卫生(即职业卫生、营养与食品卫生、环境卫生)、卫生统计学、流行病学这五大部分内容是卫生综合考试中缺一不可的。
以《流行病学》为例,复习主要包括以下几部分:第一章绪论重点掌握流行病学的定义、原理、应用、研究方法和特征,了解简史和展望第二章疾病的分布重点掌握疾病的分布、疾病频率测量指标、散发、爆发和流行、大流行的定义,短期波动、长期趋势的定义,移民流行病学。
描述分类变量的相对数
分类变量(也称离散变量)是统计学中的一种变量类型,它表示的是数据集中的不同类别或类别组合。
分类变量的特点是其取值是有限且明确定义的,而且不可排序。
相对数是指对分类变量进行比较或描述时使用的指标。
常见的相对数有以下几种:
1. 频数:指数据集中某一类别的出现次数,描述了各类别的数量差异。
2. 百分比:指某一类别的频数占据整个数据集的比例。
以百分数形式表示,用于描述各类别在整体中的相对比例。
3. 比例:指某一类别的频数占据另一类别的比例。
常用于比较不同类别之间的关系。
4. 比率:指两个类别之间的比例,通常用于描述某一类别相对于另一类别的相对大小。
5. 条形图:用于可视化描述不同类别的频数或百分比,以便比较各类别之间的差异。
6. 饼图:用于可视化描述不同类别的百分比,以便比较各类别在整体中的相对比例。
相对数的使用有助于对分类变量进行描述和比较,从而更好地理解数据的分布和关系。