四川大学《医学统计学》复习
- 格式:ppt
- 大小:670.50 KB
- 文档页数:38
医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习大纲(一)绪论1)总体与样本总体:根据研究目的确定的同质研究对象的全体。
分为有限总体与无限总体。
样本:从总体中随机抽取的部分观察单位。
2)参数与统计量参数:总体的统计指标,用希腊字母表示。
如总体均数、标准差,分别记为μ、σ。
固定的常数。
统计量:样本的统计指标,用拉丁字母表示。
如样本均数、标准差,为X(拔)、S。
在参数附近波动的随机变量。
3)抽样误差误差:实际观察值与客观真实值之差a.系统误差在实际观测过程中,由研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。
特点:观察值有方向性、周期性。
可以通过严格的实验设计和技术措施消除b.非系统误差由研究者的偶然失误而造成。
c.随机误差排除上述误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小和方向不固定。
随机测量误差——提高操作者熟练程度可以减少这种误差。
随机抽样误差(由抽样造成的样本统计量和总体参数间的差异。
)——不可避免,但有一定的分布规律,可估计。
4)四种随机抽样方法a.单纯随机抽样——将观察单位逐一编号,然后用随机数字表、抽签或电脑等方法随机抽取部分观察单位组成样本。
为最基本的抽样方法。
b.系统抽样——按一定顺序机械地每隔若干个观察单位抽取一个观察单位以组成样本。
又称间隔抽样、机械抽样、等距抽样。
c.整群抽样——从总体中随机抽取若干个“群体”以组成样本。
这个群体可以是班级、街道社区等。
d.分层抽样——先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计上叫“层”),再从每一层内随机抽取一定数量的观察单位,以组成样本。
也即分类抽样。
误差大小排序:整群抽样>单纯随机抽样>系统抽样>分层抽样5)P ≤ 0.05(5%)或P ≤ 0.01(1%)称为:小概率事件,即某事件发生的可能性很小。
6)变量的分类a.数值变量——其变量值是定量的,表现为数值的大小,一般有度量衡单位。
——计量(定量)资料b.分类变量——其变量值是定性的,表现为互不相容的类别或属性。
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学考前复习提纲第1章绪论⼀、名解1、Statistic统计量:由样本观测值获得的统计指标称为统计量。
2、Statistics统计学:收集、分析、解释与呈现数据资料同时处理数据中变异的⼀门学科。
3、Medical statistics医学统计学:运⽤概率论和数理统计学的原理和⽅法,研究医学数据的收集、整理、分析和推断,从⽽发现医学现象的内在规律,⽤以指导医学理论和实践的学科。
4、Individual个体(观察单位observation unit):是医学研究获得数据的基本单位,也是研究者所直接⾯对的研究对象。
5、Population总体:根据研究⽬的,所有的同质的观察单位(个体)某项观测值的全体称为总体。
6、Sample样本:来⾃总体的部分观察单位的观测值称为样本。
7、Descriptive statistics统计描述:⽤统计指标、统计图表等描述资料的数量特征及其分布规律。
8、Statistics inference统计推断:指⽤样本信息推断总体特征的统计学问题,包括参数估计parameter estimation和假设检验hypothesis test两部分内容。
9、Homogeneity同质:同⼀总体中个体的性质,影响条件或背景相同或⾮常相近。
个体的同质性是构成研究总体的必备条件。
10、Variation变异:对于同质的研究对象,其变量值之间的差异称为变异。
11、Variable变量:可以测量的任何特征或属性(不同个体结果可能不同),能表现观察单位变异的某种特征。
12、Variance⽅差/均⽅mean square:13、random variable随机变量:随机实验结果的所有取值称为随机变量。
14、概率与频率:在相同的条件下,独⽴地重复n次实验(如采⽤某种药物治疗多名患者),随机实验地某⼀结果A(如有效)出现f次,则称f/n为结果A出现地频率(frequency)。
当n逐渐增⼤时,频率f/n始终在⼀个常数左右微⼩摆动,称该常数为结果A出现的概率(probability),记为P。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
《卫生统计学》第一次作业答案一、单项选择题。
本大题共40个小题,每小题2.5 分,共100.0分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.A. AB. BC. CD.DE. E2.A. AB. BC. CD.DE. E3.A. AB. BC. CD.DE. E4.A. AB. BC. CD.DA. AB. BC. CD.DE. E6.A. AB. BC. CD.DE. E7.A. AB. BC. CD.DE. E8.A. AB. BC. CD.DA. AB. BC. CD.DE. E10.统计资料的类型可以分为( )A.定量资料和等级资料B.分类资料和等级资料C.正态分布资料和离散分布的资料D.定量资料和分类资料E.二项分布资料和有序分类资料11.A. AB. BC. CD.DE. E12.A. AB. BC. CD.DE. E13.小概率事件在统计学上的含义是( )A.指的是发生概率P≤0.5的随机事件B.指一次实验或者观察中绝对不发生的事件C.在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05D.以上说法均不正确E.A和C正确14.描述定量资料集中趋势的指标有( )A.均数、几何均数、变异系数B.均数、几何均数、四分位数间距C.均数、变异系数、几何均数D.均数、四分位数间距、变异系数E.均数、几何均数、中位数15.关于频数表的说法正确的是( )A.都分为10个组段B.每一个组段必须组距相等C.从频数表中可以初步看出资料的频数分布类型D.不是连续型的资料没有办法编制频数表E.频数表中的每一个组段不一定是半开半闭的区间,可以任意指定16.关于偏态分布资料说法不正确的( )A.正偏态资料的频数分布集中位置偏向数值大的一侧B.负偏态资料的频数分布集中位置偏向数值大的一侧C.偏态分布资料频数分布左右不对称D.不宜用均数描述其集中趋势E.不宜用变异系数来描述其离散程度17.A. AB. BC. CD.DE. E18.下列关于标准差的说法中哪种是错误的( )A.对于同一个资料,其标准差一定小于均数B.标准差一定大于0C.同一个资料的标准差可能大于均数,也可能小于均数D.标准差可以用来描述正态分布资料的离散程度E.如果资料中观察值是有单位的,那么标准差一定有相同单位19.A. AB. BC. CD.DE. E20.用下列哪两个指标可以较全面地描述正态分布特征()A.均数和中位数B.中位数和方差C.均数和四分位数间距D.均数和标准差E.几何均数和标准差21.下列哪个资料适宜用几何均数来描述其集中趋势()A.偏态分布的资料B.对称分布的资料C.等比级数资料D.一端不确定的资料E.正态分布资料22.下列关于变异系数的说法,错误的是()A.与标准差一样都是用来描述资料变异程度的指标,都有单位B.可以比较计量单位不同的几组资料的离散程度C.可以比较均数相差悬殊的几组资料的离散程度D.变异系数的实质是同一个资料的标准差与均数的比值E.变异系数可以用来描述正态分布资料的变异程度23.假设将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是()B.均数和标准差均增大C.均数不变,标准差增大D.不一定E.均数和标准差均没有变化24.假设将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的是()A.均数不发生改变B.标准差将不发生改变C.均数是否变化不一定D.变异系数不发生改变E.中位数不发生改变25.A. AB. BC. CD.DE. E26.A. AB. B27.A. AB. BC. CD.DE. E28.A. AB. BC. CD.DE. E29.A. AB. BC. CD.DE. E30.A. AB. BC. CD.DE. E31.A. AB. BC. CD.DE. E32.下列关于确定正常人肺活量参考值范围说法正确的是()A.只能为单侧,并且只有上限B.只能为单侧,并且只有下限C.只能为双侧,这样才能反映全面D.单双侧都可以E.以上说法均不确切33.下列关于医学参考值范围的说法中正确的是()A.医学参考值范围是根据大部分“健康人”的某项指标制定的B.医学参考值范围的制定方法不受分布资料类型的限制C.在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题D.在制定医学参考值范围时,最好用95%范围,因为这样比较好计算A.无法制定,要制定正常值范围必须测定健康人的尿铅含量B.可以制定,应为单侧上限C.可以制定,应为单侧下限D.可以制定,但是无法确定是上侧范围还是下侧范围E.可以制定双侧95%的参考值范围35.A. AB. BC. CD.DE. E36.标准误越小,说明此次抽样所得样本均数()A.离散程度越小B.可比性越好C.可靠程度越小D.系统误差越小E.抽样误差越小37.A. AB. BC. CD.DE. E38.t分布与正态分布的关系是()C.曲线下两端5%面积对应的分位点均是±1.96D.随样本含量的增大,t分布逼近标准正态分布E.样本含量无限增大时,二者分布完全一致39.标准差与标准误的关系中,正确的是()A.二者均反映抽样误差的大小B.总体标准差不变时,增大样本例数可以减小标准误C.总体标准差增大时,总体的标准误也增大D.样本例数增大时,样本的标准差和标准误都会减小E.标准差用于计算可信区间,标准误用于计算参考值范围40.下列哪个说法是统计推断的内容()A.区间估计和点估计B.参数估计与假设检验C.统计预测和统计控制D.统计描述和统计图表E.参数估计和统计预测《卫生统计学》第二次作业答案单项选择题。