医学统计学重点总结教学提纲
- 格式:doc
- 大小:379.50 KB
- 文档页数:7
医学统计学教学大纲一、说明(一)课程的性质与地位《医学统计学》是对运动康复与健康专业和运动人体专业的学生开设的专业选修课。
医学统计学是用统计学的原理和方法研究医学,特别是预防医学和卫生事业管理中数据的收集、整理与分析的一门应用科学。
它通过对事物数量关系的详尽描述和比较,进而认识其客观规律性,是从事卫生事业管理人员必须具备的重要工具和研究手段。
本课程将阐述数据处理的基本统计理论和方法,结合实例分析加深理解统计方法在实际工作中的正确应用;介绍卫生业务与居民健康统计的内容,运用各种分析方法和计算手段,开发统计信息资源,为卫生决策和管理提供依据。
(二)课程的作用与价值通过对本课程的学习,逐步培养学生的抽象思维能力、逻辑推理能力、空间想象能力和自学能力,特别注重培养学生的熟练运算能力和综合运用所学知识去分析解决问题的能力。
(三)授课对象、学时及学分本课程为专业选修课,授课对象为运动康复与健康专业和运动人体专业的学生,开设时间为第3学年第2学期,教学总时数为36学时,2学分。
二、教学任务和目标(一)通过对本课程的学习,为后续课程《科研方法》及学生的毕业论文打下一个良好的基础。
(二)通过对本课程的学习,培养学生的逻辑思维能力。
三、教学内容第一章绪论[ 目的要求]1 、了解医学统计学的定义。
2 、了解统计学与医学的关系。
3 、了解统计学与数学的关系。
4 、掌握统计学在医学的应用。
5 、了解医学论文中的统计。
[ 教学内容]1 、医学统计学的定义和内容。
2 、统计学与医学的关系:提供“证据”、收集“证据”和对“证据”进行科学的解释,已成为医学研究的主流。
3 、统计学在医学的应用:变异的描述、观察对比、实验性研究4 、医学论文中的统计[ 重点难点]重点:统计学在医学的应用第二章数据特征与统计描述[ 目的要求]l 、掌握计量资料的频数表的概念和编制方法。
2 、掌握频数分布的两个特征、类型及频数表的用途。
3 、掌握描述计量资料集中趋势常用的指标、意义、应用条件。
《医学统计学》复习提纲第二章 统计描述公式:几何均数(1)直接法: nn X X X G ...21=或 )lg (lg )lg ...lg lg (lg 1211nX n X X X G n ∑--=+++=(2)加权法:)lg (lg ....lg ...lg lg (lg 12122111∑∑--=++++++=f X f f f f X f X f X f G k k k中位数(median ) (1) 直接法:n 为奇数 , 2)1(+=n X M n 为偶数,)(21122++=n n X X M(2)频数表法:用于频数表资料。
∑-+=)2(L Mf nf i L M 标准差(standard deviation ): nX ∑-=2)(μσ 1)(2--=∑n X X S离均差平方和2)(∑-X X 常用SS 或l XX 表示。
∑∑∑-=-==NX X X X l SS XX 222)()(直接法: 1)(22--=∑∑n n X X S 加权法:1)(22--=∑∑∑∑f ffX fX S1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请联系实际加以说明。
率和构成比所说明的问题不同,绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。
这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。
但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。
若要比较高血压的患病率,应该计算患病率指标。
3. 应用相对数时应注意哪些问题?4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。
医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。
变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。
注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。
有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。
样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。
在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。
医学统计学(医学统计方法)教学大纲(供五年制临床医学、护理、口腔专业)前 言本大纲供五年制医学系临床医学专业、护理专业、口腔专业《医学统计学》(《医学统计方法》教学用,是对医学统计学教学提出的基本要求。
其内容可通过讲课,实习或其它方式进行教学,讲授时不一定按此顺序,可根据情况作些调整。
内容分作二级要求:第一级是学生必须掌握的内容,教师一般应于理论课讲授,亦为实习课与考试的重点。
第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。
本大纲规定教学时数为36学时,其中讲授27学时,实习9学时。
《医学统计学》是应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的重要工具。
生物医学的研究对对象是随机现象,其表现不仅受该事物本质规律的制约,同时还受偶然因素的影响,只有用医学统计学方法才能揭示被偶然因素掩盖的本质规律。
学习医学统计学方法对医学科学研究和疾病防治工作有重要意义,是医学生需掌握的基本知识。
第一章 医学统计学的基本内容一、目的和要求㈠ 掌握几个基本概念。
㈡ 熟悉统计资料的基本内容。
㈢ 熟悉统计工作的基本步骤。
㈣ 熟悉统计图和统计表基本内容二、教学内容㈠ 统计中的几个基本概念:总体、样本、变异、概率。
㈡ 统计资料的类型1、计量资料与数值变量2、计数资料与分类变量3、变量的转化㈢ 统计工作的步骤统计工作可分为设计、搜集资料、整理资料和分析资料四个步骤:1、设计2、搜集资料3、整理资料4、分析资料以上四个步骤是紧密联系,不可分割的整体,任何一步的缺陷,都会影响统计分析的结果。
㈣ 统计图和统计表1、统计表的基本结构、种类和编制统计表的注意事项。
2、统计图的概念、绘制统计图的基本要求及常用统计图的绘制方法与注意事项。
第二章 数值变量资料的统计分析第一节 数值变量的统计描述一、目的和要求㈠ 掌握平均水平指标和离散程度的计算方法和各个指标的适用条件。
㈡ 了解频数表的编制方法及用途。
护理等专业《医学统计学》教学大纲范文一、课程名称医学统计学二、教学目的和要求本课程着重培养学生具有医学统计学基本理论和实践操作技能以及医学科学研究和临床实践中数据分析、处理和应用的能力,旨在培养护理等专业学生具备以下能力:1.掌握医学统计学基本理论和方法;2.能够独立完成医学研究数据的收集、整理、分析及处理;3.能够在医学科学研究和临床实践中,发挥医学统计学方法的作用;4.具备团队协作能力,能够与医学专业人员之间合作开展工作。
三、教学内容第一章医学统计学导论1.1 医学统计学基本概念 1.2 医学统计学与生物统计学、统计学的关系 1.3 医学统计学在医学科学研究和临床实践中的应用第二章医学数据收集方法2.1 医学研究的数据要求 2.2 医学数据收集的基本方法 2.3 医学问卷设计及问卷调查方法第三章医学数据描述和分析方法3.1 医学数据的分类和描述 3.2 常用医学数据分析方法 3.3 医学数据统计学描述方法第四章医学假设检验4.1 医学假设检验基础知识 4.2 参数假设检验 4.3 非参数假设检验第五章医学统计学应用方法5.1 统计图与图表的绘制与说明 5.2 医学统计学在医学科学研究和临床实践中的应用 5.3 实验设计与样本量计算四、教学方法1.讲授。
2.互动式教学。
3.课程案例分析。
4.实验操作。
5.课外作业。
五、考核方式1.作业、小论文等平时成绩占20%。
2.期末考试占80%。
六、教材及参考书目主要教材1.何国良, 蔡世洁. 医学统计学[M]. 上海科学技术出版社, 2017.2.朱桦. 医学统计学:基础研究与实践[M]. 化学工业出版社, 2017.参考书目1.Bernstein DA, 武松译. 统计学的科学原理[M]. 人民邮电出版社, 2015.2.李姝茵, 刘凯. 生物统计学及SPSS应用[M]. 科学出版社, 2014.3.韩高林, 邵振民. 随机模型及其应用:生物统计学[M]. 科学出版社, 2016.七、教学进度安排•第一、二周:第一章医学统计学导论•第三至五周:第二章医学数据收集方法•第六周至第九周:第三章医学数据描述和分析方法•第十至十二周:第四章医学假设检验•第十三至十五周:第五章医学统计学应用方法•第十六周:期末复习注:教学进度安排仅供参考,如果遇到特殊情况可能会进行适当调整。
医学统计学教学大纲(来自网络教学平台)(供七年制用)预防医学系流行病与卫生统计学教研室2007年2月前言医学统计学是应用概率论与数理统计的原理和方法研究医学中数据的收集、整理与分析的一门应用科学,通过对大量偶然现象的研究,认识其客观规律性,是从事医学研究必须具备的重要工具和研究手段。
通过本课程教学,培养学生科学思维与推断能力,使其掌握:医学统计方法的基本理论、基本方法与技能,具备基本的医学科研设计、统计分析与评价能力,为阅读专业文献、进行科研工作打下良好的统计学基础。
本课程共126学时,其中理论72学时,实验54学时(课堂讨论9学时,统计软件应用45学时)。
理论课程内容主要包括三个部分:第一个部份是医学统计学基本概念和方法(36学时),其中包括总体和样本等基本概念、计量资料和计数资料的统计描述方法、单个样本数据的参数估计、两个或多个样本数据比较的假设检验。
第二个部份是医学科研设计(14学时),其中包括医学科研设计的意义、原则、要素、样本含量估计、抽样方法及常见的几种设计类型。
第三个部份是医用多元统计分析(22学时),其中包括多元统计分析概论、多元线性回归、多元逐步回归、判别分析、聚类分析、Logistic回归、Cox回归。
本大纲适用于七年制学生。
第一章绪论一、教学目的要求:了解医学统计学的意义、统计工作的基本步骤;熟悉资料的统计分类及几个重要分布——正态分布、二项分布、泊松分布;掌握以下基本概念:同质与变异、总体与样本、总体研究与抽样研究、误差、概率与小概率事件。
二、教学重点、难点:重点:基本概念:同质与变异、总体与样本、总体研究与抽样研究、误差、概率与小概率事件。
难点:几个重要分布——正态分布、二项分布、泊松分布。
三、教学方法:课堂讲授。
第二章计量资料的统计描述一、教学目的要求:1、了解频数分布表的编制, 并据此描述资料的频数分布特征;2、掌握各种平均数指标的计算及其适用条件,尤其是均数;3、掌握各种离散趋势指标的计算及其适用条件,尤其是标准差,熟悉标准差的意义及应用;4、掌握正态分布理论的重要应用:医学参考值范围的估计。
医学统计学教学大纲一. 引言A. 课程目的和背景B. 学习目标和预期结果二. 课程概述A. 课程描述和内容概要B. 授课方式和时间安排三. 基础知识A. 统计学基础概述1. 统计学的定义和作用2. 常用统计学术语和概念B. 医学统计学基础1. 研究设计和方法学2. 数据类型和数据收集3. 数据的整理、描述和汇总四. 描述性统计学A. 数据的图形表示1. 双变量数据的分布图2. 三个或多个变量数据的图形表示B. 数据的中心趋势1. 平均数2. 中位数3. 众数C. 数据的离散程度1. 范围2. 方差和标准差3. 百分位数D. 数据的相关性分析1. 单变量和多变量相关性2. 相关系数的计算和解释五. 推断性统计学A. 参数估计1. 点估计和区间估计2. 样本均值和总体均值的估计B. 假设检验1. 假设检验的基本原理2. 单样本均值假设检验3. 双样本均值假设检验C. 方差分析1. 单因素方差分析2. 两因素方差分析D. 非参数检验方法1. Wilcoxon秩和检验2. Mann-Whitney U检验六. 模型构建和回归分析A. 简单线性回归模型1. 回归方程的建立和解释2. 残差分析和模型诊断B. 多元线性回归模型1. 多元回归方程的建立2. 假设检验和参数估计C. Logistic回归模型1. 二分类Logistic回归的基本原理2. 多分类Logistic回归的应用七. 临床试验统计学A. 临床试验设计和估计1. 随机分组设计2. 平行设计和交叉设计3. 效应量和样本大小的计算B. 生存分析1. Kaplan-Meier生存曲线2. Cox比例风险模型八. 教学方法A. 理论讲授B. 统计软件实践C. 讨论和案例分析九. 考核方式A. 课堂测试B. 作业和小组项目C. 期末考试十. 参考书目十一. 附录A. 课程日程安排B. 课程要求和评价标准以上为医学统计学教学大纲的大致内容。
该课程将侧重于统计学的基础知识、描述性统计学和推断性统计学的应用、模型构建和回归分析、临床试验统计学等方面的教学。
医学统计学第一章、绪论1、医学统计学★★★:是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、如何学好、用好医学统计学?①进行科学的医学科研设计;②掌握资料的收集、处理方法(流行病学);③虽不要求掌握统计公式的数理推导,但必须了解其直观的意义、用途和应用条件;④对于不同类型的数据资料选择合理的统计描述和分析方法;⑤对于统计获得的结果进行合理的解读,不能将医学问题归结到纯粹的数量问题。
3、几个基本概念(1)同质和异质:①具有相同性质的事物称为同质的(homogeneous);否则称为异质的或者间杂(heterogeneous)。
②同质和异质是相对的概念。
③不同质的个体不能笼统地混在一起分析(不同年龄组的男童身高)。
(2)变异★①同质事物之间的差别称为变异(Variation);②由于观察单位通常即观察个体,变异亦称为个体变异;③就每个观察单位而言,观察指标的变异是不可预测的,或者说是随机的;④统计学是探讨变异规律并运用其规律性进行深入分析的一门学科,因此,没有变异就没有统计学。
(3)总体、个体和样本★★★总体(Population):根据研究目的所确定的同质观察单位的全体;分为有限总体(确定的时间和空间范围,如20名患者的血红蛋白含量)和无限总体(没有时间和空间的概念,如辅助疗法对肾移植病人生存时间的影响)。
个体(Individual):是构成总体的最基本观察单位。
样本(Sample):是从总体中按照一定的目的随机抽取的一部分个体。
样本含量(Sample Size):样本中包含的个体个数。
即使是有限的总体,实际研究中也不可能逐一筛查;因此,在实际工作中,从总体中随机抽取一定含量的样本,根据样本所提供的信息推断总体的特征,这是统计推断的基础。
(4)随机★随机(Random):是指机会均等,目的是保证样本对总体的代表性、可靠性。
随机抽样:有相同的机会被抽到。
医学统计学第一章 医学统计中的基本概念1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。
2 资料的类型:计量资料(数值变量),计数资料(无序分类),等变异(variation ):在同质的基础上被观察个体的差异。
级分组资料(有序分类)。
3 同质(homogeneity ):对研究指标有影响的非实验因素相同。
4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。
样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。
5 参数(parameter ):总体的设计指标称为参数。
统计量(statistic ):样本的统计指标称为统计量。
6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。
7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。
第二章 集中趋势的统计描述一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 Xnxn X X X n ∑=+⋯++=21(二)加权法(针对频数表)nfx nx f f f X k k ∑=+++= (21)二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度,血清凝集效价,细菌计数,某些物质浓度等)G=nn X X X ⋯21 为了计算方便,常改用对数的形式计算,即=G lg 1-(nX ∑lg )对于频数表资料,可用公式 G=lg1-(nx f ∑lg )三 中位数(M )和百分位数中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+(MLf f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。
百分位数:用符号X P 表示,x 即百分位公式:x P =L+(xLf f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,L f 为x P 所在组段之前各组段的累积频数第三章 变异程度的统计描述1.衡量.变异程度的指标有:极差,四分位数间距,方差,标准差,变异系数。
2.极差(range )也称全距,即观察值中最大值和最小值之差,用符号R 表示。
3.四分位数间距(quartile )用符号Q 表示,可以通过计算百分位数75P 和25P 之差得到,即Q=2575P P -,适用于偏态分布资料,特别是末端没有确定数据的资料(常与中位数一起用)。
4.方差(varience )适用于正态分布,标准差是将方差取平方根,反映一组观察值的离5.散程度,标准差小,离散程度小,均数代表性好(方差和标准差常与均数一起用)。
6.变异系数(coefficient of variation,CV )常用于度量衡单位不同或均数相差悬殊的两组资料的变异程度,其计算公式为:CV=XS%100⨯(CV 可能大于1,等于1,小于1;S 为标准差,X 为均数)7.正态分布的主要特征:1)正态分布以均值μ为中心,左右对称;2)曲线下面积集中在以均值μ为中心的部分,越远离中心,曲线越接近X 轴,曲线下面积越小;3)正态曲线下的面积分布有一定规律;4)正态分布完全由参数μ和σ决定,μ是位置参数,σ是变异参数,σ越大,表示数据分布越分散。
8.标准正态分布(standard normal distribution )是均数为0、标准差为1的正态分布,表示为N(μ,σ2)9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ σ10.医学参考值范围(reference value range )传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
习惯上是包含95%的参照总体的范围。
第四章 抽样误差与假设检验1.抽样误差(sampling error ) :在抽样的过程中由于个体差异造成的样本统计量与总体参数之间的差异。
2. 标准误 (standard error ):样本均数中用来衡量抽样误差的大小用符号σx 表示,计算公式为σ-x =nσ(标准误小于原始测量值的标准差,标准误越小说明估计越精确,因此可以用标准误表示抽样误差的大小)实际工作中标准差 σ往往未知,因而通常用样本标准差S 代替σ,求得样本均数 准误估计值S -x ,计算公式为 S -x =nS(当n →无穷,S →σ,S -x →0)3 95%的可信区间的计算:x (μ,σ2x) 1) σ已知,可信区间=-x ±1.96σx2)σ未知,n 为小样本:x ±tx v S ⋅),2/05.0(3)σ未知,n 为大样本:X S x 96.1±T 变换 μ变换N (0,1)3、t 分布曲线的形态变化与自由度v=n-1有关。
4、假设实验的基本步骤:1)建立假设和确定检验标准 包括无效假设(符号为H 0)和备择假设(符号为H 1)【H 1是在H 0成立证据不足的情况下而被接受的假设,有双侧和单侧两种情况,未作说明时,选用的均是双侧检验】 检验标准用α表示,一般取α=0.5或α=0.01. 2)选择检验方法和计算检验统计量 3)确定P 值和作出统计推断结论【结论:P>α,不拒绝H 0,差别无统计学意义,还不能认为两总体均数不等;P<α,拒绝H 0,接受H 1,差别有统计学意义,结论是两总体均数不相等】 第五章 t 检验1.t 检验的应用条件要求样本来自正态分布总体,两样本均数比较时,还要求两总体方差相同,即具有方差齐性。
2配对样本均数t检验公式:t=--dS d =nS d d-自由度:ν = 对子数 - 13 t 检验统计量u 值的计算公式:222121212121n s n s XX s X X u X X +-=-=-4.假设检验中两类错误:第一类错误(Type I Error )”弃真”原假设为真,而拒绝了它;第一类错误记为 a ,称为检验水准 第二类错误(Type II Error )”存伪”原假设为假时却接受了它;第二类错误的概率记为 b第五章 方差分析1.与前面讲过的假设检验不同的是用于比较两个或两个以上均数的差别。
2.总变异SS 总、组间变异SS 组间和组内变异SS 组内之间关系: SS 总= SS 组内+ SS 组间 ν总= ν组内+ ν组间3.第七章 相对数及其应用1.率 (rate )—— 表示某种现象发生的频率和强度,通常以百分率(%)、千分率(‰)、万分率(/万)、十万分率(/10万)表示。
率=有可能数某事物或现象发生的所际概率某事物或现象发生的实×比例基数2.构成比(constituent ratio ):表示某一事物各组成部分所占的比重或分布的情况. 构成比通常以100%为比例基数. 计算公式:构成比=观察单位总数同一事物各组成部分的位数某一组成部分的观察单×100%特点:各组成部分的构成比之和为100% 某一部分比重增大,则其它部分相应减少。
3.相对比(relative ratio )是两个有关指标之比,用以描述两者的对比水平,常用R 表示 R=A 指标/B 指标 A>B 结果多用倍数表示; A<B 结果多用百分数表示两指标互不包含,可以是相对数,绝对数,平均数,可以性质不同,不一定有相同的量纲 4.应用相对数时的注意事项:1)不要把构成比与率相混淆2)使用相对数时分母不宜过小3)注意资料的可比性4)要考虑存在抽样误差5.标准构成的选取:1)另外选取一个包含比较各组(如各地区)的有代表性的、较稳定的、数量较大的构成为标准。
如世界的、全国的、全省的数据为标准构成2)取比较各组的各层例数的合计为标准构成。
3)从比较的各组中任选其一的构成作为标准构成。
6.率的标准化的注意事项:1).标准不同得到的标化值不同,但得出的结论是一致的.2).标完全随机设计方差分析表变异来源SS ν MS F 总变异 )(或总1)(22--∑∑N S X X ij ji 1-N 组 间 (处理组间)2)(X X n i i i -∑ 1-k 组间组间νSS 组内组间MS MS 组内(误差) 组间总SS SS - k N - 组内组内νSS化后的数值不再反映实际水平,只能表明相互比较资料间的相对水平。
3).两组率各分组对应的率有明显交叉时,则不能用标准化率进行比较.4).两样本标准化率存在抽样误差。
比较两样本的标准化率应该做假设检验。
7.率的标准误(样本率为P ,总体率为π):8.正态近似法的条件:当n 足够大,且nP 和n(1-P)均大于5时,P 的分布接近正态分布,可用公式来求总体率的可信区间:(P-u 2a S P ,P+u 2a S P )第八章 χ2检验1. χ2检验常用于检验两个或多个率(或构成比)之间差别是否有统计学意义,可用于检验配对计数资料差异有无统计学意义及两种属性或特征之间是否有关系,还可做频数分布资料拟合优度检验。
2. 四格表专用公式(3对于四格表资料,通常规定为:(1)当n ≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T <5时,用四格表资料的校正公式;(3)当n <40,或T <1时,用四格表资料的Fisher 确切 概率法。
4 行×列表资料的χ2检验: 自由度:ν=(行数-1)(列数-1)5 注意事项:(1)不能有1/5的理论频数小于5,或有理论频数小于1。
(2)行×列表检验有统计学意义,并不等于任意两组之间都有统计学意义,要继续做两两比较。
(3)在实际应用中,对于行×列表资料要根据其分类类型和研究目的用恰当的检验方法,行×列表资料的卡方检验与分类变量的顺序无关。
第十章 线性相关与回归1线性相关分析(linear correlation analysis ):研究两个服从正态分布的随机变量间有无直线相关关系,关系的方向及关系的密切程度。
2 线性相关系数r 没有测量单位,其数值在-1和1之间,相关系数的绝对值 愈接近1,相关愈密切;相关系数愈接近0时,相关愈不密切。
自由度:ν=n-2 a b c dnP P Sn P P )1()1(-=-=ππσ22()ad bc nχ-=3 线性相关的步骤:1)绘制散点图2)求相关系数r3)假设检验(H 0:ρ=0)或查找b 界值表4)得出结论4 线性回归(linear regression ):用直线回归方程来描述两个变量X 和Y 数量上依存关系的一种统计分析方法。