医学统计学总复习资料
- 格式:ppt
- 大小:247.50 KB
- 文档页数:88
方差由Y 及 b (x - x)的方差两部分构成个体Yi 值的范围预测
直线回归方程的应用
描述两变量的依存数量关系
利用回归方程进行预测
利用回归方程进行控制
第二直线相关 ( linear correlation )
;
()0.5,
()0.5, 对比组,
(RR)无单位,比值范围在0至∞之间。
表明暴露与疾病无联系;
表明存在负联系(提示暴露是保护因子);
消除更多因素(如大于3个)的影响:
分层分析受到限制,因为很多层可能没有病例,这时通常可使用COX回归模型
期望人数?即根据两种疗法疗效相同的假设,由总死亡人数计算出的两种疗法在该日的期望死亡人数。
1.生存率分析的概念,特点(与其它统计分析比较),适用范围。
生存分析:是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。
医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤1、设计: 这是关键的一步。
要求科学、周密、简明。
2、搜集资料: 要求完整、准确、及时。
医学统计资料的来源主要有三个方面:(1) 统计报表; (2) 日常医疗工作的原始记录和报告卡片; (3) 专题调查3、整理资料: 核查资料; 按性质或数量分组, 拟定整理表。
4、分析资料: 包括指标的计算、统计图表的绘制, 用统计方法如参数估计、假设检验等对资料作统计分析。
医学统计复习资料
以下是一些医学统计学的复习资料:
1. 《医学统计学》(作者:杨晓丽、徐菲、马健等)
这是一本医学统计学的教材,内容全面,包含了医学统计学的基本概念、方法和应用等方面的知识。
2. 《医学统计学与SPSS应用》(作者:陈建华、李晓红、刘静等)
这本书介绍了医学统计学的基本概念和原理,并详细介绍了如何使用SPSS 软件进行医学统计分析。
3. 《医学统计学与临床研究设计》(作者:王伟)
这本书主要介绍了医学统计学在临床研究设计中的应用,包括研究设计的选择、样本量计算、数据收集和分析等方面的内容。
4. 《医学统计学》(作者:梁家全)
这本书详细介绍了医学统计学的基本概念和方法,包括描述统计学、推断统计学、生存分析和回归分析等方面的内容。
此外,还可以参考一些医学统计学的课件和教学视频,如Coursera上的《医学统计学》课程和YouTube上的《医学统计学基础》系列视频等。
同时,还可以参加一些医学统计学的培训班或研讨会,与专业人士交流学习经验和方法。
医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。
本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。
一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。
例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。
1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。
而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。
假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。
在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。
二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。
正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。
常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。
2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。
t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。
在医学研究中,常用t分布来进行样本均值的假设检验。
非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。
与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。
常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。
三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。
通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。
复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数-—刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量—-刻画样本特征的统计指标.抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0。
052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图—-判断分布类型——(2)描述离散趋势的统计指标:✓极差R=最大值—最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型-—正态分布-—*双侧95%参考值范围:±1.96S、单侧95%参考值范围:下限为—1。
64S、上限为+1。
医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
统计学复习要点-医学总体率的估计(二项分布):(1)查表法:当样本含量n ≤50,特别是p 很接近于0或1时,按二项分布原理估计总体率的可信区间,可根据样本含量n 和阳性例数X 乾地查表查出总体率的可信区间。
(2)近态近似法:当样本含量n 足够大,且np>5且n(1-p)>5,样本率p 的抽样分布近似正态分布,总体率的可信区间),(2/2/p p S u p S up αα+-已知:n=,p= =-=np p s p )1( np=?>5 n(1-p)=?>5总体率的可信区间)96.1,96.1(pp S p S p +- 实际准备的药物:求出的上下限分别乘以总n 。
正态分布、二项式和泊松分布的关系:二项分布(binomial distribution ):对只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
Poisson 分布是在π很小,样本含量n 趋于无穷大时,二项分布的极限形式。
当v=∞时,t 分布即为u 分布,趋向正态分布。
正态分布的特征:正态曲线在横轴上方均数处最高;以均数为中心,左右对称;正态分布有两个参数,即均数μ(位置参数)和标准差σ(形状参数),μ越大,曲线沿横轴越向右移动;σ越大,曲张越平阔;正态分布在±1σ处各有个拐点;正态曲线下的面积分布有一定的规律。
t 分布的特征:以0为中心,左右两侧对称的单峰型分布;t 分布曲线的变化与自由度的大小有关,自由度v 越小,则t 值越分散,曲线越低平;自由度v 逐渐增大时,则t 分布逐渐逼近正态分布。
当v=∞时,t 分布即为u 分布。
X s X t/)(μ-= n s s X /= 标准正态分布(u 分布)与t 分布有何异同?答:相同点:t 分布和标准正态分布(u 分布)都是以0为中心的正态分布。
标准正态分布是t 分布的特例(自由度是无限大时)。
不同点:t 分布为抽样分布,u 分布为理论分布;t 分布比标准正态分布的峰值低,且尾部翘得更高;t 分布受自由度大小的影响,随着自由度的增大,逐渐趋近于标准正态分布;t 分布有无数条曲线,而u 分布只有唯一一条曲线。
第一章绪论1.下列关于概率的说法,错误的是A. 通常用P表示B. 大小在0%及100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.下列有关个人基本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.下列关于总体与样本的说法,不正确的是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体与有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有成都市居民C. 2007年所有成都市居民D. 2007年成都市居民中的糖尿病患者E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的答:研究人员通常需要了解与研究某一类个体,这个类就是总体。
一、统计学(statistics) ---是搜集资料、整理资料、分析资料,并且据此作出决策的一门学科。
医学统计学(medical statistics) --- 是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理、分析,并且作出决策。
从而掌握事物内在客观规律的一门学科。
二、医学统计工作可分为四个步骤:1、统计设计(第一步也是关键一步);2、搜集资料(资料来源:统计报表,医疗卫生工作记录,专题调查或实验研究);3、整理资料(审核,分组,汇总);4、分析资料(统计描述,统计推断)。
三、频数分布图的步骤,用途:步骤:1、计算全距;2、确定组距;3、划分组段;4、统计频数;5、频率与累计频率。
用途:①反映频数分布的类型。
②描述频数分布的特征。
③便于发现极端值:如极大值、或极小值。
④便于进一步进行统计分析。
四、集中趋势与离散趋势的概念、特点及应用条件:集中趋势:反映一组数据的平均水平的指标。
(1)算术均数:应用条件:①正态分布的数据;②对称分布的数据。
(2)几何均数:适用条件:对于变量值呈倍数关系或呈对数正态分布。
(3)中位数:应用条件:①偏态分布②分布不明③有极端值④有开口的资料。
特点:不受极端值影响。
(4)百分位数:应用条件:①描述一组资料在某百分位置上的水平;②用于确定正常值范围;③计算四分位数间距。
(5)众数:一组观察值中出现次数最多的那个数值,可以没有也可以不止一个。
离散趋势:反映一组数据离散或分散的水平的指标。
(1)极差:全距=最大值-最小值。
优点:计算简单方便,应用广范,容易理解。
缺点:只反映两端数据最大最小值的差别,易受极端值的影响,不能反映组内其他变量离散情况。
(2)四分位数间距:Q=P75-P25。
优点:不受极端值影响,比极差R 稳定。
缺点:计算繁琐、不易理解、只反映中间50%的数据的两端的差值(3)方差的特点:①充分反映了每一个数据与平均数的差别;② S2指标很稳定;③S2应用广泛;④S2计算比较麻烦;⑤S2单位是原单位的平方,在实际应用时不太方便。