第5章 概率分布 医学统计学
- 格式:ppt
- 大小:1.85 MB
- 文档页数:75
复习:二项分布及泊松分布的特征 第五章常用概率分布——正态分布及其应用一、正态分布的概念和特征止态分布又称Gauss 分布,是--种很重要的连续型分布1. 正态分布的图形已知正态分布的方程,即可绘其图形2. 正态分布的特征(1) 正态曲线在横轴上方、均数处最高(2) 以均数为中心,左右对称。
对称轴是? (3) 正态分布山两个参数决定,即均数和标准差。
均数为位置参数,标准差为变异参数。
当标准弟恒定时,均数越人,曲线沿横轴越向右移;反之则向左移。
当均数恒定时,标准差越大,数据越分散,曲线授高点越向下・•・(4) 正态曲线下的而积分布有一定的规律。
二、标准正态分布将止态分布的方程作如下变量变换u 二(x -口)/o 即将原正态分布曲线图的原点 移到U 的位置,横轴尺度以。
为单位,就可将正态分布变换为标准正态分布N ( 0, 1 ), u 称为标准正态变量或标准正态(离)差。
⑴10,多媒体演 示正态分布的形成频数分布逐渐接近正态分布示意图10'图示参数 变化与图 形的关系10'三、正态曲线下面积的分布规律:实际工作中,常需要了解止态曲线下横轴上某一区间的而积占・总而积的百分数,以便估计该区间的例数書总例数的百分数(频数分布)或观察值落在该区间的概率。
正态曲线下一定区间的而积可以通过附表1求得。
对于正态或近似正态分布的资料,已知均数和标准差,就町对其频数分布作出概率估计。
杳附表1标准正态分布曲线下左侧尾部面积,e (u)值注意:(1)当卩、。
和xD知时,先按U二(x-u) /。
求U值,再查附表1;当》、。
未知时,分别用兀和S來估计;(2)曲线下对称于0的区间,面积相等,.••附表1只列出(-□)值。
(3)曲线下横轴上的总面积为100%或1。
正态分布Illi线下有三个区间的面积应用较多,应熟记:①标准正态分布时区间(-1,1) 或正态分布时区间(u-10, u+lo)的而积占总面积的68.27%;②标准正态分布时区间(-1.96, 1.96)或正态分布时区间(U-1.96 0, y+1.96o )的面积占总面积的95%;③标准正态分布时区间(-2.58, 2. 58)或正态分布时区间(»-2.58。
医学统计学之概率分布的概念医学统计学之概率分布的概念众所周知,统计分析可以分为描述性统计分析(descriptive statistics)和推断性统计分析 (inferential statistics)。
下面是yjbys店铺为大家带来的关于医学统计学的知识,欢迎阅读。
对于推断性统计分析来说,要抓住其本质,就必须对其背后最根本的概率分布(probability distribution)有个清楚的理解。
概率分布是很多统计推断方法的基础,最典型的例子就是正态分布,很多统计检验方法都会涉及到正态分布。
而有些统计检验则是直接建立在统计量值服从某种概率分布的基础上的,比如t检验的t值服从t分布,方差分析的F值服从F分布,卡方检验的卡方值服从卡方分布等。
因此在展开推断性统计分析或统计检验之前,先和大家一起熟悉一下概率分布。
首先简单介绍一下几个常见的概念:1、Random variable (随机变量):假设我们掷硬币,那么出现的结果有两种:正面或反面。
我们换个角度,把正面和反面的结果与数字联系起来,将结果数量化,比如我们掷10次硬币,出现5正5反。
这时我们就把掷硬币的结果(正或反)与出现正或反结果的数字联系起来了。
而随机变量就是一种function,它把每一种结果都与一个唯一的数值联系起来。
对于随机变量的定义,版本有很多,我们来看一下其中的一个定义:一个随机试验的可能结果(称为基本事件)的全体组成一个基本空间Ω 。
随机变量X是定义在基本空间Ω上的取值为实数的函数,即基本空间Ω中每一个点,也就是每个基本事件都有实轴上的点与之对应。
随机变量一般可分为离散型随机变量(discrete)和连续性随机变量(continuous)。
所谓离散型随机变量是指随机变量X的取值是有限个或可列无限个。
比如我们掷硬币,我们定义随机变量是正面的次数,那么我们掷10次,那么X的取值只能是0,1,2,3,4,5,6,7,8,9,10,这时我们就称X是个离散型随机变量。
第一章绪论第二章(一)A1型:1.下面的变量中,属于分类变量的是_____。
A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于定量变量的是_____。
A.性别 B.体重 C.血型 D.职业 E.民族3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于_____。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料4.上述资料可以进一步转换为_____。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是_____。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量_____。
A.是统计总体数据得到的量 B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7.因果关系_____。
A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型:1.教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是_____。
A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2.上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对_____而言。
A.180万儿童B.每个儿童C.所有使用索尔克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题 1.定量变量、分类变量和有序变量可以相互转换。
2.假变量可以参与计算,所以假变量是定量变量。
3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。
第四章·资料分布特征与描述统计量1.统计描述主要从哪几个方面发现和描述数据特征?统计描述可以从样本含量n,集中趋势(算术均数、几何均数、中位数),离散趋势(极差、四分位数间距、方差和标准差)以及通过绘制统计图,编制统计表来发现和描述数据特征。
2.频数表的主要用途有哪些?(1)描述频数分布的类型;(2)描述频数分布的特征;(3)便于发现一些特大或特小的可疑值;(4)便于进一步做统计分析和处理。
3.算数均数、几何均数和中位数各有什么适用条件?算术均数主要适合描述对称分布资料的集中位置;几何均数适合描述当资料呈倍数关系或对数正态分布时的集中趋势;当大部分观测值比较集中,少数观测值偏向一侧时,或资料分布情况不清楚时,或数据的最大值(最小值)无准确测量数据时,宜用中位数来表示其平均水平。
4.标准差有何用途?(1)表示变量分布的离散程度。
两组资料(总体或样本)均数相近,度量单位相同的条件下,标准差较大,说明变量值的变异度较大,即各变量值较分散(较远离均数),因而均数的代表性较差;反之标准差较小,说明变异度x 来较小,即各变量值较集中在均数周围,因而均数对各变量值的代表性较好,在用数字作统计描述时常用符号s反映均数代表性的好坏。
(2)可用来计算变异系数。
当两组资料单位不同,或单位相同,均数相差较大时,不能直接用标准差比较它们的变异程度,须用变异系数进行比较。
(3)结合均数描述正态分布的特征,并利用正态曲线下面积分布规律,来计算医学上各种生化、生理的参考值范围。
(4)在单纯随机抽样调查中,是计量资料估计样本大小的不可缺的重要依据之一。
(5)可用来计算抽样误差的大小。
5.变异系数与标准差有何异同?同:变异系数与标准差都可反映数据的变异度大小,异:标准差是一组同质数据间变异度大小的量度指标,它带有单位,因而不同单位的数据间的变异度大小不可用标准差作比较;而变异系数是一种不带单位的反映变异度大小的相对数值,因而它可对不同单位数据间的变异度大小作比较。