均数的抽样误差分布参数估计
- 格式:ppt
- 大小:2.44 MB
- 文档页数:25
一、名词解释抽样误差、均数的抽样误差、标准误、可信区间二、填空题1.参数估计可分为_____点估计____ 和__区间估计______ 。
2. 在抽样研究中,当样本含量趋向无穷大时,X 趋向等于__μ___,S 趋向等于__0__,t(0.05,v) 趋向等于________ 。
3、定量资料常用的假设检验方法有 t 检验 、 u 检验 、 方差分析 。
4、方差分析可用于两个或两个以上样本均数的比较,其应用时要求,(1)正态分布;(2)方差齐。
5、标准误是 均数 的标准差,与标准差的关系可用公式 n s表示。
6、假设检验时根据检验结果作出的判断, 可能发生两种错误, 第一类错误的概率为 α,第二类错误的概率为 β , 同时减少两类错误的唯一方法是 增加样本含量 。
7、t 检验的应用条件是 正态分布 和 方差齐 。
8. 配对设计差值的t 检验无效假设是 d =0 。
9、两样本比较t 检验要求资料(1) 正态分布 ;(2) 方差齐 。
10、样本量较小的二组数值变量资料进行t 检验时,要求二组资料呈 正态分布; 方差齐。
11、数值变量数据常用的参数统计方法有 t 检验、u 检验和方差分析。
三、是非题1.在假设检验中,无论是否拒绝H 0,都有可能犯错误。
( V )2.同类研究的两组资料,n 1=n 2,则标准差大的那一组 ,μ的95%可信区间范围也一定小。
( X )3.两个同类资料的t 检验,其中P 1<0.01, 0.01﹤P 2<0.05,说明前者两样本均数之差大于后者。
( X )4.均数比较的u 检验的应用条件是n 较大或n 虽小但σ已知。
(V )5.标准误越小,表示用样本均数估计总体均数的可靠性越大。
( V )6.统计的假设是对总体特征的假设,其结论是概率性的,不是绝对的肯定或否定。
( V )7.成组设计的两样本几何均数的比较;当n 足够大时,也可以用u 检验。
(V )8.在配对T 检验中,用药前数据减去用药后的数据和用药后的数据减去用药前的数据,作T 检验后的结论是相同的。
医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。
由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。
一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。
2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。
标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。
当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。
第三单元总体均数的估计和假设检验第一节均数的抽样误差与标准误1.均数的抽样误差例如:在北京市估计10岁男孩身高。
样本均数与总体均数之间的差异或样本均数之间的差异都是由于抽样引起的,称为均数的抽样误差。
影响均数的抽样误差大小的因素有两个:总体内各个个体间的变异程度;样本的含量n的大小。
与样本量的关系:S 一定,n↑,标准误↓。
2.标准误描写抽样误差大小的统计量称为标准误。
对计量资料,其计算公式为:例1、测量140名正常人的空腹血糖,得试计算标准误。
第二节t分布1.概念William Sealey GossetBorn: 13 June 1876 in Canterbury, EnglandDied: 16 Oct 1937 in Beaconsfield, England2.图形特征(1)以0为中心,左右对称;(2)形状与自由度有关,自由度越小,曲线的峰部越低,尾部越高;(3)随自由度增大逼近标准正态分布,当自由度为∞时,t分布就是标准正态分布。
3.曲线下面积特点与t临界值表t 值表(附表1)横坐标:自由度,υ。
纵坐标:概率p, 即曲线下阴影部分的面积;表中的数字:相应的 |t| 界值。
第三节总体均数的估计参数估计:用样本指标值(统计量)估计总体指标值(参数)。
统计推断的任务就是用样本信息推论总体特征。
参数估计,用样本均数估计总体均数。
1、点(值)估计(近似值)2、区间估计(近似范围)▲概念:根据样本均数,按一定的可信度计算出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间(confidence interval, CI)。
区间估计:1.当n足够大时,总体均数的区间估计:总体均数的95%的置信区间:总体均数的99%的置信区间:140名正常人的空腹血糖的95%与99%的区间估计为:(88.55-1.96×1.096,88.55+1.96×1.096)即:(86.40, 90.70)(88.55-2.58×1.096,88.55+2.58×1.096)即:(85.72,91.38)2.当n较小且总体方差未知时,总体均数的区间估计例2、测得25名1岁婴儿血红蛋白均数为123.7g/L,标准差为11.9g/L。