(卫生统计学)第5章 参数估计基础2-1
- 格式:ppt
- 大小:890.50 KB
- 文档页数:68
第五章参数估计基础[教学要求]了解:通过电脑实验了解抽样分布及t分布的特征,了解查表法估计总体概率的置信区间。
熟悉:理解抽样误差的概念;熟悉标准误的意义及其应用。
掌握:会计算均数及频率的标准误;掌握总体均数95%和99%置信区间的计算及适用条件;掌握正态近似法计算总体概率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。
[重点难点]第一节抽样误差与标准误一、均数(频率)的抽样分布及抽样误差基本概念:在同一总体中反复多次随机抽取样本含量相同的若干样本,由于个体差异与偶然性的影响,样本统计量之间以及样本统计量与总体参数之间的差异,称为抽样误差。
这种由抽样造成的均数之间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。
特点:从正态分布N(μ,σ2)总体中抽样,样本均数X仍服从正态分布;从非正态分布总体抽样,只要样本量足够大(n≥ 50),样本均数的分布也近似于正态分布。
在抽样研究中,抽样误差是不可避免的。
用来表示抽样误差大小的指标称为标准误。
二、标准误(一)均数标准误意义:均数标准误用符号σ表示,也称样本均数的标准差。
它反映了样X本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。
计算:可按公式X σ=计算。
在实际应用中,总体标准差σ 常常未知,需要用样本标准差s 来估计。
此时,均数标准误的估计值为 nS S x =。
由此式可见,若增加样本含量n 可以减小样本均数的抽样误差。
主要应用:①估计总体均数的置信区间;②均数的假设检验。
在指标的意义、计算及结果解释方面注意与标准差区别,不能将两者混淆。
(二) 频率的标准误意义:频率的标准误用符号σp 表示,它反映了样本频率与样本频率之间、样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
计算:可按公式 σp 计算。
在实际应用中,总体概率π 常常未知,需要用样本频率p 作为总体概率 π 的估计值 ,因此频率的标准误的估计值为 np p n p p S p )1(1)1(-≈--=。
统计学第五章参数估计目录2第五章参数估计3第一节统计推断的基本问题、概念和原理3一、简单随机抽样和抽样误差6二、统计量及其抽样分布8三、参数估计的主要内容9第二节总体参数的点估计9一、矩估计10二、极大似然估计11三、点估计的评价标准12第三节正态总体均值的区间估计12一、总体参数的区间估计的概念和基本思想13二、单正态总体均值的区间估计17三、两正态总体均值之差的区间估计19*四、单侧区间估计问题21第四节一般总体均值和成数的大样本区间估计21一、非正态总体均值的大样本区间估计22二、总体成数(比例)的大样本区间估计24*三、单侧区间估计25*第五节正态总体方差的区间估计25一、单正态总体方差的区间估计26二、两正态总体方差之比的区间估计28第六节样本容量的确定28一、总体均值估计的必要样本容量29二、总体成数估计的必要样本容量30三、影响必要样本容量的因素31英文摘要和关键词32习题第五章参数估计通过本章的学习,我们应该知道:统计推断的基本问题、概念与原理参数点估计的方法与评价正态总体均值、方差的区间估计一般总体的均值、成数的区间估计参数估计所需的样本容量的确定统计抽样推断是统计学研究的重要内容,它包括两大核心内容:参数估计(Parameter Estimation)和假设检验(Hypothesis Testing)。
两者都是根据样本资料,运用科学的统计理论和方法对总体的参数进行推断;参数估计对所要研究的总体参数,进行合乎数理逻辑的推断;假设检验对提出的关于总体或总体参数的某个陈述进行检验,判断真伪。
2005年中国消费者协会的主题是“健康·维权”。
想象你是中国消费者协会的官员,负责治理缺斤少两的不法行为。
假如你知道可口可乐公司,他们生产的一种瓶装雪碧,包装上标明其净含量是500ml,在市场上随机抽取了25瓶,测得到其平均含量为499.5ml,标准差为2.63ml。
你拿着这些数据可能做两件事:一是你做一个估计:该种包装的雪碧平均含量在498.03-500.97ml之间,然后向消协写份报告;二是你做一个裁决:说“可口可乐公司有欺骗消费者的行为”的证据不足。
第五章 参数估计基础【内容精要】1. 抽样误差的概念及其特点(重点)从同一总体中反复多次地随机抽取样本含量相同的若干份样本,由于受个体差异和偶然性的影响,样本统计量与总体参数之间可存在差异,这种差异称为抽样误差(sampling error)。
从同一总体中随机抽取样本含量相同的若干份样本,所得样本统计量之间也不尽相同,这也是抽样误差的表现。
在抽样研究中,抽样误差是不可避免的。
反映抽样误差大小的指标是标准误。
增加样本含量可以降低抽样误差。
2. 均数的标准误与频率的标准误(重点)样本均数的标准差称为均数的标准误(standard error of mean ,SEM 或SE),用于反映均数抽样误差的大小。
其计算公式为nX σσ=。
实际应用中,总体标准差σ常常未知,需要用样本标准差S 来估计,此时,均数标准误的估计值为nS S X =。
频率的标准误用于反映频率抽样误差的大小,可按公式()np ππσ-=1计算。
实际应用中,总体概率π常常未知,需要用样本频率p 来估计,因此,频率标准误的估计值为np p n p p S p )1(1)1(-≈--=。
3. t 分布当X 服从均数为μ的正态分布时,统计量 XX t S μ-=服从自由度为1-=n ν的t 分布。
ν不同, t 分布的形态也不同;ν趋于∞时,t 分布趋近标准正态分布。
4. 参数估计方法(重点)参数估计有两种方法:一种是直接利用样本统计量的值来估计总体参数,称为点估计(point estimation);另一种是区间估计(interval estimation),即按一定的置信度来估计总体参数所在的范围,该范围称为总体参数的置信区间(confidence interval ,CI),最常用的是95%置信区间。
由于考虑了抽样误差的大小,区间估计优于点估计。
5. 总体均数及总体概率的区间估计(重点)根据资料的已知条件及样本含量n 的不同,总体均数置信区间的计算公式亦不同(见表5-1)。