2、 t分布
前面讲得就是样本平均数呈正态分布或接近正态分布
得情况。此外,还有两种情况:一就是总体分布为正态, 但总体方差 未知,且样本容量又较小;二就是总休分 布为非正态,而且总体方差 未知,样本容量又较小。 在这些情况下,样木平均数得分布为t分布这就是因为 总体力一差末知,在计算
这一比率时,要用样本标准差S取代 ,但就是在样本较
体参数,因而我们所希望得当然就是:这一区间越小越 好,而估计得正确概率越大越好。但就是,从进行区间 估计得公式可以瞧出,在其它条件一定时,要提高正碗 估计得概率 (即提高置信水平) , 置信区间就不可避免 地会增大, 而要使置信区间缩小,就要降低正确估计得 概率。必须牢记得就是,置信水平越低,置信区间越小, 该区间不包括总体参数得可能性就越大;置信水平越 高,置信区间越大,该区间包括总体参数得可能性就越 大。
从样本统计量估计整体参数
从样本统计量估计或推断总体参数就是推断统计 得一个重要部分。
我们在引入 “样本” 与 “总体 ” 这两个概念时 瞧到, 语言研究所涉及得总体往往非常大 (甚至就 是无限大得) , 因而难以对其中所有个体都加以研 究,研究者们所能做得只就是通过随机得方法从总 体中抽取一个具有代表性得样本加以研究,然后再 从有关样本统计量来估计或推断未知得总休参数, 例如从样本平均数来估计总体平均数。本章只讨 论如何从样本平均数X与比 分别估计总体平 均数 μ 与比 。估计得方法有两种: 点估计与 区间估计。
第一节 点估计
当总休平均数或比例未知时,我们可以直接把样本 平均数或比例用作它得估计值。由于样本统计量 为数轴上得一个点,所以称为“点估计值” 。
一个理想得点估计值至少应具备以下两个条件:
(1)无偏性
一般情况下,样本统计量就是不会与相应得总体参数完 全相同得,两者多少都会有一定得差距,但就是如果用 无限多个样本得统计量来估计总体参数,平均估计误 差将会等于0。具有这一特征得统计量就无偏估计值。