练习1: 某农场进行小麦产量的抽样调查,该农场小麦播 种面积为10 000亩,采用不重复的简单随机抽样从中 选100亩作为样本,进行实割实测,得到样本的平均亩 产量为400千克,样本标准差为12千克。则: n N 100 10000 ( 2 ) 若以概率 95.45%(t 2) 保证,该农场 10000 亩小麦的平均 亩产量的可能范围为: X x ± x 400 ±2 × 1 .19 397 .62 ~ 40 2.38( 千克 ) (3) 若以概率 99.73%(t 3) 保证,该农场 10000 亩小麦的平均 亩产量的可能范围为: X 400 ±3 × 1 .19 396 .43 ~ 40 3.57( 千克 ) x x x x 例题应用 [例7-4] 从某市高中生中按不重复抽样方法随机抽取 25名调查每周收看电视的时间,分组资料见下表: 每周看电视时间(小时) 2 以下 2—4 4—6 6—8 8—10 合计 学生人数(人) 2 6 8 8 1 25 要求:(1)计算抽样平均误差和抽样允许误差 (2)估计该市全体高中生每周平均看电视时间 的置信区间(给定的显著性水平为0.05) (二)抽样估计的置信度与精确度 ** 2.抽样估计的精确度:用置信区间的大小即抽样极 限/允许误差来表示 3.抽样估计的置信度与精确度的矛盾关系 在样本容量和其他条件一定的情况下, 若希望抽样估计有较高的可靠度,则必须扩大置信区 间,即必须降低估计的精确度 若希望抽样估计有较高的精确度,即置信区间范围缩 小,则必须降低估计的把握度 即:抽样估计要求的把握度越高,则抽样允许误差越 大,精确度越低;反之则相反 **思考:在抽样调查中,如何同时提高抽样估计的精 确度和把握度? x Z / 2 根据区间估计的定义,在给定的显著性水平
n , x Z / 2 / n ~ N (0,1) 下,总体均值 在 (
n ),即 x x x x
n /2 其中, 误差 n ( x) 即抽样平均误差 , Z
即抽样允许 x 1.总体方差已知时总体均值的区间估计 ( x t / 2 S n 1 n S n 1 n , x t / 2 ) = (x x , x x ) =(5-0.859,5+0.859) =(4.14,5.86) 即我们可以以95%的把握保证该市高中生每周平 均看电视时间在4.14到5.86小时之间。 (二)总体比例的区间估计 p(1 p) n 80% (1 80%) 2.83% 200 p Z / 2 ( p) 1.645 2.83% 4.655% 抽样极限误差为: 所以,该批产品的一等品比例的置信区间为: 80% 4.655 % P 80% 4.655 % 即这批产品的一等品率在75.35% 到84.66% 之间。 区间估计的应用 (一)总体均值的区间估计 1.总体方差已知时 2 X ~ N ( 当 , x1 , x2 ,, xn )时,来自该总体的简单随机样本 的样本均值服从数学期望为 、方差 2 为的正态分布,将样本均值统计 量 x 标准化,得到 Z 统计量 Z 1- x 的置信度下的置信区间为:
n , xZ
/2 n )= (x x , x x ) )= (30.02, =( 30.2 0.1764 30.38) 30.2 0.1764 , 即我们可以以95%的概率保证该厂零件平均长度在 30.02厘米到30.38厘米之间 2.总体方差未知时总体均值的区间估计 S 代替,但新的统 **总体方差 2 未知,可以以样本方差 n -1 t 计量不服从标准正态分布,而是服从自由度为 的 分布 2 t / 2 (n 1) =0.05时,临界值 4.33 0.416 25 t 0.025= (25 1) 抽样平均误差 ( x) Sn1 n 抽样允许误差 x t / 2 S n 1 2.0639 0.416 0.859 n 解题过程(二) (2)总体均值置信度为95%的置信区间为: 也即所估计的区间包含总体参数真实值的可能性大小, 一般以1- 表示。其中 表示显著性水平,即某一小 概率事件发生的临界水平 置信度通常采用三个标准: (1)显著性水平=0.05,即1- =0.95 (2)显著性水平=0.01,即1- =0.99 (3)显著性水平=0.001,即1- =0.999 第七章 参数估计 7.1 点估计 7.2 区间估计 一、点估计 (一)概念 1.点估计 设总体随机变量的分布函数已知,但它的一个或多 个参数未知,若从总体中抽取一组样本观察值,以该 组数据来估计总体参数,就称为参数的点估计 例如,在全部产品中,抽取100件进行仔细检 查,得到平均重量 x=1002 克,合格率 p=98% , 我们直接推断全部产品的平均重量 X=1002 克, 合格率P=98%。 2 t / 2 (n 1) ,可查t 分布表确定临界值 **给定置信度1- 从而总体均值的置信区间为: ( x t 其中, S n 1 n ( x) S n1 /2 n S n1 , x t / 2 n ) 即为抽样平均误差 即为抽样允许误差 t / 2 S n 1 n x 上式也可表示为: 例题分析 [例7-4] 某厂对一批产成品按不重复抽样方法随机抽选 200件进行质量检测,其中一等品160件,试以90%的概 率估计一等品率的范围 已知:p 160 80 % ,1- =90%, n =200 200 查表知: Z / 2 =1.645 计算得样本比例的抽样平均误差为: ( p) 解题过程(一) 已知: n =25, 样本均值 样本方差 x =0.05 1 2 3 6 5 8 7 8 9 1 5(小时 ) 25 =4.33 (1)查 t 分布表知 2.063 9,因此, (1- 5)2 2 (3 - 5) 2 6 (5 - 5) 2 8 (7 - 5) 2 8 (9 - 5)2 1 s 25 - 1 一、点估计 (一)概念 2.矩估计 矩估计法是用样本的矩去估计总体的矩,从而获得总 体有关参数的估计量的方法。矩是指以期望值为基础 定义的数字特征,如数学期望、方差、协方差等 由于区间估计所表示的是一个可能的范围,而不是一 个绝对可靠的范围。就是说,推断全及指标在这个范 围内只有一定的把握程度。用数学的语言讲,就是有 一定的概率。 解:点估计法是用样本指标直接作为总体指标的代表 值,所以,全部电子元件的平均耐用时间即为4 340小 时;总体合格率为98% 7.2 区间估计 (一)区间估计的概念 根据样本统计量以一定的可靠程度去估计总体参数 值所在的范围或区间,是抽样估计的主要方法 (二)抽样估计的置信度与精确度 1.置信度:表示区间估计的可靠程度或把握程度, 一、点估计 (二)矩估计法的评价 优点: 一、 计算简便直观,一般不考虑抽样误差和可靠程 度 二、适用于对估计准确与可靠程度要求不高的情况 局限性: 一、它要求总体矩存在 二、不能充分利用估计时已掌握的有关总体分布的 信息 (三)应用例题 [例7-1] 某厂对所生产的电子元件抽取5%进行抽样调 查,计算出样本的平均耐用时间为4 340小时,样本合 格率为98%。根据矩估计法原理,估计该厂所生产的电 子元件的平均耐用时间和合格率。 解题过程 (1)抽样平均误差 ( x) n 0.45 25 0.09 Z / 2 =1.96,所以, 查标准正态分布表可知在 =0.05时, 抽样允许误差 Z 1.96 0.09 0.1764 /2 x n (2)总体均值的置信区间为: ( x Z / 2 (1 ) x 2 (1 n ) 12 2 (1 100 ) 1 .19 ( 千克 ) 练习2: 某机械厂日产某种产品8 000件,现采用纯随机不 重复抽样方式(按重复抽样公式计算),从中抽取400件 进行观察,其中有380件为一级品,试以概率95.45%的 可靠程度推断全部产品的一级品率及一级品数量的范 围。则:抽样一级品率: **在大样本下,样本比例的分布趋近于均值为 P 差为 P (1 P ) n 、方 的正态分布。因此,给定置信度1- ,查正态分布 表得 Z / 2 ,则样本比例的抽样极限误差为: p Z / 2 ( p) 所以,总体比例的置信度为1- 的置信区间为: p p P p p p 380 400 ´ 100% 95% p P (1 P ) n
95%( 1 95%) 400 1.09% 在概率 95.45%的保证下,全及一级品 率: P p ± p ~ 95% ±2 ´ 1.19% 92.82% × 97.18% 例题应用 [例7-3] 某厂生产的零件长度服从正态分布,从该 厂生产的零件中随机抽取25件,测得它们的平均长度 为30.2厘米。已知总体标准差 =0.45厘米 要求:(1)计算抽样平均误差和抽样允许误差 =0.05) (2)估计零件平均长度的可能范围( 0.452 ), x =30.2, 来自百度文库 =25, 已知: X ~ N ( , 1- =0.95