当前位置:文档之家› 用样本分布估计总体分布

用样本分布估计总体分布

用样本分布估计总体分布
用样本分布估计总体分布

用样本分布估计总体分布

用样本分布估计总体分布是从样本分布状况的角度分析总体的规律,涉及的内容有图表和数字特征. 其中图表包括频率分布表及直方图、折线图、散点图、茎叶图. 数字特征包括平均数、中位数、众数、方差、标准差等. 考纲对这部分内容的要求是识图、读图和估计. 本文将通过几个实例分析这类题型的解法.

数据特征

例1 为评估一种农作物的种植效果,选了[n]块地作试验田.这[n]块地的亩产量(单位:kg)分别为[x1],[x2],…,[xn],下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()

A. [x1],[x2],…,[xn]的平均数

B.[x1],[x2],…,[xn]的标准差

C.[x1],[x2],…,[xn]的最大值

D.[x1],[x2],…,[xn]的中位??

解析刻画评估这种农作物亩产量稳定程度的指标是标准差.

答案 B

点评众数:一组数据出现次数最多的数叫众数,众数

反应一组数据的多数水平. 中位数:一组数据中间的数(起到分水岭的作用),中位数反应一组数据的中间水平. 平均数:反应一组数据的平均水平. 方差:反映和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小),并把它叫作这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.

频率分布表及频率分布直方图

例2 某手机卖场对市民进行国产手机认可度的调查,随机抽取100名市民,按年龄(单位:岁)进行统计的频数分布表和频率分布直方图如下. 求频率分布表中[x,y]的值,并补全频率分布直方图.

解析由图知,[P(25≤x<30)=0.01×5=0.05],

故[x=100×0.05=5].

[P(30≤x<35)]=1-(0.05+0.35+0.3+0.1)=1-0.8=0.2,故[y]=100×0.2=20.

图中缺失部分:[频率组距=0.25=0.04](画图略).

点评用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分布直方图比较直观. 频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分

布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.

例3 某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图.

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;

(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)上的人数;

(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.

解析(1)根据频率分布直方图可知,样本中分数不小于70的频率为[(0.02+0.04)×10=0.6].

所以样本中分数小于70的频率为[1-0.6=0.4].

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.

(2)根据题意知,样本中分数不小于50的频率为[(0.01+0.02+0.04+0.02)×10=0.9],分数在区间[[40,50)]上的人数为[100-100×0.9-5=5].

所以总体中分数在区间[[40,50)]上的人数估计为[400

×5100=20].

(3)由题意知,样本中分数不小于70的学生人数为[(0.02+0.04)×10×100=60],样本中分数不小于70的男生人数为[60×12=30].

所以样本中男生人数为[30×2=60],女生人数为

100-60=40,男生和女生人数的比例为60∶40=3∶2.

所以根据分层抽样原理,总体中男生和女生的人数比例估计为3∶2.

点评利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即为众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.

折线图

例4 某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是()

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月

D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

解析观察折线图知,每年7月到8月折线图呈现下降趋势,月接待游客量减少,选项A错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,选项B正确;每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,选项C正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,选项D正确.

答案 A

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

用样本估计总体教案

2.2.1用样本的频率分布估计总体分布 一、教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。 (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。 2、过程与方法目标: 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观目标: 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学的重点和难点 重点:会列频率分布表,画频率分布直方图。 难点:能通过样本的频率分布估计总体的分布。 三、教法与学法分析 1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。 2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。 四、教学过程 (一)情境引入 1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即 用样本估计总体,是我们需要进一步学习的内容. 3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下: 82,75,61,93,62,55,70,68,85,78. 如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. (二)新课讲解 知识探究(一):频率分布表 【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

必修三2.2.用样本估计总体(教(学)案)

. . . .. .. 2.2 用样本估计总体 教案 A 第1课时 教学容 §2.2.1 用样本的频率分布估计总体分布 教学目标 一、知识与技能 1. 通过实例体会分布的意义和作用. 2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 二、过程与方法 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 三、情感、态度与价值观 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 教学重点、难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 难点:能通过样本的频率分布估计总体的分布. 教学设想 一、创设情境 在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要容——用样本的频率分布估计总体分布. 二、探究新知 探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确

用样本估计总体

用样本估计总体一、基础知识 1.频率分布直方图 (1)纵轴表示频率 组距 ,即小长方形的高= 频率 组距 ; (2)小长方形的面积=组距×频率 组距 =频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法 第一步:求极差,决定组数和组距,组距=极差组数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数. 4.中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数 一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的 平均数x=1 n(x1+x2+…+x n).

5.样本的数字特征 如果有n个数据x1,x2,…,x n,那么这n个数的 (1)平均数x=1 n(x1+x2+…+x n). (2)标准差s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. 二、常用结论 1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a. (2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2. 考点一茎叶图 [典例](优质试题·山东高考)如图所示的茎叶图记录了甲、 乙两组各5名工人某日的产量数据(单位:件).若这两组数据 的中位数相等,且平均值也相等,则x和y的值分别为() A.3,5B.5,5 C.3,7 D.5,7 [解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

用样本估计总体测试题

《2.2用样本估计总体(2)》测试题 、选择题 1. (2012安徽理)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图,贝U (). A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙 的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩 的极差 考查目的:考查统计图的识读,以及对数字特征的分析与理解能力 答案:C. —J + 5 + 6 + 7^8 工—5x316+9 二+ y- —______________ —Q x —___________ — & j 解析:「匚' - ,甲成绩的方差为:, f >3 + 32xl.— -------------- = 乙成绩的方差为* . 2. (2012江西理)样本("V '二)的平均数为」,样本-'人)的平均数为,C~),若样本(b P =,心P '-)的平均数「」:",其中 Q -C 氓—

2,贝U n,m的大小关系为().

A.;!—; B. : - W C. !八; D.不能确定 考查目的:考查平均数意义的理解和灵活应用 答案:A. 解析:由题意知,样本(“ V 宀'■■-)的平均数为 M - ffl - 咖十M m 十闰P ,又?.? £ = m 丰(1 「即,?—「:,答案应选A. 3. (2012陕西理)从甲乙两个城市分别随机抽取16台自动售货机,对其销售 额进行统计,统计数据用茎叶图表示(如图),设甲乙两组数据的平均数分别为 r -,中位数分别为J ,冷匸,则(). 甲 乙 ?65 0 1 028 75 2 i 2 C2337 E0Q 1 3 12443 3 1 4 238 A.怎甲弋冥己,叨甲 > 叫 B.怎甲丈龙己,丹3甲c 烧乙 C.怎甩〉工邑,用甲〉临己 D.忙甲〉蛊巴,廉零c 烧乙 考查目的:考查茎叶图的结构特征和作用,以及从茎叶图中提取样本数字特征的能力 答案:B. 18+22 解析:根据平均数的概念易计算出",又???「」 上 27 4-31 = ??答案应选B. MJ+JJ27 jn+z! m m +xi

用样本估计总体分布

用样本的频率分布估计总体分布(第1课时) 教学目标: 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想. 3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实. 教学重点: 会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系 教学难点: 掌握频率分布直方图的正确画法,体会分布的意义与作用 教学方法:引导——探究教学法 教学过程: 一、创设情境,呈现问题 问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 二、操作讨论,构建新知 <知识探究1 改良频数分布表→频率分布表> 问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作? 【学生活动1】探究讨论,得到结论: ①为了制定一个较为合理的标准a,需要知道每个家庭的用水量 ②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式 ③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适 课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如: 通过抽样调查,获得100户居民的月均用水量如下表(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

用样本估计总体知识讲解

用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释: 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰. 要点四、众数、中位数与平均数 1.众数 一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出

用样本估计总体练习题含答案

25.2用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为1.5, 1.4, 1.6, 2, 1.8,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克? (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元?

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

用样本估计总体

用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差:s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2](x n是样本数据,n是样本容 量,x是样本平均数). 知识拓展 1.频率分布直方图的特点 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率 组距 ,频率=组距 ×频率组距 . (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a. (2)数据x1,x2,…,x n的方差为s2. ①数据x1+a,x2+a,…,x n+a的方差也为s2; ②数据ax1,ax2,…,ax n的方差为a2s2.

用样本估计总体练习题

23.4 用样本估计总体习题课 1、随机抽样的三种方法是、、 2、在简单随机抽样中,常用的两种办法是、 3、画频率分布直方图的步骤是: 4、茎叶图的两个优点是: (1) (2) 课内探究一:用样本的平均数估计总体的平均数 【例1】从一种棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 计算这25根棉花的纤维的平均长度,并估计这种棉花的纤维的平均长度? 问题一:计算数据的平均数有没有较为简便的方法? 跟踪训练:上图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________. 课内探究二:用样本的标准差估计总体的标准差 【例2】在一次跳远选拔比赛中,甲、乙两名运动员各进行了10次测试,成绩如下: 甲运动员﹕5.85 5.93 6.07 5.91 5.99 6.13 5.89 6.05 6.00 6.19; 乙运动员﹕6.11 6.08 5.83 5.92 5.84 5.81 6.18 6.17 5.85 6.21;

观察上述样本数据,如果你是教练,选哪位选手去参加正式比赛?为什么? 跟踪训练: 1、甲、乙两台机床同时加工直径为100mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 2、某校开展“爱我海西、爱我家乡”摄 影比赛,9位评委为参赛作品A给出的 分数如茎叶图所示.记分员在去掉一个 最高分和一个最低分后,算得平均分为 91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

统编人教A版高中必修第二册《9.2 用样本估计总体》名校精品导学案

9.2.4总体离散程度的估计 知识点一一组数据的方差与标准差 知识点二总体方差与总体标准差

知识点三 样本方差与样本标准差 知识点四 标准差、方差描述数据的特征 标准差刻画了数据的□ 01离散程度或□02波动幅度,标准差越大,数据的离散程度□ 03越大;标准差越小,数据的离散程度□04越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差. 知识点五 分层随机抽样估计总体方差 设层数为2层的分层随机抽样,第1层和第2层包含的样本变量由x 1,x 2,…,x n 及y 1,y 2,…,y n 表示. 样本数 总体数 方差 平均数 第1层 m M s 2x x - 第2层 n N s 2y y - 则总体方差s 2=M [s 2x +(x --z -)2]+N [s 2y +(y --z -)2 ]M +N

1.方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x -2],或写成s 2=1n (x 2 1+x 22+…+x 2n )-x -2.即方差等于原数据平方的平均数减去平均数的平方. 2.平均数、方差公式的推广 (1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a . (2)若数据x 1,x 2,…,x n 的方差为s 2,那么 ①数据x 1+a ,x 2+a ,…,x n +a 的方差也是s 2; ②数据ax 1,ax 2,…,ax n 的方差是a 2s 2. 1.判一判(正确的打“√”,错误的打“×”) (1)方差越大,数据的稳定性越强.( ) (2)在两组数据中,平均值较大的一组方差较大.( ) (3)样本的平均数和标准差一起反映总体数据的取值信息.一般地,绝大部分数据落在[x --2s ,x -+2s ]内.( ) (4)平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小.( ) 答案 (1)× (2)× (3)√ (4)√ 2.做一做 (1)下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差 C .若一组数据的值大小相等,没有波动变化,则标准差为0 D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散 (2)某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则:①平均命中环数为________; ②命中环数的标准差为________.

用样本估计总体

《§6.2用样本估计总体》学案 一、学习要求: 1、掌握数据整理及其相关图表的制作方法 2、会求样本的平均值和标准差 3、能通过样本的分布和特征值来估计总体的分布和特征值 4、通过具体的实际问题,感受用样本估计总体分布规律的思想 二、学习重点、难点: 重点:数据整理及其相关图表的制作;样本特征值的计算;对总体分布和特征值的估计。 难点:频数频率分布图表和累计频率分布折线图的作用和分析;如何用样本的分布和特征值来估计总体。 三、学时安排:共4学时 第一学时:学习频率分布表,感受如何用样本频率分布表去估计总体分布,亲自体验制作频数频率分布表的过程。 第二学时:学习频率分布直方图,强化制作频率分布直方图的可操作性。 第三学时:学习平均数、方差和标准差的计算,熟悉并会用计算公式。 第四学时:建立用样本的分布估计总体的特征性质的思想,并小结本节内容四、学习过程: 第一学时 (一)课前尝试 1、学法指导: (1)回顾初中已经学过的频数分布表 (2)自学课本上P.8~10介绍的频数频率分布表。 2、尝试练习: 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量 为100的身高样本,数据如下(单位:cm),试作出该样本频率分布表。 168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162

160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 (二)课堂探究: 1、探究问题:频数频率分布表能较好地反映总体分布情况,在实际中应用很广,因此,如何来制作频数频率分布表呢? 2、知识链接:对总体分布的估计 (1)频数频率分布表 (2)频数频率分布表的制作 3、拓展练习:课本上P.9例1 一般地,编制频率分布表的步骤如下: (1)求全距,决定组数和组距,组距组数 全距 ; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表。 4、当堂训练: 下面是某职业学校学生随机抽样的40名学生在一个月内的零花钱数据(单

第43讲 抽样方法、用样本估计总体

第七章概率与统计 知识体系【p98】 第43讲抽样方法、用样本估计总体 夯实基础【p98】 【学习目标】 1.了解三种抽样方法:简单随机抽样、分层抽样、系统抽样. 2.掌握“一表三图”:频率分布表、频率分布直方图、折线图、茎叶图. 3.会求“六种数”:众数、中位数、平均数、极差、方差、标准差. 【基础检测】 1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是() A.分层抽样法,系统抽样法

B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法 【解析】显然,调查②为简单随机抽样,而对于调查①,因地区不同产品的销售情况会有差异,因此要采取分层抽样,故选B. 【答案】B 2.某校1 000名学生中,O型血有450人,A型血有200人,B型血有200人,AB型血有150人,为了研究血型与血弱的关系,从中抽取容量为40的样本,按照分层抽样的方法抽取样本,则O型血,A型血,B型血,AB型血的人应分别抽取的人数为() A.16、10、10、4 B.18、8、8、6 C.18、10、10、2 D.15、8、8、9 【解析】分层抽样为按比例抽样,则O型血抽取的人数为40× 450 1 000=18;A型血抽取 的人数为40× 200 1 000=8;B型血抽取的人数为40× 200 1 000=8;AB型血抽取的人数为40× 150 1 000 =6.故本题答案选B. 【答案】B 3.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2 000人中抽取100人做问卷调查,为此将他们随机编号1,2,…,2 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间[1,820]的人做问卷A,编号落入区间[821,1 520]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为() A.23 B.24 C.25 D.26 【解析】若采用系统抽样方法从2 000人中抽取100人做问卷调查,则需要分为100组,每组20人,若第一组抽到的号码为9,则以后每组应抽取的号码分别为29,49,69,89,109,…, 所以抽到的号码构成以9为首项,20为公差的等差数列, 此等差数列的通项公式为a n=9+20(n-1)=20n-11. 由题意可知,落在区间[1 521,2 000]的有: 1 521≤20n-11≤ 2 000,n∈Z, 解得:76.6≤n≤100.55,n∈Z,所以77≤n≤100,n∈Z. 编号落入区间[1 521,2 000]的有24(人), 故选B. 【答案】B 4.为了解某校高二1 000名学生的体能情况,随机抽查部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是() A.该校高二学生1分钟仰卧起坐的次数超过30次的人数约有200人 B.该校高二学生1分钟仰卧起坐的次数少于20次的人数约有20人 C.该校高二学生1分钟仰卧起坐的次数的中位数为25.25次 D.该校高二学生1分钟仰卧起坐的次数的众数为27.5次 【解析】图象的纵坐标是频率比组距,故仰卧起坐的次数超过30次的频率为0.04×5=0.2,故人数有0.2×1 000=200,A是正确的;

相关主题
文本预览
相关文档 最新文档