统计学例子第七章简单随机抽样平均误差
- 格式:ppt
- 大小:79.00 KB
- 文档页数:6
生物统计学姓名:班级:学号:第一章概论一、填空1 变量按其性质可以分为_______变量和_______变量。
2 样本统计数是总体_______的估计量。
3 生物统计学是研究生命过程中以样本来推断_______的一门学科。
4 生物统计学的基本内容包括_______、_______两大部分。
5 统计学的发展过程经历了_______、_______、_______3个阶段。
6 生物学研究中,一般将样本容量_______称为大样本。
7 试验误差可以分为_______、_______两类。
二、判断()1 对于有限总体不必用统计推断方法。
()2 资料的精确性高,其准确性也一定高。
( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
()4 统计学上的试验误差,通常指随机误差。
三、名词解释样本总体连续变量非连续变量准确性精确性第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为_______变量和_______变量。
2 直方图适合于表示_______资料的次数分布。
3 变量的分布具有两个明显基本特征,即_______和______。
4 反映变量集中性的特征数是_______,反映变量离散性的特征数是_______。
5 样本标准差的计算公式s=_______。
二、判断( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
()3 离均差平方和为最小。
()4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
()5 变异系数是样本变量的绝对变异量。
三、名词解释资料数量性状资料质量性状资料计数资料计量资料普查抽样调查全距(极差)组中值算数平均数中位数众数几何平均数方差标准差变异系数四、单项选择( )1 下面变量中属于非连续性变量的是_______。
A 身高 B 体重 C 血型 D 血压( )2 对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成_______图来表示。
统计学题型示例一、单选题(本题共10小题,每小题1分,共10分)1、一个总体单位()A、只能有一个标志B、可以有多个标志C、只能有一个指标D、可以有多个指标2、构成统计总体的必要条件是()A、同质性B、社会性C、综合性D、差异性3、广州市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,这种调查属于()A、重点调查B、典型调查C、抽样调查D、普查4、某高新技术开发区现有人口11万,有8家医院(其病床合计为700床),则该开发区的每万人的病床数为63.636,这个指标是()。
A、结构相对指标B、正强度相对指标C、比例相对指标D、逆强度相对指标5、某商店在制定男式衬衫进货计划时,需了解已售衬衫的平均尺寸,则应计算()。
A、算术平均数B、调和平均数C、几何平均数D、众数6、某企业2006年职工平均工资为5200元,标准差为110元,2009年职工平均工资增长了40%,标准差增大到150元,职工平均工资的相对变异()。
A、增大B、减小C、不变D、不能比较7、平均差的主要缺点是()。
A、与标准差比计算复杂B、易受极端值的影响C、不符合代数演算方法D、计算结果比标准差数值大8、某企业1~3月份生产计划完成情况的资料如下,该企业一季度的平均计划完成程度为()。
月份一二三实际产量a(件)产量计划完成程度﹪c 500100618103872109A、错误!未找到引用源。
B、错误!未找到引用源。
C、错误!未找到引用源。
D、错误!未找到引用源。
9、用综合指数公式计算总指数的主要问题是()A、同度量因素的选择B、同度量因素时期的确定C、同度量因素的选择和时期的确定D、个体指数和权数的选择10、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()A、增加1.25倍B、增加9倍C、增加8倍D、增加2.25倍二、多选题(在5个备选答案中选择2-5个正确答案,本大题共5小题,每小题2分,共10分)1、在工业设备普查中()A、调查对象是工业设备B、总体单位是工业企业C、报告单位是工业企业D、调查单位是每台工业设备E、总体是工业部门2、某公司钢铁产量资料如表,平均发展速度为()。
统计学(选择,判断)判断1.描述统计是用文字和图表对客观世界进行描述。
()2.箱线图主要展示分组的数值型数据的分布。
()3.抽样极限误差可以大于、小于或等于抽样平均误差。
4.直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
()5.相关系数为0表明两个变量之间不存在任何关系。
()6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少()7.在单因素方差分析中,SST =SSE+SSA()。
()8.右侧检验中,如果P值<α,则拒绝H9.抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
()10.当原假设为假时接受原假设,称为假设检验的第一类错误。
()11.简单随机抽样由于样本是完全随机的,适用于任何情形。
12.采用多阶段抽样时,阶段数越多,结果越正确。
13.四分位差是下四分位数与上四分位数14.点估计就是用样本统计量代表总体参数15.总体比例标准差的最大值是116.在简单随机抽样时,当总体单位数较多时,若抽样比例为64%,则不重复抽样的抽样平均误差比重复抽样的抽样平均误差大约减少40%17.当置信水平一定时,置信区间的宽度随着样本量的增大而减少18.重复简单随机抽样的抽样平均误差小于不重复简单随机抽样的抽样平均误差。
19.平均差与标准差都表示各标志值对其算术平均数的平均离差。
20.单一表能容纳较多的标志,因而能把许多单位的资料填列于一张表中,这有利于比较和分析。
等距抽样在决定间距时要注意总体中有无周期性变化。
采用多阶段抽样时,阶段数越多,结果越正确。
两个变量的相关分析中要求其中一个是自变量,另一个是因变量。
标志是单位的属性或特征,指标是总体的数量特征,两者没有关系。
在评判估计量好坏中,有效性就是指估计的正确性。
21.如果总体情况复杂,适宜于采用分层抽样。
整群抽样要求群与群之间差异要大。
22.在评判估计量好坏中,无偏性就是指估计的正确性。
《统计学原理》作业(三)(第五~第七章)一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。
(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。
(√)6、在一定条件,施肥量与收获率是正相关关系。
(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )。
8、利用一个回归方程,两个变量可以互相推算(×)。
二、单项选择题1、在一定的抽样平均误差条件下( A )。
A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。
A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是( C )。
A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大。
A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。
A、等于78%B、大于84%c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A )。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
《统计学基础》(专)阶段练习四(第七、八章)一、填空题1.抽样调查中,抽取样本的方法有___重复抽样____和____不重复抽样___。
2。
根据总体各单位的标志值或标志属性计算的、反映总体数量特征的综合指标称为___总体指标____。
样本指标是根据___样本____标志值或标志属性计算的综合指标.3.在纯随机重复抽样的条件下,若其他条件不变,抽样平均误差缩小一半,则样本单位数___增加____;若抽样平均误差增加一倍,则样本单位数___减少____.4.影响抽样误差大小的因素主要有:___样本容量的大小____、___抽样方法____、___总体各单位标志值的变动程度____和抽样调查的组织形式.5.抽样误差是由于抽样的___随机性____而产生的误差,这种误差不可避免,但可以____控制___。
6。
影响样本单位数的因素主要有___总体标志值的变异程度____、___概率保证程度的大小____、___极限误差____及___抽样方法与组织形式____.7。
抽样估计的方法有___点估计____和___区间估计____两种。
8.常用的抽样组织形式有___简单随机抽样____、___分类抽样____、___整群抽样____、___等距抽样____四种。
9。
现象之间的相关关系按相关的程度分有___完全相关____相关、____不相关___相关和____不完全相关___相关;按相关关系的方向分有___正相关____相关和___负相关____相关;按相关关系的表现形式分有____线性相关___相关和___非线性相关____相关;按自变量的多少分有_______相关和_______相关。
10.相关系数等于0,说明两变量之间____无线性相关___;直线相关系数等于1,说明两变量之间____完全正线性相关___;直线相关系数等于-1,说明两变量之间___完全负线性相关____。
二、单项选择题1。
抽样平均误差是( A )。