当前位置:文档之家› 统计学部分

统计学部分

统计学部分
统计学部分

六西格玛管理-统计学部分

6Sigma改进模式-DMAIC

1)界定

SIPOC、立项说明书、KANO模型分析、QFD、COPQ

2)测量

流程图、MSA、过程能力分析、数据调查表、直方图、箱线图、散布图、时间序列图3)分析

Pareto图、因果图、假设检验、方差分析、相关与回归分析、FMEA、列联表与卡方方法、SOV、可靠性分析、时间序列分析

4)改进

脑力激荡法、TRIZ、DOE、防差错措施

5)控制

SPC、SOP、CP、项目报告

6Sigma管理哲学:

1)真正关注顾客

2)以事实和数据驱动管理

3)以过程为重

4)预防性管理

5)无边界合作

6)力求完美但容忍失败

统计技术是一种工具,它是一系列质量活动中重要的一环而不是全部。统计技术不能取代技术和管理措施,它只是提供比较可靠的质量信息。比如在控制图出现异常现象后,还要进行原因分析、提出纠正措施、验证纠正措施有效性、修改相应的程序等一系列活动,从而形成闭环控制。

通篇的理论推导自然会让人望而生畏,然而只是单方面统计软件的介绍,没有理论上的指导,会让人一头雾水,知其然却不知所以然,肯定会有误操作、分析不当,自然而然的会有错误的判断、决策;

本课程力求涵盖统计学各方面的知识,常用的统计分析和统计质量工具,略去不必要的证明;

6Sigma管理者学习统计学的目标不是要把自己培养成统计专业工作者,也不是要把自己变成统计工具的操作者,而是要学会用统计思维去看待和分析问题,避免只看到表面层次的现象就去下结论、作决策、做动作;

培训主要对象:质量技术人员、检验员、实验室人员、计量室人员、持续改进人员,最好具备大专毕业水平,要求具备高中阶段一些概率论和统计学方面的基础;

课程前需要了解一些基本的东西,诸如:

1.对质量管理及过程本身的理解;

质量策划、质量控制、质量改进(朱兰质量管理三部曲);

2.对数据的看法、认识;(严谨性、调查结果反映出的数字特征、工艺参数、Cpk、检验的一致性、样本量、可能性、质量改进的效果)

3.质量专业术语、过程专业术语的掌握;(统计过程控制、过程均值、过程能力、测量系统性能、设备能力)

4.必要时,了解基本的统计学和概率论专业知识;(均值、方差/σ2、标准差/Sigma/σ、抽样分布)

5.结合公司实际状态,不断运用、学习、改进制造工艺、采用新的管理方法:(不然Minitab软件是不会发挥它的最大作用!然而运用的过程是艰难的,统计学不是一朝一夕学会或学好的,理论与实际的良好配合需要各部门的协作,任何一环出现问题都会影响分析员的分析、判断,最终导致改善活动失败!比如错误的样本信息所得到的控制图,会导致控制措施不足或过偏的错误动作或多余动作。到真正的统计质量管理还需要很长的路要走,学习统计学首先应从思想意识上改变、学会统计学思维开始!开始时肯定会有很多失败!在一切等于0的统计管理开始,不会指望一次就能把事情做好,统计学非常严谨然而又非常实用的一门学科,从小学五年级我们就已经接触统计学,知识在于积累!)

产品设计-(过程设计:工艺参数的设定、优化)-生产过程;

6.对关键对象的管理、控制能力:(过程控制能力、关键测量系统合格的判定)

对过程把控的能力,包括:测量系统、机器设备等;

7.理性对待事物,合理进行判断、决策。(有果必有因、相信总有改进的地方!工序的优化、维修或购买先进设备与测量仪器、对造成过程的特殊变异采取动作。)

8.遵守原则,做合理、正确的事。

统计学入门

第一章什么是统计?

考虑从数据中获取信息的四个步骤来学习统计,即四步法:

1)设计数据的收集过程;

2)准备用于分析的数据(概括、建模);

3)分析数据;

4)解释数据分析的结果。

所有这四步,对于从数据中获取信息都很重要。

如果第一步执行不当,试验或研究的目标往往会因为收集的数据不完全或含有不恰当的信息而实现不了。

为概括和分析而处理数据的步骤:

1.获得原始数据资源;

2.从原始数据资源创建数据库;

3.编辑数据库;

4.校正和澄清原始数据资源;

5.数据库的最终确定;

6.从数据库创建数据文件。

统计学家是做什么的?

统计学家需要进行试验或调查的设计,用图表或数据概括准备分析用的数据、分析数据及报告分析结果等所有方面的工作。

收集数据的方法有好有坏。统计学家运用他们现有的有关调查技术和科学调查设计的知识,或者开发新的技术为收集数据提供好的指导方法。

统计学的目标在于基于从感兴趣的总体抽得的样本的测量信息对该总体做出推断。概率的基本概念允许我们对感兴趣的总体做出推断,这一推断包含我们对总体的最佳推测以及最佳推测可能存在的误差。

从数据中获取信息,着重的是解释而不是计算,计算可以有一些专业的统计分析软件来辅助,诸如:SAS、Minitab、Stata、Systat、Jmp、SPSS。通过使用统计分析软件的图形输出功能,使得我们把更多的时间用来解释分析的结论,而不是去手动计算,绘制这些图形。但是对于简单少量的数据,建议用定义好的计算公式去手动计算,这有利于我们对统计学基本概念或术语的理解。

所有四个步骤对于每一个调查研究和试验的人员都是密切相关的。许多组织机构很少有具有统计学学位的人员或统计学专家。这样,在许多研究中数据收集方案的设计,数据的概括和统计分析,解释研究结果等都需要在没有真正的统计学专家其帮助下完成。即使聘请统计学专家,他是研究小组中的活跃分子,其他小组成员具有统计设计和数据分析概念的一般认识仍很重要,否则统计工作无法顺利展开。事实上,小组成员可以把某一方面的专业知识和经验带进所面对的问题中去,这样,在如何进行调查的设计以及如何来解释分析结果方面,可以群策群力。

*质量和工序改进*

成功实施质量改进过程的基本要求:

1.以顾客为中心是该过程的最重要部分;

2.使质量改进过程作为管理系统的一部分成为管理部门的长期责任;

3.相信总有质量改进的余地;

4.相信防止问题发生总比问题发生后再改正要好;

5.管理部门重视,领导重视并参与;

6.把不出任何错误作为工作标准或目标;

7.全体员工或作为个人,或组成小组积极参与;

8.专注于改进工序,而不是改造人;

9.相信如果供应商理解你的需要,他们定会与你合作;

10.表彰成功。

用于质量改进或工序设计的统计学工具、技术或方法:

直方图、数据的描述性统计量、散点图、控制图、抽样方案、试验设计。

第二章利用调查和科学研究来收集数据

从数据中学习的第一步是仔细地思考研究的目标,即三思而后行。

数据收集过程的设计,需要有意识地做好以下四步:

1.详细说明研究、调查或试验的目标;

2.确定所关心的变量;

3.为调查或科学研究选择适当的设计方案;

4.收集数据。

在大多数科学试验中,影响测量值的尽可能多的因素都在试验者的控制之下。

抽样的方法

在任何调查中,如何从总体中挑选样本都是一个关键的因素。如果其中个体的选择仅仅是出于方便,那么抽样调查可能会产生偏差,这将妨碍调查准确地反映作为一个整体的总体。抽样所用的方法对研究结果的可信度和适用程度至关重要。

#采用随机抽样方法形成的样本称为随机样本。

构成随机样本需要具有三个基本条件:

1)代表性;

2)随机性;

3)独立性。

常用的获取随机样本的方法(即随机抽样方法)有:

1)一般随机抽样法/简单随机抽样法:每组样本量为n的样本都有相同的机会被抽选出来;

2)系统抽样法/机械抽样法:等距/等间隔抽样

3)分层抽样法:抽样前根据需要分层【分层是利用一个辅助变量。

比估计不仅使用对所关心的响应变量的测量值,而且把它与辅助变量的测量值结合起来,是另一个利用辅助变量所含信息的方法。】;

4)整群抽样法:先分层抽取有关组的简单随机样本,然后抽取组中所有样本。【尽管在整群抽样和分层抽样中我们都对总体进行分组,但这是两种不同的方法,在分层随机抽样中,我们在每一组中抽取简单随机样本,而在整群抽样中,先抽取有关组的简单随机样本,然后调查选中组(群)中的所有元素。】#

*生产过程中的质量控制很大程度上依赖于抽样技术。*

#变化抽样率#

与抽样调查方法有关的问题

即使恰当地选取了样本,调查结果是否代表了从中取样的总体仍可能并不确定。

1)调查中的无回答;

调查中出现无回答可能会因为样本不代表总体而使得调查产生偏差。

对付无回答的措施:

①奖励;

②提醒;

③利用统计方法,在考虑到样本不同于总体的侧面的基础上,对调查结果予以调整。

2)调查中的测量问题。

测量问题是由于回答者没有提供调查所寻求的信息而造成的。这些问题常常可归因于调查设计中的某些措辞,被调查者回答调查问题的方式,及在采访中采访人表达问题的方式。例如:

①回想不起问题的答案—(措施)查看原先的记录;

②对答案有诱导性的提问—以客观的方式仔细地写出问题;

③问题中不明确的措辞—在进行调查之前,把问题在各种人中进行测试,以判断问题中是否在含糊不清或会引起误导的词句。在对采访人员进行培训的过程中,让所有采访人员知道所有关键词的“正确的”定义,并且建议他们把这些定义提供给回答者。

数据收集方法

抽样调查中最常用的数据收集方法有:

1)当面采访;

2)电话采访;

3)自主执行的问卷调查;

4)直接观察。

科学研究中的试验设计

完全随机化设计

随机化区组设计

析因试验

析因试验是指在自变量的所有因子水平组合上都对响应变量进行了观测的试验。

观察研究

【本章小结】

从数据中学习的第一步是聪明地收集数据:指定数据收集活动的目标、确定所关心的变量和为抽样调查和科学研究选择适当的设计方案。

第三章数据的描述

用图示法来概括数据。有哪些图?:

饼图、条形图、直方图、茎叶图、时间序列图、正态概率图、箱线图、散点图、矩阵图、残差图。

正态概率图用于残差的正态性检验;

用箱线图来概括评价的差异;

这些图形可以帮助我们:

1)理解数据的特点;

2)概括数据的方法;

3)数据分析报告;

4)基于数据做出决策。

描述性统计与推断性统计是统计学的两个主要分支。

在以数据描述为主的情形,我们所拥有的测量值常常来自于整个总体。

适当的概括性度量可以为原始测量值的集合提供一幅良好的、粗线条的描绘。通过把一大堆测量值缩减到几个描述性统计量,我们可以理解数据所包含的信息。

当我们关注于统计推断时,通常唯一可以利用的测量值集合就是一个样本。我们利用样本信息对从中抽取样本的总体做出结论。在推断的过程中,我们需要组织、概括及描述这个样本数据。

无论我们是在描述观测到的总体还是在使用样本数据对总体进行推断,在从数据得到结论的过程中,重要的一步是对其进行有见地的描述。无论我们的目的是统计推断还是总体描述,首先我们必须充分地描述我们手头中所有的测量值集合。

描述一组测量值有两个主要方法,即图形描述方法和数值描述方法。

通常使用一个统计软件系统,只需了解你感兴趣的程序。在工作中典型的步骤包括:对所使用的软件系统描述你的数据;若你的数据没有适当的形式,或想得到原始数据的子集合,就要对数据进行一些操作;然后,用你所使用的软件的特有的关键词,去调用适当的一组程序或过程;最后,从调用的程序中得到的结果,显示在计算机终端上或由打印机输出。

你学的统计学知识越多,就能理解更多的输出结果。

GIGO:Garbage in,garbage out.错误地输入,错误地输出。

图形方法

在收集到感兴趣的测量值后,可以通过各种图形技术,对数据进行合理地组织、显示及考察。就常规而言,应当对数据进行分类,使得每一个测量值都被分入这些类中某一类,且是唯一一类。当按以上准则整理数据时,有几种图表法可以把数据显示出来。

基于分类准则:饼图法、条形图法

饼图法:通过把一个圆分割(近似于切一张饼),饼图法很有效地展示了测量值落进每一类的总数的百分比。

饼图的作法指南:

1)选择较少的变量分类数,因为分类太多会使得饼图难以解释;

2)在任何可能的情况下,按百分比上升或下降的顺序作饼图;

条形图法:

条形图作法指南:

1)把频数列在一个轴上,变量的类别列在另一个轴上;

2)在变量值的每一类别上,利用频数(观察值的数目)作相应高度的矩形;

3)为了加以区别,分开各类以及使描述更清晰,在各类之间留出空隙。

基于定量准则:直方图、茎叶图

频数直方图-利用频数表

要构建频数表,首先要把最小值到最大值这一区间分成任意个数的子区间,称之为分组区间。

分组区间构造指南:

1)利用所希望的分组区间的大致数目,除测量值的极差(最大与最小测量值之间的差)。通常,要求5-20个区间;

2)利用所希望的子区间的数目除极差之后,把结果中的数据四舍五入到便利(易于处理)的单位。这个单位表示分组区间的共同宽度。

3)选择第一个分组区间,使其包含最小的测量值。建议为第一区间选择一个始点,使得没有测量值落在两个子区间的分点上,从而避免在确定一个测量值的分组区间时发生模棱两可的情况(一种方法是选取这些边界点,使得他们比数据多一位小数)。

落入某一区间的测量值的个数叫做分组频数。

一组的频率定义为此组的频数除以数据集合中测量值的总个数(总频数)。

对于一个特别大的测量值集合,如果用许多宽度很小的分组区间作一个频数直方图,直方图将近似于一条平滑曲线。

频率直方图

由于区间数、起始值和区间长度选择的任意性,对于同一数据集合,直方图可以被做成不同的形状。

茎叶图

显示数据以说明其形状和分布。它与直方图相似;但是,茎叶图显示准确的数据点,从而使得计算均值、中位数和模式简便得多。

在茎叶图中,每个数据值都分为“茎”和“叶”。“叶”通常是数字的最后一位,而在“叶”左侧的其他位构成“茎”。

假设我们收集六月份每日的高温,茎叶图将如下所示:

有30个数据点。

数据计数 - 第一列显示直到中位数的数据计数,然后再次向下计数。中位数上面一行的计数代表该行及其上面各行的总计数。中位数下面一行的值代表该行及其下面各行的总计数。

茎叶图 - 第一个茎是“6”,并有三个叶:8、9 和9。这意味着在六十多的数字中有三天:68、69、69。

七十多的数字中有十四天:70、73、73、74、74、75、75、76、76、77、77、77、78 和78。

八十多的数字中有十一天,九十多的数字中有两天。

数字“125”将分为:茎 12,叶 5,数字“8124”将分为:茎 812,叶 4。

Minitab 显示每行的计数、茎、叶。中位数之上和之下的行计数是经过累积的。中位数上面一行的计数代表该行及其上面各行的总计数。中位数下面一行的值代表该行及其下面各行的总计数。在示例中,样本的中位数为 77.5,因此第五行和第六行的累积计数均为 15。

注意

“区间宽度”由 Minitab 自动选择。此处,每个茎都有 2 个可能的叶,但并非总是这样。在此示例中,第一个茎表示数据值 68 或 69。第二个茎表示数据值 70 和 71,依此类推。

茎叶图的作法指南:

1.把每一个记分或数值分为两套数字。第一或前几位数字的集合是茎,第二或其后的数字是叶;

2.从小到大排列所有可能的茎数字;

3.对于大量数据中的每一记分,在适当的茎数字所确定的行中写下叶数字;

4.如果排列太拥挤,可以把每个茎的位臵扩为两行,例如,叶数字1,2,3和4放在茎的第一行,5,6,7,8和9放在茎的第二行;

5.如果出现太多的位数,如6位或7位记分,可去掉最右面的尾数字,使排列更清晰;

6.作茎叶图的规则和建分组区间的规则有所不同,分组区间的规则用在传统的频数分布。某种意义上讲,茎叶图的分组区间是不规则的。

时间序列图:

表示变量如何随时间而变化的图形法。

成功作图的一般规则:

1.在作图前确定出你的重点,看图的人应当在图中得到什么信息;

2.选择图形类型(饼图,条形图,直方图等);

3.注意题目,图形最重要的一个方面是它的题目。题目将使看图的人了解图形的主旨,起到画龙点睛的作用;

4.防止过多的字体型号、风格及颜色改变的应用。不加选择地过度地应用不同的字体类型、风格和颜色将使看图者感到混乱。一般地,我们提倡用两种字体,颜色变化和斜体字仅在一两个地方用到;

5.通过颜色和格式的应用传达图形的基调。热烈温暖的颜色(黄色、橙色和红色)比蓝色、紫色、紫色更加生动,并有助于激起看图者的热情。同样,简单的形式显示保守的调子。然而,繁复的样式则给人以刺激;

6.不要低估一个简单易懂的图形的效果;

7.经常练习作图,像做任何事情一样,熟能生巧。

********************************************************

§3.1 ☆总体与样本及抽样的基本概念

§3.2 描述性统计

数据的描述性统计:

§3.3 简单统计图形

Minitab 16菜单栏

统计>基本统计量>显示描述性统计

统计>基本统计量>图形化汇总

原假设、备择假设、检验统计量、拒绝域及使得此假设检验有效的条件,当假设检验所需要的条件没有得到满足时,则建议可供选择的其它检验统计量。

如果n>=30,我们可以用样本标准差s来代替 ;

n<30时不必。

样本量及t检验和F检验中犯第II类错误的概率的计算技巧在书中。

注意基本的假定。用图示方法和检验方法判断假定是否成立。

4个例子:

(1)50万只灯泡,检验1000只;

(2)断言“人在戒烟后体重会增加”,400个参与者,戒烟因素还是由于随机因素;

(3)15块田地,氮肥;

(4)1500个选民民意调查,19500多万美国选民。

这样的数据是否真的意味着新药更有效,结果中观察到的差别是不是仅仅是试验中测量值的随机变动引起的呢?

从数据中获取知识的所有四个组成部分:

1)设计监测站应建立在城中的何处;

决定以何种频繁的程度来采集数据以及需要记录什么量;

2)描出数据的空间-时间图形;

3)创建臭氧数据、气象数据和人口数据的空间-时间模型;

4)写一份报告以能够帮助地区和联邦官员制定关于降低臭氧浓度的决策。

精心设计的图表是了解数据的第一步。同时,平均值或典型的值和一些反映数据的极差或分散性特征指标的量对于解释也很有帮助。

要着眼于理解数据所包含的信息这一大概念,不要让细节模糊了研究对象的由数据信息反映出来的主要特征。

对有效的和有用的调查起决定作用的因素。

描述性统计提供清晰而简明的数据汇总。可以采用数字方式或图形方式汇总数据。例如,快餐店的经理将在一周内跟踪顾客在午餐时间所等待的时间。他汇总了跟踪的数据:

数据的描述性统计

均值:6.2分钟

标准差:1.5分钟

极差:等待时间从3到10分钟,极差为7分钟

N(样本数):50

1)直方图

用于评估连续样本数据的形状和展开的图形。可以在分析之前或在分析的同时创建直方图,从而帮助确认假设并指导进一步的分析。

为了绘制直方图,将样本值划分成许多区间。默认情况下,条形表示落入每个区间的观测值个数(频数),所以直方图又叫做频率分布图。它清楚地显示了样本数值在数据区间中出现的频率。

从直方图可以判断:

1.数据是否呈正态分布?

2.数据左偏斜还是右偏斜?

3.数据是否围绕某个值紧密聚类?

4.数据是否位于设定的限制中?

2)箱线图

样本分布的图形化汇总,显示其形状、中心趋势和变异性。

默认箱线图显示包括以下内容:

1异常值 (*) - 超出 whisker 上限或下限的观测值

2whisker 上限 - 延伸至距框顶部 1.5 倍框高范围内的最大数据点

3四分位间距框 - 中间 50% 的数据

〃顶部线条- Q3(上四分位数),75% 的数据小于等于此值

〃中间直线 - Q2(中位数),50% 的数据小于或等于此值

〃下部直线 - Q1(下四分位数),25% 的数据小于等于此值

4 whisker 下限 - 延伸至距框底部 1.

5 倍框高范围内的最小数据点

箱线图可帮助您了解分布情况。例如,上面的箱线图表示客户支持电话的等待时间。上部端点处的异常值、较长的whisker上限以及框的上半部分表明数据呈正偏斜,这是符合实际的,因为在分布的下部端点处,等待时间不可能低于零。

箱线图还可用于比较多个分布。例如,质量工程师可以比较三周内每周生产的塑料管件的直径。下面的箱线图表示了结果。

三个星期的中位数彼此接近。但是,箱线图显示管件直径随时间呈增加趋势。

箱线图默认显示四分位间距框,但是对于某些箱线图,可以选择显示不同的框类型:

·中位数臵信区间框- 为中位数显示95% 臵信区间(默认设臵)。

·极差框- 从最小值延伸至最大值。

描述性统计和图形分析

数据的描述性统计

收集和罗列数据是统计资料处理的初级阶段,日渐庞大的原始数据资料往往会使人无所适从,进一步的研究分析不仅要求我们对数据分布变化有直观的了解,而且要求我们用几个既简洁又有效的统计量将其分布变化的规律性表示出来。

描述性统计就是与这个问题相关的统计学工具,力求能够高度综合地概括出数据中所蕴含的关于总体的统计特征。

用图形分析数据

条形图

用于比较数据类别的某种度量。每个条形都可以表示某个类别的计数、某个类别的函数(如均值、合计或标准差)或某个表格中的汇总值。

饼图

用于显示每个数据类别相对于整个数据集的比率。

直方图

用于检查样本数据的形状和分布情况。直方图将样本值划分为许多称为区间的间隔。条形表示落于每个区间内的观测值的数量(频率)。

散点图

用于通过相对于一个变量绘制另一个变量来图示说明两个变量之间的关系。

散点图也可用于绘制随时间变化的变量。与时间序列图不同的是,提供的时间变量必须来自于工作表。这对于那些没有按时间先后顺序输入或不是以规则时间间隔收集的数据尤为有用。

单值图

用于通过在一个垂直列中标绘每个变量或组的单个值来评估和比较样本分布,以便于发现异常值和查看分布情况。

箱线图

箱线图(也称为方框须线图)可用来评估和比较样本分布。下图显示了默认箱线图的组成:

时间序列图

用于评估数据随时间变化的模式。

用统计量分析数据

均值、中位数、极差、方差、标准差

具有代表性的数据描述性统计量有:

位臵状况:

均值、中位数、众数、LQ/Q1/第一四分位数、UQ/Q3/第三四分位数

离散程度:

方差、标准差、极差、均值标准误、IQR四分位间距

分布形状:

偏度、峰度

几个术语:

总体:我们所关心事物的全体。按包含个体的数目分为有限总体和无限总体。总体可看成是一样本空间。

总体包含个体的数目称为总体容量或总体大小,记为N。

样本:样本是总体的子集。指的是随机样本,即总体中每个个体都有相同的可能性被抽取出来组成样本。样本中的个体也称为样品。

n m。

样本量:样品的数量,样本量常记为,...

这只是粗糙的直观描述,实际上我们关心的并不是个体本身,而是关心其某个数量特性。由于各个个体的数量特性总会有随机波动的状况,也就是说这个数量特性是可以取不同数值的随机变量,所以我们有更进一步的数学定义:

所谓总体其实就是一个具有确定分布的随机变量,而每个组成总体的个体则是随机变量的一次观测值。

我们最终希望了解的总体特性其实就是希望了解总体的分布函数,从总体中抽取样本就是为了认识总体的分布函数,希望通过样本数据的分析来推断总体。

参数vs统计量

描述总体数据数字特征的我们往往称之为参数。有

位臵参数、散布参数、形状参数。(形似于随机变量的数字特征,但不同)

样本是经抽样后获得的,每次抽样后所得到的结果(样本数据)是不同的,它是随机变量取值的一部分(子集),我们称之为统计量。

记法也有不同,总体均值记为 ,样本均值记为X。

关于总体,有:

总体参数

总体均值:反映总体的集中位臵,反映了所有总体数据的中心。

总体方差:反映总体数据偏离中心的程度。

总体标准差:也能反映总体数据偏离中心的程度,但其量纲与观测数据相同。反映了任一过程或产品特性值相对于其均值的分散程度。

总体分布:

总体均值和总体标准差可以给出总体数据的中心和散布程度,但不足以唯一地确定总体的情况,还需要了解总体数据散布的形状。常用到:

直方图、箱线图、茎叶图、饼图、正态概率图。

关于样本,有:

位臵状况:

样本均值:反映了所有样本数据的中心。

样本中位数:样本数据排序后,排列在中间的那个数。同样可以反映样本数据的中心。不受极大或极小数据的影响,计算简单。

样本众数:样本中出现频率最高的数值。(用得不多)

LQ第一四分位数

UQ第三四分位数

离散程度:

样本方差

样本标准差

样本极差:样本数据中最大值与最小值之差。

IQR四分位间距

分布形状:

偏度

峰度

为什么在计算样本方差时要用n-1作为除数,而不像计算样本均值那样用n作为除数呢?

原因:是总体方差的一个无偏估计,考虑到样本量n太小时,估计有偏差,涉及到自由度的概念。(参数的点估计时详细讲明!)

Microsoft Excel 2010中STDEVP(

i

x)函数实质:

σ=

而得到样本标准差的无偏估计,应该用:STDEV(

i

x)其实质:

σσ

'==

【小结】

均值:

1)它是数据集合中测量值的算术平均值;

2)一个数据集合仅有一个均值;

3)其值受极端测量值的影响。截尾有助于减少这种影响;

4)子集合的均值放在一起可以决定整个集合的均值;

5)仅适用于定量数据。

中位数:

1)它是中心值,50%的测量值比它大,50%的测量值比它小;

2)一个数据集合仅有一个中位数;

3)不受极端测量值的影响;

4)子集合的中位数放在一起不能用来确定整个集合的中位数;

5)对分组数据,即使用不同的方法对数据进行分类,它的值也是相当稳定的;6)仅适用于定量数据。

众数:

1)它是数据集合中出现最多,或者说出现的可能性最大的测量值;

2)一个数据集合可能存在不止一个众数;

3)不受极端测量值的影响;

4)子集的众数不能放在一起用来确定整个集合的众数;

5)对于分组数据,众数的值随所用的类别而改变;

6)对于定性数据和定量数据均适用。

箱线图

1)从Q1到Q3分位数画出一个箱框;

2)过中位数画一条线;

3)标出上下边界值;

4)在四分位数与边界值间画一条线;

5)用*标出每个极端离群值。

概率论基础

第二章概率论基础

随机现象及随机事件

在现实世界中有两类现象:一种是确定性现象,另一种是不确定性现象或称随机现象。例如:

1)在标准大气压下,水温达到100℃时会沸腾;

2)在地球上,物体下落会遵循自由落体定律;

3)掷硬币出现正面还是反面;

4)下期中奖彩票号码是多少?

请判断哪些是随机现象,哪些是确定性现象?

我们在研究客观世界中的各种随机现象时,一定要有清醒的认识,在任何情况下,个别随机现象是绝对不可预测的,但是同时也注意到大量随机现象将呈现明显的规律性。

例如:

假定生男生女的可能性相同,那么10 000个新生婴儿中,男婴将会是多少?女婴又会是多少?其数量的范围又是如何?

这些都是可以预测的。概率论所研究的就是大量随机现象的某种规律性。

§2.1 随机变量及其分布

随机变量的概念

随机变量

用来表示随机现象结果的变量。

随机变量根据取值不同,分为两种类型: 1)离散型随机变量-也称计数型随机变量

只能得到诸如0、1、2、3、…等自然数的这类数据。 例如:

①检查一个产品是否合格,只有“合格”、“不合格”两种结果,可分别用1,0表示; ②车间产品分一等品、二等品、三等品,可用3,2,1表示;

③满意度调查结果分为“极不满”、“不满”、“尚可”、“满意”、“非常满意”,可分别用1,2,3,4,5表示。

细分为计件型和计点型: 计件型有:不合格品数

计点型有:缺陷数,诸如:疵点数、砂眼数、气泡数、单位(产品)缺陷数等等

数据以百分率表示时,是计量数据还是计数数据取决于计算公式中分子是计量还是计数。 计件数据服从(或叫符合)二项分布,计点数据服从泊松分布(Poisson 分布)。

2)连续型随机变量-也称计量型随机变量 取值为连续值的随机变量。 例如:

胶管内径、预成型件单耗、混炼胶硬度、某种化学物质含量、纯度、强度、时间、温度、压力、长度、容积、手机电池使用寿命(小时)等等;(常服从正态分布)

【概率论上定义】

随机现象:在一定条件下,并不总是出现相同结果的现象;

随机试验:在同一组条件下,对某事物或现象所进行的观察或实验;

随机变量:如果随机试验的每种结果都可以用一个数字作为其代表,而这些数字全体用一个量来表示,则它是一个变化不定的量,我们称此变量为随机变量,这些数字为随机变量的取值。随机变量常用大写字母,,X Y Z 等表示,随机变量的取值常用小写字母

,,x y z 等表示。

事件:观察或实验的结果;分为随机事件、必然事件和不可能事件;

样本点:随机现象的每个可能结果。这种结果不可再分,也是今后的抽样单元,用ω表示。

样本空间:随机现象的所有样本点的集合,记为{}.ωΩ= 随机事件:

可能发生,也可能不发生的事件。(文字语言上描述性定义!)

随机现象的某些样本点组成的集合;(数学集合上定义!)

任一事件A是相应样本空间Ω的一个子集,常用韦恩(Venn)图示意。事件A可能发

ω)发生,则称事件A发生。

生,也可能不发生。当且仅当A中某一个样本点(如

1

随机事件常用集合表示,也可用语言文字表示,还可用随机变量这一数学工具表示。

必然事件:

任一样本空间Ω的最大子集(Ω本身)称为必然事件,仍用Ω表示。是必然要发生

的事件。

不可能事件:

样本空间Ω的最小子集(空集Φ)称为不可能事件,仍用Φ表示。是一定不会发生

的事件。

可将必然事件和不可能事件看作是两种极端的随机事件;

如果一个事件不可再分,则称其为基本事件,显然基本事件包含的样本点个数为1。

A 事件的包

事件不相

事件的并

事件的交

事件的差

对立事件

事件的概率

概率是描述事件(不妨记为A )在试验中出现的可能性大小的一种度量,事件A 的概率记为().P A

显然概率越大,事件发生的可能性越大;概率越小,事件发生的可能性越小。必然事件的概率1,不可能事件的概率为0。

【概率的公理化定义】

在一个随机现象中,用来表示一个随机事件A 发生可能性大小的实数称为事件A 的概率,记为()P A ,并规定:

(1)非负性公理:对任一事件A ,必有()0P A ≥; (2)正则性公理:必然事件Ω的概率()1P Ω=;

(3)可列可加性公理:设12,,...A A 为互不相容的事件列,则有

1

1

()().i i i i P A P A ∞∞

===∑

【概率的性质和运算法则】

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学原理苏继伟答案

第一章总论 一、单项选择题 BBBCA DDAAA 二、多项选择题 BCD BCD ABD BDE ACD ACD ADE ABE ACE ACD 三、判断题 ×√×××√×√×√ 第二章统计资料的收集 一、单项选择题 BDBDD CAADC 二、多项选择题 ADE BCDE BDE ADE ABD 三、判断题 ×××××××√×× 第三章统计数据的整理与显示 一、单项选择题 CABBD ACACD 二、多项选择题 AD ACE ABC DC ABCD 三、判断题 √×√√×√×××√ 第四章思考与练习答案 一、单项选择题 1.就业人数增减量指标属于( C ) A、相对指标; B、平均指标; C、总量指标; D、变异指标 2.下面指标中,属于时期指标的是( C ) A、某地区人口数; B、商品库存量; C、产品产量; D、中小企业数 3. 男女性别比是一个( B ) A、结构相对指标; B、比例相对指标; C、比较相对指标; D、强度相对指标 4.指标值随研究范围的大小而增减的综合指标是( C ) A、相对指标; B、平均指标; C、总量指标; D、质量指标 5.人均粮食产量是( C )

A、总量指标; B、平均指标; C、相对指标; D、数量指标 6.下面属于时点指标的是( B )。 A.商品销售额 B.营业员人数 C.商品价格 D.商品销售量 7.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( D )A.动态相对指标 B.结构相对指标 C.比例相对指标 D.比较相对指标8.第五次人口普查结果显示,我国每10万人口中有大学文化程度的为6311人。该数字是( D ) A.绝对指标 B.比较相对指标 C.强度相对指标 D.结构相对指标 9.下列属于比例相对指标的是( B ) A.工人出勤率 B.一、二、三产业的产值比 C.每百元产值利税额 D.净产值占总产值的比重 10.计算计划完成情况相对指标时,分子和分母的数值( D )。 A.只能是绝对指标 B.只能是相对指标 C.只能是平均指标 D.既可以是绝对指标,也可以是相对指标或平均指标 11.结构相对指标是( C )。 A.报告期水平与基期水平之比 B.实际数与计划数之比 C.总体部分数值与总体全部数值之比 D.甲单位水平与乙单位水平之比 12.某商场2003年彩色电视机的销售量为8800台,年末库存量有1500台,这两个总量指标是( B )。 A.时期指标 B.前者是时期指标,后者是时点指标 C.时点指标 D.前者是时点指标,后者是时期指标 13.对甲、乙两个工厂生产的饮料进行质量检查,不合格率分别为5%和8%,则甲、乙两厂饮料的不合格品数量( D )。 A.甲>乙 B.甲<乙 C.甲=乙 D.无法判断 14.某商场计划6月份销售利润比5月份提高2%,实际却下降了3%,则销售利润计划完成程度为( B )。 A.66.7% B.95.1% C.105.1% D.99.0% 15.某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是( B )。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学原理简答题答案

《统计学原理》简答题答案 第一章总论 1.统计一词有几种含义?它们之间的关系? 答:三种。统计工作、统计资料、统计学。 (1)统计工作:即统计实践活动,是指从事统计业务的机关、单位利用科学的统计方法,搜集、整理分析和提供有关客观现象的数据资料、研究数据的内在特征,并预测事物的发展方向等一系列工作过程的总称。 (2)统计资料:是统计实践过程的取得的各项数据资料以及和它相联系的其他资料的总称。 (3)统计学:统计工作和统计资料的关系是统计活动即过程和统计成果的关系,统计工作和统计学的关系是统计实践和统计理论的关系 2.社会经济统计的特点有哪些? 答:社会经济统计是社会现象的一种调查分析活动,它具有以下特点: a)数量性 b)总体性 c)变异性 d)社会性 3.什么是统计总体、统计单位、标志、变异、变量和变量值?并举例说明。答:(1)统计总体,简称总体,是指客观存在的在同一性质基础上结合起来的许多个别事物的整体。例如,研究某班学生的情况时,该班全体学生就是一个统计总体。 (2)统计单位,是指构成统计总体的个别事物。例如,以我国全部普通高等院校为总体,每一个普通高等院校就是总体单位。 (3)标志,是指总体单位所共同具有的某种属性或特征。例如,工人作为总体单位,他们都具备性别、工种、文化程度、工会、工资等属性或特征。 (4)变异是变动的标志,具体表现在各个单位的差异,包括量(数值)的变异和质(性质、属性)的变异。如:性别表现为男、女,这是属性变异;年龄表现为18岁、25岁、28岁等这是数值上的变异。 (5)变量,就是可变的数量标志。例如,商业企业的职工人数、商品流转额、流动资金占用额等数量标志,在各个商业企业的具体表现都是不尽相同的,是一个变动的量,这些变动的数量标志就称作变量。 (6)变量值,就是变量的具体表现,也就是变动的数量标志的具体表现。例如,企业的职工人数是一个变量,甲企业职工人数100人,乙企业职工人数150人,丙企业职工人数200人等等,100人、150人、200人都是职工人数这个变量的变量值(标志值)。 4.总体好和总体单位有什么关系? 答:总体和总体单位是相对而言的。随着研究目的和范围的变化,同一事物在不同的情况下可以是总体单位,也可以转化为总体

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学原理作业(1)答案

《统计学原理》作业一 一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.总体的同质性是指总体中的各个单位在所有标志上都相同。(×)4.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 6.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 7.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√) 8.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 9.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) 10.总体单位是标志的承担者,标志是依附于总体单位的。(√) 二、单项选择 1.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2.构成统计总体的各个单位称为(A )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3.对某城市工业企业未安装设备状况进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4.标志是说明总体单位特征的名称(C)。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值5.总体的变异性是指( B )。 A.总体之间有差异B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化D、总体单位之间有差异 6.工业企业的设备台数、产品产值是(D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7.几位学生的某门课成绩分别是57分、68分、78分、89分、96分,“学生成绩”是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9.下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学试题库及答案

1、统计学与统计工作的研究对象就是完全一致的。F 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。T 3、统计学就是对统计实践活动的经验总结与理论概括。T 4、一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。T 5、数量指标就是由数量标志汇总来的,质量指标就是由品质标志汇总来的。F 6、某同学计算机考试成绩80分,这就是统计指标值。F 7、统计资料就就是统计调查中获得的各种数据。F 8、指标都就是用数值表示的,而标志则不能用数值表示。F 9、质量指标就是反映工作质量等内容的,所以一般不能用数值来表示F。 10、总体与总体单位可能随着研究目的的变化而相互转化。T11、女性就是品质标志。T 12、以绝对数形式表示的指标都就是数量指标以相对数或平均数表示的指标都就是质量指标 T 13、构成统计总体的条件就是各单位的差异性。F 14、变异就是指各种标志或各种指标之间的名称的差异。F 9、调查某校学生,学生“一天中用于学习的时间”就是(A)A、标志 13、研究某企业职工文化程度时,职工总人数就是(B) B数量指标 14、某银行的某年末的储蓄存款余额(C)C、可能就是统计指标,也可能就是数量标志 15、年龄就是(B)B、离散型变量 四、多项选择题 1、全国第四次人口普查中(BCE)A、全国人口数就是统计总体B、总体单位就是每一个人 C、全部男性人口数就是统计指标 D、男女性别比就是总体的品质标志 E、人的年龄就是变量 2、统计总体的特征表现为(ACD)A、大量性B、数量性C、同质D、差异性E、客观性 3、下列指标中属于质量指标的有(ABCDE)A、劳动生产率B、产品合格率C、人口密度 D、产品单位成本 E、经济增长速度 4、下列指标中属于数量指标的有(ABC) A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资 5、下列标志中属于数量标志的有(BD)A、性别B、出勤人数C、产品等级D、产品产量E 文化程度 6、下列标志中属于品质标志的有(ABE)A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质 7、下列变量中属于离散型变量的有(BE)A、粮食产量B、人口年龄C、职工工资 D、人体身高 E、设备台数 8、研究某企业职工的工资水平,“工资”对于各个职工而言就是(ABE)A、标志B、数量标

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学原理第三章习题答案

一. 判断题部分 1 : 对统计资料进行分组的目的就是为了区分各组单位之间质的不同。 (×) 2: 统计分组的关键问题是确定组距和组数。 ( × ) 3: 组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平 均分配次数。 ( × ) 3 : 分配数列的实质是把总体单位总量按照总体所分的组进行分配。 ( ∨ ) 4: 次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标 志值在总体中所起的作用程度。 ( ∨ ) 5: 某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。 (×) 6: 连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重 叠的方法确定组限。 ( ∨ ) 7: 对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所 以这种分组会使资料的真实性受到损害。 ( ∨ ) 8: 任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于 或 100%。( × ) 9: 按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都 可称为次数分布。 ( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。 ( 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位 的差异。( ∨ ) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作第三章 统计资料整理 ×)

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越 小。( × ) .单项选择题部分 2: 在组距分组时,对于连续型变量,相邻两组的组限( A )。 A 、 必须是重叠的 B 、必须是间断的 C 、可以是重叠的,也可以是间断的 D 、必须取整数 3: 下列分组中属于按 品质标志分组 的是( B )。 A 、学生按考试分数分组 B 、产品按品种分组 C 、企业按计划完成程度分组 D 、家庭按年收入分组 4 : 有一个学生考试成绩为70分,在统计分组中,这个变量值应归入 ( B )。 A 、60---70 分这一组 B 、 70---80 分这一组 C 、60— 70或 70—80两组都可以 D 、作为上限的那一组 5: 某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的 分组属于( B )。 A 、简单分组 B 、复合分组 C 、分析分组 D 、结构分组 6: 简单分组和复合分组的区别在于( B )。 A 、选择的分组标志的性质不同 B 、选择的分组标志多少不同 1: 统计整理的关键在( B A 、对调查资料进行审核 C 、对调查资料进行汇总 )。 B 、 对调查资料进行统计分组 D 、编制统计表

统计学测试题及答案

统计学 1.总体与总体单位之间的关系是( B ) A.在同一研究目的下,两者可以相互变换 B.在不同研究目的下,两者可以相互变换 C.两者都可以随时变换 D.总体可变换成总体单位,而总体单位不能变换成总体 2. 下列标志哪一个是品质标志( C ) A. 产品成本 B. 企业增加值 C. 企业经济类型 D. 企业职工人数 3. 构成统计总体的总体单位( D ) A. 只能有一个指标 B. 只能有一个标志 C. 可以有多个指标 D. 可以有多个标志 4. 某连续变量数列,其末组为开口组,下限有500,相邻组的组中值为480,则末组的组中值为( A ) A.520 B.510 C.500 D.540 5. 社会经济现象构成统计总体的必要条件是总体单位之间必须存在( B ) A. 差异性 B. 同质性 C. 社会性 D. 综合性 6. 研究某市工业企业生产设备的使用情况,则总体单位是( C ) A. 该市全部工业企业 B. 该市每一个工业企业 C. 该市工业企业的每一台生产设备 D. 该市工业企业的全部生产设备 7.对某市占成交额比重大的7个大型集市贸易市场的成交额进行调查,这种调查的组织方式是( C ) A.普查 B.抽样调查C.重点调查 D.典型调查 8.某一学生的统计学成绩为85分,则85分是( D ) A. 品质标志 B. 数量标志 C. 数量指标 D. 标志值 9.下列变量中属于连续变量的是( C ) A. 职工人数 B. 设备台数 C. 学生体重 D. 工业企业数 10. 某企业1994年计划规定劳动生产率提高8%,实际提高6%,则计划完成程度为( B ) A.75% B.98.15% C.133.33% D.101.89% 11. 假设计划任务数是五年计划中规定最后一年应达到的水平,计算计划完成程度相对指标可采用( B ) 累计法 B.水平法 C.简单平均法 D.加权平均法 12.“平均每个人占有钢产量”这个指标是( D ) A.总量指标 B.平均指标C.比较相对指标 D.强度相对指标 13. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需要分别计算其( A )来比较 A.标准差系数 B.平均差C.极差 D.均方差 14.产品单位成本、产品合格率、劳动生产率、利润总额这四个指标中有几个属于质量指标?( C ) A. 一个 B. 两个 C. 三个 D. 四个 15.在校学生数和毕业生人数这两个指标( A ) A. 前者为时点指标,后者为时期指标 B. 均为时期指标 C. 前者为时期指标,后者为时点指标 D. 均为时点指标 1、构成统计总体的个别事物称为( D ) A、调查单位 B、标志值 C、品质标志 D、总体单位 2、对一批商品进行质量检验,最适宜采用的方法是( B ) 。

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学原理第三章习题答案

统计资料整理第三章 判断题部分一.1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。) ×( )统计分组的关键问题是确定组距和组数。(×2: 3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平)(×均分配 次数。3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。)∨( 4:次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标)∨志值在 总体中所起的作用程度。(5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。)×( 6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重)叠的方法确 定组限。(∨7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所)(∨以这种分组会使资料的真实性受到损害。8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 )×或100%。( 9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都 ) ∨( 可称为次 数分布。)×10:按数量标志分组的目的,就是要区分各组在数量上的差异。( 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位)∨(的差异。 :分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作12. 用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越)×小。(二.单项选择题部分。 B )1:统计整理的关键在( A、对调查资料进行审核 B、 对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 )。:在组距分组时,对于连续型变量,相邻两组的组限( A 2A、必须是重叠的 B、必须是间断的 、必须取整数、可以是重叠的,也可以是间断的 C D。的是( B )3:下列 分组中属于按品质标志分组 A、学生按考试分数分组 B、产品按品种分组、家庭按年收入分组、企业按计划完成程度分组 D C4:有一个学生考试成绩为7 0分,在统计分组中,这个变量值应归入)。( B A、60---70分这一组 B、70---80分这一组 、作为上限的那一组两组都可以 D8060—70或70—C、5:某主管局将下属企业先按轻、重 工业分类,再按企业规模分组,这样的)。分组属于( B A、简单分组 B、复合分组 C、分析分组 D、结构分组 。简单分组和复合分组的区别在于( B ) 6:、选择的分组标志多少不同 B、选择的 分组标志的性质不同A. D、组数的多少不同、组距的大小不同答案:C7:有20 个工人看管机器台数资 料如下: 2,5,4,4,3,4,3,4,4,2,2,4, A )3,4,6,3,4,5,2,4。如按以上资料编制分配数列,应采用( B.等距分组A.单项式分组 D.以上几种分组均可以 C.不等距分组8:在分组时, 凡 遇到某单位的标志值刚好等于相邻两组上下限数值时,。一般是( B )将此值归入下限所 在组 A.将此值归入上限所在组 B.另立一组此值归入两组均可 D. C.)次数分配数列是( D 9: 按数量标志分组形成的数列 A. B.按品质标志分组形成的数列 C. 按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列。划分连

1111统计学考题集及答案

练习1. 采用简单随机重置抽样的方法,从2000件产品中抽查200件,其中合格品190件。要求: (1) 计算合格品率及其抽样平均误差。 (2) 以%概率保证程度,对合格品率和合格品数目进行区间估计。 (3) 如果合格品率的极限误差为%,则其概率保证程度是多少 解:已知 ()()()% %Z F n N 31.245.952000002=?===件件 ()%p 95200 190 1==样本合格频率为: ()()% n P P p 54.1200 95.0195.01=-= -= μ ()()()()()()() 件%%:合格产品数估计区间:%%,%%::产品合格率的估计区间 , NP % , % P % %Z Z %Z F 9611838108.98000292.91000208.9892.9108.39508.39508.354.1229546.02=??=+-=?=?=?∴==μ()()()% F Z F % % Z Z 64.865.15.154.131.23==== ? =?=?μ μ 练习2.某电子产品的使用寿命在3000小时以下为次品,现在用简单随机抽样方法,从5000个产品中抽取100个对其使用寿命进行测试,其结果如下: 电子产品使用寿命表 根据以上资料,要求: (1)按重置抽样和不重置抽样计算该产品平均寿命的抽样平均误差。 (2)按重置抽样和不重置抽样计算该产品次品率的抽样平均误差。 (3)以95% 的概率保证程度,对该产品的平均使用寿命和次品率进行区间估计。 解:

(1)()()()小时小时 x S x 7.7341 100000 440533404100000 434=-=== 重置抽样() ()小时 5.73100 7 .734n X x == = σμ 不重置抽样:765.7299.05.73)1(2 x =?=- = N n n σμ (2)重置抽样:()()% 4.1100 02.01 02.0 n P 1 P p =-=-= μ 不重置抽样:%386.199.0%4.15000 100 1%4.1)1()P 1(P p =?=-?=--= N n n μ (3)()96.1% 95==Z Z F ()小时1445.7396.1=?=?X %7.2%4.196.1p =?=? 估计区间为: ()()() , X 小时,:4844196414434041443404=+- () () %. , P P 740:7.227.22即%%,%%:+- 1. 假设检验:总体平均数、总体成数—双侧和单侧; 练习3. 某牌号的彩电规定无故障时间为10000小时,厂家采取改正措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(01.0 =α ) 解 :()()() 150 10x 100n 000 10X 0小时件小时已知: === ()() 01.0 500X (大样本)小时==ασ

相关主题
文本预览
相关文档 最新文档