统计学大题题型整理
- 格式:doc
- 大小:288.00 KB
- 文档页数:14
统计学题型示例一、单选题(本题共10小题,每小题1分,共10分)1、一个总体单位()A、只能有一个标志B、可以有多个标志C、只能有一个指标D、可以有多个指标2、构成统计总体的必要条件是()A、同质性B、社会性C、综合性D、差异性3、广州市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,这种调查属于()A、重点调查B、典型调查C、抽样调查D、普查4、某高新技术开发区现有人口11万,有8家医院(其病床合计为700床),则该开发区的每万人的病床数为63.636,这个指标是()。
A、结构相对指标B、正强度相对指标C、比例相对指标D、逆强度相对指标5、某商店在制定男式衬衫进货计划时,需了解已售衬衫的平均尺寸,则应计算()。
A、算术平均数B、调和平均数C、几何平均数D、众数6、某企业2006年职工平均工资为5200元,标准差为110元,2009年职工平均工资增长了40%,标准差增大到150元,职工平均工资的相对变异()。
A、增大B、减小C、不变D、不能比较7、平均差的主要缺点是()。
A、与标准差比计算复杂B、易受极端值的影响C、不符合代数演算方法D、计算结果比标准差数值大8、某企业1~3月份生产计划完成情况的资料如下,该企业一季度的平均计划完成程度为()。
月份一二三实际产量a(件)产量计划完成程度﹪c 500100618103872109A、错误!未找到引用源。
B、错误!未找到引用源。
C、错误!未找到引用源。
D、错误!未找到引用源。
9、用综合指数公式计算总指数的主要问题是()A、同度量因素的选择B、同度量因素时期的确定C、同度量因素的选择和时期的确定D、个体指数和权数的选择10、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()A、增加1.25倍B、增加9倍C、增加8倍D、增加2.25倍二、多选题(在5个备选答案中选择2-5个正确答案,本大题共5小题,每小题2分,共10分)1、在工业设备普查中()A、调查对象是工业设备B、总体单位是工业企业C、报告单位是工业企业D、调查单位是每台工业设备E、总体是工业部门2、某公司钢铁产量资料如表,平均发展速度为()。
统计学计算题复习(学生版)统计学复习提纲一、期末考卷题型1. 单项选择题;2. 多项选择题;3. 简答题4. 计算题二、知识点复习1. 统计学分类、指标、变量、参数、统计量等概念,以及各种统计图形;2.统计数据的相关内容,以及测量数据分布的测度的描述;平均数、中位数和众数的计算公式。
3. 调查的各种方式; 4. 组距数列的相关概念。
5. 置信区间的相关概念,以及单个总体均值、比例、方差的区间估计;6. 估计单个总体均值、比例时的样本容量的计算公式;7. 单个总体均值、比例、方差的假设检验;8. 相关系数和回归系数的相关知识;9. 一元、二元回归模型的EXCEL操作结果的解释以及模型的建立和检验;10. 时间序列的各种分类;平均速度等指标、移动平均法的概念等;平均发展水平的计算和季节指数的计算; 11.统计指数的相关概念,制作综合指数要点和原则,综合指数、平均指数的计算。
1统计学计算题复习一.平均数、中位数和众数的计算和三者之间的关系1.算术平均数。
也叫均值,是全部数据的算术平均,是集中趋势的最主要测度值。
主要适用于定距数据和定比数据,但不适用于定类数据和定序数据。
2.众数。
众数是一组数据中出现次数最多的变量值,用Mo表示。
主要用于测度定类数据的集中趋势。
组距式数列确定众数,是先根据出现次数确定众数所在组,然后利用下列公式计算众数的近似值:M?L?0f?f?1?i (f?f?1)?(f?f?1) 3.中位数。
中位数是一组数据按从小到大排序后,处于中间位置上的变量值,用Me表示。
主要用于测度定序数据的集中趋势。
分组数据计算中位数时,先根据公式N确定中位数所在的组,然后用下列公式计算2N?Sm?1中位数的近似值: M?L?2?i efm4.众数、中位数和算术平均数的关系 x?Me?Mo,数据是对称分布; x<Me<Mo,数据是左偏分布; x>Me>Mo,数据是右偏分布。
例题1:某地区有下列资料:人均月收入400以下400~500 500~600 600~700 700~800 800~900 900以上合计要求计算算术平均数、众数、中位数。
统计学知识点与复习题(特别说明:考试不出名词解释等类型题目,但需要学生掌握,总结辅导不可或缺,另有章节练习题单独给出,这里列示的是为了巩固各章知识点内容,为了加深学生的复习和掌握,除计算题外,有的题目未附答案,各位老师辅导时注意)考试题型:填空、单选、多选、判断、计算第一章绪论练习题一、填空题1.统计一词从不同角度理解有三种涵义,即统计工作、统计资料和统计学。
2.社会经济统计的研究对象是社会经济现象的数量方面。
3.统计总体具有的特点是大量性、同质性和差异性。
4.标志是说明总体单位特征的,可以分为品质标志和数量标志。
5.统计指标是说明总体特征的,其构成要素有6个,分别为指标名称、数值、计量单位、计算方法、时间范围、空间范围。
6.职工的文化程度是品质标志,工龄是数量标志。
7.企业的机器台数和职工人数是属于离散变量,而固定资产原值和销售收入是连续变量。
8.要了解我国乳品企业的生产情况,总体是所有乳品企业,总体单位是每一个乳品企业。
9.要了解我国乳品企业的设备状况,总体是所有乳品企业,总体单位是每一个乳品企业。
10.学生的性别、民族属于品质标志,而学生的身高、体重是数量标志。
11.统计指标的概念完整表述为:“说明社会经济现象总体的数量特征的概念和具体数值”。
12.按统计指标的性质不同,统计指标可分为数量指标和质量指标。
二、判断题1.随着研究目的的不同,总体与总体单位之间是可以变换的,指标与标志也是可以变换的。
(T )2.张明同学期末数学成绩85分,这是统计指标。
(F )3.总体单位的特征用指标来说明,总体的特征用标志来说明。
(F )4.标志可以用文字表现,也可以用数字表现。
(T )5.指标可以用文字表现,也可以用数字表现。
(F )6.指标值是由标志值汇总计算而得到。
(T )7.在全国人口普查中,“年龄”是变量。
(T )8.某班学生学习情况调查中,班级名称和学生姓名都是可变标志。
(F )9.张明同学期末数学成绩85分,“成绩”是连续变量,“85分”是变量值。
统计知识点及常见题型2.1.1简单随机抽样1.总体和样本:在统计学中, 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
统计学大题考试题库及答案一、选择题1. 下列哪个是描述数据集中趋势的度量?A. 方差B. 标准差C. 平均数D. 众数答案:C2. 假设检验中的零假设(Null Hypothesis)通常表示什么?A. 效应存在B. 效应不存在C. 效应显著D. 效应不显著答案:B二、简答题1. 简述什么是标准正态分布,并说明其特点。
答案:标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。
其特点是对称性,曲线的中心位于均值0处,两侧对称;无偏性,曲线的中心线为均值线;稳定性,当两个独立的正态分布变量相加时,其和也是正态分布。
2. 解释什么是样本和总体,并给出它们之间的区别。
答案:样本是从总体中抽取的一部分个体,用于研究和推断总体特性。
总体是指研究对象的全部个体。
样本与总体的主要区别在于规模大小和代表性,样本是部分,总体是全部。
三、计算题1. 给定一组数据:2, 4, 6, 8, 10,计算其平均数、中位数和众数。
答案:- 平均数:(2 + 4 + 6 + 8 + 10) / 5 = 6- 中位数:数据已排序,中位数为中间值6- 众数:数据中没有重复值,因此没有众数2. 如果一个正态分布的总体均值为100,标准差为15,求P(85 < X < 115)。
答案:首先将数据标准化,计算Z值:Z1 = (85 - 100) / 15 = -1,Z2 = (115 - 100) / 15 = 1。
然后使用标准正态分布表查找P(Z < 1) - P(Z < -1),得到P(85 < X < 115)。
四、论述题1. 论述相关性与因果性的区别,并举例说明。
答案:相关性指的是两个或多个变量之间的统计关联,而因果性则表明一个变量的变化导致另一个变量的变化。
例如,吸烟与肺癌之间存在相关性,但只有通过实验证明吸烟是导致肺癌的原因,才能说存在因果性。
以上是统计学大题考试题库及答案的示例。
实际的考试题库可能包含更多的题型和复杂的问题,建议学生在准备考试时,广泛练习不同类型的题目,并深入理解统计学的原理和应用。
1. 一本书排版后一校时出现错误处数X 服从正态分布N(200,400),求:(1) 出现错误处数不超过230的概率。
(2) 出现错误处数在190~210之间的概率 卷面解答过程:解:已知X~N (200,202),则(1) P (X ≤230)=Φ(230−20020)=Φ(1.5)=0.9332(2) P (190<X <210)=Φ(210−20020)-Φ(190−20020)=0.382MINITAB 操作步骤:(1) 图形→概率分布图→查看概率→输入均值、标准差→阴影区域→左尾→X 值230 (2) 图形→概率分布图→查看概率→输入均值、标准差→阴影区域→双尾→X 值190或2102. 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。
为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队等待。
为比较哪种排队方式使顾客等待的时间更短,要求:(1) 构建第一种排队方式等待时间标准差的95%的置信区间 (2) 构建第二种排队方式等待时间标准差的95%的知心区间 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 卷面解答过程: 解:已知n=10(1) 根据抽样结果计算得x =7.150s=0.477又∵α=0.05,由单方差得总体标准差σ的95%的置信区间为(6.809, 7.491);(2) 根据抽样结果计算得x =7.150s=1.822又∵α=0.05,由单方差得总体标准差σ的95%的置信区间为(5.847, 8.453)。
(3) 根据上面两道题目的答案可知,第一种排队方式所需等待的时间较为稳定,更为可取。
MINITAB 操作步骤:(1) 输入数据→统计→基本统计量→单样本t →选择数据→选项:95%MINITAB 显示: 单样本 T: C1平均值变量 N 平均值 标准差 标准误 95% 置信区间C1 10 7.150 0.477 0.151 (6.809, 7.491)(2)同上3.调查了338名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。
统计学原理考试题一、选择题。
1. 下列哪个不是统计学的基本概念?A. 总体。
B. 样本。
C. 参数。
D. 统计量。
2. 在统计学中,描述总体特征的数字指标称为什么?A. 参数。
B. 样本。
C. 统计量。
D. 方差。
3. 下列哪个不是描述数据集中心位置的统计量?A. 均值。
B. 中位数。
C. 众数。
D. 标准差。
4. 如果一个数据集的标准差很大,表示什么?A. 数据集的离散程度大。
B. 数据集的离散程度小。
C. 数据集的中心位置偏移。
D. 数据集的分布形状不规则。
5. 在统计学中,概率分布的形状是由哪个参数控制的?A. 均值。
B. 标准差。
C. 方差。
D. 自由度。
二、填空题。
1. 样本容量为100,样本均值为30,总体标准差为5,样本标准误差为?答,0.5。
2. 一组数据的中位数为35,下四分位数为30,上四分位数为40,该组数据的四分位差为?答,10。
3. 某随机变量X的期望为20,方差为16,标准差为?答,4。
4. 在正态分布曲线上,距离均值两个标准差之外的数据占比约为?答,95.44%。
5. 在t分布中,自由度为10时,t分布的峰度为?答,3。
三、简答题。
1. 请解释参数和统计量的区别。
答,参数是用来描述总体特征的数字指标,如总体均值、总体标准差等;统计量是用来描述样本特征的数字指标,如样本均值、样本标准差等。
参数是对总体进行推断的依据,而统计量是对样本进行推断的依据。
2. 请解释正态分布曲线的特点。
答,正态分布曲线是一个钟形曲线,以均值为中心对称,曲线两侧尾部逐渐下降。
正态分布曲线的均值、中位数、众数重合,曲线的标准差决定了曲线的宽窄。
在正态分布曲线上,距离均值一个标准差之外的数据占比约为68%,距离均值两个标准差之外的数据占比约为95.44%,距离均值三个标准差之外的数据占比约为99.73%。
3. 请解释t分布与正态分布的区别。
答,t分布与正态分布的区别在于t分布是以样本容量为自由度的分布,而正态分布是以总体为基础的分布。
高中数学统计学大题10种题型在高中数学统计学中,有许多不同类型的大题。
这些题型涵盖了各种统计学的基本概念和方法。
下面是关于高中数学统计学大题的10种常见题型:1. 频数统计题:在这种题型中,学生需要根据给定的数据,计算出各个数值的频数。
这有助于学生更好地了解数据的分布情况。
2. 累计频数统计题:类似于频数统计题,但是在这种题型中,学生需要计算出相应的累计频数。
这有助于学生更好地理解数据的累积情况。
3. 平均数计算题:学生需要根据给定的数据集,计算出平均数。
平均数是一个常用的统计指标,用于衡量一组数据的集中趋势。
4. 中位数计算题:中位数是将一组数据按照大小顺序排列后,处于中间位置的数值。
学生需要根据给定的数据集,计算出中位数。
5. 众数计算题:众数是一组数据中出现次数最多的数值。
学生需要根据给定的数据集,计算出众数。
6. 极差计算题:极差是一组数据中最大值与最小值的差。
学生需要根据给定的数据集,计算出极差。
7. 四分位数计算题:四分位数是将一组数据按照大小顺序排列后,将数据分为四个等分的数值。
学生需要根据给定的数据集,计算出四分位数。
8. 箱线图解读题:箱线图是一种用于表示数据分布情况的图表。
学生需要根据给定的箱线图,回答与数据分布相关的问题。
9. 频数直方图绘制题:学生需要根据给定的数据集,绘制出对应的频数直方图。
频数直方图用于可视化数据的分布情况。
10. 统计推断题:在这种题型中,学生需要根据给定的样本数据,对总体数据进行推断。
学生需要运用统计学中的方法和技巧,进行数据分析和推断。
以上是高中数学统计学大题的10种常见题型。
通过熟练掌握这些题型,学生可以更好地理解和运用统计学的知识和技能。
考试题型一、单项选择题(每题1 分,共16分)二、多项选择题(每题2分,共16分)三、判断题(每题1分,共10分)四、填表题(每空1分,共14分)五、技能题(共44分)一、单选题C1、社会经济统计学是一门()A、自然科学B、实质性科学C、社会科学D、新兴科学C 2、要研究某市全部工业企业的产品生产情况,总体单位是()A、每一个工业企业B、全部工业企业C、每一个产品D、全部工业产品C3、要了解某市全部工业企业的职工情况,总体单位是()A、每一个职工B、每一个工业企业C、每一个工业企业的职工D、全部工业企业C 4、统计有三种涵义,其中( )是基础、是源。
A、统计学B、统计资料C、统计活动D、统计方法C5、一个统计总体()A、只能有一个指标B、只能有一个指标志C、可以有多个指标D、可以有多个指标志D6、构成统计总体的总体单位()A、只能有一个标志B、只能有一个指标C、可以有多个指标D、可以有多个标志C7、要了解100个学生的学习情况,则总体单位()A、100个学生B、100个学生的学习情况C、每一个学生D、每一个学生的学习情况C1.研究某市全部工业企业的产品生产情况,总体单位是( )。
A.每一个工业企业 B.全部工业企业C.每一个产品 D.全部工业产品D2.某自行车厂要统计该企业自行车的产量和产值,上述两个变量()。
A.二者均为离散变量B.二者均为连续变量C.前者为连续变量,后者为离散变量D.前者为离散变量,后者为连续变量B1、统计调查按调查对象包括范围的不同,可分为()A、统计报表和专门调查B、全面调查和非全面调查C、定期和不定期调查D、经常性和一次性调查A 2、统计调查按组织方式的不同,要分为()A、统计报表和专门调查B、经常性和一次性调查C、定期和不定期调查D、全面调查和非全面调查D 3、一次性调查()A、只能是定期的B、只能是不定期的C、可以是经济性的D、可以是定期和不定期的B4、在统计调查中,调查项目的承担者是()A、调查对象B、调查单位C、填报单位D、统计报表C5、在统计调查中,负责向上报告调查内容的单位是()A、调查对象B、调查单位C、填报单位D、统计报表A6、在国营工业企业设备普查中,调查单位是()A、国营工业企业的每台设备B、每个国营工业企业C、国营工业企业的全部设备D、所有国营工业企业C7、某市1995年工业企业经济活动成果的统计年报的呈报时间为1996年元月31日,则调查时间为()A、1年零1个月B、1年C、1个月D、1天B8、对我国各铁路交通枢纽的货运量进行的调查,属于()A、普查B、重点调查C、抽样调查D、典型调查C9、某手表厂为了解手表产品质量情况而进行的调查,属于()A、普查B、重点调查C、抽样调查D、典型调查B10、某市1995年社会商品零售总额统计年报的呈报时间为1996年元月31日,则调查时间为() A、1年零1个月B、1年C、1个月D、1天B11、调查大庆、胜利、大港、中原等几个大油田,以了解我国石油工业生产的基本情况,这种调查属于()A、普查B、重点调查C、抽样调查D、典型调查A3.调查时间是指( )。
第三章:编制次数分配数列1.根据所给资料分组并计算出各组的频数和频率,编制次数分布表;根据整理表计算算术平均数。
例题:某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。
要求:(1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表;(2)指出分组标志及类型及采用的分组方法;(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩; (4)分析本单位职工业务考核情况。
解答:(1)该企业职工考核成绩次数分配表:成 绩(分) 职工人数(人) 频率(%)不及格(60以下) 3 7.5 及格 (60-70) 6 15 中 (70-80) 15 37.5 良 (80-90) 12 30 优 (90-100) 4 10 合 计 40100(2)此题分组标志是按“成绩”分组,其标志类型是“数量标志”; 分组方法是“变量分组中的组距式分组的等距分组,而且是开口式分组”;(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩。
(4)分析本单位职工考核情况。
本单位的考核成绩的分布呈两头小,中间大的“钟形分布”(即正态分布),不及格和优秀的职工人数较少,分别占总数的7.5%和10%,本单位大部分职工的考核成绩集中在70-90分之间,占了本单位的为67.5%,说明该单位的考核成绩总体良好。
)(774095485127515656553分=⨯+⨯+⨯+⨯+⨯==∑∑f xf x第四章:计算加权算术平均数、加权调和平均数(已知某年某月甲、乙两农贸市场A 、B 、C 三种农产品价格和成交量、成交额资料,试比较哪一个市场农产品的平均价格 较高?并说明原因。
一,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。
抽取零售企业105家的销售收入如下表:解:先求出组中值,如上表所示。
直接按计算器,可得:算术平均数=76.09 标准差=30.65 中位数=60+ {(105/2)-34/26}*20=74.23众数=60+{(26-19)/(26-19)+(26-20)}*20=70.77附:计算器按法:开机→mode →2→shift →mode →1→=→输入数据(30 shift ,15 M+ 50 shift ,19 M+ …… )→shift →2 →计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差 2,区间估计求置信区间的方法与步骤:第一步 根据中心极限定理,构造一个含未知参数的分布 第二步 对给定的置信度, 1-α 查表得到标准分z α/2 第三步 利用不等式变形,求出未知参数1-α置信区间.⎪⎪⎭⎫⎝⎛⋅+⋅-=⎪⎪⎭⎫ ⎝⎛⋅±-n Z x nZ x n Z x σσσμμαααα222,:::1的置信区间为总体均值就有给定置信度二,总体均值的区间估计 ①正态总体,方差已知,(大、小)样本 例1,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4 mm 。
已知总体标准差σ =0.15mm ,试建立该种零件平均长度的置信区间,给定置信水平为0.95。
解:已知X-N (μ,0.152),⎺x =2.14, n =9, 1-α = 0.95,Zα/2=1.96 总体均值μ的置信区间为⎪⎭⎫ ⎝⎛+-n Z x n Z x σσαα2,⎪⎭⎫ ⎝⎛+-=915.096.14.21,915.096.14.21()498.21,302.21= 结论: 我们可以95%的概率保证该种零件的平均长度在21.302~21.498 mm 间。
当%5>N n时,需要修正,⎪⎪⎭⎫⎝⎛--⋅±1:2N n N n Z x σμα 例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样 抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
()()μασ21:%45.951,5.4,35%5%1030100n ,1000N :xx Nn∆=-==>=>==求已知 ()()()()()()86.35,14.3486.035:286.01100010010001005.42112%45.951:22=±=∆±=--⨯⨯=--⋅⋅=∆==-x x x N n N nZ Z μσααα件知由解②正态总体,大样本,当方差未知时,以样本方差替代即可 ③总体比例的区间估计重复抽样VS 不重复抽样 : ⎪⎪⎭⎫⎝⎛--⋅±⎪⎪⎭⎫⎝⎛⋅±==1::),(:222N n N n pq Z p P n pq Z p P pq s p x αα大样本例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。
在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。
试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。
解:已知 n =200 , pˆ=0.7 , α= 0.95,Zα/2=1.96()764.0,636.0200)7.01(7.096.17.0)ˆ1(ˆˆ2-±=-±n p pZ pα结论:我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%~76.4%之间。
④T 分布:正态总体、当样本容量n <30,总体标准差σ未知时,用样本标准差S 代替。
自由度为(n-1) 置信区间为:()⎪⎪⎭⎫ ⎝⎛⋅±-n s t x n 12α例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。
()()()μα21:%951136.171109.264211.79110806780789:2xn x x s nx x ∆=-=-=--==+++==∑∑求已知()()()()()()()36.803,84.77826.121.791:26.1210136.172622.22622.2%951:12110205.012=±=∆±=⨯=⋅=∆∴===----x n x n x n s t t t μααα克知由解三,样本容量的计算估计总体均值时样本容量的确定 :①根据均值区间估计公式可得样本容量n 为 22220∆=σαZ n②根据比例区间估计公式可得样本容量n 为 222)1(∆-=p p Z n α(若总体比例P 未知时,可用样本比例来代替)例:某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?nx :95.01,20,160:求已知=-=∆=ασ2462016096.116096.120:96.195.01:222=⎪⎭⎫ ⎝⎛⨯=∴⨯=⋅=∆==-n n nz z x 即知由解σααα总体方差未知时样本容量的确定例1,某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有关人员到该地区查询资料,以便估计一下该地区有电脑的家庭所占的比例。
公司希望这一比例的估计允许误差不超过0.05,且置信度为95%。
问:要抽取多大容量的样本?(事先对总体一无所知) 。
解: 已知∆=0.05,α=0.05,Z α/2=1.96,当p 未知时用最大方差0.25代替 应抽取的样本容量为385)5.0()5.01)(5.0()96.1()1(22222≈-=∆-=p p Z n α例2,某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?651%307.093.0307.093.03%33%73.991::%73.991%,3,5000:2222=⨯⨯=⨯⨯=⋅=∆∴==-=-=∆=n nnPQ z z nN p p αααα知由本容量应用最大标志值计算样解求已知4. 假设检验步骤:1、提出原假设和备择假设原假设:有待检验的假设 备择假设:拒绝原假设后可供选择的假设。
原则:(1)“不轻易拒绝原假设(2) 原假设总是与等号连在一起。
假设的三种形式: (1)双侧检验:100:,:μμμμ≠=H H(2)左侧检验:如果指标越大越好以及要求指标是否明显降低。
10:,μμμ<≥H(3) 右侧检验: 如果指标越小越好以及要求指标是否明显增加10:,μμμ>H2、选择适当的统计量,并按照中心极限定理确定其分布形式n sx t ns x Z nx Z 00,μμσμ-=-=-=3、选择选择显著性水平,确定临界值。
显著性水平表示H 0为真时拒绝H 1 的概率,即拒绝原假设的风险。
( 总是与 H 1相对应)4、抽取样本,计算样本统计量, 比较统计量与临界值的大小。
5、作出统计结论和经营管理决策结。
例题1:(右侧检验)根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N(1020,1002), 现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。
试 在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?右側检验求小样本方差已知正态总体已知1020:,,05.0,1080,16,100,1020:0>=====μασμx n .,645.14.21610010201080645.105.01020:,1020::10005.010有显著提高即这批产品的使用寿命接受拒绝原假设知由解H H nx Z Z H H ∴>=-=-===>≤σμαμμ例题2:(左侧检验)一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的 平均温度是1250℃,在过去,供货商提供的产品都符合要求,并从大量的 数据获知零件抗热的标准差为 150 ℃,在最近的一批进货中随机测试了100 个零件,其平均的抗热为 1200 ℃, 能否接 受这批产品?工厂希望对实际产 品符合要求而错误地加以拒绝的风险为0.05。
1250:05.0,1200,30100,150,1250:0<==>===μασμ证明已知x n.0=α33.3-.,,645.133.310015012501200645.105.01250:,1250::10095.0110拒收产品不合格接受拒绝而知由解H H n x Z Z Z H H-<-=-=-=-===<≥-σμαμμα 例题3:(t-检验)相关知识:正态总体、方差未知、小样本时服从t 分布()120~--=n t ns x t αμ某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。
某日随机抽查9包,测得样本平均重量为986克,样本标准差 为24克。
试问在0.05的检验水平上, 能否认为这天自动包装机工作正常?()1000:;05.0,24,986,3091000,,1000~:02====<==μαμσ求已知s x n N X ()()常这天自动包装机工作正拒绝接受而知由解.,306.275.175.19241000986306.205.01000:,1000::1008025.01210H H t ns x t t t H H n <=∴-=-=-====≠=-μαμμα例题4: (Z-检验)相关知识: 对总体比例的假设检验通常是在大样本的条件下进行的,根据正态分布来确定临界值,即采用Z-检验法。
pq P p Z nQ P P p Z 0000,-=-=某研究者估计本市居民家庭的电脑拥有率为30%。
现随机抽查了200个家庭, 其中68个家庭拥有电脑。
试问该研究者的估计是否可信(=10%)?%30:%10,34.02006830200%,30:0====>==P p n P 求已知α.:.,645.123.12007.03.03.034.0645.1:%10%30%,30::100210的该研究者的估计是可信即拒绝接受而知由解H H n PQ P p Z Z P H P H ∴<=⨯-=-===≠=αα 5. 相关与回归分析: 相关知识:(1)相关系数的计算公式:一般用表示总体相关系数,用r 表示样本相关系数。