Excel软件在标准样品定值统计运算中的应用
- 格式:pdf
- 大小:212.34 KB
- 文档页数:4
区间估计
一、区间估计的Excel实现
1、总体方差已知,在某显著性水平下,均值区间估计。
某药材生产商需要对某仓库中的1000箱药材的平均重量进行估计。
已知药材重量的总体标准差为5千克,在随机抽取40箱样本称重后计算出每箱的平均值为52千克,求该仓库中每箱药材平均重量的区间估计(置信水平95%)
2.总体方差未知,大样本(n>=30)时的均值区间估计。
某药材生产商需要对其仓库中的1000箱药材的平均重量进行估计,药材重量的总体方差未知。
随机抽取50箱样本称重后
结果如下表所示。
求该仓库中每箱药材平均
重量在95%置信水平下的区间估计。
3.总体方差未知,小样本(n<30)下的均值区间估计。
T分布
tinv( )——求某自由度水平下,某显著性水平(注意录入的是a,而不是a/2!)下的t临界值。
某药材生产商需要对其仓库中的1000项药材的平均重量进行估计,药材重量的总体方差未知,随机抽取16箱样本称重后结果如下表所示,求该仓库中每箱药材平均重量在95%置信水平下的区间估计。
二、样本容量估计
已知样本方差、抽样误差,求样本容量。
教材55页,第5题
课堂练习:某市场调查公司接受客户委托,调查学生每月上网的时间,由于市场调查公司没做过此类调查,在正式调查前首先进行了一次预调查,抽取了20名学生进行访谈,结果如下表所示。
而客户要求偏差不超过0.5小时,试分别求在1%和5%的显著性水平下需要调查的学生的数量。
表1 20名学生每月上网时间(小时)
参考答案:a=0.01时,n=572人;a=0.05时, n=331人。
Excel在统计中的应用Excel与数据统计分析一、实验说明(一)中文Excel 简介Microsoft Excel 是美国微软公司开发的Windows 环境下的电子表格系统,它是目前应用最为广泛的办公室表格处理软件之一。
自Excel 诞生以来 Excel 历经了Excel5.0、Excel95、Excel97 和Excel2000 等不同版本。
随着版本的不断提高,Excel 软件的强大的数据处理功能和操作的简易性逐渐走入了一个新的境界,整个系统的智能化程度也不断提高,它甚至可以在某些方面判断用户的下一步操作,使用户操作大为简化。
Excel 具有强有力的数据库管理功能、丰富的宏命令和函数、强有力的决策支持工具、图表绘制功能、宏语言功能、样式功能、对象连接和嵌入功能、连接和合并功能,并且操作简捷,这些特性,已使Excel 成为现代办公软件重要的组成部分。
由于大家对Excel的常用办公功能都比较熟悉,本实验重点介绍Excel在统计分析中的应用。
(二)实验目的与要求本实验重点介绍Excel在统计分析中的应用,包括Excel在描述统计中的应用以及Excel在推断统计中的应用,要求学生熟练掌握运用Excel进行统计分析的方法,并能够对分析结果进行解释。
二、实验实验一 Excel 在描述统计中的应用实验目的及要求要求学生掌握运用Excel进行描述统计分析、绘制各种图表和运用数据透视表工具的技术。
实验容及步骤(一)描述统计分析例1-1:表1-1是1978-2005年我国城镇居民可支配收入数据,试求城镇居民可支配收入时间序列的基本统计量。
表1-1 1978-2005年我国城镇居民可支配收入(元)年份城镇居民可支配收入年份城镇居民可支配收入1978 344 1992 2026.6 1979 405 1993 2577.4 1980 477.6 1994 3496.2 1981 500.4 1995 4283 1982 535.3 1996 4838.9 1983 564.6 1997 5160.31984 652.1 1998 5425.11985 739.1 1999 58541986 899.6 2000 62801987 1002.2 2001 6859.61988 1181.4 2002 7702.81989 1379 2003 8472.21990 1510.2 2004 9421.61991 1700.6 2005 10493STEP1:用鼠标点击工作表中待分析数据的任一单元格。
Excel软件在检验科日常工作中的运用摘要:excel是微软公司出品的office系列办公软件中的一个组件,它用来制作电子表格、完成许多复杂的数据运算、进行数据的分析和预测并且具有强大的制作图表的功能。
由于excel具有十分友好的人机界面和强大的计算功能,因此在实验室中用来对实验数据进行登记、筛选、处理、统计、分析乃至质量控制管理十分方便,它已成为许多实验室人员的得力助手[1]。
近年来,随着实验室信息化的进程、现代实验室信息系统(lis)的建立,很多实验室花大力气构建了无纸化办公系统,本文简单介绍了一些在日常工作中使用excel软件的方法,可以大大方便检验科人员的工作。
关键词:excel软件检验科日常工作中图分类号:tp2 文献标识码:a 文章编号:1672-3791(2013)01(b)-0007-02excel软件是大家经常用到的一个软件,随着实验室信息化的进程这个软件的运用也越来越广泛。
现将平时使用excel软件的情况总结如下。
1 管理质控数据,绘制质量控制图excel软件有强大的数据和图表处理功能,对于各种质控数据可以使用excel软件将质控报表的相应条目定义在excel工作表的不同单元格中,均值、标准差、变异系数等的运算借助excel提供的各种函数;质控图的绘制、页面的调整和数据的备份等操作由预先设计的各种宏自动完成。
一个项目对应一个工作表。
处理质控图所用的工具是excel模板而不是程序,因而系统无须安装,可以直接在任意一台装有excel的电脑上使用[2]。
数据的录入、修改、保存,页面的设置和调整,项目的增减和调整随时可以进行,相当方便。
用其管理质控数据绘制质量控制图更是非常方便,这方面的文章在这些年中发表了不少,这里简单介绍一下绘制均值质控图的步骤。
(1)积累到足够的数据,然后a1-l1中分别输入以下字段名:测定序号、测定结果1(x1)、测定结果2(x2)、每组均值()、标准差s、上控制限、上警告限、上辅助限、中心线()、下辅助限、下警告限、下控制限。
Excel在统计学中的具体应用众所周知,统计学可以利用比较科学的方法来对数据信息资料进行合理的收集、整理、整合与分析,同时,在此基础上,再对其进行合理的判断与决策的一门科学。
统计学的狭义定义就是数据信息或者是在数据信息中获取其他数字。
在上述定义中可以发现,统计学的重点就是对数据信息资料进行相应的分析和加工。
然而,电脑中的Excel软件具有自己独特的优势,该软件具有十分强大的数据信息分析的功能,所以,可以将其应用在统计学的工作中。
除此之外,所开发的专业统计分析软件也同样使Excel软件逐渐成为统计学分析过程中比较实用并且具有高效性的软件工具。
但是,除了该软件以外,专业的统计软件还包括SPSS与SAS等软件,由于其价格比较高,并且需要比较专业的编程,所以,与Excel软件相比并没有普及性。
一、Excel软件数据库统计函数以及数据透视表在电子表格的软件当中,Excel软件的数据结构核心就是单元格与单元格区域,所以,该软件与数据库软件具有一定的相似性,都是对有规律的数据信息资料进行管理与处理[1]。
在Excel软件行列结构的基础上,需要在具体的工具表中根据标准数据库的规范来进行数据信息的处理工作,也可以被称作是Excel软件内部数据库技术。
在Excel软件内部数据库的创建基础上,能够利用数据库的函数来对数据信息进行相应的统计与分析。
数据库统计函数创建内部数据库以后,使得Excel软件内部包含了一组工作表函数,该函数能够对存储与数据清单或者是数据库中的所有数据信息进行全面的统计运算,所以,上述函数被统称为数据库函数,也就是Dfunctions[2]。
而在以上函数中的每种函数都会对应三个参数,主要是field、database、criteria。
这三个参联盟数相对应的函数使用的工作表区域,就可以应用在日常的统计学工作中,并对数据信息资料进行基本的统计与运算。
其中,Dfunctions存在相同的语法格式:第一,数据库函数的名称就是Dfunctions,并且在Excel 软件内部一共包括十二个相似的数据库函数。
Excel及其数据分析功能评定标准物质均匀性标准偏差张倩;刘存成;马茂冬;靳京民【摘要】建立了Excel及其数据分析功能评定标准物质均匀性标准差的方法.利用Excel所提供的数据分析功能,即单因素方差分析,计算获得标准物质均匀性测量数据的标准差等统计量.统计结果与按照JJF 1343-2012规定的统计量相同.该方法简便、快速,数据处理效率提高,简化了标准物质均匀性标准差的评定过程.【期刊名称】《化学分析计量》【年(卷),期】2018(027)0z1【总页数】4页(P85-88)【关键词】Excel;数据分析;标准物质;标准差;均匀性【作者】张倩;刘存成;马茂冬;靳京民【作者单位】中国兵器工业标准化研究所,北京 100089;西安北方光电科技防务有限公司,西安 710043;中国兵器工业标准化研究所,北京 100089;中国兵器工业标准化研究所,北京 100089【正文语种】中文【中图分类】O657均匀性是标准物质的基本属性,用于描述标准物质特性的空间分布特征。
在标准物质的研制与生产过程中必须进行均匀性评估,以证明具有良好的均匀性[1-3]。
按照JJF 1343-2012 《标准物质定值的通用原则及统计学原理》规定,一般情况下,采用单因素方差分析法进行均匀性评估[4]。
按照JJF 1343-2012的规定,采用Excel电子表格,逐步计算获得标准物质均匀性测量数据的标准差等统计量,计算过程繁杂且容易出错。
为此,通过研究,笔者利用Excel所提供的数据分析功能,即单因素方差分析,简便而快速地获得相同结果的统计量,数据处理效率大大提高,简化了标准物质均匀性标准差的评定过程。
该方法既提高了数据处理的效率,又为标准物质定值不确定度评定的通用化和计算机程序化奠定了基础。
1 均匀性评估统计模式为进行样品均匀性评估,从标准物质总体单元中抽取m个单元,选择不低于定值方法精密度和灵敏度的测量方法,在相同条件下的m组等精度测量数据如表1所示。
实验室管理Excel软件在标准样品定值统计运算中的应用胡修伟,张翠敏,彭 霞,胡晓燕,唐本玲(钢铁研究总院分析测试研究所,北京100081)中图分类号:O21 文献标志码:B 文章编号:1001 4020(2010)07 0834 03GB/T15000系列 标准样品工作导则要求标准样品定值一般采用多家实验室协作定值的方式,标准值确定过程中需应用正态性检验、异常值检验、等精度检验等手段判断数据正确性,数据运算量较大。
尤其是夏皮罗 威尔克检验较为复杂,常用的统计软件如SPSS、SAS、OriginPro等在处理该统计时需编写程序,一般使用者难于掌握[1]。
Excel软件计算功能强大、操作简单,是目前应用最广泛的办公软件之一。
本工作设计了一个Excel电子表格,使用者只需输入各实验室测试原始数据即可由Excel软件自动完成标准样品定值统计运算中所涉及的全部数据,无需借助其他专业软件。
1 标准样品定值统计运算中需计算和引用的数据将标准样品定值统计运算中需计算和引用10多种相关数据分别由Excel公式直接计算数据、引用数据或间接计算数据两类。
1.1 由Excel公式直接计算极差、平均值、总平均值、标准偏差、数据组数、中位值和格拉布斯检验统计量等数据,具有定义简单、数据运算量小、Ex cel自带公式等特点,可由Excel公式直接计算获得。
1.2 引用数据或间接计算数据1.2.1 正态性检验根据GB/T4882-2001 数据的统计处理和解释正态性检验,当数据量不太大时(8!n!50),一般采用夏皮罗 威尔克检验(后经弗朗夏扩充,当n!100时均可使用[2])。
夏皮罗 威尔克检验是基于次序统计量对它们期望值的回归,是一个完全样本的方差分析形式的检验。
检验统计量为样本次序统计量线性组合的平收稿日期:2009 10 07方与通常的方差估计量之比。
建立在次序观测值基础上,将n个独立观测值按非降次序记为x(1),x (2)∀x(n),如果一些观测值相等,按原数列中出现的次数,将相等的观测值重复列出,然后计算统计量W:W=[#l k=1 k(x n+1-k-x k)2]#nk=1(x k-x)2(1)式中:W为夏皮罗 威尔克检验统计量;k取值根据n 的奇偶性分别取1,2,3∀,n/2(n为偶数)或1,2, 3∀(n-1)/2(n为奇数); k为样本容量为n时对应k的一组特定系数,可由系数表查出,l值视n为奇数或偶数分别取(n-1)/2和n/2。
在显著性水平a=p下,如果统计量W值小于其p分位数则拒绝零假设,一般常用a=p=0.05和a=p=0.01时的p分位数判断正态性,即对于样本容量为n的一组测试数据,计算W,然后根据以下原则判断:(1)若W大于样本容量为n,且a=p=0.05时的p分位数,则这组测试数据呈正态分布;(2)若W介于样本容量为n,且a=p=0.05时的p分位数和a=p=0.01时的p分位数之间,则这组测试数据呈近似正态分布;(3)若W小于样本容量为n,且a=p=0.01时的p分位数,则这组测试数据非正态分布。
1.2.2 异常值检验根据GB/T4883-2008 数据的统计处理和解释正态样本离群值的判断和处理,异常值检验可采用奈尔检验、格拉布斯检验、狄克逊检验、偏度 丰度检验等方法,标准样品研制中一般进行格拉布斯上侧检验和下侧检验,即分别计算:G(n)=[x(n)-x]/s(2)G(n∃)=[x-x(1)]/s(3)式中:G(n)、G(n∃)分别为上、下侧统计量;x(n)、x% 834 %(1)分别为样本最大、最小观测值;x、s分别为样本平均值与样本标准差。
确定检验水平a和剔除水平a*,由格拉布斯检验法临界值表中查出对应n,a的临界值G1-a(n)和对应n,a*的临界值G1-a*(n),当G(n)、G(n∃)大于G1-a*(n)为高度异常值,必须剔除,G(n)、G(n∃)大G1-a(n)于时为异常值,需引起注意(一般a为0.05, a*为0.01)。
1.2.3 等精度检验一般采用柯克伦检验判断数据是否等精度。
根据GB/T6379.2-2004 测量方法与结果的准确度,当每个子样本(每个实验室数据)数相同时,先分别计算各实验室数据组内方差,再计算柯克伦检验统计量:S2=#(x i-x)2n-1(4)C=S2max#S2(5)式中:S2为各实验室数据组内方差;x i为各实验室原始数据;x为各实验室平均值;n为实验室独立测试次数;C为柯克伦检验统计量;S2max为各实验室数据组内方差中最大值。
确定检验水平a和剔除水平a*,由柯克伦法临界值表中查出对应n-1,a的临界值C(n-1,a)和对应n-1,a*的临界值C(n-1,a*)。
当C大于C (n-1,a*)时,S2max所在实验室数据为高度异常值;当C大于C(n-1,a)时,S2max所在实验室数据为异常值(一般a为0.05,a*为0.01)。
2 Excel电子表格的设计考虑到Ex cel各版本的普及性,此电子表格基于Ex cel2003设计。
2.1 Excel电子表格设计过程采用表1所示的Ex cel电子表格作为标准值定值汇总表,在此电子表格内完成全部相关数据运算,由于部分数据不能直接计算,需计算过渡数据,在此将过渡数据一并置于表格内,最终完成后再隐藏相应行或列。
表1 Excel初始电子表格Tab.1 Excel electronic initial chartA B C D E F G H I J K L M N 1名称1编号1项目C2实验室测量值极差组内标准偏差S2i n i/S2i平均值方法312344A5B6C7D8E9F10G11H12I13总平均值S N C0.01C0.05C n1n2b1b2W0.01()W0.05()W() 14151617中位值G0.01G0.05G min G max W0.01()W0.05()W() 1819推荐值标准偏差数据组数具体操作步骤如下:(1)新建Ex cel工作簿,建立如表1所示工作表,命名为Sheet1。
(2)于此工作簿中建立DAT A工作表,在DATA工作表S~U列输入夏皮罗 威尔克检验p 分位数表、在A~C列输入格拉布斯检验临界值G1-a(n)和G1-a*(n)、在E~J列、L~Q列分别输入柯克伦检验临界值C(n-1,a)和C(n-1,a*),建立A工作表在A1~Z50区域内输入夏皮罗 威尔克检验系数a k。
(3)在行1,2,13,17相应单元格输入说明文字,如名称、编号、项目、平均值等。
(4)在A4~A12单元格内输入协作实验室名称(以A~J代替),B3~E3单元格为实验室重复试验次数(一般为4次),则B4~E12区域用于输入检测原始数据,本工作假设有n个实验室测试得出N%835%个数据(N =4n),M4~M 12单元格用于输入各实验室所采用分析方法。
(5)在F4单元格内输入公式&=MAX (B4:E4)-M IN (B4:E4)∋,并拖动填充柄至F12单元格,即可获得实验室内数据极差。
(6)在H 4单元格内输入公式&=POWER (STDEV(B4:E4),2)∋,并拖动填充柄至H 12单元格,即可获得实验室内数据方差。
(7)在L4单元格内输入公式&=AVERA GE (B4:E4)∋,并拖动填充柄至L12单元格,即可获得实验室数据平均值。
(8)在A14、B14、C14、A18单元格内分别输入公式&=A VERAGE (L4:L12)∋、&=STDEV (L4:L12)∋、&=COUNT A (L4:L12)∋、&=M EDIAN (L4:L12)∋,分别计算总平均值、标准偏差、数据组数(实验室数)、中位值。
(9)在F14单元格内输入公式&=M AX(H 4:H 12)/SU M(H 4:H 12)∋计算柯克伦检验统计量,在H 14单元格内输入公式&=COUNT (B3:E3)∋计算实验室重复测量次数,在D14单元格、E14单元格内分别用INDEX 函数引用DAT A 工作表内柯克伦检验临界值C(n -1,a *)和C(n -1,a)数据。
INDEX 函数为二维引用函数,其语法为:INDEX(arr ay ,row _num,column_num ),其中ar r ay 为指定的查找区域,row _num,column_num 分别为行号和列号[3]。
在D14、E14单元格分别输入公式&=IN DEX (DATA!$L:$Q,C14,H 14)∋、&==IN DEX (DAT A!$E:$J,C14,H 14)∋,即分别在DA TA 工作表的L ~Q 列、E ~J 列查找C14中数据行,H 14中数据列所定位的单元格数据并引用。
(10)在D18、E18单元格分别输入公式&=(A14-MIN (L4:L12)/B14∋&=(MAX (L4:L12)-A14)/B14∋,计算格拉布斯检验上、下侧统计量,在B18、C18单元格用LOOKUP 函数引用DATA 工作表内格拉布斯检验临界值G 1-a *(n)和G 1-a (n)数据。
VLOOKUP 函数为列查找函数,其语法为:VLOOKUP(loo kup_value,table_array,co l_index _num,rang e_lookup),其中lookup_value 为首列查找数据,table_arr ay 为查找区域,col_index _num 为返回数据位于第几列,rang e_lo okup 为进行精确查找或模糊查找,为零或缺省时函数进行精确查找[3]。
在B18、C18单元格分别输入公式&=VLOOK UP(C14,DAT A!$A:$C,2)∋、&=VLOOKUP (C14,DAT A!$A:$C,3)∋,即分别在DAT A 工作表A ~C 列中查找A 列为C14单元格数据的行,并返回该行B 列、C 列单元格中的数据。
(11)在L14、M14、L18、M 18单元格用VLOOKU P 函数引用DATA 工作表内样本容量分别为n 、N 时a =p =0.01和a =p =0.05的p 分位数,公式与步骤(10)相似,不累述。
(12)在N14、N18单元格计算样本容量为N 、n 时的夏皮罗 威尔克检验统计量,涉及运算较多,以N14单元格计算样本容量为N 时w 为例说明如下:由式(1),分别计算对应每个k =1,2,∀∀l 的a k (x n +1-k -x k )2,这里需在15~16行计算25个a k (x n +1-k -x k )2数据,涉及MAX 、M IN 、LARGE 、SMA LL 、VLOOKUP 函数。