当前位置:文档之家› 置信区间与置信水平

置信区间与置信水平

置信区间与置信水平
置信区间与置信水平

“置信区间与置信水平、样本量的关系

置信水平Confidence level

置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

一、置信区间的概念

置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。置信区间是按下列三步计算出来的:

第一步:求一个样本的均值

第二步:计算出抽样误差。

人们经过实践,通常认为调查:

100个样本的抽样误差为±10%

500个样本的抽样误差为±5%

1,200个样本时的抽样误差为±3%

第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。

举例说明:

美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为:

国别样本均值抽样误差置信区间

美国55% ±3% 52%-58%

德国26% ±3% 23%-29%

日本17% ±3% 14%-20%

二、关于置信区间的宽窄

窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。

假设全班考试的平均分数为65分,则

置信区间间隔宽窄度表达的意思

0-100分 100 宽等于什么也没告诉你

30-80分50 较窄你能估出大概的平均分了(55分)

60-70分10 窄你几乎能判定全班的平均分了(65分)

三、样本量对置信区间的影响

影响:在置信水平固定的情况下,样本量越多,置信区间越窄。

下面是经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):

样本量置信区间间隔宽窄度

100 50%—70% 20 宽

800 56.2%-63.2% 7 较窄

1,600 57.5%—63% 5.5 较窄

3,200 58.5%—62% 3.5 更窄

由上表得出:

1、在置信水平相同的情况下,样本量越多,置信区间越窄。

2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

通过置信区间的计算公式来验证置信区间与样本量的关系

置信区间=样本的推断值±(可靠程度系数×)

从上述公式中可以看出:

在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。

四、置信水平对置信区间的影响

影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

举例说明:美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:

抽样误差置信水平置信区间间隔宽窄度

±3% 95% 60%±3%=57%-63% 6 宽

±2.3% 90%60%±2.3%=57.7%-62.3% 4.6 窄

由上表得出:

在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

五、样本量对置信水平的影响

影响:在置信区间不变的情况下,样本量越多,置信水平越高。

举例说明:

置信区间样本量置信水平

52%-58% 1,200 95% (前面美国盖洛普公司的例子)”

https://www.doczj.com/doc/e63477828.html,/magazine/0252-3116/2008/03/2470138.htm

图书馆用户满意度测评流程与技术分析

推荐到首页

□ 杨广锋韩新月王秀华《图书情报工作》2008年第03期

1/4页1234

[摘要]用户满意度测评的可靠性、有效性和实用性直接来源于测评的流程与技术应用,其中,调查方式、抽样技术以及调查邀请与督导构成了调查对象的控制技术,是数据采集范围的保证。指标体系、量表设计、问卷形式与处理构成了调查数据的控制技术,保证了数据采集的形式和质量。最后,数据统计分析和制图技术展现了测评的具体结果。

[关键词]用户满意度服务质量图书馆评价

[分类号]G251 G252

随着图书馆由资源范式向服务范式转型,服务质量和用户满意度成为图书馆评价关注的重点。满意度测评(satisfaction measurement)是一种定量评价,其测评内容必须具有度量意义并且可以度量,测评指标体系的构建是首当其冲的研究重点,但测评流程和技术也是至为关键的。因为无论多么完善的指标都只有经过严密的测评流程控制才能保证其可靠性、有效性和实用性。

1用户满意度概述

1.1图书馆用户满意度

用户满意是用户对其需求已被满足程度的感受。满意度是这种感受的定量化描述,是用户接受产品和服务的实际感受和其价值感与期望值之间的差异函数。满意度是在服务接触过程中具体形成的,不同行业的服务内容、服务方式决定了用户满意度各有特点。

随着信息技术的发展、信息自由和平等获取价值观的确立,任何具有信息需求的个体和群体都可能成为图书馆的用户,图书馆的服务范围得到空前拓展。但同时,图书馆服务仍然具有不同于市场服务的特性:①多数图书馆尚不具备对所有用户群提供均等服务的经济力量,还必须在兼顾所有用户群的前提下寻求资源的合理配置;②图书馆需要保证最大程度地服务于母体机构的战略目标,也常常要为不同用户群提供质量不等的服务;③用户自身也并不能完全自由地选择图书馆服务的来源和内容,图书馆之间的用户争夺并不明显,网络、书店、咨询公司等才是图书馆用户转移的方向。

1.2测评一般流程

用户满意度测评是一种以用户为主体、以满意度为对象、兼具鉴定性和发展性的评价方法,具体包括比例法、均值法和结构方程模型法三种方法。满意度测评是对用户的态度进行量化和对用户满意状况数据进行统计分析的过程,需要从样本数据中提取有统计价值的信息,并利用这些信息推断总体信息(见图1)。

从技术的角度看,可以把整个流程分为调查对象控制、调查数据控制和数据分析与展示三个方面。图书馆服务的特点又决定了其具有不同于一般满意度测评的技术方法。

2调查对象的控制技术

调查对象即图书馆用户中参加测评的对象,是测评数据的具体来源。选择调查对象既要照顾到各种用户群,又要考虑到图书馆服务的重点,既要照顾到调查的全面性,又要考虑调查的效率和可行性。在满意度测评中,主要通过控制调查方式、抽样技术和调查邀请与督导来调节这几方面的平衡。

2.1调查方式

用户的调查方式有许多种,适用于满意度测评的方式主要有以下三种:

·面访调查。面访调查即调查员持纸质的调查问卷进行当面调查。面访调查中调查者具有主动性,可以有意识地按照调查意图控制样本和问卷的质量,在调查中也可以获取较多的信息内容。但面访调查的成本较高,调查的客观性受调查员的影响也比较大。

·邮件调查。最常见的邮件调查是邮寄调查和电子邮件调查。另外,留置问卷调查也属于此种类型,即调查者将问卷发放到用户手中、邀请或要求其在一定时间内填写问卷后予以回收。邮件调查的保密性好,没有调查员影响偏差。但问卷回收率比较低,调查的可控性不强。

·网站调查。网站调查就是把设计好的调查问卷放在机构主页上,让用户自主进行填写。有时调查者也会向目标用户发出一份解释调查性质并邀请他们参加的电子邮件,邮件中包含调查问卷的超级链接。网站问卷调查的结果可以自动进入数据库,便于快速处理。网站问卷调查受用户主导,成本低、速度快,但调查对象、回答率比较难以控制。目前,较为典型的网站调查方式的实例就是ARL的LibQUAL+TM。

2.2抽样技术

受测评成本、用户分布等限制,不可能对所有的用户都进行调查。实际上,完全调查不会比随机抽样提供更多的信息。用户抽样就是从总体中抽取若干个体作为调查样本,通过对样本的调查分析达到对总体情况了解的方法。常见的抽样方法有:

·概率抽样。也称随机抽样,就是按照随机原则进行抽样,总体中的每个个体都有一定的机会被抽中。概率抽样能够保证样本数据对总体参数的代表性,而且它能够将调查误差中的抽样误差限制在一定范围之内。但严格的概率抽样操作复杂、成本较高,对抽样设计人员的专业技术要求也较高。

·判断抽样。判断抽样是指调查者根据实际情况人为地确定样本,或由了解情况的专家圈定样本的抽样方法。判断抽样不利于对总体参数进行估计,也不能从概率的意义上控制误差。因而理论上不具备由样本对总体进行推断的依据。但判断样本对于图书馆用户满意度测评是非常有用的,因为图书馆用户呈现出较强的群体特征,如科研人员、研究生等身份用户群,或者理工、文史、医学等学科用户群。有意识的判断抽样有利于更准确地反映图书馆的发展状况。

·自愿样本。自愿样本不经过调查者的抽取,而是由自愿接受调查的用户直接组成样本,网站调查就是采取自愿样本的方法。自愿样本组织方便、成本低廉,而且参与者大多是对调查内容的关心者,他们态度的分析更具价值性。但自愿样本往往集中于某些特定的用户群,与总体结构相距较远,调查结果不能完全反映总体状况。

2.3调查邀请与督导

满意度测评往往需要综合应用多种调查方式和抽取技术。同时,为了充分争取用户的配合,还会根据测评意图主动控制样本数量和规模。面访调查时可以直接控制样本情况,而在邮件调查和网络调查时,则需要向目标用户主动发出“调查邀请函”。在测评过程中,当样本结构出现偏差时还应适时发出及时“提醒信”。

邀请函和提醒信的内容基本相同,主要说明调查的内容、目的和意义,并申明调查资料的保密性,以充分争取用户的合作。提醒信中还应重点标明调查的结束日期,提醒用户尽快填写问卷。为方便用户,采取邮件调查时会直接附带问卷,网站调查时则直接在E-mail中标明调查问卷的超级链接。

3调查数据的控制技术

3.1指标体系设计

满意度比例法测评和均值法测评的指标体系设计采用的是层次化构建方法,即将用户满意度分解为几个方面,再将该方面具体化为若干具体指标。在层次化指标体系中,同样涉及信息资源、信息人员、服务内容和图书馆环境四个方面,与传统的测评只是测评目的、出发点和主体上的区别。

层次化指标体系的构建不是一个逻辑思维的产物,而是需要使用德尔菲法、主成因法、因子分析法等多种方法,经过目标分解、指标简化、权值确定等多个环节以及局部试调、修正完善的严格实践验证过程。完善的指标体系应具有的特征:①可以测量,具有统计分析意义和可操作性;②来源于用户,是用户认为重要的,具有实用性;③能够为图书馆所控制,对工作改进具有实际指导意义;④考虑到与竞争者的比较,便于基准检验、横向比较和学习,体现前瞻性。

但由于不同图书馆的服务方式、服务内容各有特色,具体测评的意图和目的也有所区别,层次化指标体系呈现很大的个体性和人为性。结构方程法指标体系的设计则克服了这些缺点,它深入满意度形成的具体过程,从服务期望、服务感知、用户价值、满意度、忠诚度、抱怨度等前因后果上构建指标体系。商业营销领域通用的满意度测评CSI(Customer Satisfaction Index)便采用了路径性指标体系构建方法和结构方程模型测评法。

3.2量表设计

指标体系确定了测评的内容,量表则规定了测评数据的形式。满意度的测评尺度属于对于调查者心理状态和情感测度的态度量表,常有的形式有:

·李克特量表。李克特量表用于测量对一句陈述的认同程度,一般设5级备选答案,范围从非常赞成到非常不赞成,中间为中性类。例如“很满意、比较满意、一般、不满意、很不满意”。在转化成量化数据时,通常需要人为赋值。李克特量表的优点是简单易懂,但其结果不太精确,对于满意状态的覆盖面比较有限。

·语义差异量表。语义差异量表以形容词的正反意义为基础,一般包含一系列形容词及其反义词,在每一个形容词和反义词之间有约7-11个区间,较多的级数可以更为精确地表示用户的态度。

同时,语义差异量表可以是对称量表,也可以具有某种倾向。如表1所示的就是具有肯定倾向的语义量表,适合对服务表现比较好的图书馆进行用户满意度测评。对于那些不太满意的用户,由于人数不多,可以逐一询问,探查他们不满意的原因,并及时予以补救。

·数字量表。数字量表就是要求被访者对自己的态度直接给出一个分数的方法。分数的级别大小没有严格限制,常用的有五分制、十分制和百分制。数字量表将对态度强度的量化过程直接交给了用户,在一定程度上避免了对不同答案进行分级量化的主观偏差。数字量表反映的信息较多,但填写难度比较大。LibQUAL+TM采用的是用户选择打分的9级数字量表。

3.3问卷形式

·一列问卷表。只调查用户的满意度,要求用户根据自己的实际感知与期望质量直接判定服务质量。各项目的权重用户不予考虑,分析过程中可以忽略,也可以由专家赋值。

·两列问卷表。同时调查用户满意度和关注度,用户在确定自己对于某项目的满意程度时,要同时判定该项目的重要性。用户关注度的调查是把项目权重的赋予权交给了用户(见表2)。

3.4问卷处理

满意度调查一般持续一个月左右。在调查期间,要及时回收问卷。问卷回收工作的要点是:①及时掌

握每天完成的问卷数和接受的问卷数,以掌握测评的进度;②对接受的每一份问卷都要记录一个唯一的、有顺序的识别号码,作为原始的文件,以方便随时查找原始资料;③问卷回收必须保证原始问卷的良好保存。

问卷处理时还需要鉴别有效问卷,即具有数据统计分析意义、并且符合测评目的的问卷。不符合要求的问卷便视为无效问卷,弃而不用。无效问卷通常有这样几种情况:①回答不完全,即有相当多的问卷没有填写答案。例如,清华大学的调查中超过1/3的问题没有回答的即视为无效㈣;②回答没有变化的问卷,例如在7级的量表中,其回答全是4,完全没有正向或者反向的看法;③在截至日期之后回收的问卷;④前后矛盾或有明显错误的问卷,例如具体项目都比较满意但总体满意度很差的问卷;⑤纸质问卷调查中有明显缺损的问卷。

4调查数据分析与展示

4.1数据分析

数据统计分析是应用SAS、SPSS等软件对采集到的原始数据进行运算处理,并由此对研究总体进行定量描述与推论,从而得出最后的测评结果。统计分析的方法包括:

·描述统计分析。描述统计是对其调查数据的集中趋势(众数、中位数、平均数)和离散趋势(标准差、方差、离散系数)进行数量描述的分析方法,着重于对数量水平或其他特征的描述,而不具有推断性质。

·推论统计分析。满意度测评是通过抽样调查推断用户总体的方法,这种推断成立的前提包括问卷设计的科学性和样本抽取的有效性。前者需要进行相关的信度和效度检验,信度检验保证调查结果的一致性、稳定性和可靠性;效度检验保证问卷能够真实地测量到所有测量的东西,达到测评的目的。样本抽取的有效性需要进行必要的参数估计,通过推断总体参数的置信区间来判断。

·多元统计分析。多元统计是对多个变量进行分析的技术,诸如判别分析、因子分析、聚类分析等具体方法。在用户满意度测评中,多元统计分析是判断测评指标稳定性的重要工具。LibQUAL+TM测评方面变化的依据就是多元统计分析,特别是因子分析的结果。

4.2制图技术

满意度测评的结果一般需要利用图形来予以形象化的展示。除传统的圆饼图、线图、条形图外,还有一些针对不同问卷调查形式的专门制图技术:

4.2.1 满意度对比图如果满意度测评采用李克特5级量表和一列问卷表的形式,满意度对比图就是最适用的图解方法(见图2),其方法是:将“比较满意”和“很满意”的百分数相加或叠加在一起,称为满意度;将“很不满意”和“不满意”的百分比合并,称为不满意度,将满意度和不满意度分别按直方图的形式做成对比图;中立的态度“一般”在图中不出现。满意度对比图可以直观地表示出用户对各项项目的满意程度。br> 4.2.2关注度/满意度矩阵关注度/满意度矩阵是两列问卷表的图示工具。如图3所示,矩阵图中纵轴表示用户的关注度(重要性),横轴表示用户的满意度,从而形成四个象限。根据测评的结果将各项目在此矩阵中进行定位。关注度/满意度矩阵的优点在于能够对各项目进行分析,如落在图中的阴影部分的项目即表示用户关注度高但图书馆表现比较差的环节,是今后工作中需要重点改进的部分。

4.2.3容忍阈图和雷达图三列问卷表形式的制图技术有容忍阈图和雷达图两种。容忍阈图如图4所示,用户的最低服务期望和理想服务期望之间会形成一个服务容忍区域,也就是容忍阈;用户实际感知与最低服务之间的差距构成服务的合格度,实际感知与理想服务之间的差距构成服务的优秀度。将这些指标统一到一个坐标系中就形成了容忍阂图。容忍阈图的优点在于可以同时表示项目的重要程度、合格程度和优秀程度。

如果指标比较多,雷达图(Radar Chart)就是较好的图示工具。雷达图又称为蜘蛛网型图(SpiderChart),是将分值转化为一组同心圆,各项目或测评指标构成从圆心散射的若干轮辐,然后根据测评的结果在其间

进行标识。当把各指标的理想期望、最低期望和实际感知分别连结后,就会形成不同的区域。灰色的区域表示实际感知高于理想服务水平,是图书馆服务的强势;而黑色的区域表示实际感知低于最低期望,是以后工作改进的重点。

5结语

调查对象的控制确保了数据采集的范围,调查数据的控制保证了数据采集的形式和质量,数据的分析与展示反映了测评的具体结果,三者相互影响、互为因果,需要根据具体情况密切配合才能取得良好的测评效果。当然,完整的满意度测评还需要辅之以定性方法,并在测评的有效性和实用性、测评成本和信息价值之间取得平衡。

第四节正态总体的置信区间

第四节 正态总体的置信区间 与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色. 本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间; 4. 双正态总体均值差(方差已知)的置信区间; 5. 双正态总体均值差(方差未知但相等)的置信区间; 6. 双正态总体方差比的置信区间. 注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的. 分布图示 ★ 引言 ★ 单正态总体均值(方差已知)的置信区间 ★ 例1 ★ 例2 ★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4 ★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ 双正态总体均值差(方差未知)的置信区间 ★ 例7 ★ 例8 ★ 双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4 内容要点 一、单正态总体均值的置信区间(1) 设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间 ,,2/2/???? ? ??+?-n u X n u X σσαα 二、单正态总体均值的置信区间(2) 设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量 n S X T /μ-=, 从第五章第三节的定理知).1(~/--= n t n S X T μ 对给定的置信水平α-1, 由 αμαα-=? ?????-<-<--1)1(/)1(2/2/n t n S X n t P ,

Excel求置信区间的方法

应用Excel求置信区间 一、总体均值的区间估计 (一)总体方差未知 例:为研究某种汽车轮胎的磨损情况,随机选取16只轮胎,每只轮胎行驶到磨坏为止。记录所行驶的里程(以公里计)如下: 假设汽车轮胎的行驶里程服从正态分布,均值、方差未知。试求总体均值μ的置信度为的置信区间。 步骤:

1.在单元格A1中输入“样本数据”,在单元格B4中输入“指标名称”,在单元格C4中输入“指标数值”,并在单元格A2:A17中输入样本数据。 2.在单元格B5中输入“样本容量”,在单元格C5中输入“16”。 3.计算样本平均行驶里程。在单元格B6中输入“样本均值”,在单元格C6中输入公式:“=AVERAGE(A2,A17)”,回车后得到的结果为。

4.计算样本标准差。在单元格B7中输入“样本标准差”,在单元格C7中输入公式:“=STDEV(A2,A17)”,回车后得到的结果为。 5.计算抽样平均误差。在单元格B8中输入“抽样平均误差”,在单元格C8中输入公式:“=C7/SQRT(C5)” ,回车后得到的结果为。 6.在单元格B9中输入“置信度”,在单元格C9中输入“”。 7.在单元格B10中输入“自由度”,在单元格C10中输入“15”。 8.在单元格B11中输入“t分布的双侧分位数”,在单元格C11中输入公式:“ =TINV(1-C9,C10)”,回车后得到α=的t分布的双侧分位数t=。 9.计算允许误差。在单元格B12中输入“允许误差”,在单元格C12中输入公式:“=C11*C8”,回车后得到的结果为。

10.计算置信区间下限。在单元格B13中输入“置信下限”,在单元格C13中输入置信区间下限公式:“=C6-C12”,回车后得到的结果为。 11.计算置信区间上限。在单元格B14中输入“置信上限”,在单元格C14中输入置信区间上限公式:“=C6+C12”,回车后得到的结果为。 (二)总体方差已知 仍以上例为例,假设汽车轮胎的行驶里程服从正态总体,方差为10002,试求总体均值μ的置信度为的置信区间。

置信区间与置信水平

“置信区间与置信水平、样本量的关系 置信水平Confidence level 置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 一、置信区间的概念 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。置信区间是按下列三步计算出来的: 第一步:求一个样本的均值 第二步:计算出抽样误差。 人们经过实践,通常认为调查: 100个样本的抽样误差为±10% 500个样本的抽样误差为±5% 1,200个样本时的抽样误差为±3% 第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。 举例说明: 美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为: 国别样本均值抽样误差置信区间 美国55% ±3% 52%-58% 德国26% ±3% 23%-29% 日本17% ±3% 14%-20% 二、关于置信区间的宽窄 窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。 假设全班考试的平均分数为65分,则 置信区间间隔宽窄度表达的意思 0-100分 100 宽等于什么也没告诉你 30-80分50 较窄你能估出大概的平均分了(55分) 60-70分10 窄你几乎能判定全班的平均分了(65分) 三、样本量对置信区间的影响 影响:在置信水平固定的情况下,样本量越多,置信区间越窄。 下面是经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同): 样本量置信区间间隔宽窄度 100 50%—70% 20 宽 800 56.2%-63.2% 7 较窄 1,600 57.5%—63% 5.5 较窄 3,200 58.5%—62% 3.5 更窄 由上表得出: 1、在置信水平相同的情况下,样本量越多,置信区间越窄。

正态分布可信区间

3. 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。 (2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。 表某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量频数累积频数 0.00~7 7 0.24~49 56 0.48~45 101 0.72~32 133 0.96~28 161 1.20~13 174 1.44~14 188 1.68~ 4 192 1.92~ 4 196 2.16~ 1 197 2.40~ 2 199 2.64~ 1 200 [参考答案] (1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。 某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量组中值频数累积频数累积频率 0.00~0.12 7 7 3.5 0.24~0.36 49 56 28.0 0.48~0.60 45 101 50.5 0.72~0.84 32 133 66.5 0.96~ 1.08 28 161 80.5

1.20~ 1.32 13 174 87.0 1.44~ 1.56 14 188 94.0 1.68~ 1.80 4 192 96.0 1.92~ 2.04 4 196 98.0 2.16~ 2.28 1 197 98.5 2.40~ 2.52 2 199 99.5 2.64~ 2.76 1 200 100 (2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。 百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故 95 (2000.95188) 1.680.24 1.80(μmol/L) 4 P ?- =+?= 即该地正常成人血铅值的95%参考值范围为小于1.80μmol/L。 正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。 某地200例正常成人血铅含量(μmol/L)均值和标准差计算表 血铅含量组中值lg组中值(x) 频数(f) fx2fx 0.00~0.12 -0.92 7 -6.44 5.9248 0.24~0.36 -0.44 49 -21.56 9.4864 0.48~0.60 -0.22 45 -9.9 2.178 0.72~0.84 -0.08 32 -2.56 0.2048 0.96~ 1.08 0.03 28 0.84 0.0252 1.20~ 1.32 0.12 13 1.56 0.1872 1.44~ 1.56 0.19 14 2.66 0.5054 1.68~ 1.80 0.26 4 1.04 0.2704 1.92~ 2.04 0.31 4 1.24 0.3844 2.16~ 2.28 0.36 1 0.36 0.1296 2.40~ 2.52 0.40 2 0.80 0.3200 2.64~ 2.76 0.44 1 0.44 0.1936 合计——200 -31.52 19.8098

置信区间的解释及求取

置信区间的解释及求取-学习了解 95%置信区间(Confidence Interval,CI):当给出某个估计值的95%置信区间为【a,b】时,可以理解为我们有95%的信心(Confidence)可以说样本的平均值介于a到b之间,而发生错误的概率为5%。 有时也会说90%,99%的置信区间,具体含义可参考95%置信区间。 置信区间具体计算方式为: (1) 知道样本均值(M)和标准差(ST)时: 置信区间下限:a=M - n*ST; 置信区间上限:a=M + n*ST; 当求取90% 置信区间时n=1.645 当求取95% 置信区间时n=1.96 当求取99% 置信区间时n=2.576 (2) 通过利用蒙特卡洛(Monte Carlo)方法获得估计值分布时: 先对所有估计值样本进行排序,置信区间下限:a为排序后第lower%百分位值; 置信区间上限:b为排序后第upper%百分位值. 当求取90% 置信区间时 lower=5 upper=95; 当求取95% 置信区间时lower=2.5 upper=97.5 当求取99% 置信区间时lower=0.5 upper=99.5 当样本足够大时,(1)和(2)获取的结果基本相等。 参考资料:http://140.116.72.80/~smallko/ns2/confidence_interval.htm Confidence Limits: The range of confidence interval

附MATLAB 求取置信区间源码: %%% 置信区间的定义90%,95%,99%-------Liumin 2010.04.28 clear clc sampledata=randn(10000,1); a=0.01; %0.01 对应99%置信区间,0.05 对应95%置信区间,0.1 对应90%置信区间 if a==0.01 n=2.576; % 2.576 对应99%置信区间,1.96 对应95%置信区间,1.645 对应90%置信区间 elseif a==0.05 n=1.96; elseif a==0.1 n=1.645; end %计算对应百分位值 meana=mean(sampledata); stda=std(sampledata); sorta=sort(sampledata); %对数据从小到大排序 leng=size(sampledata,1); CIa(1:2,1)=[sorta(leng*a/2);sorta(leng*(1-a/2))]; %利用公式计算置信区间 CIf(1:2,1)=[meana-n*stda;meana+n*stda]; …………………………………………………………………………………………

OR的置信区间及如何由置信区间求解标准差

OR的置信区间及如何由置信区间求解标准差 董圣杰(Dongsj) 02-08-2014

关于OR 、lnOR 及置信区间的计算 暴露非暴露合计处理组 59(a )28(b )87(n1)对照组 8(c ) 33(d ) 41(n2) 合计67(m1)61(m2)128(N ) 1、处理组的暴露比值=a/b ,对照组的暴露比值=c/d ,两组的优势比OR= a b c d = ad bc 2、OR 置信区间的计算:主要有计算方法,即Miettinen 法和Woolf 法,其中Woolf 法 是Meta 分析中采用的方法;先简单介绍两种方法。 (1) Miettinen 法:计算中要利用四个表的卡方值,计算如下: (2) Woolf 法:该法采用了对数转换,利用了正态分布的进行计算,总体OR 的α的置信区间: 59338.69 828 OR ?==?()()()()() 2 226.07 ad bc n a b c d a c b d χ-?==++++() /2 2 1.961126.07 8.69 3.39,19.93Z OR αχ ±± ==标准正态分布的分位数 [] /2lnOR exp lnOR Z SE α±?ln 111111110.456 5928833 OR SE a b c d =+++=+++=()() exp ln 8.69 1.960.456 3.56,21.24±?=

如何采用Stata计算OR及其置信区间命令很简单: Woolf法计算的结果

知道置信区间如何求解标准差(误) ?经典统计学置信区间的计算,是通过构建枢轴量,根据枢轴量的分布获得的。

置信区间的定义及求解

一、置信区间的概念 定义1 设θ为总体分布的未知参数, n X X X ,,,21 是取自总体X 的一个样本, 对给定 的数)10(1<<-αα, 若存在统计量 ),,,,(),,,,(2121n n X X X X X X θθθθ== 使得 ,1}{αθθθ-=<

2017年公卫助理:总体率的置信区间试题

2017年公卫助理:总体率的置信区间试题本卷共分为1大题50小题,作答时间为180分钟,总分100分,60分及格。 一、单项选择题(共50题,每题2分。每题的备选项中,只有一个最符合题意) 1.HOCI和OCI-的杀菌效果为( c )。 A. HOCI的杀菌效果与OCI-相同 B. HOCI的杀菌效果与OCI-低80倍 C. HOCI的杀菌效果与OCI-高80倍 D. HOCI的杀菌效果与OCI-低20倍 E. HOCI的杀菌效果与OCI-高20倍 2.高温车间是指 A.夏季车间内气温超过30℃ B.车间内气温比室外夏季设计通风计算温度高2℃及以上 C.夏季车间内气温超过35℃ D.车间内热源散热量每小时每m3大于50kcal E.未明确规定 [正确答案]:B 3.甲氧苄啶的抗菌机制是抑制细菌的 A.二氢叶酸合成酶 B.四氢叶酸合成酶

C.二氢叶酸还原酶 D.DNA回旋酶 E.RNA聚合酶 正确答案:C 4.硝酸甘油的不良反应主要是由哪种作用所致 A.心排出量减少 B.血压降低 C.耗氧量减少 D.血管扩张 E.心肌血液的重新分布 正确答案:D 5. 社会医学研究工具(问卷或量表)的效度评价不包括( B ) A 表面效度B质量效度C 结构效度D 内容效度 6. 下列何药可诱发支气管哮喘 A.甲基多巴 B.利舍平 C.呱乙啶 D.普萘洛尔 E.硝苯地平

正确答案:D 7. 环磷酰胺的不良反应不包括 A.血压升高 B.恶心、呕吐 C.脱发 D.骨髓抑制 E.出血性膀胱炎 正确答案:A 8. 粉尘对人体可有以下作用 A.致纤维化 B.刺激 C.中毒 D.致敏 E.以上全部 9. 下列哪项不是文化的基本特征( C ) A 历史性 B 现实性 C 创造性 D 渗透性 10. 问卷的一般结构包括(A ) A、封面信——指导语——问题及答案——编码

第6章 总率的区间估计和假设检验

第6章总体率的区间估计和假设检验 ?掌握率的抽样误差的概念和意义 ?掌握总体率区间估计的概念意义和计算方法 ?掌握率的U检验的概念和条件,计算方法 ?第一节率的抽样误差与总体率的区间估计 一、率的抽样误差:在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。 例6.1 检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。 本例:n=800,p=0.25,1-p=0.75, % 53 .1 0153 .0 800 75 .0 25 .0 = = ? = p S 二、总体率的区间估计 ㈠正态分布法 样本含量n足够大,np与n(1-p)均≥5时, 例6.2 求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。 95%的可信区间为:25%±1.96×1.53% 即(22.00%,28.00%) 99%的可信区间为:25%±2.58×1.53% 即(21.05%,28.95%)㈡查表法 当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。 第二节率的u检验 应用条件:样本含量n足够大,np与n(1-p)均≥5 。 此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的。 一、样本率与总体率比较的u ?u值的计算公式为: 例6.5 根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃n p ) 1(π π σ - = n p p S p ) 1(- = p S u p α ± n p p u p ) 1 ( | | | | π π π σ π - - = - =

正态总体参数的区间估计

第19讲 正态总体参数的区间估计 教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行 区间估计的方法。 教学重点:置信区间的确定。 教学难点:对置信区间的理解。 教学时数: 2学时。 教学过程: 第六章 参数估计 §6.3正态总体参数的区间估计 1. 区间估计的概念 我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。因此,对于未知参数θ,除了求出它的点估计?θ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。 设?θ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即 ?{||}1P θθεα -<=- 或 αεθθεθ-=+<<-1)??(P 这表明,随机区间)?,?(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)?,?(εθεθ+-就称为置信区间,1α-称为置信水平。 定义 设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得 12{}1P θθθα <<=-

则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。 注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。 (2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1α-的置信区间12(,)θθ,一方面置信水平1α-越大,估计的可靠性越高;另一方面区间12(,)θθ的长度(2)ε越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降(1α-变小),所以要找两方面的平衡点。 在学习区间估计方法之前,我们先介绍标准正态分布的α分位点概念。 设 () ~0,1X N ,若 z α 满足条件 { },01 P X z α αα>=<<,则称点z α为标准正态分布的α分位点。例如求0.01z 。按照α分位点定义,我们有 {}0.010.01P X z >=,则{}0.010.99P X z ≤=,即0.01()0.99z φ=。查表可得0.01 2.327z =. 又 由()x ?图形的对称性知1z z αα-=-。下面列出了几个常用的z α值: 2. 正态总体均值μ的区间估计 设已给定置信水平为1α-,总体()2~,X N μσ,12,,,n X X X 为一个样本,2 ,X S 分别是样本均值和样本方差。

相关主题
文本预览
相关文档 最新文档