当前位置:文档之家› 统计学原理复习重点概述

统计学原理复习重点概述

统计学原理复习重点概述
统计学原理复习重点概述

第一章绪论。

统计的三层含义及相互关系

统计是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。

统计即统计工作、统计资料、统计学

统计工作:即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作的总称,是一种社会调研活动

统计资料:是统计工作的成果,包括各种统计报表、统计图形及文字资料等。统计学:是研究大量社会现象(经济)的总体方面的方法论科学

(四)三者关系

统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。统计工作和统计数据是工作和工作成果关系。

统计实践活动的产生与发展

三个主要的统计学派

1、政治算术学派

代表人物:英国的威廉·配第《政治算术》)、约翰·格朗。

研究目的:揭示以数量表现的社会经济现象的规律性

研究方法:以数量、重量、尺度表现和比较的方法,就经济现象进行比较和推算。

2、记述学派(国势学派〕

代表人物:德国的康令阿亨瓦尔

研究目的:为从政者提供管理国家的必要知识

研究方法:对各国情况进行比较,以文字叙述为主

3、数理统计学派

代表人物:比利时的凯特勒《社会物理学》

描述统计学派:以描述为主,倡导大样本理论,研究简化数据

推断统计学派:以推断为主,倡导小样本理论,在随机样本上推断总体

4、社会统计学派

代表人物:梅尔恩格尔(19世纪后期)

研究目的:查明社会生活的规律性,对象是社会总体

研究方法:大量观察法、强调全面调查

5、社会经济统计学派

研究特点:实质性的社会学科,具有鲜明阶级性研究大量社会现象的数量方面研究方法:辩证唯物主义的认识论,大量观察法和分组法

理论基础:马克思主义哲学和政治经济学

社会统计学的特点:数量性、总体性、具体性、社会性

1、数量性:统计研究对象是客观事物的数量方面。

2、总体性:主要是研究社会经济现象的总体数量规律

3、具体性:社会经济统计的研究对象是具体事物的数量,不是抽象的量。

4、社会性:社会经济统计认识的对象是社会经济现象,它包括人类经济社会活

动的各种条件(自然条件、社会条件)、人类各种活动的过程与结果(生产活动、交换活动、分配活动、消费活动等)。

统计的职能:信息职能、咨询职能、监督职能。

统计工作的基本任务和统计工作过程

2009年6月27日,十一届全国人大常委会第九次会议通过《中国人民共和国统计法》

具体任务:信息功能、监督功能、咨询(服务)功能

1.全面、准确、及时地提供有关社会经济情况的资料,为党和国家决策管理服务;

2.为科学编制计划提供依据,对计划执行情况进行统计检查和监督;

3.为加强各部门、各地区和各单位的经济管理提供所需的统计资料和分析资料;

4.为积累统计资料和开展社会科学研究提供依据;

统计工作过程(统计工作的基本环节):

1.统计设计(准备阶段)设计方案、指标体系、分类目录等

2.统计调查(调查阶段)收集和占有统计资料

3.统计整理(整理阶段)分布数列、次数分布等加工资料(承上启下)

4.统计分析(分析阶段)绝对指标、相对指标等

5.统计的表现与运用(工作总结)

统计学中几个基本概念

统计总体和总体单位

总体即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。

总体单位(简称单位)是组成总体的各个个体。

例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体,每一个居民为总体单位。

总体的特点:

同质性是确定总体的前提和基础。它是根据统计的研究目的而定的。

大量性统计总体应该由足够数量的同质性单位构成(必要条件)。

差异性构成总体的各个同质性单位的特征存在着差异(前提和内容)。注

构成中提的单位必须是同质的,不能把不通知的单位混在总体之中。

总体与总体单位具有相对性,随着研究任务的改变而改变。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。

标志和指标

标志:标志表现(品质标志、数量标志)

标志变异(不变标志、可变标志)

标志是说明总体单位属性和数量特征的名称

标志分类:

品质标志:说明总体单位质的特征,只能用文字、符号或数字代码来表现。数量标志:表示总体单位量的特征,用数值来表现称为标志值(变量值)。

不变标志: 在同一总体中,当一个标志在各个总体单位的表现都相同称为不变指标。不变标志是总体同质性的基础。

变异标志:亦称可变标志,在一个总体中,当一个标志在各单位的具体表现有可能不同时,称为可变标志。作为总体,同时必须存在变异标志,这表

示所研究的现象在各单位之间存在着差异,才需要进行统计研究。

标志表现是指标所反映的属性和数量特征在各总体单位的具体表现

统计指标

统计指标是反映统计总体数量特征的概念和数值。

–统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。例如:经统计调查某民营企业固定资产原值(指标名称)为

9.2亿元(指标数值)

特性:数量性、具体性、综合性

指标与标志的关系

–标志反映总体单位的属性和特征,而指标则反映总体的数量特征。

–指标都是用数值表示,标志用属性表示

–指标数值经汇总得出,标志中的数量标志不一定通过汇总,可直接

–标志一般不具有时间、地点等条件

–总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。

–有许多统计指标的数值是从总体单位的数量指标汇总而来的

变异与变量

变异:标志在总体单位之间的不同具体表现

变量:可变的数量标志变量的具体数值表现即变量值。

连续型变量是指变量的取值在数轴上连续不断,例如,气象上的温度、湿度,零件的尺寸等。按取值是否连续:

离散型变量是指变量的其取值是整数值,例如,企业数,职工人数等。

按所受因素不同:

确定性变量是受确定性因素影响的变量

随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。

统计指标与统计指标体系

统计指标:由指标名称和指标数值构成。反映统计总体数量特征的概念和数值。

特点:能用数字表示、说明综合特征、反映一定社会经济范畴的数量

统计指标分类:

按其反映的内容不同分为

数量指标(对应总量指标)反映总体绝对数量多少的总量指标(指标总量和总体单位数)质量指标(对应相对指标和平均指标)反映总体内部结构和总体单位平均水平,说明工作效率、工作质量的统计指标

按其作用和表现形式的不同分为

总量指标(绝对数)

相对指标(相对数)

平均指标(平均数)

流量与存量

流量:一定时期存量:一定时点

第二章统计数据的收集与整理

统计调查方案的设计(六项基本内容)1调查目的

2调查对象和单位

3调查项目

4调查时间和期限

5制定调查的组织方式/

6 调查方法

调查目的

框架(蓝图)、为什么(目的)、怎样去做(转化可操作)、值得去做(成本、作用)、达到什么目标

调查对象和单位

调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。

调查单位是进行研究的总体单位,也即登记的标志表现的直接承担者。

注意:调查单位与填报单位的区别

调查单位是调查项目的承担者;

填报单位是负责上报调查资料的单位。

例如1.汽车企业生产情况调查单位与填报单位是每一个汽车企业

2.汽车企业高科技设备使用情况调查单位每一台高科技设备

填报单位每一个汽车企业

调查项目:

调查项目要少而精;

调查项目含义要明确,只列入能够得到确定答案的项目;

调查项目之间有一定的联系以便相互核对;

有的项目可以拟定为“选择式”。

调查表:列出调查项目的表格形式统计调查方式,也称为调查问卷(一览表、单一表)

调查问卷的设计:

组成:题目、引导语、主体、编码、结语

主体的设计:问卷的总框架(图示法)

问卷的问题:关于事实、行为、原因、态度、情感或环境等

问卷设计原则:实际出发点;围绕假设进行设计;表述要清楚;

尽量避免社会禁忌和敏感性问题;合理安排结构;简明扼要;问卷回答形式:封闭性、开放性、半开半闭

问卷发放形式:邮寄、电话、实地调查、网络

调查方式(调查的类型/组织形式)

1、按调查对象范围:全面调查(普查)

非全面调查(抽样调查统计报表重点调查典型调查)

2、按调查目的:应用性调查学术性调查

3、按调查时间:一次性调查经常性调查跟踪性调查

4、按状态不同:动态调查静态调查

5、按调查对象内容:综合调查专题调查

普查:为某一特定目的而专门组织的一次性全面调查(人口普查、工业普查等)●特点:

(1)通常是周期性的或一次性的,涉及面广、耗时、费力,一般需间隔较长时间;

(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏;(3)准确性一般较高,较规范;

(4)适用的对象较窄,只能调查一些最基本、最一般的现象。

抽样调查:从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果推断总体数量特征。

●特点/优点:经济性强、时效性高、适应面广、准确性高

作用:能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。

重点调查(反映总体基本情况)(个别现象----一般性情况)

从调查对象的全部单位中选择少数重点单位进行调查(适用于―同类‖中的―大户‖)。

典型调查(推算总体的数量特征)(个别表象-----一般性结论)

从调查对象的全部单位中选择一个或几个有代表性的单位进行调查。(不一定针对―大户‖)

调查方法:问卷访谈文献专家实验观察

第三节统计分组

统计分组的概念和作用:揭露社会经济现象

说明社会经济现象的内部结构

研究经济现象之间的依存关系

选择分组标志的原则:根据研究问题的目的来选择

要选择最能反映被研究现象本质特征的标志

要结合现象所处的具体历史条件或经济条件来选择

分组标志的种类:品质标志分组——反映事物属性差异(简单复杂)

数量标志分组——反映事物数量差异(单项式组距式)

简单分组——按一个标志对总体进行分组

复合分组——按两个或两个以上标志对同

第四节分配数列

统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。

月工资分组(元) 工人数(人) 占总数比重(%)

1000 以下210 39.6

1000-1500 187 35.3

1500 以上133 25.1

合计530 100.0

组别(变量) 次数(频数) 频率(比率

分配数列:品质分配数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准

确地反映总体的分布特征)

组别次数频率

变量分配数列单项式分配数列

组距分配数列(等距数列异距数列)

单距式某厂第二季度工人平均日产量

工人平均日产量(件) 工人人数(人)

2 10

3 15

4 30

5 40

6 20

合计115

组距数列的编制

组限:组距两端的数值。分为上限和下限。

组距:某一组的上限和下限的距离,分等距和异距(组距=上限-下限)

全距:分组数列中最大值的上限与最小值的下限之差

组中值: 组的上限和下限的中间值

等距数列等组距=全距/组数

异距数列次数密度=各组次数/各组组距

频数密度=各组频率/各组组距

累计次数分布

向上累计(以下累计、较小制累计)有变量值低的组向变量值高的组逐组累计向下累计则为变量组高向变量值低的组累计

下图为向上累计:

第五节统计表

统计表的结构

从构成要素看:统计表由总标题、分标题(横行标题、纵栏标题)、数字资料构成。从内容上看:统计表由主词和宾词两部分构成。如图所示

统计表的种类

简单表

分组表

复合表

第三章、综合指标

综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标

第一节总量指标(绝对指标)

总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。总量指标表现形式是绝对数,不是抽象的绝对数,是有名数。

作用:总量指标能反映一个国家的基本国情和国力,反映某部门或单位等人、财、物的基本数据。

总量指标是制定政策、编制计划、实行社会经济管理的依据之一。

总量指标是计算相对指标和平均指标的基础。

总体指标的计算:注意现象的同类、明确每项总量指标的统计含义、对计量单位熟悉

自然单位度量衡单位双重或多重单位复合单位货币单位劳动单位等

第二节相对指标

是两个有联系的指标数值之比。

作用:相对指标能具体表明社会经济现象之间的比例关系。

相对指标能使一些不能直接对比的事物找出共同比较的基础。

相对指标便于记忆、易于保密。

相对指标的数值有两种表现形式:有名数(有单位的)无名数(系数百分数倍数等)

二、相对指标的种类及其计算

常用相对指标类型:计划完成相对指标;结构相对指标;比例相对指标;比较相对指标;

强度相对指标;动态相对指标

相对指标的计算

计划完成相对数:用来检查、监督计划执行情况的相对指标。一般用百分数表示。

基本公式:

表示计划的完成程度

例如:某企业生产某产品,本年度计划单位成本降低6%,实际降低7.6%,则:

成本降低率计划完成数

=[(1-7.6%)/(1-6%)]*100%=98.29%

答:成本降低率比计划多完成1.71%。

如:第三季度完成4590万元,全年计划总产值为6000万元,则:

计划执行进度=(4590/6000)*100%=76.5

例题:某企业某产品降低率94%,实际是92.4%

问该产品单位成本降低率计划完成率?该产品的单位成本降低率超额完成计划百分比?该产品的单位成本降低率实际比计划降低了几个百分

1. 9

2.4%/94%*100%=98.3%

2.98.3%-1=-1.7%

3.92.4%-94%=-1.6%

结构相对指标

以部分数值与总体全体数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。其计算公式:

2.作用:(1)可以反映总体内部结构的特征。

(2)通过不同时期相对数的变动,可以看出事物的变化过程及其发展趋势。

(3)能反映对人力、物力、财力的利用程度及生产经营效果的好坏。

(4)结构相对数在平均数计算中的应用。

强度相对数的概念

强度相对数的两种表示方法:(1)一般用复名数表示。(2)少数用百分数或千分数表示。注:强度相对数不是平均数,不是同质总体的标值总量与总体单位数之比。

强度相对数的作用

(1)说明一个国家、地区、部门的经济实力或为社会服务的能力。

(2)反映和考核社会经济效益。

(3)为编制计划和长远规划提供参考依据。

动态相对指标

作为对比标准的时间叫做基期,而同基期比较的时期叫做报告期,有时也称为计算期。

动态相对数的计算结果用百分数或倍数表示

增长量=报告期水平-基期水平

增长1%绝对值

第三节平均指标

一、平均指标的概念和作用

(一)平均指标的概念:又称平均数

平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。

特点:

1、将数量差异抽象化(数量标志)

2、只能就同类现象计算

3、能反映总体变量值的集中趋势

算术平均数的基本公式=总体标志总量÷总体单位总数

(二)简单算术平均数(未分组)

例张三期末考试成绩微积分55分,毛概63分,英语51分,体育69分,宏观经济学65分,数理统计45分,求张三的平均成绩。

(三)加权算术平均数(分组后的单项数列或组距数列)

例 某公司在四个城市销售产品,某月统计4个城市销售总额分别为50、52、46、60(万元),毛利率分别为56%、63%、70%和54%,计算此公司此月平均销售毛利率。

调和平均数

调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。

先算变量值倒数:加权调和平均数

2、几何平均数 (1)几何平

N

变量

N

(2)加权几何平均数

几何平均数的对数是各变量值对数的算术平均。 几何平均主要用于计算比率或速度的平均 几何平均数的应用及特点 :

我国国内生产总值2001年、2002年、2003年的环比发展速度分别是107.5%,108.3%,109.3%,则各年的平均发展速度是

%4.108084.1093.1083.1075.13==??=G

某人有一笔款项存入银行10年,前2年的年利率为6%,第3至5年的年利率是5%,后5年的年利率3%,如果按复利计算,这笔款项的平均年利率为多少?

%

.......G 24042010421042103105106110532==-=??=

这笔款项的平均年利率为4.2%。 ①应用条件

a.变量值是相对数据,如比率或发展速度。

b.变量值的连乘积等于总比率或总发展速度。 ②特点

a.如果数列中有一个标志值等于零或负值,则无法计算。

b.受极端值影响较小,故较稳健。

(3)调和平均数,是各数据倒数的(简单)算术平均数的倒数: 价格=金额/购买量

中位数(Median)

中位数是一组数据按大小排序后,处于中间位置上的变量值。 1、 对于未分组数据:

(1)如果数据个数为奇数,则中位数恰为处于中间位置的数: (2)如果数据个数为偶数,则为中间位置两个数的平均数

(2)单项数列的中位数

计算各组的累计频数(向上累计或向下累计);根据中位数位置确定中位数。

对于分组后的数据

下限公式:L 代表下限 Sm-1代表中位数所在组以前一组的累计次数 fm 为中位数所在组的次数(频数)

上限公式:

式中:m 为中位数所在的组,d 为该组组距,

L 、U 分别为该组的下限值与上限值, fm 为该组的频数,

Sm-1 为该组以下各组的频数总和, Sm+1为该组以上各组的频数总和, 显然

众数(Mode)

众数是一组数据中出现次数最多的变量值。 在分组数据中,众数可按下式计算: 下限公式:

d

f S f

L M m

m e ?-+=-∑

1

2d

f S f

U M m

m e ?--=+∑

1

2∑

=+++-f

S f S m m m 11

上限公式:

式中:fm为某数值出现次数(频数)最多的组(第m组)的频数,

fm-1与fm+1分别为第m-1组与m+1组的频数,

L、U分别为第m组的下限与上限值,d为该组组距。

1、如果某组统计数据中没有哪个数值出现较多的频率(次数),则可认为该组数无众数;如果有多个数据出现的次数(频率)较多,则认为有多个众数。

在有多个众数的情况下,则对众数的关注度下降,因为多众数对描述数据位置无多大帮助。

2、对描述品质数据的分布特征的―位置‖测度只能用众数。

第四节标志变动度

测定标志变动度的方法:全距、四分位差、平均差、标准差、离散系数。分布离散程度的测度

全距

全距的概念与计算又称“极差”,是总体各单位标志的最大值和最小值之差,用以说明标志

值变动范围的大小

特点:计算方便,易于理解。但很粗略,不全面。

四分位差

应用统计学复习重点

应用统计学 定义:统计学是研究数据收集、整理、显示与分析方法(或公式)的科学。目的是探索数据内在数量规律性,以达到对客观事物总体的科学认识。 1、参数(parameter):指用于说明总体的指标。 均值—μ, 标准差—σ,方差—σ2,率—P 2、统计量(statistics):指用于说明样本的指标。 均值—。标准差— s。方差— s2 ,率—p 数据的计量尺度 1列名尺度nominal scale (1)定义:按事物的某种属性对事物进行平行分类或分组。 划分的各类别之间无大小或优劣之分,且次序可以改变。 (2)适用:取值只能大体进行平行分类的品质型标志(变量)。 (3)记录方式: 变量名称:类别名罗列或用无意义数字表示。 例:性别:男/ 女 性别:(1)男(2)女 2顺序尺度ordinal scale (1)定义:按事物的某种属性对事物进行分类或分组基础 上,再将类别等级由大到小或由小到大排序。 (2)适用:取值可以进行分类且各类别具有等级差异的品质 型标志(变量)。 (3)记录方式: 品质变量名:类别名序号由大到小或由小到大排列。 例:文化程度(1)文盲(2)小学(3)初中(4)高中以上 3间隔尺度interval scale (1)定义:选定一个测量单位,对数值变量在分类 排序基础上测量其间距(差距)。测量出的数 值有加、减意义,无乘除意义。 (2)适用:可用数值记录其值而无比率意义的数值 型标志。 (3)记录形式: 数值变量名:________ 例:语文成绩:________ **表述语:甲(60分)比乙(30分)高30分 4比例尺度ratio scale (1)定义:选定一个测量单位,对数值型标 志(变量)在测量间距基础上,测量其比率。 (2)适用:可用数值记录其值且有比率意义的数值 型变量。 (3)记录形式:

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

应用统计学试题和复习资料分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--=)(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数: 22 212 2 ()0.5671080 0.884392.8 () x x R y y β-?= ==-∑∑

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学期末复习重点

统计总体:统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的由许多个别事物组成的整体,简称总体。 样本:是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。 算术平均数:算术平均数是统计中最基本、最常用的一种平均数,它的基本计算形式是用总体的单位总数去除总体的标志总量。 调和平均数:是根据变量值的倒数计算的,是变量值倒数的算术平均数的倒数,也叫倒数平均数。 简单分组:是指对所研究的总体按一个标志进行分组。 复合分组:复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。 结构相对指标:结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标,也叫比重指标。 强度相对指标:是指两个性质不同,但有一定联系的总量指标数值之比。 类型抽样:又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。 机械抽样:它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。 综合指数:凡是一个总量指标可以分解为两个或两个以上的因素指标时,为观察某个因素指标的变动情况,将其他因素指标固定下来计算出的指数称为综合指数。 平均指数:平均指数法是以个体指数为基础来计算总指数,根据选用的权数不同,平均指数法可以进一步分为加权算术平均法,加权调和平均法,固定权数加权平均法。 相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。 回归分析:现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。 统计调查:就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织的搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。 统计指数:广义指数泛指社会经济现象数量变动的比较指标,及用来表明同类现象在不同空间、不同时间,实际与计划对比变动情况的相对数。狭义指数仅指反应不能直接想家的复杂社会经济现象在数量上综合变动情况的相对数。 简单随机抽样:简单随机抽样也叫纯随机抽样,它对总体单位不做任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。 季节分析的含义:是指某些现象由于自然因素和社会条件的影响在一年之内比较有规律的变动。 总量指标:是指反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。 相对指标:是指说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数,故也将相对指标称为相对数。 平均指标:是同类社会经济现象总体内,各单位某一数量标志在一定时间、地点和条件下,数量差异抽象化的代表性水平指标,其数值表现为平均数。 1计算运用总量指标的原则。 (1)在计算实物指标时,应注意现象的同类性 (2)统计总量指标时要有明确的统计含义和合理的统计方法

《应用统计学》复习题库48832

第一章思考题及练习题 (一)填空题 1.统计工作与统计资料的关系是和的关系。 2.统计工作与统计学的关系是和的关系。 3.统计活动具有. . .和的职能。 4.统计指标反映的是的数量特征,数量标志反映的是的数量特征。5.在人口总体中,个体是“”,“文化程度”是标志。 6.统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法. .综合指标法.和统计推断法等。 7.统计标志是总体中各个体所共同具有的属性或特征的名称。它分为和两种。 8.要了解一个企业的产品质量情况,总体是.个体是。9.性别是标志,标志表现则具体为或两种结果。 10.一件商品的价格在标志分类上属于。 11.一项完整的统计指标应该由. .. . 和等构成。 12.统计指标按所反映的数量特点不同,可以分为和。 13.反映社会经济现象相对水平或工作质量的指标称为指标。 14.统计活动过程通常被划分为. 和三个阶段。 15.经过余年的发展,形成了今天的统计学。 16.古典统计学时期有两大学派,它们分别是和。 17.《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。 18. 提出了著名的误差理论和“平均人”思想。 19.统计研究的数量性是指通过数来反映事物的量的.量的.量的和量的。 20.统计学包括和两部分内容。 21.总体中所包含的个体数量的多少称为;样本中所包含的个体数量的多少称为。 22.总体中的一个组或类,可被称为一个研究域或。 23.从总体中随机抽取的一部分个体所组成的集合称为。 24.统计理论与方法,事实上就是关于的理论和方法。 25.总体的三大特征是. 和。 26.总体的差异性要求体现在至少具有一个用以说明个体特征的。 27.企业性质标志适用的测定尺度是,产品质量等级标志适用的测定尺度是,企业利润标志适用的测定尺度是,企业产量标志适用的测定尺度是。 28.可变的数量标志的抽象化称为。它按其所受影响因素不同,可分为和两种,按其数值的变化是否连续出现,可分为和两种。 29.个体是的承担者。 30.统计指标按其反映现象的时间状态不同,可以分为和两种。 31.若干互有联系的统计指标组成的有机整体称为,其中一个很重要的反映国民经济和社会发展状况的基本统计指标体系是。 32. 统计研究的一大任务就是要用的样本指标值去推断 的总体指标值。 (二)单项选择题 1.社会经济统计的研究对象是()。 A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量方面 D.社会经济统计认识过程的规律和方法 2.某城市进行工业企业未安装设备普查,个体是()。

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

应用统计学复习试题

应用统计学复习题 一简述 1.统计调查的方法有那几种 答:三种主要调查方式:普查,抽样调查,统计报表。实际中有时也用到重点调查和典型调查。 2.表示数据分散程度的特征数有那几种 答:全距(又称极差),方差和标准差,交替标志的平均数和标准差,变异系数,标准分数3为什么对总体均值进行估计时,样本容量越大,估计越精确 答:因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。 4.区间估计与点估计的结果有何不同 答:点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。 5.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显著性水平较大还是较小,为什么 答:取显著性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显著性水平α 6.简述算术平均数、几何平均数、调和平均数的适用范围。 答:几何平均数主要适用于比率的平均。一般地说,如果待平均的变量x与另外两个变量f 和m 有fx=m 的关系时,若取f为权数,应当采用算术平均方法;若取m 为权数,应当采用调和平均方法。 7.对总体均值的假设检验中,如何通过确定样本容量大小以控制两类错误 答:要控制两类错误就要减小误差,也就是提高精确性,决定样本大小的影响因素主要有:(1)总体方差σ2的大小.总体方差大,抽样误差大,则应多抽一些样本容量.问题是实际工作中我们往往不知道总体方差,因而必须作试验性调查,或以过去的历史资料作参考.(2)可靠性程度的高低.要求可靠性越高,所必需的样本容量就越大.(3)允许误差的范围.这主要由研究目的而定.若要求推断比较精确,允许误差范围应该小一些,随之抽取的样本单位数就要多一些. 可用最大允许抽样误差e 来表示区间估计的准确程度,其中 /2 e Z α = 对于无限总体, 22 /2 2 Z n e α σ = ;对于有限总体, 2 22 2 /2 n e Z N α σ σ = + ,

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

统计学期末复习重点知识

P11 1.3统计数据可以分为哪几种类型?不同类型的数据各有什么特点? 答:①按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此统称定性数据或品质数据。数值型数据说明的是现象的数量特征,通常是用数值来表现,因此也可称为定量数据或数量数据。 ②按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。 观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据则是在实验室中控制对象而收集到的数据。 ③按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 截面数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。时间序列数据是按时间顺序收集到的,用于描述现象随时间变化的情况。 1.5举例说明总体,样本、参数,统计量变量这几个概念 总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。 P40 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样?什么情况下适合非概率抽样? 答:概率抽样的特点: ①抽样时是按一定的概率以随机原则抽取样本。 ②每个单位被抽中的概率是已知的,或是可以计算出来的。 ③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样的特点: 操作简便,时效快,成本低,而且对于抽样中的统计学专业技术要求不高。 非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析提供准备。同时也适合市场调查中的概念测试,如产品包装测试、广告测试等。 概率抽样适合调查的目标是用样本的调查结果对总体相应的参数进行估计,并计算估计的误差,得到总体参数的置信区间。 P109

相关主题
文本预览
相关文档 最新文档