当前位置:文档之家› 统计学原理》习题集(附答案)

统计学原理》习题集(附答案)

统计学原理》习题集(附答案)
统计学原理》习题集(附答案)

《统计学原理习题集》

第一章绪论

复习思考题

1.从统计工作的产生和发展说明统计工作的性质和作用。

2.试说明统计工作与统计学的关系。

3.我国统计工作的基本任务是什么

4.试述统计学的研究对象和性质。

5.解释并举例说明下列概念:

统计总体、总体单位、标志、统计指标、变异、变量。

6.试说明标志与指标的区别和联系。

练习题

一、填空题:

1.统计总体的特征可概括成、和。

2.统计学的发展史有三个起源,即技术学派、及数理统计学派。

3.统计研究的基本方法有、统计分组法和三种方法。

4.在现实生活中,“统计”一词有三种涵义,即、及

统计学。

5.统计的作用主要体现在它的三大职能上,即信息职能、及。

6.从认识的特殊意义上看,一个完整的统计过程,一般可分为四个阶段,即、统计调查、及。

7. 当某一标志的具体表现在各个总体单位上都相同时,则为。

8. 当某一标志的具体表现在各个总体单位上不尽相同时,则为。

9. 同一变量往往有许多变量值,变量按变量值是否连续可分为和。

10. 凡是客观存在的,并在某一相同性质基础上结合起来的许多个别事物

组成的整体,我们称之为。

二、单项选择题:

1. 要了解某市工业企业的技术装备情况,则统计总体是()。

A、该市全部工业企业

B、该市每一个工业企业

C、该市全部工业企业的某类设备

D、该市工业企业的全部设备

2. 对交院学生学习成绩进行调查,则总体单位是()。

A、交院所有的学生

B、交院每一位学生

C、交院所有的学生成绩

D、交院每一位学生成绩

3. 对全国城市职工家庭生活进行调查,则总体单位是()。

A、所有的全国城市职工家庭

B、所有的全国城市职工家庭生活

C、每一户城市职工家庭

D、每一户城市职工家庭生活

4. 对全国机械工业企业的设备进行调查,则统计总体是()。

A、全国所有的机械工业企业

B、全国所有的机械工业企业的设备

C、全国每一个机械工业企业

E、全国每一个机械工业企业的设备

5. 对食品部门零售物价进行调查,则总体单位是()。

A、所有的食品部门零售物

B、每一个食品部门零售物

C、所有的食品部门零售物价

D、每一个食品部门零售物价

6. 港口货运情况调查,则统计总体是()。

A、所有的港口货运

B、每一个港口货运

C、所有的港口货运情况

D、每一个港口货运情况

7. 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。

A、指标

B、标志

C、变量

D、变量值

8. 下列属于品质标志的是()。

A、工人年龄

B、工人性别

C、工人体重

D、工人工资

9. 一个统计总体()。

A、只能有一个标志

B、只能有一个指标

C、可能有多个标志

D、可能有多个指标

10. 商业企业的职工数、商品销售额是()。

A、连续变量

B、前者是连续变量,后者是离散变量

C、离散变量

D、前者是离散变量,后者是连续变量

三、多项选择题:

1.指出下列变量中的连续型变量()。

A、成绩

B、身高

C、人数

D、教科书册数

E、体重

2. 全国工业普查中()。

A、全国工业企业数为总体

B、每一个企业即是调查单位又是报告单位

C、所有制是品质标志

D、全国工业企业职工总数为指标

3. 下列标志中,属于数量标志的有()。

A、性别

B、工种

C、工资

D、民族

E、年龄

4. 下列标志中,属于品质标志的有()。

A、性别

B、工种

C、工资

D、民族

E、年龄

5. 社会经济统计的特点,可概括为()。

A、数量性

B、同质性

C、总体性

D、具体性

E、社会性

6. 指标与标志之间存在着变换关系,是指()。

A、在同一研究目的下,指标与标志可以相互对调

B、指标有可能成为标志

C、标志有可能成为指标

D、在不同研究目的下,指标与标志可以相互对调

7. 下列哪几个属于质量指标()。

A、产品合格率

B、废品量

C、单位产品成本

D、资金利润率

E、上缴利润额

8. 下列哪几个属于数量指标()。

A、产品合格率

B、废品量

C、单位产品成本

D、资金利润率

E、上缴利润额

9. 在说明和表现问题方面,其正确的定义是()。

A、标志是说明总体单位特征的

B、指标是说明总体特征的

C、变异是可变标志的差异

D、变量是可变的数量标志

E、标志值是变量的数值表现

10. 数量指标反映总体某一特征的()。

A、规模

B、工作总量

C、强度

D、水平

E、密度

四、简答题:

1.试说明标志与指标的区别和联系。

2.试述统计学的研究对象与特点。

3.试说明统计工作与统计学的关系。

4.试述数量指标与质量指标的区别及联系。

第二章统计设计和统计调查

复习思考题

1.试述统计设计的概念及内容。

2.试述统计指标的分类情况。

3.试述统计表的构成及分类情况。

4.试述统计调查的意义及其基本情况。

5.一个周密的调查方案应该包括哪些内容这些内容的意义怎样

6.指出下列调查的调查对象和调查单位:

(1)城市职工家庭生活调查;

(2)机械工业设备调查;

(3)科技人员调查。

7.试列举下列调查单位的主要标志:

①高等财经院校;②图书馆;③商店。

8.什么是统计报表制度它在我国统计调查组织形式中的地位与作用如何

9.什么是统计调查的单一表和一览表它们分别在什么情况下采用

10.什么是原始记录和统计台帐它们的意义怎样

11.试述普查的意义、特点和作用。组织好普查应注意哪些问题

12.什么是重点调查、典型调查和抽样调查它们各自有哪些特点和作用

13.统计调查的种类

练习题

一、填空题:

1. 对全国各铁路交通输纽的货运量、货物种类调查以了解全国铁路货运概况,这种调查属于调查。

2.就是根据统计研究任务的要求,对统计调查所得的各项原始资料进行科学的加工与汇总,使其系统化,得出能反应现象总体特征的综合资料;或对已加工过的资料(包括历史资料)进行再加工。

3. 常见的统计资料整理的组织形式有:、、综合整理以及汇审汇编的办法。

4. 统计表从形式上看,主要由、横行标题、纵栏标题和四部分组成。

5. 统计调查按调查对象所包括被研究总体的范围可分为和。

6. 统计表按主体栏(主词)是否分组可分为、和复合表。

7. 统计调查的组织形式主要有统计报表制度、、、和抽样调查这五种形式。

8.是根据统计研究对象的性质和研究目的,对统计工作各个方面和各个环节的通盘考虑和安排,制定各种设计方案的过程。

9.就是按照预定的调查要求采用科学的调查方法,有组织、有计划地向客观实际搜集资料的过程。

10. 统计调查按搜集资料的方法不同,可分为直接观察法、和采访法。

二、单项选择题:

1. 人口普查规定统一的标准时间是为了()。

A、避免登记的重复与遗漏

B、确定调查的范围

C、确定调查的单位

D、登记的方便

2. 统计调查分为统计报表和专门调查是按()。

A、调查对象包括的范围不同划分的

B、按其组织形式的不同划分的

C、收集资料的方式不同划分的

D、按登记的时间不同划分的

3. 某市对占该地交通运输业总产值三分之二的六个运输企业进行调查,这

种调查方法叫()。

A、普查

B、典型调查

C、抽样调查

D、重点调查

4. 对全国各铁路交通枢纽的货运量、货物种类调查以了解全国铁路货运概况,这种调查属于()。

A、一次性典型调查

B、连续性的全面调查

C、连续性的重点调查

D、普查

5. 某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()。

A、普查

B、典型调查

C、抽样调查

D、重点调查

6. 对某城市工业企业的设备进行普查,填报单位是()。

A、全部设备

B、每台设备

C、每个工业企业

D、全部工业企业

7. 对科技人员进行调查,其填报单位是()。

A、所有的科技人员

B、每一位科技人员

C、所有的科技人员所在企业

D、每一位科技人员所在企业

8. 对百货商店工作人员进行普查,调查对象是()。

A、各百货商店

B、各百货商店的全体工作人员

C、一个百货商店

D、每位工作人员

9. 全国人口普查中,调查单位是()。

A、全国人口

B、每一个人

C、每一户

D、工人工资

10. 某自行车企业对其产品质量进行调查,其调查单位是()。

A、每一辆自行车

B、每一辆自行车的质量

C、每一产品质量

D、该企业

三、多项选择题

1. 下列各项中,哪些属于统计指标()

A、我国1995年社会总产值

B、某台设备的使用年限

C、某同学该学期平均成绩

D、某地区原煤产量

E、某市年供水量

2. 全国工业普查中()。

A、全国工业企业数为总体

B、每一个企业即是调查单位又是报告单位

C、所有制是品质标志

D、全国工业企业职工总数为指标

3. 简单分组与复合分组的区别在于()。

A、总体的复杂程度

B、组数的多少不同

C、选择分组标志的性质不同

D、选择分组标志的数量多少不同

E、分组状态的排列形式不同

4. 抽样调查与重点调查的主要区别有()。

A、抽选调查单位的多少不同

B、抽选调查单位的方式方法不同

C、取得资料的方法不同

D、对调查资料的使用时,所发挥的作用不同

E、原始资料的来源不同

5. 统计调查按搜集资料的方法,可分为()。

A、采访法

B、抽样调查法

C、直接观察法

D、典型调查法

E、报告法

6. 非全面调查包括()。

A、重点调查

B、抽样调查

C、快速普查

D、典型调查

E、统计年报

7. 某地区进行企业情况调查,则每一个企业是()。

A、填报单位

B、调查项目

C、调查单位

D、统计总体

E、调查对象

8. 普查是一种()。

A、非全面调查

B、专门调查

C、全面调查

D、一次性调查

E、连续性调查

9. 下列判断中,不正确的有()。

A、重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查

B、抽样调查是非全面调查中最有科学根据的方式方法,因此,它适用于完成任何调查任务

C、在非全面调查中,抽样调查最重要,重点调查次之,典型调查最

不重要

D、如果典型调查的目的是为了近似地估计总体的数值,则可以选择

若干中等典型单位进行调查

E、普查是取得全面统计资料的主要调查方式方法

10. 统计调查时间的含义是()。

A、调查资料所属时间

B、调查进行的起止时间

C、调查时实际登记的时间

D、调查工作的时限

E、进行调查的时间

四、简答题:

1. 试述一个周密的调查方案应该包括哪些内容

2. 试述重点调查中重点单位的含义。

3. 试述统计调查的意义及其基本要求。

4.什么是统计指标体系

5.说明统计指标的主要分类。

五、综合题:

(一)指出下列调查的调查对象及单位:

1.商店网点调查;

2.城市职工家庭生活调查;

3.食品部门零售物价调查;

4.住宅调查;

5.机械工业设备调查;

6.科技人员调查;

7.科研机构调查;

8.自行车质量调查;

9.农产品成本调查;

10.扩大企业自主权试点调查;

11.基本建设大、中型企业投资效果调查;

12.港口货运情况调查。

(二)列举习题一中的调查单位和报告单位,指出它们在哪些调查中是一致的,哪些中不是一致的

(三)统计报表和普查都是调查,两者有何区别如果采取定期普查可否代替统计报表

(四)设某人口普查的标准时点规定为6月30日24时,并以长住人口为普查对象,在标准时间后几天,调查人员遇到下列情况,该如

何处理

1、7月3日在第一家调查时,得知这家7月2日死去1人,在普查表

上应列为“死亡”或“不死亡”

2、同日在第二家遇到婚礼,10天以前,新婚夫妇办理好结婚登记,

调查人员应如何登记这对青年人的“婚否”项目

3、7月4日到第三家,这家6月30日出生1小孩,应如何登记

4、7月4日到第四家,户主告许调查员:他在7月1日已办理离婚手

续,对被询问者的婚姻状况应如何填写

5、7月5日在第五家,遇到户主的儿子从外地回家探亲,户主对调查

员说:他儿子6月25日回家后在派出所办理了一个月的临时户

口,试问他的户籍应如何登记

第三章统计整理

复习思考题

1.试述统计整理的意义。

2.统计资料整理一般有哪些步骤

3.统计分组的意义和作用是什么

4.正确选择分组标志有何重要意义如何正确选择分组标志

5.什么是统计分组体系它有哪些重要意义

6.什么是分组数列分组数列按分组标志的不同有哪两种数列

7.解释下列概念:

单项数列、组距数列;组限、上限、下限;全距、组中值;闭口组、

开口组;等距分组和不等距分组、离散型变量和连续型变量、频数和

频率

8.什么情况下编制等距数列或不等距数列

9.统计资料汇总前,为什么要对原始资料进行检查检查哪些内容检查的方法有哪些

10.统计资料的汇总技术有哪几种

11.试述统计表的意义和作用。

12.统计表的构成要素有哪些

13.什么是统计分布其类型有哪几种

14.试述统计资料积累的意义、基本内容和基本方法。

练习题

一、填空题:

1. 统计资料的整理一般经过了审核、、汇总、编表和积累这五个

阶段。

2. 就是根据统计研究任务的要求,对统计调查所得的各项原始资料进行科学的加工与汇总,使其系统化,得出能反应现象总体特征的综合资料;或对已加工过的资料(包括历史资料)进行再加工。

3. 统计表从内容上看,包括和两部分。

4. 统计资料汇总前的审核方法有及两种。

5. 统计资料汇总后的审核方法有、及三种。

6. 统计分组的关键在于选择和划分各组界限。

7. 呈现于统计表上的综合资料,即为统计数列,其基本形态不外乎以下三种形式:、分组数列、时间数列。

8. 次数分配数列按其分组标志特征不同,可分为和。

9. 变量数列按其各组变量值表现形式不同,可分为和。

10. 统计资料的汇总技术经历过三个阶段,即、机械汇总以及计算

机汇总。

二、单项选择题:

1. 次数是分配数列组成的基本要素之一,它是指()。

A、各组单位占总体单位的比重

B、分布在各组的个体单位数

C、数量标志在各组的划分

D、以上都不对

2. 某连续变量数列,其末组为600以上。又如其邻近组的组中值为560,

则末组的组中值为()。

A、620

B、610

C、630

D、640

3. 次数密度是()。

A、平均每组组内分布的次数

B、各组单位组距内分布的次数

C、平均每组组内分布的频率

D、单位次数的组距长度

4. 某厂的职工人数构成表如下:

该组的分组标志是()。

A、性别

B、男、女

C、文化程度

D、性别和文化程度

5. 变量数列中各组频率的总和应该是()。

A、小于1

B、等于1

C、大于1

D、不等于1

6. 某连续变量分为五组:第一组为40~50,第二组为50~60,第三组为60~70,第四组为70~80,第五组为80以上。依习惯上规定()。

A、50在第一组,70在第四组

B、60在第二组,80在第五组

C、70在第四组,80在第五组

D、80在第四组,50在第二组

7. 对职工的生活水平状况进行分组研究,正确地选择分组标志应当用()。

A、职工月工资总额的多少

B、职工人均月收入额的多少

C、职工家庭成员平均月收入额的多少

D、职工的人均月岗位津贴及奖金的多少

8. 分配数列有两个组成要素,它们是()。

A、一个是单位数,另一个是指标数

B、一个是指标数,另一个是分配次数

C、一个是分组,另一个是次数

D、一个是总体总量,另一个是标志总量

9. 某连续变量数列,其首组为500以下。又如其邻近组的组中值为520,

则首组的组中值为()。

A、460

B、470

C、480

D、490

10. 某厂的职工人数构成如下:

该表是()。

A、简单表

B、分组表

C、复合表

D、以上都不是

三、多项选择题:

1. 下列分组哪些是按品质标志分组()

A、职工按工龄分组

B、科技人员按职称分组

C、人口按民族分组

D、企业按所有制分组

E、人口按地区分组

F、职工按收入水平分组

2. 下列分组哪些是按数量标志分组()。

A、职工按工龄分组

B、科技人员按职称分组

C、人口按民族分组

D、企业按所有志分组

E、人口按地区分组

F、职工按收入水平分组

3. 对连续型变量与离散型变量,组限的划分在技术上有不同要求。如果对企业按工人人数分组,正确的方法应该是()。

A、300人以下,300~500人

B、300人以下,301~500人

C、300人以下,310~500人

D、299人以下,300~499人

E、300人以下,301~499人

4. 统计表按分组的情况分类,可分为()。

A、调查表

B、简单表

C、汇总表

D、简单分组表

E、复合分组表

5. 统计分组的主要作用在于()。

A、反映总体的基本情况

B、说明总体单位的数量特征

C、区分事物的本质

D、反映总体内部的结构

E、研究现象之间的依存关系

6. 按数量标志将总体单位分组,形成的分布(分配)数列是()。

A、变量数列

B、变量分布(分配)数列

C、品质数列

D、品质分布(分配)数列

E、次数分布(分配)数列

7. 影响次数分布的要素是()。

A、变量值的大小

B、组距与组中值

C、组限与组中值

D、变量性质不同

E、选择的分组标志

8. 在组距数列中,组距数列的种类有()。

A、闭口式的

B、开口式的

C、等距式的

D、不等距式的

E、有组限的

9. 正确选择分组标志的原则是()。

A、应当根据研究的目的与任务选择

B、要选择能够反映事物本质或主要特征的标志

C、要根据事物发展的规律选择

D、要根据现象的历史条件及经济条件来选择

E、要根据数量标志与品质标志的不同来选择

10. 各种不同性质的社会经济现象都有着特殊的统计分布类型。常见的

主要有()。

A、钟性分布

B、S型分布

C、双曲线分布

D、J型分布

E、U 型分布

四、简答题:

1. 试述分配数列及其分类情况。

2. 什么是统计分布其类型有哪几种

3.统计资料整理有哪些内容

4.统计分组有何作用

5.分组标志选择的原则是什么

五、计算题:

(一)某工厂120个工人某月份生产某种产品件数的资料如下:

要求:根据上列的原始统计资料,把工人按生产件数(等距)分成七组,并编制变量数列表。

(二)下面是两个地区机械厂工人劳动生产率资料:

要求:对上述资料进行分组,计算相应的频数和频率,以比较两地区机械厂工人劳动生产率的分配情况。

(三)某年某地工业企业按固定资产总值大小分组资料如下:

要求:试用上列资料,作如下的再分组(提示:本题可按比例法推算)

1.把原分的九个组,改分为下列五组,并计算企业数和总产值占总计的百分数;

??

??

?

?

?

?

?

万元以上~~~万元以上2000200010001000500500100100

2.把原分组,改按类型分组,分为下列三组。各组总产值比重如下,并计算各组企业数对总计的百分数。 小型企业占总产值合计数的25%;

中型企业占总产值合计数的50%;

大型企业占总产值合计数的25%。

第四章综合指标分析方法

——变量数列分析法

复习思考题

1.试述总量指标的概念、种类和作用。

2.总量指标的计量单位有哪些它们各有什么不同意义

3.试述相对指标的概念、相对指标的数值表现形式有哪些如何区别选用

4.试述结构相对指标、比较相对指标和强度相对指标的意义和作用。

5.试述长期计划完成情况的水平法和累计法的不同特点。

6.当计划指标用提高或降低百分比表示时,应该怎样检查和分析计划的完成程度。

7.计算和应用相对指标必须遵循哪些原则

8.试述平均指标的概念及作用,它与强度相对指标如何分辨

9.平均指标有哪几种为什么算术平均数是平均指标中最基本的、最常用的指标

10.什么是加权算术平均数什么是权数加权算术平均数数值大小受哪两个因素的影响

11.什么是调和平均数在什么情况下计算平均数要采用的调和平均数公式。

12.试述众数、中位数的意义和作用。

13.应用平均指标必须遵循哪些原则

14.试述标志变异指标的意义和作用。

15.测定标志变异的指标有哪几个各有什么特点

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计学 名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

统计学中几个基本理论

统计学中几个基本理论的释疑 文章摘要:如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 在计算加权算术平均数时,即使各组的单位数相等,权数也不一定会失去其应有的作用。正确的说法应该是:当各组权数相等且都等于某一任意常数时,权数就失去了其应有作用。此时,加权算术平均数就变成了简单算术平均数。也正是因为如此,所以我们说简单算术平均数是加权算术平均数的一个特例,是各组权数相等时的一种特殊的加权算术平均数。 对“下限在内,上限不在内”原则的辨析现行统计学教材在讲到组距式变量数列的编制时,指出“凡遇到某单位的变量值刚好等于相邻两组界限时,例行规定是将这个单位归入作为下限的组内,即所谓…下限在内,上限不在内?的原则。”代写理论统计学论文笔者认为,对其变量值刚好等于相邻两组界限值的单位,究竟是归入作为下限的组内,还是归入作为上限的组内,不应简单地像教材中所说的那样用一条“下限在内,上限不在内”的原则去解决,而是应当视变量的取值是越大越好还是越小越好来分别解决。具体说来,对于其取值越大越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,应按“下限在内 ,上限不在内”的原则归组;而对于其取值越小越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,则应按“上限在内,下限不在内”的原则归组。因为只有这样,才能将性质不同的单位分别划归到不同的组里去,从而实现统计分组的目的。否则,就不能做到这一点。以下分别举例说明。 “下限在内,上限不在内”原则的例题资料如表6所示。表 6 按耐穿时间分组(天) 鞋数(双) 280~300 300~320 320~340 340~360 360~380 2 000 3 000 26 000 8 000 1 000 ∑40 000 注:国家规定,该种鞋的耐穿时间在300天以上(含300 天)为合格。此例中,由于鞋的耐穿时间是一个取值越大越好的变量, 因此,当某一双鞋的耐穿时间刚好等于300天时,理应将其归入300天作为下限的第二组,而不应将其归入300天作为上限的第一组。因为只有这样,才能保证第一组的鞋都是不合格的,第二组的鞋都是合格品。现在如果硬要将耐穿时间刚好等于300天的鞋划归到第一组中去,则第一组的全部鞋中,既有合格品,又有不合格品,这样就达不到统计分组的目的。“上限在内,下限不在内”的原则的例题资料如表7所示因为只有这样,才能确保第三组中的零件都为不合格品。否则的话,如果硬要将尺寸误差刚好等于3mm 的零件划归到第三组中去,则就会使第三组的全部零件中,既有合格品,又有不合格品,从而也就不能达到统计分组的目的。对“整群抽样中样本成数计算公式”的质疑与释疑现行统计学教材中, 在谈到整群抽样方式下样本成数的计算公式时,往往是这样介绍的:若已知样本中各群的成数分别P1, P2, P3,…Pr,则样本成数计算公式为: P=P1+P2+P3+…Prr=∑Pir(i=1, 2, 3,…, r) 例如,从某县的50个村中随机不重复抽取5个村,对被抽中的5个村的所有养猪专业户进行全面调查,以推算该县存栏牲猪数及其优良品种率。调查结果,各村养猪专业户存栏牲猪的优良品种率分别为90%、80%、50%、70%和55%,则该县养猪专业户样本存栏牲猪的优良品种率为: P =∑Pir =90%+80%+50%+70%+55%5 =69% 笔者认为,用上述公式计算样本成数是不正确的一方面,在介绍平均数时,所有教材都讲到如果只知道若干个比率而要求计算其平均数,则最合适的方法应是简单几何平均法,而不应是简单算术平均法;另一方面,在实际抽样中,所获取的信息往往是计算各样本群成数的原始信息,此时,如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 因此,我认为,在计算样本成数时,应针对不同的已知条件,采取不同的计算方法: (1)当已知样本中各样本群内具有某种特征的单位数n1i、不具有某种特征的单位数noi和样本单位总数n三个中的任意两个时,可采用下列公式计算样本成数: P=∑n1i∑ni或=∑(ni-noi)∑ni=∑n1i∑(n1i+noi)(i=1, 2, 3, …, r) 如,假设原例中被抽中的5个村养猪专业户的存栏牲猪数分别为5 000头、8 000头、7 000头、8 800头和6 500头, 且其中的优良品种数分别为4 500头、6 400头、3 500头、6 160头和3 575头,则该县养猪专业户样本存栏牲猪

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用:? 特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;? 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; ?5、u变换:为了便于描述和应用,常将正态变量作数据转换;?? 应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能 7.线性回归的主要用途。

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

统计学经典书籍推荐

统计学经典书籍推荐 这是我碰巧在网上看到有人做了一些关于统计学经典书籍推荐和建议的总结,所以特意 转载与此,希望对大家有用。 一、统计学基础部分 1、《统计学》David Freedman等著,魏宗舒,施锡铨等译中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》机械工业出版社 只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社 看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》中国统计出版社 在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社 和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》中国统计出版社 还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》 这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分 析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》王学民上海财经大学出版社 现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。 2、《Analyzing Multivariate Data(英文版)》Lattin等著机械工业出版社这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

最新医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算 S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布 原始值X 无需转换 作u=(X-μ)/σ转换 分布类型 对称 对称 集中趋势 μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同?

统计学必看教材推荐

一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it\'s just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》中国统计出版社还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS 程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》王学民上海财经大学出版社现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。

相关主题
文本预览
相关文档 最新文档