最新统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案资料
- 格式:doc
- 大小:296.50 KB
- 文档页数:17
医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
统计学原理第七版课后答案1. 样本与总体。
1.1 什么是样本?什么是总体?样本是指从总体中抽取出来的一部分个体或观测值,而总体则是指研究对象的全体个体或观测值的集合。
在统计学中,我们通常通过对样本进行统计分析来推断总体的特征。
1.2 为什么要使用样本?使用样本可以节约时间和成本,同时也可以减小调查的难度。
通过对样本的分析,我们可以得出对总体的推断,从而更加高效地进行统计研究。
2. 描述统计与推断统计。
2.1 描述统计和推断统计有什么区别?描述统计是通过对样本数据的整理、分析和总结,来描述数据的基本特征和规律。
而推断统计则是通过对样本数据的分析,来推断总体的特征和规律。
2.2 描述统计和推断统计各自的应用场景是什么?描述统计主要用于对已有数据进行整理和总结,以便更好地理解数据的特征;而推断统计则主要用于从样本数据中推断总体的特征,以便对总体进行更深入的研究和分析。
3. 概率分布。
3.1 什么是概率分布?概率分布是指描述随机变量可能取值的概率规律的数学函数。
常见的概率分布包括正态分布、泊松分布、均匀分布等。
3.2 为什么要研究概率分布?研究概率分布可以帮助我们更好地理解随机变量的性质和规律,从而为后续的统计推断和分析提供基础。
4. 参数估计与假设检验。
4.1 参数估计和假设检验的基本思想是什么?参数估计的基本思想是通过样本数据对总体参数进行估计,从而对总体的特征进行推断;而假设检验的基本思想是在已知总体参数的情况下,通过样本数据来检验总体参数的假设。
4.2 参数估计和假设检验的应用范围有哪些?参数估计和假设检验在统计学中有着广泛的应用,包括医学、经济学、社会学等各个领域。
5. 方差分析。
5.1 什么是方差分析?方差分析是一种用于比较两个或多个总体均值是否相等的统计方法,常用于实验设计和数据分析中。
5.2 方差分析的原理是什么?方差分析的原理是通过比较组内变异和组间变异的大小,来判断总体均值是否存在显著差异。
统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。
本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。
1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。
请计算该组数据的均值、中位数和众数,并解释它们的含义。
答案:均值:计算方法是将所有数据相加,然后除以数据的个数。
对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。
中位数:将数据按照从小到大的顺序排列,找出中间的数。
对于给定的数据,中位数为16。
众数:出现频率最高的数。
对于给定的数据,众数为10。
这些统计量可以帮助我们了解数据的集中趋势。
均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。
在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。
2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。
如果投掷一次骰子,求得到奇数的概率。
答案:奇数的个数为3个,即1、3、5。
骰子的总个数为6个。
所以得到奇数的概率为3/6 = 1/2。
概率是事件发生的可能性。
在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。
3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。
你打算进行一次调查,抽取100名居民进行问卷调查。
这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。
原因是抽样的方式可能引入抽样误差。
如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x xL xiP L n x f f P u P u P u离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布(2)Descriptive StatisticsN Range Min Max Mean Std. Deviation 胸围120 12.7 49.1 61.8 55.120 2.3188(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L xiP L n f f P x P P2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
医学统计学第七版课后答案及解析医学统计学第七版课后答案及解析目录第一章医学统计中的基本概念 (1)第二章集中趋势的统计描述 (2)第三章离散程度的统计描述 (5)第四章抽样误差与假设检验 (8)第五章 t检验 (10)第六章方差分析 (14)第七章相对数及其应用 (19)第八章2检验 (22)第九章非参数检验 (26)第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
第2章 定量资料的统计描述
案例2-1(P27)
答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:
25507523.5(23825%20) 4.7(mol/kg)
6625.5(23850%86) 6.6(mol/kg)
602
7.5(23875%146)8.9(mol/kg)
48(%)
x x L x i
P L n x f f P u P u P u =+?==+?==+?==+?S
离散程度指标:
四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,
思考与练习(P31)
1.
答:
(1)
某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布
Group Frequency Percent Cumulative Percent
49.0- 1 .8 .8
50.0- 4 3.3 4.2
51.0- 8 6.7 10.8
52.0- 6 5.0 15.8
53.0- 19 15.8 31.7
54.0- 18 15.0 46.7
55.0- 14 11.7 58.3
56.0- 26 21.7 80.0
57.0- 10 8.3 88.3
58.0- 9 7.5 95.8
59.0- 4 3.3 99.2
61.0-62.0 1 .8 100.0
Total 120 100.0
(2)
(3) 利用频数分布表数据计算均数和标准差
0149.5161.56623.01112055.19(cm)
fX X f
∑=
∑⋯⨯++⨯==
⋯++=
(4)………..
S 2.33(cm)=
2550751
53.0(12025%19)53.58(cm)191
55.0(12050%56)55.29(cm)141
56.0(12075%70)56.77((cm)
26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S
2.
答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.
M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)
3.
答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
lg 1lg 2lg86lg161lg5121lg 301lg 1.68581.68581048.5
f X G f ⎛⎫∑-= ⎪∑⎝⎭
⨯+⨯++⨯⎛⎫-= ⎪
⎝⎭-==≈
四、综合分析题(P393)
第一题
176名燃煤型砷中毒患者尿砷含量(ug/L)的频数分布Frequency Percent Cumulative Percent
0.01- 84 47.7 47.7
0.06- 41 23.3 71.0
0.11- 25 14.2 85.2
0.16-
4 2.3 87.5
0.21- 7 4.0
91.5
0.26-
5 2.8 94.3 0.31-
2 1.1 95.5 0.36-
3 1.7 97.2 0.41- 2 1.1 98.3
0.51-
1 .6 98.9
0.56-0.61 2 1.1 100.0
Total 176 100.0
由上图可见,该资料集中位置偏向左侧,为正偏态分布,可考虑作对数变换: Y=lg(尿总砷)
Tests of Normality(正态性的检验)
a Lilliefors Significance Correction
Descriptive Statistics
结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得几何均数G=0.0656(ug/L)。
第二题
解:
(1) 已知健康人的血清胆固醇服从正态分布,故采用正
态分布法制定95%的参考值范围。
下限:
上限:
故该市45-55岁健康男性居民的血清胆固醇的95%的参考值范围为(2.96mmol/L, 6.72mmol/L)
1.96 4.84 1.960.96
2.96(/)X S mmol L -=-⨯=1.96 4.84 1.960.96 6.72(/)
X S mmol L +=+⨯=
(2) 45-55岁健康男性居民的血清胆固醇的分布为正态分
布,且仅知样本均数和样本标准差,则先按下式求得z 值,再查附表二的标准正态分布下的面积求得曲线下某区间的面积。
查标准正态分布曲线下的面积表(附表2)得:
1122
3.25
4.84 1.660.96
5.25 4.840.430.96X X Z S X X Z S --===---===1
2()(1.66)0.0485
()(0.43)1(0.43)z z ΦΦΦΦΦ=-===--
即该市45-55岁健康男性居民中,血清胆固醇在
3.25-5.25mmol/L 范围内的比例为61.79%。
(3)
即该市45-55岁健康男性居民中,血清胆固醇低于3.80mmol/L 所占的比例为14.01%。
3.80
4.84 1.080.96X X Z S --===-()(1.08)0.140114.01%z ΦΦ=-==
第三题
Group Frequency Percent Cumulative Percent 50- 3 2.5 2.5
3 2.5 5.0
60-
3 2.5 7.5
70-
80- 9 7.5 15.0
90- 12 10.0 25.0
100- 9 7.5 32.5
110- 27 22.5 55.0
21 17.5 72.5
120-
23 19.2 91.7 130-
10 8.3 100.0 140-
120 100.0
Total。