统计学第三版答案
- 格式:doc
- 大小:2.26 MB
- 文档页数:119
统计学原理宫春子第三版答案一、填空题(每空1分,共10分)1.从标志与统计指标的对应关系来看,标志通常与()相同。
2.某连续变量数列,其首组为开口组,下限为80,又言其邻组的组中值为95,则首组的组中值为()。
3.国民收入中消费额和积累额的比例为1:0.4,这是()相对指标。
4.在+a的公式中,a称作()。
5.峰度是指次数分布曲线项峰的(),是次数分布的一个重要特征。
6.用水平法求平均值发展速度本质上就是谋()平均数。
7.按习惯做法,采用加权调和平均形式编制的物量指标指数,其计算公式实际上是()综合指数公式的变形。
8.对一个确认的总体,抽取的样本可能将个数与()和()有关。
9.用来反映回归直线代表性大小和因变量估计值准确程度的指标称()。
二、是非题(每小题1分后,共10分后)1.统计史上,将国势学派和图表学派统称为社会经济统计学派。
2.统计数据总体与总体单位在任何条件下都存有转换关系。
3.学生按身高分组,适宜采用等距分组。
4.根据组距数列排序求出的算术平均数就是一个近似值。
5.基尼系数的基本公式可转化为2(s1+s2+s3)。
6.对已连续时点数列谋序时平均数,应当使用平均值算术平均方法。
7.分段平均法的数学依据是∑(y-yc)2=最小值。
8.平均数、指数都存有静态与动态之分后。
9.在不重复抽样下,从总体n中抽取容量为n的样本,则所有可能的样本个数为nn 个。
10.根据每对x和y的等级计算结果∑d2=0,表明x与y之间存有全然正有关。
三、单项选择题(每小题2分,共10分)1.在综合统计数据指标分析的基础上,对社会总体的数量特征做出概括、推测和预测的方法就是a.大量观察法b.统计分组法c.综合指标法d.模型推断法2.对同一总体挑选两个或两个以上的标志分别展开直观分组,构成a.复合分组b.层叠分组c.平行分组体系d.复合分组体系3.交错标志方差的最大值为a.1b.0.5c.0.25d.04.如果使用三项移动平均值修匀时间数列,那么税金修匀数列比原数列首尾各少a.一项数值b.二项数值c.三项数值d.四项数值5.气门权数就是所指在一个指数数列中,各个指数的a.同度量因素是变动的b.基期是变动的c.指数化因数就是变动的d.时期就是变动的四、多项选择题(每小题2分,共10分)1.充分反映以经济指标为中心的三位一体的指标总体系包含a.社会统计指标体系b.专题统计指标体系c.基层统计数据指标体系d.经济统计数据指标体系e.科技统计指标体系2.典型调查a.是一次性调查b.是专门组织的调查c.就是一种深入细致的调查d.调查单位就是有意识地挑选出的e.可用采访法取得资料3.以下指标中属总量指标的存有a.月末商品库存额b.劳动生产率c.历年产值增加额d.年末紧固资金额e.某市人口净增加数4.重复样本的特点就是a.各次抽选互不影响b.各次抽选相互影响c.每次抽取时,总体单位数逐渐增加d.每次抽选时,总体单位数始终不变e.各单位被抽到的机会在各次抽取中成正比5.下列关系中,相关系数小于0的现象有a.产品产量与耗电量的关系b.单位成本与产品产量的关系c.商品价格与销售量的关系d.纳税额与收入的关系e.商品流通费用率与商品销售额的关系五、计算题(每小题10分,共60分)建议:(1)写出必要的计算公式和计算过程,否则,酌情扣分。
社会统计学第三版第10章课后答案1.指标是说明总体特征的,标志是说明总体单位特征的,所以()。
(分值: [单选题] *A.标志和指标之间的关系是固定不变的B.标志和指标之间的关系是可以变化的(正确答案)C.标志和指标都是可以用数值表示的D.只有指标才可以用数值表示2.统计最基本的职能是()。
(分值: [单选题] *A.信息职能(正确答案)B.咨询职能C.反映职能D.监督职能3.“统计”一词的三种涵义是()。
(分值: [单选题] *A.统计活动.统计资料和统计学(正确答案)B.统计调查.统计整理和统计分析C.统计设计.统计分析和统计预测D.统计方法.统计分析和统计预测4.统计活动过程一般由四个环节构成,即()。
(分值: [单选题] *A.统计调查.统计整理.统计分析和统计决策B.统计调查.统计整理.统汁分析和统计预测C.统计设计.统计调查.统计审核和统计分析D.统计设计.统计调查.统计整理和统计分析(正确答案)5.调查某市职工家庭的生活状况时,统计总体是()。
(分值: [单选题] *A.该市全部职工家庭(正确答案)B.该市每个职工家庭C.该市全部职工D.该市职工家庭户数6.调查某班50名学生的学习情况,则总体单位是()。
(分值: [单选题] *A.该班50名学生B.该班每一名学生(正确答案)C.该班50名学生的学习情况D.该班每一名学生的学习情况7.工业企业的设备台数、产品产值是()。
(分值: [单选题] *A.连续变量B.离散变量C.前者是连续变量D.前者是离散变量(正确答案)8.对某地区工业企业职工情况进行研究,统计总体是()。
(分值: [单选题] *A.每个工业企业B.该地区全部工业企业C.每个工业企业的全部职工D.该地区全部工业企业的全部职工(正确答案)9.在第四次全国人口普查中()(分值: [单选题] *A.男性是品质标志表现(正确答案)B.人的年龄是指标C.人口的平均寿命是数量标志D.某家庭的人口数是统计指标10.以下岗职工为总体,观察下岗职工的性别构成,此时的标志是()。
医学统计学八年制第三版课后答案一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
第四章、参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。
设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量。
2.说明区间估计的基本原理答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。
置信水平反映估计的可信度,而区间的长度反映估计的精确度。
3.解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知的,置信区间是一个随机区间。
置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。
4.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。
练习题:●1.解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,(1)样本均值的抽样标准差σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2Z 6×0.7906=1.5496。
●2.解:(1)已假定总体标准差为σ=15元,则样本均值的抽样标准误差为x σ15=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E=α/2Z 6×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,这时总体均值的置信区间为±α/2x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
统计学第三版答案第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
各位老师读者好:《统计学基础》(王瑞卿主编,北京大学出版社,2016年8月第3版)每个项目后面设置了技能训练题库,由于统计学教材很多,不同的老师在编写时内容描述会有些许差异,所以有些习题答案可能有差异,答案以本教材为准。
祝各位工作、学习顺利。
真诚欢迎各位提出您的宝贵意见!王瑞卿2016年9月12日项目1 统计概论一、填空题1.现代统计的含义包括三个方面: 、 和 。
2.一个完整的统计工作过程可以划分为 、 、 、 四个阶段。
3.总体是由许多具有 的个别事物组成的整体;总体单位是 的组成单位。
4.标志是说明总体单位的特征的名称,按表现形式不同分为 和 两种。
5.统计指标按其所说明的总体现象内容的不同,可分为 和 。
参考答案1.统计工作统计资料统计学2. 统计设计统计调查统计整理统计分析3.共同属性总体4.数量标志品质标志5.数量指标质量指标二、单项选择题1.统计总体的同质性是指(B )。
A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.某地区有800家工业企业,要研究这些企业的产品生产情况,总体是( A ),总体单位是( B )。
A.全部工业企业B.每一家工业企业C.每一件产品D.800家工业企业的全部工业产品3.要了解某班50名学生的学习情况,则总体是( A ),总体单位是( C )。
A.50名学生B.50个学生的学习成绩C.每一个学生D.每一个学生的学习成绩4.一个统计总体( B )。
A.只能有一个标志B.可以有多个标志C.只能有一个指标D.可以有多个指标5.张明的月工资为4560元,工资是( B ),4550是( C )。
A.品质标志B.数量标志C.变量值D.指标6.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是( A )。
管理统计学第三版答案第一章管理统计学概述1.1 管理统计学的定义与作用管理统计学是一门研究数据收集、整理、分析和解释的学科。
它应用于管理决策的各个领域,帮助管理者做出基于数据的决策,提高组织的绩效和竞争力。
1.2 管理统计学的应用领域管理统计学广泛应用于企业管理、市场调研、财务分析、生产管理等各个领域。
它可以帮助管理者分析市场需求、优化生产过程、制定预算计划等,从而提高企业的效益和经营水平。
1.3 管理统计学的基本概念管理统计学涉及的基本概念包括样本、总体、统计量、统计推断等。
样本是从总体中抽取出来的一部分观察值,总体是所研究对象的全体观察值的集合。
统计量是对样本观察值进行总结和描述的指标,统计推断则是根据样本数据对总体进行估计和推断。
第二章数据收集与整理2.1 数据的分类与来源数据可以分为定量数据和定性数据。
定量数据是可以量化的、可以进行数值计算的数据,如销售额、利润等。
定性数据是描述性的、无法进行数值计算的数据,如产品类型、客户满意度等。
数据的来源包括实地调查、问卷调查、文献分析等。
2.2 数据的收集方法数据的收集方法包括实地调查、电话调查、问卷调查等。
在选择数据收集方法时,需要考虑调查对象、时间和经济成本等因素,以确保数据的准确性和可靠性。
2.3 数据的整理与清洗数据整理是指对收集到的数据进行排序、分类和编码,以便于后续的分析和处理。
数据清洗是指对数据中的错误、缺失和异常值进行检查和修正,以提高数据的质量和可靠性。
第三章描述性统计与数据可视化3.1 描述统计的基本概念描述统计是对数据进行汇总和描述的统计方法。
它包括中心趋势度量、离散程度度量和数据的分布形状等指标。
3.2 描述统计的方法与应用描述统计的方法包括频数分布、统计图表、平均数、中位数等。
它可以帮助管理者对数据进行简要的分析和概括,了解数据的基本情况。
3.3 数据可视化的方法与应用数据可视化是使用图表、图像等方式展示数据的过程。
它可以帮助管理者直观地理解数据,发现数据的规律和趋势,从而更好地做出决策。
1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110 110~120 120~130 130~140 140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40 100.0 ————(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(3)茎叶图如下:65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.5 (1)属于数值型数据。
第七章拟合优度检验7.12000年在5 760 295名成年人群中和1 596 734名儿童群体中严重CDH(先天性心脏病)和其他程度CDH的流行病学患者数如下表[36]:尚存活的成年人 2 205 21 358 23 563尚存活的儿童 2 316 16 663 18 979 合计 4 521 38 021 42 542检验在尚存活的成年人和儿童中受损害的程度,差异是否显著?答:这是2×2列联表χ2检验,使用程序如下:options linesize=76 nodate;data;do a=1 to 2;do b=1 to 2;input case @@;output;end;end;cards;2205 213582316 16663;proc freq formchar(1,2,7)='|-+';weight case;tables a*b/cellchi2 expected nocol norow nopercent chisq;title '2*2 Contingency Table Test';run;程序运行结果见下表:2*2 Contingency Table TestTABLE OF A BY BA BFrequency |Expected |Cell Chi-Square| 1| 2| Total---------------+--------+--------+1 | 2205 | 21358 | 23563| 2504.1 | 21059 || 35.72 | 4.2474 |---------------+--------+--------+2 | 2316 | 16663 | 18979| 2016.9 | 16962 || 44.347 | 5.2733 |---------------+--------+--------+Total 4521 38021 42542STATISTICS FOR TABLE OF A BY BStatistic DF Value Prob------------------------------------------------------Chi-Square 1 89.588 0.001Likelihood Ratio Chi-Square 1 89.070 0.001Continuity Adj. Chi-Square 1 89.289 0.001Mantel-Haenszel Chi-Square 1 89.586 0.001Fisher's Exact Test (Left) 2.21E-21(Right) 1.000(2-Tail) 4.20E-21Phi Coefficient -0.046Contingency Coefficient 0.046Cramer's V -0.046Sample Size = 42542从“A×B列联表的统计量”部分可以得出,连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在尚存活的成年人和儿童中受损害的程度差异极显著。
医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1) 均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069) (2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较, t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038, 转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义 (3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
第1章绪论1什么是统计学怎样理解统计学与统计数据的关系2试举出日常生活或工作中统计数据及其规律性的例子。
3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此他们开始检查供货商的集装箱有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求1描述总体2描述研究变量3描述样本4描述推断。
答1总体最近的一个集装箱内的全部油漆2研究变量装满的油漆罐的质量3样本最近的一个集装箱内的50罐油漆4推断50罐油漆的质量应为4.536×50226.8 kg。
4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分选择了1000名消费者进行匿名性质的品尝试验即在品尝试验中两个品牌不做外观标记请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求1描述总体2描述研究变量3描述样本4一描述推断。
答1总体市场上的“可口可乐”与“百事可乐” 2研究变量更好口味的品牌名称3样本1000名消费者品尝的两个品牌4推断两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1. 解1由于表2.21中的数据为服务质量的等级可以进行优劣等级比较但不能计算差异大小属于顺序数据。
2频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数频数频率 A 14 14 B 21 21 C 32 32 D 18 18 E 15 15 合计100 100 3条形图的制作将上表包含总标题去掉合计栏复制到Excel表中点击图表向导→条形图→选择子图表类型→完成见Excel练习题2.1。
即得到如下的条形图02040ABCDE服务质量等级评价的频数分布频率服务质量等级评价的频数分布家庭数频数●2. 解1要求对销售收入的数据进行分组全部数据中最大的为152最小的为87知数据全距为1528765 为便于计算和分析确定将数据分为6组各组组距为10组限以整10划分为使数据的分布满足穷尽和互斥的要求注意到按上面的分组方式最小值87可能落在最小组之下最大值152可能落在最大组之上将最小组和最大组设计成开口形式按照“上限不在组内”的原则用划记法统计各组内数据的个数——企业数也可以用Excel 进行排序统计见Excel练习题2.2将结果填入表内得到频数分布表如下表中的左两列将各组企业数除以企业总数40得到各组频率填入表中第三列在向上的数轴中标出频数的分布由下至上逐组计算企业数的向上累积及频率的向上累积由上至下逐组计算企业数的向下累积及频率的向下累积。
统计学第三版答案第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
统计学—基于SPSS第三版贾俊平习题答案1、数据的预处理包括哪些内容?答:数据审核,数据筛选,数据排序,数据透视表2、分类数据和顺序数据的整理和图示方法各有哪些?答:分类数据方法:在整理时首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表。
图示的方法:条形图,帕累托图,饼图,环形图3、数值型数据的分组方法有哪些?简述组距分组的步骤。
答:分组的方法有单变量值分组和组距分组两种。
组距分组步骤:第1步,确定组数。
第2步,确定各组的组距。
第3步,根据分组整理成频数分布表。
单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量值较少的情况下使用。
在连续变量或变量值较多的情况下,通常采用组距分组。
它是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组。
在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。
4、直方图与条形图有何区别?答:直方图与条形图不同。
首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
5、绘制线图应注意哪些问题?答:线图(line plot)主要用于反映现象随时间变化的特征(针对时间序列数据)。
绘制线图时,时间一般绘在横轴,观测值绘在纵轴。
一般应绘成横轴略大于纵轴的长方形,其长宽比例大致为10:7。
图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便于对数据变化的理解。
一般情况下,纵轴数据下端应从“0”开始,以便于比较。
如果数据与“0”之间的间距过大,可以采取折断的符号将纵轴折断。
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26 700 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 18720 1 2 2 5 6 7 8 9 9 1073 3 5 6 374 1 4 7 3茎叶图与直方图所反映的数据分布是一致的,不同的是茎叶图中保留了原始数据。
2.3 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:人数考试成绩甲班乙班优 3 6良 6 15中18 9及格9 8不及格 4 2(1)根据上面的数据,画出两个班考试成绩的环形图,比较它们的构成。
(2)画出雷达图,比较两个班考试成绩的分布是否相似。
详细答案:(1)环形图如下:(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
从雷达图的形状看,两个班考试成绩的分布没有相似之处。
2.4 下面是我国10个城市2006年各月份的气温数据:月份北京沈阳上海南昌郑州武汉广州海口重庆昆明1月-1.9 -12.7 5.7 6.6 0.3 4.2 15.8 18.5 7.8 10.82月-0.9 -8.1 5.6 6.5 3.9 5.8 17.3 20.5 9.0 13.23月8.0 0.5 11.1 12.7 11.5 12.8 17.9 21.8 13.3 15.94月13.5 8.0 16.6 19.3 17.1 19.0 23.6 26.7 19.2 18.05月20.4 18.3 20.8 22.7 21.8 23.9 25.3 28.3 22.9 18.06月25.9 21.6 25.6 26.0 27.8 28.4 27.8 29.4 25.4 20.47月25.9 24.2 29.4 30.0 27.1 30.2 29.8 30.0 31.0 21.38月26.4 24.3 30.2 30.0 26.1 29.7 29.4 28.5 32.4 20.69月21.8 17.5 23.9 24.3 21.2 24.0 27.0 27.4 24.8 18.310月16.1 11.6 22.1 22.1 19.0 21.0 26.4 27.1 20.6 16.911月 6.7 0.8 15.7 15.0 10.8 14.0 21.9 25.3 14.6 13.2绘制各城市月气温的箱线图,并比较各城市气温分布的特点。
详细答案:箱线图如下:从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。
从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。
第3章用统计量描述数据3.1 随机抽取25个网络用户,得到他们的年19152925242321382218302019191623272234244120311723龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
详细答案:网民年龄的描述统计量如下:从集中度来看,网民平均年龄为24岁,中位数为23岁。
从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)计算第二种排队时间的平均数和标准差。
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:(1)(岁);(岁)。
(2);。
第一中排队方式的离散程度大。
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300~40030400~50042500~60018600以上11合计120计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:=426.67(万元);(万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?详细答案:通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。
下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C1641291251671301261681291261651301271701311261651301281641291271681271261641281271621281271631271251661281261.你准备用哪些统计量来评价组装方法的优劣?2.如果让你选择一种方法,你会做出怎样的选择?试说明理由。
详细答案:评价。
从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
第4章概率分布4.1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:X012345678910P0.0410.1300.2090.2230.1780.1140.0610.0280.0110.0040.001根据这些数值,分别计算:(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。
(2)只有不到2个空调器出现重要缺陷的概率。
(3)有超过5个空调器出现重要缺陷的概率。
详细答案:(1)0.724。
(2)0.171。
(3)0.105。
4.2 设是参数为和的二项随机变量。
求以下概率:(1);(2)。
详细答案:(1)0.375。
(2)0.6875。
4.3 求标准正态分布的概率:(1);(2);(3)。
详细答案:(1)0.3849。
(2)0.1844。
(3)0.0918。
4.4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)9.1910.019.609.279.788.829.638.8210.508.839.358.6510.109.4310.129.399.548.519.7010.039.499.489.369.1410.099.859.379.649.689.75绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?详细答案:正态概率图如下:由正态概率图可以看出,汽车耗油量基本服从正态分布。
4.5 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。
(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?详细答案:(1)200。
(2)5。
(3)近似正态分布。
4.6 从的总体中,抽取一个容量为500的简单随机样本。
(1)的期望值是多少?(2)的标准差是多少?(3)的分布是什么?详细答案:(1)0.4。
(2)0.0219 。
(3)近似正态分布。
4.7 假设一个总体共有8个数值,54,55,59,63,64,68,69,70。
从该总体中按重复抽样方式抽取的随机样本。
(1)计算出总体的均值和方差。
(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布?(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?详细答案:(1),。
(2)共有64个样本。
(3)所有样本的样本均值如下:54.556.558.559.061.061.562.054.054.555.057.059.059.561.562.062.556.557.059.061.061.563.564.064.558.559.061.063.063.565.566.066.561.562.064.066.066.568.569.069.562.062.564.566.567.069.069.570.0(4)样本均值的正态概率图如下:从正态概率图可以看出,样本均值近似服从正态分布。