统计学第二版的课后答案
- 格式:doc
- 大小:962.50 KB
- 文档页数:21
《统计学基础(第2版)》参考答案【习题与实践训练】答案第一章判断题1.×2.×3.×4.×5.×6.×7.√8.×9.× 10.√ 单项选择题1.B2.D3.D4.D5.A6.C7.D8.B9.A 10.C 多项选择题1.BCDE2.ABCD3.ACD4.ADE5.ABC6.ABCDE7.ADE8.BCE9.ABCDE10.BCD 填空题1.工作过程与结果理论与实践2.统计设计、统计调查、统计整理和统计分析3.大量观察法、统计分组法、综合指标法4. 变动的数量标志5.总体单位数量标志品质标志统计总体数量指标质量指标 6.指标条件指标名称、指标数值、指标单位7.一系列相互联系的统计指标所组成的有机整体基本专题 8. 定性数据定量数据9.母体子样 10.连续型变量离散型变量应用能力训练题 1.略 2.略3. ⑴总体:持有该公司信用卡的所有顾客;总体单位:持有该公司信用卡的每一位顾客;样本:300名顾客;样本量:300名;品质标志:过去六个月是否购买产品;数量标志:每位顾客购买金额;数量指标:300名顾客购买总额;质量指标:平均购买额为1782.67元;统计量:300名顾客平均购买额为1782.67元;参数:持有该公司信用卡的所有顾客购买总额。
⑵本案例采用的统计方法属推断统计。
4.轿车生产总量,旅游收入是数量指标;经济发展速度,人口出生率,安置再就业人数,城镇居民人均可支配收入,恩格尔系数是质量指标。
区分数量指标与质量指标的方法是:数量指标用绝对数表示,质量指标用相对数和平均数表示。
5.总体:中国农民;样本:全国31个省(区、市)6.8万户农村住户的农民;变量:现金收入、工资性收入、出售农产品的收入、家庭二、三产业生产经营收入、财产性收入、转移性收入。
6.略。
第二章判断题1.×2.×3.×4. √5.×6.×7. ×8. √9.× 10. × 单项选择题1.C2.A3.A4.C5.B6.D7.A8.C9.B 10.D 多项选择题1.BDE2.ACD3.BCD4.ADE5.BCE6.ABCE7.ABCE8.BDE9.BDE 10.ABC 填空题1.单一表一览表2.普查抽样调查重点调查典型调查3.全面调查非全面调查4.直接观察法5.有意识随机6.统计调查方案7.表头表体表脚8. 访问法(采访法、询问法)9. 开放式问题封闭式问题 10.网上直接调查网上间接调查1应用能力训练题 1.略 2.略3. ⑴全面调查一次性调查直接调查统计报表⑵全面调查一次性调查直接调查普查⑶非全面调查经常性调查直接调查抽样调查⑷非全面调查经常性调查直接调查重点调查⑸非全面调查经常性调查直接调查典型调查4. ⑴直接观察法直接调查⑵实验法直接调查⑶访问法直接调查⑷网上调查直接调查 5.略6.略第三章一、判断题1.× 2. × 3. × 4. × 5. √ 6. √ 7. × 8. × 9. √ 10. √ 二、选择题1.B 2. B 3. C 4.A 5. D 6.A 7.D 8.B 9.D 10.A 三、多项选择题1.ACD 2.BCD 3.ABDE 4.CD 5.ACE 6.BCE 7.BCD 8.ABE 9.BCDE 10.BC 四、填空题1.选择分组标志和划分各组界限 2.类型分组、结构分组和分析分组 3.品质分配数列变量分配数列4.组限每个组的最大值每个组的最小值组中值 5.反比6.上组限不在内7.等距分组异距分组8.按某标志分的组各组相应的分配次数或频率或标志值频数频率 9.钟型分布、U型分布和J型分布。
企业经营统计学第二版第四章课后答案1、社会经济统计的研究对象是社会经济现象总体的各个方面。
[判断题] *对错(正确答案)2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。
[判断题] *对错(正确答案)3、总体的同质性是指总体中的各个单位在所有标志上都相同。
[判断题] *对错(正确答案)4、个人的工资水平和全部职工的工资水平,都可以称为统计指标。
[判断题] *对错(正确答案)5、“女性”是品质标志。
[判断题] *对错(正确答案)6、某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。
[判断题] *对(正确答案)错7、统计是在质与量的辩证统一中,研究社会经济现象质的方面。
[判断题] *对错(正确答案)8、质量指标是反映总体质的特征,因此可以用文字来表述。
[判断题] *对错(正确答案)9、指标与标志一样,都是由名称和数值两部分组成的。
[判断题] *对错(正确答案)10、一般来说,以绝对数表示的指标都是数量指标;以相对数或平均数表示的指标都是质量指标。
[判断题] *对(正确答案)错1、属于统计总体的是() [单选题] *A、某县的粮食总产量B、某地区的全部企业(正确答案)C、某商店的全部商品销售额D、某单位的全部职工人数2、构成统计总体的个别事物称为()。
[单选题] *A、调查单位B、标志值C、品质标志D、总体单位(正确答案)3、对某城市工业企业未安装设备进行普查,总体单位是()。
[单选题] *A、工业企业全部未安装设备B、工业企业每一台未安装设备(正确答案)C、每个工业企业的未安装设备D、每一个工业企业4、工业企业的设备台数、产品产值是()。
[单选题] *A、连续变量B、离散变量C.前者是连续变量,后者是离散变量D、前者是离散变量,后者是连续变量(正确答案)5、在全国人口普查中()。
[单选题] *A、男性是品质标志B、人的年龄是变量(正确答案)C、人口的平均寿命是数量标志D、全国人口是统计标志6、某班60名学生统计课考试成绩依次是:81分、92分、65分、75分,成绩是()。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明人口和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2021年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2021年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差一般是指测量值与实际值之间的差值,一般分为随机误差和非随机误差。
随机误差是指重复观测得到的实际观测值经常在某一值附近无方向波动的误差;最常见的非随机误差是系统误差,也称为偏差。
正是这种误差使实际观测值偏离了实际值。
3.举例说明参数和统计量的概念。
一项研究通常希望了解人口的一些数字特征,这些特征被称为参数,例如整个城市的高血压患病率。
根据样本计算的一些数字特征称为统计学,例如根据数百人的抽样调查数据计算的样本人群中的高血压。
统计是研究人员可以知道的,参数是他们想知道的。
一般来说,这些参数很难测量,只能通过样本进行估计。
显然,只有当样本代表总体时,根据样本统计估计的总体参数才是合理的。
4.简述小概率事件原理。
当一个事件的概率小于或等于0.05时,它被用来在统计学中称该事件为低概率事件,这意味着该事件的概率非常小,因此认为不可能在一次采样中发生是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查的主要特点是:① 研究对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为地给出干预措施;② 随机分组不能用来平衡混杂因素对调查结果的影响。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第10章 非参数统计1.什么是非参数统计?它同参数检验相比,有什么特点?答:(1)非参数统计是对总体分布的具体形式不必做任何限制性假定和不以总体参数具体数值估计为目的的推断统计。
(2)非参数统计与参数统计相比,具有以下几个特点:①非参数统计方法既能适用于定名测定资料或定序测定资料,也能适用于定距测定资料和定比测定资料;②非参数统计方法是一种经济而有效的方法;③非参数统计方法不需要像参数统计方法那样假定总体的分布是正态的,也不需要检验总体的参数,使得条件容易得到满足。
2.什么是检验?检验适用于何种情况?其方法特点是什么?应用统计量检验时要注意什么问题?答:(1)检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。
(2)检验主要用于拟合优度检验和独立性检验。
(3)拟合优度检验是把样本分成K 个互斥的类,然后根据要检验的理论分布算出每一类的理论频数,与实际的观察频数进行比较;独立性检验的特点在于其理论频数不是预先确定的,而需要从样本资料中获得。
2χ2χ2χ2χ2χ(4)应用统计量进行检验时应注意:①各组的理论频数f e 不得小于总频数n ;②总频数n 应较大,至少大于50;③如果某组理论频数小于5,可将相邻的若干组合并,直至理论频数大于5为止。
此时查(K -r -1)分布表要以合并后的实有组数作为K 值。
3.符号检验和威尔科克森带符号等级检验适用于何种情况?这两种方法各有什么特点?答:(1)符号检验适用于对无法用数字计量的情况进行比较。
其优点是:①两个样本可以是相关的,也可以是独立的;②对于分布的形状、方差均一性等都不做限定;③只考虑差数的正负方向而不计具体数值。
其缺点是忽略数值差别,失去了可资利用的信息。
(2)威尔科克森带符号等级检验适用于在得到数字的计量情况下进行比较。
它具有符号等级检验的优点,并且还考虑到了正负号,还采用了其差别大小的信息,是一个更为有效的非参数统计方法。
3-16(1)NDP=GDP-固定资本消耗=940-58=882(亿元)(2)GNI=GDP+得自国外的净要素收入=940+1.2=941.2(亿元)(3)NNI=GNI-固定资本消耗=941.2-58=883.2(亿元)或=NDP+得自国外的净要素收入=882+1.2=883.2(亿元)(4)GNDI=GDP+得自国外的净要素收入+得自国外的净经常转移=940+1.2+0.5=941.7(亿元)或=GNI+得自国外的净经常转移=941.2+0.5=941.7(亿元)(5)NNDI=NDP+得自国外的净要素收入+得自国外的净经常转移=882+1.2+0.5=883.7(亿元)或=GNDI-固定资本消耗=941.7-58=883.7(亿元)3-17总营业盈余=增加值-雇员报酬-生产税净额=980-417-102+3.5=464.5原始总收入余额=增加值+初次分配收入-初次分配支出=980+28-417-(102-3.5)-63=429.5 或=总营业盈余+财产收入净额=464.5+(28-63)=429.5可支配总收入=原始总收入余额+再分配收入-再分配支出=429.5-6-4-65.8=353.74-15投入部门最终产品总产出农业轻工业重工业其他小计产出部门农业70.2 174.4 149.3 132.4 526.3 673.7 1200 轻工业 2 451 26.3 92.5 571.8 988.2 1560 重工业31.3 217.8 876.2 237.4 1362.7 677.3 2040 其他31.3 251.2 270.7 184.7 737.9 462.1 1200 小计134.8 1094.4 1322.5 647 3198.7 2801.3 6000增加值1065.2 465.6 717.5 553 2801.3 总投入1200 1560 2040 1200 6000A= 0.06 0.11 0.07 0.11 0.00 0.29 0.01 0.08 0.03 0.14 0.43 0.20 0.03 0.16 0.13 0.154-16投入部门最终产品总产出1 2 3 4产出部门1 60 120 10 15 395 6002 78 360 70 45 647 12003 18 12 6 15 149 2004 30 60 16 30 164 300增加值414 648 98 195 总投入600 1200 200 3005-171 借:其他投资360贷:货物出口3602 借:货物进口7200贷:其他投资72003 借:经常转移16贷:货物出口164 借:货物进口120贷:储备资产1205 借:服务进口 5贷:其他资产 56 借:服务进口24贷:其他资产247 借:储备资产30贷:服务出口308 借:储备资产50贷:经常转移509 借:其他资产60贷:服务出口6010 借:货物进口3000贷:直接投资300011 借:其他投资50贷:货物出口5012 借:其他投资200贷:证券投资20013 借:储备储备60贷:其他投资60需要说明的问题:(7)和(8)国内收入的30万美元和50万美元并没有明确说明作为外汇储备,一般不作为外汇储备处理,而应计入其他投资里的其他金融资产(存款)。
1习题答案计算题:(1)假设考生成绩服从正态分布,在某地一次数学统考中随机抽取了36位考生的成绩,算得平均成绩为66.5分,标准差为15分。
问在显著性水平α=0.05下,是否可以认为这次考试全体考生的成绩为70分?解:建立假设 H 0:0μ=70, H 1:0μ≠70x =66.5,s=15,n=360718/1536x t s n === 另一方面查表得,t(14)=2.1448>t故应接受零假设,即不认为0μ≠70(2)某种导线的质量标准要求其电阻的标准差不得超过σ=0.005Ω,今在一批导线中随机抽取样品9根,测得样本标准差为s=0.007Ω。
设总体为正态分布,问在显著性水平α=0.05下能否认为这批导线的标准差显著地增大了?解:建立假设 H 0:0σ=0.005, H 1: 0σ>0.005n=9,s=0.0072222220(1)80.00715.680.005n s χσ-⨯=== 另一方面查表得,20.05(8)15.5χ=>15.68故应接受原假设,即不认为0σ>0.005(但已经相当接近于拒绝零假设的边缘了)(3)两台车床生产同一种滚珠,其直径服从正态分布。
从中分别抽取8个和9个产品,测得各自的直径为:甲车床:15.0 14.5 15.2 15.5 14.8 15.1 15.2 14.8;乙车床:15.2 15.0 14.8 15.2 15.0 15.0 14.8 15.1 14.8。
比较两台车床生产的滚珠直径的方差是否有明显差别(α=0.05)?解:建立假设 H 0:12μμ=, H 1: 12μμ≠经计算后得:x =15.0125,y =14.9889;20.095536x s =,20.026111y s =1n =8,29n =合并方差 22x y 2xy (m 1)s (n 1)s 0.058509m n 2s -+-=+-=20.095536x s =自由度 m+n-2=15旗开得胜 3 xy x y mnt s mn -=+=0.200884 另一方面查表得,0.025(15) 2.1315t =>0.200884故应接受原假设,即不认为12μμ≠。
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2021年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2021年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第5章假设检验一、学习指导假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。
本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。
本章各节的主要内容和学习要点如下表所。
二、主要术语和公式(一)主要术语1. 假设:对总体参数的具体数值所做的陈述。
2. 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
3. 备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用1H 或a H 表示。
4. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用0H 表示。
5. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。
6. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“≠”的假设检验。
7. 第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为α。
8. 第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为β。
9. 显著性水平:假设检验中发生第Ⅰ类错误的概率,记为α。
10. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。
11. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。
12. 临界值:根据给定的显著性水平确定的拒绝域的边界值。
13. P 值:也称观察到的显著性水平,如果原假设0H 是正确的,那么所得的样本结果出现实际观测结果那么极端的概率。
四、习题答案1. A2. D3. C4. A5. B6. C7. A8. B9. A10. B11. A12. C13. A14. C15. D16. C17. A18. B19. A20. B21. B22. A23. B24. B25. A26. D27. D28. D29. A30. B31. B32. C33. B 34. A35. C36. B37. A38. D39. D40. C41. C42. C43. C44. A45. B46. A47. B48. D49. A50. A51. B52. D53. C54. A55. B56. C57. A58. C59. D60. C61. C62. A63. D64. B65. A66. D67. D68. A69. C70. D71. A72. C73. B74. A75. A76. B77. C78. D79. A80. C81. D82. B83. A84. A85. C86. B87. A88. C89. A90. A91. A92. A93. A94. B95. C96. B97. A98. A99. A100.B101.D102.C103.B104.D105.B106.B107.A108.A109.B110.A111.B112.A113.A114.B115.B116.B117.B118.A119.B120.B121.B122.D123.A第6章方差分析一、学习指导本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7 合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 L U 。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2.11 x =426.67(万元);48.116=s (万元)。
2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%;(4)95%。
2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:024.01.1722.4==s v ; 幼儿组身高的离散系数:032.03.713.2==s v ;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.152.16 (1)方差或标准差;(2)商业类股票;(3)(略)。
2.17 (略)。
第3章 概率与概率分布3.1设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/23.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A )的概率()P A 。
考虑逆事件A =“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:()(10.2)(10.1)(10.1)0.648P A =---=于是 ()1()10.6480.352P A P A =-=-=3.3设A 表示“合格”,B 表示“优秀”。
由于B =AB ,于是)|()()(A B P A P B P ==0.8×0.15=0.123.4 设A =第1发命中。
B =命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
)|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 3.5 设A =活到55岁,B =活到70岁。
所求概率为:()()0.63(|)0.75()()0.84P AB P B P B A P A P A ==== 3.6这是一个计算后验概率的问题。
设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。
P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:6115.050612.030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P +决策者会倾向于采用新的生产管理流程。
3.7 令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。
由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++= =0.25×0.04+0.30×0.05+0.45×0.03=0.0385 (2)3506.00385.00135.00.030.450.050.300.040.2503.045.0)|(3==++=⨯⨯⨯⨯B A P3.8据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。
设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。
其概率分布如下表:3.9 设被保险人死亡数=X ,X ~B (20000,0.0005)。
(1)收入=20000×50(元)=100万元。
要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。
所求概率为:P(X ≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为: P(X >20)=1-P(X ≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E (X ) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X )=50000×(20000×0.0005×0.9995)1/2=(元)3.10 (1)可以。
当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ= np =20000×0.0005=10,即有X ~P (10)。
计算结果与二项分布所得结果几乎完全一致。
(2)也可以。
尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N (10,9.995)。
相应的概率为: P (X ≤10.5)=0.51995,P(X ≤20.5)=0.。
可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p =0.0005,假如n =5000,则np =2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。
此时宜用泊松分布去近似。
3.11(1))6667.1()30200150()150(-<-<=<Z P Z P X P ==0.04779 合格率为1-0.04779=0.95221或95.221%。
(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:|200|(|200|){||}0.93030X KP X K P Z --<=<≥=即:{}0.9530KP Z <≥,K /30≥1.64485,故K ≥49.3456。
3.12设X =同一时刻需用咨询服务的商品种数,由题意有X ~B(6,0.2)(1)X 的最可能值为:X 0=[(n+1)p]=[7×0.2]=1 (取整数) (2)∑=--=≤-=>2668.02.01)2(1)2(k k k k C X P X P=1-0.9011=0.0989第4章 抽样与抽样分布4.1 a. 20, 2 b. 近似正态 c. -2.25 d. 1.504.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 4.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4.4 a. 101, 99 b. 1 c. 不必 4.5 趋向正态4.6. a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.9384.7. a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了 4.8. a. 增加 b. 减少4.9. a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06 4.10 a. 0.015 b. 0.0026 c. 0.15874.11. a. (0.012, 0.028) b. 0.6553, 0.7278 4.12. a. 0.05 b. 1 c. 0.第5章 参数估计5.1 (1)79.0=x σ。
(2)E =1.55。
5.2 (1)14.2=x σ。
(2)E =4.2。
(3)(115.8,124.2)。
5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4 (7.1,12.9)。
5.5 (7.18,11.57)。
5.6 (18.11%,27.89%);(17.17%,22.835)。