4第8章 假设检验 练习题 统计学
- 格式:doc
- 大小:85.00 KB
- 文档页数:5
第8章 假设检验本章教学基本要求1.理解显著性假设检验的基本思想,了解其检验过程中产生的两种错误。
2.掌握单个正态总体的均值和方差的假设检验方法。
8.1 假设检验的基本概念主要知识归纳1 显著性假设检验的基本思想与基本步骤:(1)提出假设0H 称为原假设,同时也可提出其对立假设1H ,也叫做备择假设,检验的目的就是接受或是拒绝0H .(2) 假定原假设成立,选择合适的统计量并确定其分布.(3) 给定一个小概率α,α称为显著性水平,规定小概率事件是不可能事件. (4)依据样本计算,如果使得小概率事件发生则拒绝原假设,否则接受原假设. 2 两种错误: 如果原假设正确,而拒绝了它,则检验方案犯了“弃真”错误,称为第一类错误. 犯第一类错误的概率恰好就是小概率事件发生的概率α,即{}0H H P α=为真拒绝;而如果原假设本来是错误的,按照检验方案,由于样本观察随即特性导致最终接受了它,此时检验方案犯了“取伪”错误,称为第二类错误.记其概率为β,即{}0H H P β=为假接受. 8.2 单个正态总体参数假设检验一 主要知识归纳设总体),(~2σμN X ,n X X X ,,,21 为总体的样本,2,S X 分别为样本均值与样本方差,给定显著性水平α,1.提出假设00:μμ=H ,01:μμ≠H若2σ已知, 选取统计量nX Z /0σμ-=,则参数μ的拒绝域为:2Z Z α=≥;若2σ未知,选取统计量nS X T /0μ-=,则参数μ的拒绝域为:)1(/20-≥-=n t nS X T αμ2.当μ未知,提出假设2020:σσ=H ,2021:σσ≠H选取统计量2022)1(σχS n -=,则2σ拒绝域为⎭⎬⎫⎩⎨⎧->⎭⎬⎫⎩⎨⎧-<-)1()1(2222212n n ααχχχχ 二 基础练习1.设总体),,(~2σμN X 12,,,n X X X 为来自总体的样本,当μ和2σ未知时,则(1)检验假设00:μμ=H ;(2)检验假设2020:σσ=H 应选择怎样的统计量?2.打包机装糖入包,每包的标准重量为100kg ,每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg )。
第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
假设检验练习题在统计学中,假设检验是一种常用的数据分析方法,用于通过样本数据对总体参数的假设进行验证。
通过进行假设检验,我们可以确定样本数据是否足够支持对总体参数的某种特定假设。
一、背景介绍假设检验的基本思想是:假设总体参数服从某种特定的概率分布,然后利用样本数据对这一假设进行检验。
在进行假设检验时,我们通常会提出原假设(H0)和备择假设(H1),其中原假设是我们要进行检验的假设,备择假设则是对原假设的否定或补充。
二、假设检验的步骤1. 提出假设:根据问题的需求和背景,明确原假设和备择假设。
2. 选择显著性水平:显著性水平α代表我们对假设检验结果的接受程度,通常选择0.05或0.01。
3. 计算检验统计量:根据样本数据和所选的假设检验方法,计算出相应的检验统计量。
4. 确定拒绝域:根据显著性水平和假设检验的方法,确定拒绝域的临界值。
5. 判断结论:将计算得到的检验统计量与拒绝域进行比较,根据比较结果作出结论。
三、假设检验的类型1. 单样本检验:当我们只有一个样本数据,想要对总体参数是否符合某个特定值进行判断时,可以使用单样本检验。
2. 独立样本检验:当我们有两个独立的样本数据,并且希望比较两个总体参数是否有差异时,可以使用独立样本检验。
3. 配对样本检验:当我们有两组相关的样本数据,并且希望比较两个总体参数的差异时,可以使用配对样本检验。
四、常见的假设检验方法1. t检验:用于对总体均值进行假设检验,可以进行单样本t检验、独立样本t检验和配对样本t检验。
2. 方差分析(ANOVA):用于比较多个样本均值是否有差异,适用于有两个以上样本的情况。
3. 卡方检验:用于对分类变量的比例进行假设检验,适用于两个或更多分类变量的情况。
4. 相关分析:用于检验两个变量之间是否存在线性相关性。
五、实例分析为了更好地理解假设检验的应用,我们举一个实际例子。
假设一个制药公司研发了一种新药,声称该药物的疗效显著优于市场上已有的药物。
第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。
例3.7.9从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为:1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28(1)如果金属线直径X~N(μ,0.042),试求平均直径μ的置信度为95%的置信区间.(2)如果金属线直径X~N(μ, σ2),σ2未知,试求平均直径μ的置信度为95%的置信区间.例3.7.10随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为0.9mg.试求此牌香烟尼古丁平均含量μ的95%的置信区间.(假设尼古丁含量服从正态分布).4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为510 485 505 505 490 495 520 515 490(1) 若已知总体方差σ2=8.62,求μ的置信度为90%的置信区间;(2) 若已知总体方差未知,求μ的置信度为95%的置信区间.5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间.6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000k m,样本标准差为6000k m.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%.8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:k g)一号方案产量: 86 87 56 93 84 93 75 79二号方案产量: 80 79 58 91 77 82 74 66假设两种产量都服从正态分布,分别为N(μ1, σ2) ,N(μ2, σ2), σ2未知,求μ1-μ2的置信度为95%的置信区间.9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值=500(m/s), 标准差s1=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标准差s2=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水平为95%的置信区间.10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为 1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布).11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):41 43 36 26 20 21 46 39 37 211. 以置信度95%,估计安装一个车门所需平均时间的置信区间,2.若要求估计平均装配时间的误差不超过2秒,置信度为95%,应抽选多大的样本?3.若费用为200元,观察每个样本的费用为4元,置信度为95%,则允许误差限是多少?4.假设上月测定的平均时间为35秒,则a=0.05时,检验其平均时间是否有显著缩短?12、万里橡胶制品厂生产的汽车轮胎平均寿命为40,000公里,标准差为7500公里。
第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。
尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。
2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。
此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。
通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。
有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。
上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。
例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。
这些分析研究都离不开假设检验或方差分析。
假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。
本教材介绍假设检验与方差分析的基本原理和一些基本方法。
第八章例题1.在假设检验中,检验水平α的意义是:原假设0H 成立,经检验被____________的概率(填写“拒绝”或“接受”) 拒绝2.在假设检验中,犯第一类错误是指___ 弃真。
即0H 正确却被拒绝 __3. ),(~2σμN X ,当2σ未知时,为检验假设00:μμ=H 须构造统计量__________ nS x /μ- 4.从已知标准差 5.2σ=的正态总体中,抽取容量为16的样本,算得样本均值27.56x =,试在显著水平0.05α=之下,检验假设0:26H μ=.(0.025 1.96u =) 解:0:26H μ=)1,0(~/00N n x U σμ-=;0.05α=,/20.025 1.96u u α==; 算得 1.2u ==; 由于0.025u u <,所以在显著水平0.05α=之下,接受假设0:26H μ=.5.某产品按规定每包重为10kg ,现从中抽取6包进行测试,得9.7 10.1 9.8 10.0 10.2 9.6若包重服从正态分布2(,)N μσ,且20.05σ=,问在显著性水平为0.05α=下,包的平均重量是否为10kg ?(0.025 1.96u =) 解01:10,:10.H H μμ=≠令, 9.9x =0.025||||| 1.095u 1.96x u ===<= 所以可以认为重量为10kg6. 工厂某电子元件平均使用寿命为3000小时,采用新的生产设备后,从中随机抽取20个,测得这批电子元件的平均寿命X =3100小时,样本标准差为S=170小时,设电子元件的寿命X 服从正态分布N ()2,σμ,试检验用了新生产设备后产品质量是否显著改变?(显著性水平01.0=α,54.2)19(01.0=t )解 0H :μ=3000, 1H :3000>μ0.01(19)t 显著改变 7. 设罐头番茄汁中维生素C 含量服从正态分布。
规定每罐维生素C 的平均含量为21毫克。
第八章相关与回归分析一、填空题8.1.1客观现象之间的数量联系可以归纳为两种不同的类型,一种是_____________ ,另一种是__________________ 。
8.1.2回归分析中对相互联系的两个或多个变量区分为__________________ 和___________ 。
8.1.3 _____________ 是指变量之间存在的严格确定的依存关系。
8.1.4 变量之间客观存在的非严格确定的依存关系,称为_____________________ 。
8.1.5按 ____________ 的多少不同,相关关系可分为单相关、复相关和偏相关。
8.1.6两个现象的相关,即一个变量对另一个变量的相关关系,称为。
8.1.7在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为____________________________ 。
8.1.8按变量之间相关关系的 _______________ 不同,可分为完全相关、不完全相关和不相关。
8.1.9按相关关系的 ____________________ 不同可分为线性相关和非线性相关。
8.1.10 线性相关中按_________________ 可分为正相关和负相关。
8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为__________________ 。
8.1.12当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为。
8.1.13当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为。
8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为__________________ 。
8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为_____________________ 。
第一章绪论1.(判断题) 统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
答案:√2.(判断题) 描述统计学是研究如何根据样本数据去推断通体数量特征的方法。
答案:×3.(判断题) 描述统计学是整个统计学的根底,推断统计学是现代统计学的主要内容。
答案:√4.(判断题) 推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。
答案:√5.(判断题) 统计数据的计量尺度分为定类尺度、定序尺度、定距尺度和定比尺度。
答案:√6.(判断题) 定量数据说明的是现象的数量特征,是能够用数值来表现。
答案:√7.(判断题) 定性数据说明的是现象的品质特征,是不能用数值来表现。
答案:√8.(判断题) 统计指标表现为绝对数、相对数和平均数三种形式。
答案:√9.(判断题) 产品产量是时期数。
答案:√10.(判断题) 股票价格是时点数。
答案:√11.(判断题) 考试成绩分为优、良、中、及格、不及格,这是按定类尺度划分的。
答案:×12.(判断题) 考试成绩用"百分制〞度量,这是按定比尺度划分的。
答案:×13.(判断题) 将全部人口分为男女两局部,男性所占比重就是比率相对数。
答案:×14.(判断题) 动态数列就是将*同时期的各指标数值按照组别进展排序得到的数列。
答案:×15.(判断题) "企业数〞、"年龄〞都是离散变量。
答案:×16.(判断题) "性别〞、"产品等级〞属于数量变量。
答案:×17.(判断题) 数据的加工处理方法、数据分布特征的概括与分析方法等属于描述统计学的内容。
答案:√18.(判断题) 人的身高、体重、机器设备台数等都是连续变量。
答案:×19.(判断题) 离散变量的变量值只能按整数计算,不可能有小数。
答案:×20.(判断题) 价值单位是以货币形式对现象进展度量,如国民生产总值、商品销售额等。
第8章 假设检验练习题例1 根据经验知某种产品的使用寿命服从正态分布,标准差为150小时.今由一批产品中随机抽查26件,计算得到平均寿命为2537小时,问在显著性水平0.05下,能否认为这批产品的平均寿命为2500小时?例2 化肥厂用自动打包机装化肥,某日测得10包化肥的质量(单位:千克)如: 99.3,99.3,98.7,100.5,101.2,98.3,99.7,99.5,101.4,100.5已知各包质量服从正态分布,问在显著性水平0.05下,是否可以认为每包平均质量为100千克?例 3 某种食品的保质期X ~),(2σμN ,其中2,σμ均未知.现测到16件样品的保质期(单位:小时)如下:159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170 问在显著性水平0.05下,是否有理由认为该食品的平均保质期超过225小时?例4 假定人的脉搏服从正态分布,正常人的脉搏平均为72次每分钟,现测得16例慢性铅中毒患者的脉搏,如下:54,54,67,68,78,70,66,67,70,65,69,67,68,78,54,68问在显著性水平0.05下,慢性铅中毒患者和正常人的脉搏有无显著差异?例 5 某种金属丝,根据长期正常生产的累积资料知道其折断力服从正态分布,方差为64kg 2。
最近从一批产品中抽取10根作折断力试验,产测得结果(单位:kg )如下: 578,572,570,568,572,570,572,596,584,570问在显著性水平0.05下,能否认为这批金属丝的折断力的方差变化了?例 6 用甲,乙两种方法生产同一种化学用品,其成品获得率(单位:L g )的方差分别为45.021=σ,38.022=σ。
现测得甲方法生产的化学用品获得率的26个数据,x= 3.92;乙方法生产地化学用品获得率的32个数据,y=3.66. 设获得率服从正态分布,问甲,乙两种方法的平均获得率是否有显著α)?差异(05.0=。
4-第8章假设检验练习题统计学第⼋章假设检验练习题⼀、填空1、在做假设检验时容易犯的两类错误是和2、如果提出的原假设是总体参数等于某⼀数值,这种假设检验称为,若提出的原假设是总体参数⼤于或⼩于某⼀数值,这种假设检验称为3、假设检验有两类错误,分别是也叫第⼀类错误,它是指原假设H0是的,却由于样本缘故做出了H0的错误;和叫第⼆类错误,它是指原假设H0是的, 却由于样本缘故做出H0的错误。
4、在统计假设检验中,控制犯第⼀类错误的概率不超过某个规定值α,则α称为。
5、假设检验的统计思想是⼩概率事件在⼀次试验中可以认为基本上是不会发⽣的,该原理称为。
6、从⼀批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,在显著性⽔平α=0.05下,这批零件的直径是否服从标准直径5cm?(是,否)7、有⼀批电⼦零件,质量检查员必须判断是否合格,假设此电⼦零件的使⽤时间⼤于或等于1000,则为合格,⼩于1000⼩时,则为不合格,那么可以提出的假设为。
(⽤H0,H1表⽰)8、⼀般在样本的容量被确定后,犯第⼀类错误的概率为α,犯第⼆类错误的概率为β,若减少α,则β9、某⼚家想要调查职⼯的⼯作效率,⼯⼚预计的⼯作效率为⾄少制作零件20个/⼩时,随机抽样36位职⼯进⾏调查,得到样本均值为19,样本标准差为6,试在显著⽔平为0.05的要求下,问该⼯⼚的职⼯的⼯作效率(有,没有)达到该标准。
10、刚到⼀批货物,质量检验员必须决定是否接受这批货物,如不符合要求,将退还给货物供应商,假定合同规定的货物单件尺⼨为6,请据此建⽴原假设_ _ 和备择假设。
σ已知,应采⽤统计量检验总体均值。
11、总体为正态总体,且2σ未知,应采⽤统计量检验总体均值。
12、总体为正态总体,且2⼆、选择1、假设检验中,犯了原假设H0实际是不真实的,却由于样本的缘故⽽做出的接受H 0的错误,此类错误是()A 、α类错误B 、第⼀类错误C 、取伪错误D 、弃真错误2、⼀种零件的标准长度5cm ,要检验某天⽣产的零件是否符合标准要求,建⽴的原假设和备选假设就为()A 、0:5H µ=,1:5H µ≠B 、0:5H µ≠,1:5H µ>C 、0:5H µ≤,1:5H µ>D 、0:5H µ≥,1:5H µ<3、⼀个95%的置信区间是指()A 、总体参数有95%的概率落在这⼀区间内B 、总体参数有5%的概率未落在这⼀区间内C 、在⽤同样⽅法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在⽤同样⽅法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增⼤样本容量,则犯两类错误的概率()A 、都增⼤B 、都减⼩C 、都不变D 、⼀个增⼤⼀个减⼩5、⼀家汽车⽣产企业在⼴告中宣称“该公司的汽车可以保证在2年或24000公⾥内⽆事故”,但该汽车的⼀个经销商认为保证“2年”这⼀项是不必要的,因为汽车车主在2年内⾏驶的平均⾥程超过24000公⾥。
《统计学》第8章假设检验基本信息:[矩阵文本题] *1. 对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为()[单选题] *A.参数估计B.双侧检验C.单侧检验D.假设检验(正确答案)2.研究者想收集证据予以支持的假设通常称为() [单选题] *A.原假设B.备择假设(正确答案)C.合理假设D.正常假设3. 在假设检验中,原假设和备择假设() [单选题] *A.都有可能成立B.都有可能不成立C.只有一个成立而且必有一个成立(正确答案)D.原假设一定成立,备择假设不一定成立4. 在假设检验中,第Ⅰ类错误是指() [单选题] *A.当原假设正确时拒绝原假设(正确答案)B.当原假设错误时拒绝原假设C.当备择假设正确时未拒绝备择假设D.当备择假设不正确时拒绝备择假设5. 当备择假设为:μ<μ0,此时的假设检验称为() [单选题] *A.双侧检验B.右侧检验C.左侧检验(正确答案)D.显著性检验6. 某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为 1.40。
某天测得 25 根纤维的纤度的均值为 x =1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平为α=0.05,则下列正确的假设形式是( ) [单选题] *A. H0: μ=1.40, H1: μ≠1.40B. H0: μ≤ 1.40, H1: μ> 1.40C. H0: μ< 1.40, H1: μ≥ 1.40D. H 0: μ≥1.40, H 1: μ<1.40(正确答案)7.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。
用来检验这一研究结论的原假设和备择假设应为() [单选题] *A.H 0:μ≤20%, H 1: μ>20%B.H 0:π=20% , H 1: π≠20%C.H 0:π≤ 20% , H 1: π>20%(正确答案)D.H 0:π≥20% , H 1: π<20%8. 在假设检验中,不拒绝原假设意味着()。
统计学第8章习题答案⼀、选择题1、若回归直线⽅程中的回归系数0=b 时,则相关系数( C ) A 、1=r B 、1-=r C 、0=r D 、r ⽆法确定2、下列不属于相关关系的现象是( C )A 、利息与利率B 、居民收⼊与储蓄存款C 、电视机产量与鸡蛋产量D 、某种商品的销售额与销售价格 3、当8.0=r 时,下列说法正确的是( D ) A 、80%的点都集中在⼀条直线的周围 B 、80%的点⾼度相关C 、其线性程度是4.0=r 时的两倍D 、两变量⾼度正线性相关4、在因变量的总离差平⽅和中,如果回归平⽅和所占的⽐重⼤,剩余平⽅和所占的⽐重⼩,则两变量之间( A )A 、相关程度⾼B 、相关程度低C 、完全相关D 、完全不相关 5、在直线回归⽅程bx a y +=∧中,回归系数b 表⽰( D ) A 、当0=x 时y 的平均值B 、x 变动⼀个单位时y 的变动总量C 、y 变动⼀个单位时x 的平均变动量D 、x 变动⼀个单位时y 的平均变动量6、可决系数2R 的值越⼤,则回归⽅程( B ) A 、拟合程度越低 B 、拟合程度越⾼C 、拟合程度可能⾼,也可能低D 、⽤回归⽅程进⾏预测越不准确7、如果两个变量Y X ,相关系数r 为负,说明( C )A 、Y ⼀般⼩于XB 、X ⼀般⼩于YC 、随着⼀个变量增加,另⼀个变量减少D 、随着⼀个变量减少,另⼀个变量也减少8、已知x 与y 之间存在负相关关系,指出下列回归⽅程中肯定错误的是( C ) A 、x y 82.020--=∧B 、x y 82.1300-=∧C 、x y 75.0150+-=∧D 、x y 42.090-=∧9、若协⽅差)()(y y x x --∑⼤于0,则x 与y 之间的关系是( A )A 、正相关B 、负相关C 、⾼度相关D 、低度相关10、由同⼀资料计算的相关系数r 与回归系数b 之间的关系是( D )A 、r ⼤,b 也⼤B 、r ⼩,b 也⼩C 、r 和b 同值D 、r 和b 的正负号相同 11、回归平⽅和指的是( B ) A 、2)(∑-Y YiB 、2)(∑-∧Y Y iC 、2)(∑∧-i i Y Y D 、2)(∑-X X i12、居民收⼊和储蓄额之间的相关系数可能是( B ) A 、9247.0- B 、9247.0 C 、5362.1- D 、5362.1 13、下列关系中属于负相关的有( D )A 、总成本与原材料消耗量B 、合理范围内的施肥量与农产品C 、居民收⼊与消费⽀出D 、产量与单位产品成本14、某研究⼈员发现,举重运动员的体重与他能举起的重量之间的相关关系为0.6,则( A )A 、体重越重,运动员平均能举起的重量越多B 、平均来说,运动员能举起其体重60%的重量C 、如果运动员体重增加10公⽄,则可多举6公⽄D 、举重能⼒的60%归因于其体重15、对于有线性相关关系的两变量建⽴的有意义的直线回归⽅程bx a y +=∧中,回归系数b ( A )A 、可能⼩于0B 、只能是正数C 、可能为0D 、只能是负数 16、可决系数可以说明回归⽅程的( C ) A 、有效度 B 、显著性⽔平 C 、拟合优度 D 、相关性17、样本较⼩时,回归估计置信区间的上下限( A ) A 、是对称地落在回归直线两侧的两条喇叭形曲线 B 、是对称地落在回归直线两侧的两条直线 C 、是区间越来越宽的两条直线 D 、是区间越来越宽的两条曲线18、由最⼩⼆乘法得到的回归直线,要求满⾜因变量的( D ) A 、平均值与其估计值的离差平⽅和最⼩ B 、实际值与其平均值的离差平⽅和最⼩ C 、实际值与其估计值的离差和为0D 、实际值与其估计值的离差平⽅和最⼩ 19、在相关分析中,正确的是( D )A 、相关系数既可测定直线相关,也可测定曲线相关B 、相关系数既不可测定直线相关,也不可测定曲线相关C 、相关系数不可测定直线相关,只可测定曲线相关D 、相关系数不可测定曲线相关,只可测定直线相关 20、⼀个由100⼈组成的25~64岁男⼦的样本,测得其⾝⾼与体重的相关系数r 为0.4671,则下列选项中不正确的是( D )A 、较⾼的男⼦趋于较重B 、⾝⾼与体重存在低度正相关C 、体重较重的男⼦趋于较⾼D 、46.71%的较⾼男⼦趋于较重21、在⼀元线性回归模型中,样本回归函数可以表⽰为( C ) A 、i i x x y E βα+=)|( B 、i i x y ∧∧∧+=βα C 、i i i e x y ++=∧∧∧βα D 、i i i u x y ++=∧βα22、收⼊⽔平与受教育程度之间的相关系数r 为0.6314,这种相关肯定属于( D ) A 、显著相关 B 、负相关 C 、⾼度相关 D 、正相关23、如果两个变量之间完全相关,则以下结论中正确的是( B ) A 、相关系数r 等于0 B 、可决系数2r 等于1C 、回归系数b ⼤于0D 、回归系数b 等于124、机床的使⽤年限与维修费⽤之间的相关系数是0.7213,合理范围内施肥量与粮⾷亩产量之间的相关系数为0.8521,商品价格与需求量之间的相关系数为-0.9345;则( A ) A 、商品价格与需求量之间的线性相关程度最⾼ B 、商品价格与需求量之间的线性相关程度最低 C 、施肥量与粮⾷亩产量之间的线性相关程度最⾼D 、机床的使⽤年限与维修费⽤之间的线性相关程度最⾼25、对估计的回归⽅程i i X Y ∧∧∧+=βα进⾏假设检验,0H :0=β,1H :0≠β。
62第8章 假设检验一、填空题1、 对正态总体的数学期望m 进行假设检验,如果在显著性水平0.05下,接受假设00:m m =H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为a ,则犯第一类错误的概率是a 。
3、设总体),(N ~X 2s m ,样本n 21X ,X ,X ,2s未知,则00:H m =m ,01:H m <m 的拒绝域为 )}1(/{0--<-n t nS X a m ,其中显著性水平为a 。
4、设n 21X ,X ,X 是来自正态总体),(N 2s m 的简单随机样本,其中2,sm 未知,记å==n1i i X n 1X ,则假设0:H 0=m 的t 检验使用统计量=T Qn n X )1(-.二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2s m N X05.016==a n 4252==S X(1)检验假设250:0=m H 250:1¹m H , 因为2s 未知,在0H 成立下,)15(~/250t nS X T -=拒绝域为)}15(|{|025.0tT >,查表得1315.2)5(025.0=¹t由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=s H9:201>s H因为m 未知,选统计量 222)1(s S n x -=在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x ,现算得966.24667.26916152>=´=x 拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25 件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=s 小时正态分布, 试在显著性水平0.05下确定这批产品是否合格. 解:设元件寿命),(~2s m N X ,2s 已知10002=s,05.0,950,25===a X n检验假设1000:0=m H1000:1<m H在2s 已知条件下,设统计量)1,0(~/1000N nX s m -=拒绝域为}{05.0mm<,查表得645.195.005.0-=-=m m而645.15.2205025/1001000950-<-=-=-=m拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 a , 检 验假 设 H 0 ; m = m 0, H 1 ; m ¹ m 0, 问当 m 0, m , a 一定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 b减 少 对 吗 ?并 说 明 理 由 。
第八章假设检验
练习题
一、填空
1、在做假设检验时容易犯的两类错误就是与
2、如果提出的原假设就是总体参数等于某一数值,这种假设检验称为 ,若提出
的原假设就是总体参数大于或小于某一数值,这种假设检验称为
3、假设检验有两类错误,分别就是也叫第一类错误,它就是指原假设H0
就是的,却由于样本缘故做出了H0的错误;与叫第二类错误,它就是指原假设H0就是的, 却由于样本缘故做出H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称
为。
5、假设检验的统计思想就是小概率事件在一次试验中可以认为基本上就是不会
发生的,该原理称为。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,在
显著性水平α=0、05下,这批零件的直径就是否服从标准直径5cm?
(就是,否)
7、有一批电子零件,质量检查员必须判断就是否合格,假设此电子零件的使用时间
大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为。
(用H0,H1表示)
8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为
β,若减少α,则β
9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/
小时,随机抽样36位职工进行调查,得到样本均值为19,样本标准差为6,试在显著水平为0、05的要求下,问该工厂的职工的工作效率(有,没有)达到该标准。
10、刚到一批货物,质量检验员必须决定就是否接受这批货物,如不符合要求,将退
还给货物供应商,假定合同规定的货物单件尺寸为6,请据此建立原假设_ _ 与备择假设。
σ已知,应采用统计量检验总体均值。
11、总体为正态总体,且2
σ未知,应采用统计量检验总体均值。
12、总体为正态总体,且2
二、选择
1、假设检验中,犯了原假设H0实际就是不真实的,却由于样本的缘故而做出的接
受H0的错误,此类错误就是( )
A 、α类错误
B 、第一类错误
C 、取伪错误
D 、弃真错误
2、一种零件的标准长度5cm,要检验某天生产的零件就是否符合标准要求,建立的
原假设与备选假设就为( )
A 、
0:5H μ=,1:5H μ≠ B 、
0:5H μ≠,1:5H μ> C 、
0:5H μ≤,1:5H μ> D 、0:5H μ≥,1:5H μ<
3、一个95%的置信区间就是指( )
A 、总体参数有95%的概率落在这一区间内
B 、总体参数有5%的概率未落在这一区间内
C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数
D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
4、假设检验中,如果增大样本容量,则犯两类错误的概率( )
A 、都增大
B 、都减小
C 、都不变
D 、一个增大一个减小
5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里
内无事故”,但该汽车的一个经销商认为保证“2年”这一项就是不必要的,因为汽车
车主在2年内行驶的平均里程超过24000公里。
假定这位经销商要检验假设
0:24000H μ≤,1:24000H μ>,取显著水平为α=0、01,并假设为大样本,则此项检
验的拒绝域为( )
A 、 2.33z >
B 、 2.33z <-
C 、 2.33z >
D 、 2.33z =
6、某种感冒冲剂规定每包重量为12克,超重或过轻都就是严重问题。
从
过去的生产数据得知,标准差为2克,质检员抽取25包冲剂称重检验,平
均每包的重量为11.85克。
假定产品重量服从正态分布。
取显著水平为α
=0、05,感冒冲剂的每包重量就是否符合标准要求?( )
A 、符合
B 、不符合
C 、无法判断
D 、不同情况下有不同结论
7、在假设检验中,原假设与备择假设( )
A 、只有一个成立而且必有一个成立
B 、原假设一定成立,备择假设不一定成立
C 、都可能成立
D 、都可能不成立
8、 对于非正态总体,
使用统计量
x z =
估计总体均值的条件就是( )
A 、小样本
B 、总体方差已知
C 、总体方差未知
D 、大样本 9、关于假设检验,下列哪一项说法就是正确的( )
A 、单侧检验优于双侧检验
B 、两样本比较时,取α=0、1与0、2,则使所取第二类错误最小的就是α=0、01。
C 、检验结果若置信水平越大,则接受H O 犯错误的可能性越小。
D 、在总体服从正态分布且方差已知的情况下,选择统计量)1,0(~N n
x z δμ-=
10、假设检验中的显著性水平α就就是所犯的 ( )
A 、第一类错误
B 、第一类错误的概率
C 、第二类错误
D 、第二类错误的概率
11、H 0为原假设,H 1为备择假设,H 0:μ≥20 H 1:μ<20,此为什么检验( )
A 、右侧检验
B 、左侧检验
C 、双侧检验
D 、完全检测
12、一个自动冲压机的设计标准就是每小时冲压100次,现观察了49小时的冲压
结果,得到样本平均数为( )次,标准差为25次,检验水平α为0、05,说明该
冲压机正常工作。
A 、105
B 、 106
C 、107
D 、 108
三、判断
1、如果拒绝原假设将会造成企业严重的经济损失时,那么α的值应取得小一些。
( )
2、统计假设总就是成对提出的,即既要有原假设Ho ,也要有备择假设1H 。
( )
3、犯第二类错误的概率与犯第一类错误的概率就是密切相关的,在样本一定条件
下,α小,β就增大;α大,β就减小。
为了同时减小α与β,只有增大样本容量,减小抽
样分布的离散性,这样才能达到目的。
( )
4、随着显著性水平α取值的减小,拒绝假设的理由将变得充分。
( )
5、假设检验就是一种决策方法,使用它不犯错误。
( )
6、从10000件产品中随机抽取100件进行质量检验,结果有3件不合格,则样本比
例的方差为0、0291。
( )
7、在某项医学临床试验中,女性患者只占了30%,为减少女性患者的比例,实验团
队采取一系列方案。
为了解方案的实际效果,案件但随机抽样的方式,从各个医院
抽取了400名患者其中男性300人,女性100人。
在显著性水平为0、05的要求
下对女性患者改观情况进行假设检验,应提出原假设H 0:P≥30%与备择假设
H 1:P<30% ( )
8、检验一个正态总体的方差时所使用的分布就是F 分布。
( )
9、某企业生产的产品需用纸箱进行包装,按规定供应商提供的纸箱用纸
的厚度不应低于5毫米。
已知用纸的厚度服从正态分布,σ一直稳定在0、
5毫米。
企业从某供应商提供的纸箱中随机抽查了100个样品,得样本平
均厚度 4.55x =毫米。
在α=0、05的显著显著性水平上,可以接受该批纸
箱,该检验中会犯第一类错误。
( )
10、某厂产品的优质品率一直保持在40%,近期质检部门来厂抽查,共抽
查了50件产品,其中优质品为9件。
在α=0、05的显著显著性水平上,
可以认为其优质品率仍保持在40%。
( )
三、 计算
1、下面就是某个随机选取20只部件的装配时间(单位:分)
设装配时间的总体服从正态分布,参数均未知)=(05.0α,可否认为装配时间的均
值为10?
2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机
抽取25件,测得其寿命的平均值为950小时。
一直这种原件的寿命服从正态分布,
标准差为100小时。
试求在显著性水平为0、05下,确定厂家的声明就是否可信?
3、测得两批电子器件的样品的电阻(单位:Ω)为:
设两批器材电阻总体分别服从分布222211221212(,),(,).,,,N N μσμσμμσσ均未知,且
两样本独立,问在0.05α=下,可否认为两批电子器件的电阻相等?
9、8 10、4 10、6 9、6 9、7 9、9 10、9 11、1 9、6 10、2
10.3 9、6 9、9 11、2 10、6 9、8 10、5 10、1 10、5 9、7
4、在一批产品中抽40 件进行调查,发现次品有6 件,试按显著水平为0、05 来判断该批产品的次品率就是否高于10 %。
5、某网络公司欲了解甲居民区中的家庭(21户)每月上网的平均小时数就是否比
乙居民区中的家庭(16户)少。
从这两个独立样本中得出的数据为
x=16、5(小
1时),
x=19、5(小时),S1=3、7(小时)S2=4、5(小时)。
假设两个居民区家庭每月
2
上网小时数服从正态分布(α=0、01)
6、机器包装糖果,每袋净重量X(单位:g)服从正态分布,规定每袋净重量为500克,标准差不能超过10克。
某天开工后,为检验机器工作就是否正常,从包装好的食盐中随机抽取9袋,测得其净重量为:
497 507 510 475 484 488 524 491 515
以显著性水平α=0、05检验这天包装机工作就是否正常?。