上海大学 计算机 概率论与数理统计A 第8章new分布拟合检验
- 格式:ppt
- 大小:768.50 KB
- 文档页数:21
上海市考研统计学复习资料概率论与数理统计基本概念解析概率论与数理统计是考研统计学中的重要内容,它们是统计学的核心理论,对于统计学专业的学生来说,掌握这些基本概念至关重要。
本文将对概率论与数理统计的基本概念进行解析,帮助考生更好地理解和应用这些内容。
一、概率论基本概念1.随机试验:随机试验是在相同条件下重复进行的实验,每次实验结果可能不同,但结果是确定的。
例如,掷硬币、抽卡片等都属于随机试验。
2.样本空间:样本空间是指随机试验中所有可能结果的集合,用S 表示。
例如,掷一枚硬币的样本空间为S={正面,反面}。
3.事件:事件是样本空间的一个子集,表示某些可能发生的结果。
常用A、B、C等字母表示事件。
例如,掷硬币出现正面的事件记为A={正面}。
4.概率:概率是事件发生的可能性,用P(A)表示。
概率的取值范围是0到1之间,其中,0表示不可能事件,1表示必然事件。
例如,掷硬币出现正面的概率为P(A)=0.5。
二、数理统计基本概念1.总体与样本:总体是指研究的对象的全体,样本是从总体中抽取出来的一部分。
研究对象可以是人群、产品等。
例如,研究一批产品的重量,总体是这批产品的全部重量,样本是从中抽出的数个产品进行称重。
2.参数与统计量:参数是总体的特征的数值度量,统计量是样本的特征的数值度量。
例如,研究一批产品的重量,平均重量是总体的参数,样本的平均重量是统计量。
3.抽样:抽样是从总体中随机选取样本的过程,目的是为了通过样本的研究来推断总体的特征。
抽样方法有很多种,常用的有简单随机抽样、分层抽样等。
4.频数与频率:频数是指某个事件或数值在样本或总体中出现的次数,频率是频数除以样本或总体的大小。
例如,某个班级的学生身高以及相应的出现次数和频率。
三、概率分布与统计分布概率分布是指随机变量在各个取值上的概率。
常见的概率分布有离散概率分布和连续概率分布。
离散概率分布以概率质量函数(PMF)表示,连续概率分布以概率密度函数(PDF)表示。
习题8.11.某天开工时,需检验自动装包机工作是否正常.根据以往的经验,其装包的重量在正常情况下服从正态分布N(100,1.52)(单位:公斤).现抽测了9包,其重量为:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.0 100.5问这天包装机工作是否正常?将这一问题化为一个假设检验问题,写出假设检验的步骤,设α=0.05.解: (1)作假设H0:μ=100,H1:μ≠100(2)选取检验统计量u=X−100σ√n⁄(3)查表知μα2=μ0.025=1.96, 拒绝域为|u|=|X−100σ√n⁄|≥1.96(4)由样本观测值有=99.97∴|u|=|X−100σ√n⁄|=|99.97−1001.5√9⁄|=0.06<1.96.不属于拒绝域,所以接受原假设H0,即认为这天包装机工作正常.2.设α,β分别是假设检验中犯第一,第二类错误的概率且H0,H1分别为原假设和备择驾驶,则(1)P{接受H0|H0不真}=β(2)P{拒绝H0|H0真}=α(3)P{拒绝H0|H0不真}=1−β(4)P{接受H0|H0真}=1−α习题8.21.某自动机生产一种铆钉,尺寸误差X~N(μ,1),该机正常工作与否的标志是检验μ=0是否成立.一日抽检容量n=10的样本,测得样本均值X=1.01.试问:在检验水平α=0.05下,该日自动机工作是否正常?解:检验假设H0:μ=μ0=0,H1:μ≠0∵X=1.01,n=10,σ=1∴|u|=|X−μσ√n⁄|=|1.01−01√10⁄|=3.194查表知μα2=μ0.025=1.96,由于|u|=3.194>1.96,故拒绝H0,即该日自动机工作不正常.2.假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了36位考生的成绩,算的平均成绩为X=66.5分,标准差S=15分,问在显著性水平0.05下,是否可以认为这次考试全体考生的平均成绩为70分?解: 检验假设H0:μ=μ0=70,H1:μ≠70选取检验统计量t =X−μ0S √n⁄−1)拒绝域为|t |=|X−70S √n ⁄≥t α2(n −1)=t 0.025(35)=2.0301将X =66.5,S =15,n =36代入得|t |=1.4<2.0301.故接受H 0.即在显著性水平0.05下, 可以认为这次考试全体考生的平均成绩为70分. 3. 某种产品的重量X~N (12,1)(单位:克).更新设备后,从新生产的产品中,随机地抽取100个,测得样本均值=12.5(克).如果方差没有变化,问设备更新后,产品的平均重量是否有显著变化(α=0.1)? 解: 检验假设H 0:μ=μ0=12,H 1:μ≠12 ∵ =12.5,n =100,σ=1∴|u |=|X −μσ√n⁄|=|12.5−121√100⁄|=5查表知μα2=μ0.05=1.645,由于|u |=5>1.645,故拒绝H 0.即设备更新后,产品的平均重量有显著变化.4. 一种燃料的辛烷等级服从正态分布,其平均等级为98.0,标准差为0.8,现从一批新油中抽25桶,算得样本均值为97.7.假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料平均等级偏低(α=0.05). 解: 检验假设H 0:μ≤μ0=98,H 1:μ>98 ∵ =97.7,n =25,σ=0.8∴|u |=|X −μσ√n⁄|=|97.7−980.8√25⁄|=1.875查表知μα2=μ0.025=1.96,由于|u |=1.875<1.96,故接受H 0.即可以认为新油的辛烷平均等级比原燃料平均等级偏低.5. 从一批灯泡中随机抽取50个,分别测量其寿命,算得其平均值X =1900(小时),标准差S=490(小时).问能否认为这批灯泡的平均寿命为2000(小时)( α=0.01).(用大样本情况下的u 检验) 解: 检验假设H 0:μ=μ0=2000,H 1:μ≠2000 ∵ X =1900,n =50,s =490∴|u |=|X −μs √n⁄|=|1900−2000490√50⁄|=1.44查表知μα2=μ0.005=2.57,由于|u |=1.44<2.57,故接受H 0.即可以认为这批灯泡的平均寿命为2000(小时).6. 某批矿砂的五个样品中镍含量经测定为(%):3.25 3.27 3.24 3.263.24设测定值服从正态分布,问能否认为这批矿砂的镍含量为3.25%(α=0.05). 解: 检验假设H 0:μ=μ0=3.25,H 1:μ≠3.25 选取检验统计量t =X−μ0S √n⁄−1)经计算=3.252,S =0.013 拒绝域为|t |=|X−3.25S √n⁄|≥t α2(n −1)=t 0.025(4)=2.7764将X =66.5,S =15,n =5代入得|t |=0.344<2.7764.故接受H 0. 即可以认为这批矿砂的镍含量为3.25%.7. 有甲,乙两台机床加工同样产品,从这两台机床中随机抽取若干件,测得产品直径(单位:毫米)为:机床甲20.5 19.8 19.7 20.4 20.1 20.0 19.0 19.9 机床乙19.720.8 20.5 19.8 19.4 20.6 19.2 假定两台机床加工的产品直径都服从正态分布,且总体方差相等.问甲,乙两台车床加工的产品直径有无显著差异(α=0.05). 解:检验假设H 0:μ1=μ2,H 1:μ1≠μ2经计算X =19.925,y =20,S 12=1.5157,S 22=2.386∴|t |=|X −y S w √1m +1n|=||19.925−20√7∗1.5157+6∗2.3868+7−2∗√18+17||=0.265查表知t α2(m +n −2)=t 0.025(13)=2.1604,由于|t |=0.265<2.1604,故接受H 0.即甲,乙两台车床加工的产品直径无显著差异.8. 从甲地发送一个信号到乙地.设乙地接受到的信号值是一个服从正态分布N(μ,0.22)的随机变量,其中μ为甲地发送的真实信号值.现甲地重复发送同一信号5次,乙地接受到的信号值为 8.05 8.15 8.2 8.1 8.25 设接收方有理由猜测甲地发送的信号值为8.问能否接受这一猜测? (α=0.05) 解: 检验假设H 0:μ=μ0=8,H 1:μ≠8∵ =8.15,n =5,σ=0.2∴|u |=|X −μσ√n⁄|=|8.15−80.2√5⁄|=1.677查表知μα2=μ0.025=1.96,由于|u |=1.677<1.96,故接受H 0.即可以接受这一猜测. 习题8.31. 某纺织厂生产的某种产品的纤度用X 表示,在稳定生产时,可假定X~N(μ,σ2),其中标准差σ=0.048.现在随机抽取5跟纤维,测得其纤度为 1.32 1.55 1.36 1.40 1.44 试问总体X 的方差有无显著变化. (α=0.1) 解: 检验假设H 0:σ=0.048,H 1:σ≠0.048 检验统计量χ2=(n−1)S 2σ02~χ2(n −1)由α=0.1查表得χα22(n −1)=χ0.052(4)=9.488,χ1−α22(n −1)=χ0.952(4)=0.711于是得出拒绝域为W =(0,0.711)∪(9.488,+∞) 经计算S 2=0.31124代入χ2=(n−1)S 2σ02=4∗0.311240.048=13.51>9.488,故拒绝H 0.即总体X 的方差有显著变化.2. 设有来自正态总体X~N(μ,σ2),容量为100的样本,样本均值X =2.7,μ,σ2均未知,而∑(x i −x)2ni=1=225在α=0.05下,检验下列假设: (1) H 0:μ=3, H 1:μ≠3; (2) H 0:σ2=2.5, H 1:σ2≠2.5. 解: (1) 检验假设H 0:μ=3, H 1:μ≠3∵ X =2.7,n =100,S =√1n −1∑(x i −x)2ni=1=1.508 因此可用大样本情况的u 检验|u |=|X −μs √n⁄|=|2.7−31.508√100⁄|=1.99查表知μα2=μ0.025=1.96,由于|u |=1.99>1.96,故拒绝H 0.(同课后答案有争议)(2)该题无法查到χ0.0252(99)值故省略.(用χ2检验)3. 甲,乙两台机床加工某种零件,零件的直径服从正态分布,总体方差反映了加工精度.为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8件产品,测得其直径为X(机床甲)16.2 16.4 15.8 15.5 16.7 15.6 15.8 Y(机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0 问这两台机床的加工精度是否一致? 解:该题无α值,故省略.(用F 检验)4. 对两批同类电子元件的电阻进行测试,各抽6件,测得结果如下(单位:Ω)A 批0.140 0.138 0.143 0.141 0.144 0.137 B 批 0.135 0.140 0.142 0.136 0.138 0.141 已知元件电阻服从正态分布,设σ=0.05,问:(1) 两批电子元件电阻的方差是否相等; (2) 两批元件的平均电阻是否有差异.解: (1)检验假设H 0:σ12=σ22, H 1:σ12≠σ22经计算S 12=0.00272,S 22=0.00282由α=0.05查表得F α2(n 1−1,n 2−1)=F 0.025(5,5)=无法查F 0.025(5,5)对应值,故无法做. 习题8.4某厂使用两种不同的原料生产同一类产品,随机选取使用原料A 生产的产品22件,测得平均质量为X =2.36(kg),样本标准差S x =0.57(kg).取使用原料B 生产的样品24件,测得平均质量为y =2.55(kg),样本标准差S y =0.48(kg).设产品质量服从正态分布,这两个样本相互独立.问能否认为使用B 原料生产的产品平均质量较使用原料A 显著大?(取显著性水平α=0.05).解:检验假设H 0:μA ≥μB , H 0:μA <μB ; 选取检验统计量t =X −y S w √1m +1n+n −1)|t |=|X −y S w √1m +1n|=|2.36−2.55√21∗0.572+23∗0.48244∗√122+124|=1.226查表知t α2(m +n −2)=t 0.025(44)=2.0154,由于|t |=1.226<2.0154,故接受H 0.即使用B 原料生产的产品平均质量于使用原料A 生产的产品平均质量无显著大.自测题8 一、,选择题在假设检验问题中,显著性水平α的意义是 A . A. 在H 0成立的条件下,经检验H 0被拒绝的概率 B. 在H 0成立的条件下,经检验H 0被接受的概率 C. 在H 0不成立的条件下,经检验H 0被拒绝的概率 D. 在H 0不成立的条件下,经检验H 0被接受的概率 二、,填空题1. 设总体X 服从正态分布N (μ,σ2),其中μ未知,x 1,x 2,⋯,x n 为其样本.若假设检验问题为H 0:σ2=1, H 1:σ2≠1,则采用的检验统计量应为 χ2=(n−1)S 21.2. 设某假设检验问题的拒绝域为W,且当原假设H 0成立时,样本值x 1,x 2,⋯,x n 落入W 的概率为0.15,则犯第一类错误的概率为 0.15 .(参考page 169)3. 设样本,x 1,x 2,⋯,x n 来自正态分布N (μ,1),假设检验问题为H 0:μ=0,H 1:μ≠0,则在H 0成立的条件下,对显著性水平α,拒绝域W 应为 |u |>u α,其中u =X √n .(参考page 181表8-4)三、某型号元件的尺寸X 服从正态分布,其均值为3.278cm,标准差为0.002cm.现用一种新工艺生产此类元件,从中随机取9个元件,测量其尺寸,算得均值X =3.2795cm ,问用新工艺生产的元件尺寸均值与以往有无显著差异.(显著发生性水平α=0.05)(附u 0.025=1.96,u 0.05=1.645) 解: 检验假设H 0:μ=μ0=3.278,H 1:μ≠3.278 ∵ X =3.2795,n =9,σ=0.002∴|u |=|X −μσ√n⁄|=|3.2795−3.2780.002√9⁄|=2.25又因μα2=μ0.025=1.96,|u |=2.25>1.96故拒绝H 0,即用新工艺生产的元件尺寸均值与以往有差异.四、用传统工艺加工的某种水果罐头中,每瓶的平均维生素C的含量为19(单位:mg).现改变了加工工艺,抽查了16瓶罐头,测得维生素C的含量的平均值X=20.8,样本标准差S=1.617.假定水果罐头中维生素C的含量服从正态分布.问在使用新工艺后,维生素C的含量是否有显著变化(显著性水平α=0.01)?(附t0.005(15)=2.9467,t0.005(16)=2.9208)解: 检验假设H0:μ=μ0=19,H1:μ≠19∵=20.8,n=16,S=1.617∴|t|=|X−μS√n⁄|=|20.8−191.617√16⁄|=4.453又因tα2(n−1)=t0.005(15)=2.9467,|t|=4.453>2.9467故拒绝H0,即使用新工艺后,维生素C的含量有显著变化.。