概率论与数理统计 参数检验案例
- 格式:pdf
- 大小:62.04 KB
- 文档页数:2
实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.每张彩票平均能得到奖金05512()10000500001010E X p =⨯+⨯++⨯0.5(),=元每张彩票平均可赚20.50.3 1.2(),--=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().⨯=元 实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则()80.320.71(),E X =⨯-⨯=万元存入银行的利息:1050.5(),%⨯=万元故应选择投资.实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500;3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100,0.x X x f x x Y -⎧>⎪=⎨⎪≤⎩ 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望解:11001{1}e d 10x P X x -≤=⎰0.11e -=-0.0952,= 21011{12}e d 10x P X x -<≤=⎰0.10.2e e --=-0.0861,= 31021{23}e d 10x P X x -<≤=⎰0.20.3e e 0.0779,--=-= 1031{3}e d 10x P X x +∞->=⎰0.3e 0.7408.-== Y 因而一台收费的分布律为()2732.15,E Y =得2732.15.即平均一台家用电器收费元例1 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?解: 令),260,2,1(01 =⎩⎨⎧=k k k X K 个分机不要用外线第个分机要用外线第,26021,,,X X X 是260个相互独立的随机变量,且04.0)(=i X E ,26021X X X m +++= 表示同时使用外线的分机数,根据题意应确定最小的x 使%95}{≥<x m P 成立。
第五章 数理统计初步例1.若总体2~(,)X N µσ,其中2σ已知,但µ未知,而为来自总体的一个简单随机样本,试指出下列样本函数中 12,,n X X X …是统计量, 不是统计量:(1)11n i i X n =∑; (2)211(n i i X n )µ=−∑; (3)211()1n i i X X n =−−∑;;X 。
分析:利用统计量的定义即可辨别,特别注意不能含有未知参数。
解:由统计量的定义:设为总体12,,n X X X …X 的一个样本,为连续函数,如果不包含任何未知参数,则称其为一个统计量。
12(,,)n g x x x …12(,,)n g X X X …显然,(1),(3),(4),(6)给出的是统计量;而(2),(5)给出的量因含有未知参数µ,所以不是统计量。
注:统计量不包含任何未知参数,它具有两重性。
统计量是样本的一个函数,所以是一个随机变量。
若是的一组观察值,则统计量12,,nX X X …12(,,)n g X X X …12,,n x x x …12,,n X X X …12(,,)n g x x x …又是一个确定的数。
例2.设随机变量X 和Y 都服从标准正态分布,则 。
(A ) X Y +服从正态分布。
(B ) 22X Y +服从2χ分布。
(C ) 2X 和都服从2Y 2χ分布。
() D 22X 服从F 分布。
分析:考察统计中三种常见分布的构成,注意正态分布的性质。
解:由于的联合分布是否为二维正态分布未知,不能确定(,)X Y X Y +服从正态分布,又因X 与Y 是否独立未知,因而不能确定X Y +服从正态分布,也不能确定22X Y +服从2χ分布,也不能确定22X Y 服从F 分布,因而选。
C 注:本例重在强调各分布的构成中,都有独立性的要求。
另外,正态分布的性质中也同样要求独立性。
例3.设2~(,)X N µσ,则样本均值X 与总体期望µ的偏差不超过(n 为样本容量)的概率为 。
概率论与数理统计案例分析概率论与数理统计作为数学的一个重要分支,广泛应用于各个领域。
本文将通过一些具体案例来分析概率论和数理统计在实际中的应用。
案例一:市场营销中的A/B测试在市场营销领域,A/B测试是一种常见的实验设计方法,用于比较两种不同的营销策略、广告设计或产品设计等。
假设某电商公司希望提高其网站用户的转化率,他们可以设计一个A/B测试来比较两种不同的促销活动对用户购买行为的影响。
首先,将用户随机分为两组,一组接受A方案,另一组接受B方案。
然后通过收集和分析用户的购买数据,可以利用概率论和数理统计方法来评估两种方案的效果。
通过统计显著性检验和置信区间分析,可以得出结论,哪种方案对用户购买行为影响更大,从而指导公司的营销策略。
案例二:医学研究中的双盲试验在医学研究领域,双盲试验是一种常用的研究设计,用于评估新药物的疗效。
在一次双盲试验中,研究者和参与者都不知道哪些人接受了治疗,哪些人接受了安慰剂。
通过随机分组和盲法设计,可以最大程度地减少实验结果的偏倚。
利用概率论和数理统计方法,研究人员可以对试验数据进行分析,来评估新药物的疗效是否显著,以及是否出现不良反应等情况。
通过以上案例分析,可以看出概率论和数理统计在实际中的重要性和应用价值。
无论是市场营销领域还是医学研究领域,都离不开对数据的收集、分析和解释。
掌握好概率论和数理统计知识,对于提高决策的科学性和准确性有着重要的意义。
希望本文的案例分析能够让读者更深入地理解概率论和数理统计的实际应用,为他们在相关领域的工作和研究提供一定的启发和帮助。
概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。
2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。
2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。
(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。
概率论部分:案例1 邮局开设多少服务窗口合理案例2 国家邮政局发行贺年(有奖)明信片的利润计算案例3 彩民获奖的概率问题案例4 人寿保险问题案例5 免费抽奖问题案例6 双色球彩票中奖概率的理论计算与验证案例7 公交大巴车门高度如何设计案例8 怎样由脚印长度估计罪犯身高案例9 生日问题案例10 排队等待问题案例11 传送带效率问题案例12 商品订货案例13 交货时间为随机变量的存贮模型。
案例14 轧钢问题续集案例15 销售量为随机的存储模型(报童卖报问题)案例16 到货时间为随机的存储模型(报童卖报问题)案例17 随机性人口模型案例18 捕鱼问题案例19 足球门的危险区域案例20 利用蒙特卡洛方法(随机模拟)计算积分统计部分案例21 计算常用描述性统计量,绘制常用统计图案例22 卡方分布问题:案例23 工程师的建议是否应采纳案例24 化妆品销售量的预测案例25 假设检验(配对样本的t检验,本题目源于2012年全国大学生数学建模竞赛A题)案例26 气候预测案例27 蠓虫的分类模型案例1 邮局开设多少服务窗口合理某居民区有n 个人,设有一个邮局,开m 个服务窗口,每个窗口都在办理所有业务。
m 太小则经常排长队。
m 太大又不经济。
假定在每一指定时刻,这n 个人中每一个是否去邮局是独立的。
每个人在邮局的概率都是p 。
现要求“在营业中任一时刻每个窗口的排队人数(包括正在被服务的那个人)不超过s ”这个事件的概率不小于α(一般取95.090.0,80.0或=α)则至少需开设多少窗口? 利用伯努利分布解决这个问题 设事件),,(个人在邮局办事在指定时刻恰有sm k k A k ⋯==2,1,0}{由题设条件知k n k k n k p p C A P --=)1()(由于sm A A A A ,,,,210⋯为两两互斥事件。
故∑∑=-==≥-===smk k n kk n smk k smk k p p C A P A P s P 0)1()()()(α每个窗口人数都不超过找一个最小的自然数m ,使上面不等式成立。
实践报告题目1实践内容:已知幼儿身高服从正态分布,标准差σ=7.现从5—6岁的幼儿中随机地抽查了9人,其身高(单位:cm)分别为:115120 131 115 109 115 115 105 110试求身高均值μ的置信度为95%的置信区间。
实践步骤:(1)在Excel中输入样本数据,如下图中A列(2)列出求解所需要的有关统计量,如图中B列所示,其中:①总体标准差、样本容量、置信度为已知值,直接输入;②计算“样本均值”:在“C2”中输入公式“=A VERAGE(A2:A10)”;③计算“估计误差”:在“C5”中输入公式“=CONFIDENCE(1-C4,C3,C1)”,其中“1-C4”指的是显著性水平α的值,“C3”中数据是数据区域的总体标准差“C1”为(n-1)的值;④计算“置信上限”:在“C7”中输入“=C2+C5”;⑤计算“置信下限”:在“C8”中输入“=C2-C5”;实践结果:如图所示,身高均值μ的置信度为95%的置信区间为[110.43,119.57].实践操作:如图题目2实践内容:用仪器测量温度,重复测量7次,测得温度分别为:115 120 131 115 109 105 110设温度X~N(μ,σ2),在置信度为95%时,试求温度的真值所在范围。
实践步骤:(3)在Excel中输入样本数据,如下图中A列(4)列出求解所需要的有关统计量,如图中B列所示,其中:①样本容量、置信度为已知值,直接输入;②计算“样本均值”:在“C2”中输入公式“=A VERAGE(A2:A8)”;③ 计算)6()1(205.02t n t =-α:在“C5”中输入公式“=TINV (1-C4,C1-1)”,其中“1-C4”为显著性水平α的值,“C1—1”为(n -1)的值;④ 计算“样本标准差”:在“C3”中输入公式“=STDEV (A2:A8)”;⑤ 计算“估计误差”:在“C6”中输入公式“=C5*C3/SQRT (C1)”,这依据公式nn t s )1(*2-α,SQRT表示对C1开方; ⑥ 计算“置信上限”:在“C7”中输入“=C2+C6”;⑦ 计算“置信下限”:在“C8”中输入“=C2-C6”;实践结果:如图所示,在置信度为95%时,温度的真值所在范围为[107.06,122.94]. 实践操作:如图题目3实践内容:设某灯泡的寿命X ~N (μ,σ2),μ,δ2未知,现从中任取5只灯泡进行寿命试验,得到数据:10.5 11.0 11.2 12.5 12.8(单位:千小时)试求置信水平为90%时σ2区间估计。
葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
附件1给出了某一年份一些葡萄酒的评价结果。
请尝试建立数学模型讨论下面问题:
1、分析附件1中两组评酒员对白葡萄酒的评价结果有无显著性差异,哪一组结果更可信?
*2、(选作题)分析附件1中两组评酒员对红葡萄酒的评价结果有无显著性差异,哪一组结果更可信?
要求:
一、以PPT的形式,阐述下列问题(*部分为选作问题)
(一)参数假设检验
1、Z检验的作用与适用条件;
2、T检验的作用与适用条件;
3、x2检验的作用与适用条件;
4、与上述检验法对应的MATLA函数;
*5、非正态数据常用的转化法。
(二)非参数假设检验
1、分布拟合检验
(1)x2拟合检验作用与适用条件;
(2)偏度与峰度拟合检验作用与适用条件;
(3)夏皮罗-威尔克检验作用与适用条件;
*(4)常用的正态性检验法;
(5)MATLAB中,正态检验函数及其对应的检验法;
*2、秩和检验、符号检验及符号秩和检验的作用与适用范围,秩和检验优点与缺点;
*3、秩和检验对应的MATLAB函数;
(三)假设检验问题P值法的定义
二、提交案例分析报告(具体要求看附件2)。
附件1:葡萄酒品尝评分表(含4个表格)
附件2:附件2-案例报告要求。
葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
附件1给出了某一年份一些葡萄酒的评价结果。
请尝试建立数学模型讨论下面问题:
1、分析附件1中两组评酒员对白葡萄酒的评价结果有无显著性差异,哪一组结果更可信?
*2、(选作题)分析附件1中两组评酒员对红葡萄酒的评价结果有无显著性差异,哪一组结果更可信?
要求:
一、以PPT的形式,阐述下列问题(*部分为选作问题)
(一)参数假设检验
1、Z检验的作用与适用条件;
2、T检验的作用与适用条件;
3、x2检验的作用与适用条件;
4、与上述检验法对应的MATLA函数;
*5、非正态数据常用的转化法。
(二)非参数假设检验
1、分布拟合检验
(1)x2拟合检验作用与适用条件;
(2)偏度与峰度拟合检验作用与适用条件;
(3)夏皮罗-威尔克检验作用与适用条件;
*(4)常用的正态性检验法;
(5)MATLAB中,正态检验函数及其对应的检验法;
*2、秩和检验、符号检验及符号秩和检验的作用与适用范围,秩和检验优点与缺点;
*3、秩和检验对应的MATLAB函数;
(三)假设检验问题P值法的定义
二、提交案例分析报告(具体要求看附件2)。
附件1:葡萄酒品尝评分表(含4个表格)
附件2:附件2-案例报告要求。