(整理)实验12概率统计.
- 格式:doc
- 大小:270.00 KB
- 文档页数:12
(完整版)概率与统计教学设计1. 引言本文档旨在设计一套全面且有效的概率与统计教学计划。
通过结合理论与实践,促进学生对概率与统计概念的理解和应用能力的提升。
2. 教学目标通过本课程的研究,学生应达到以下目标:- 熟练掌握概率与统计的基本概念和相关计算方法;- 能够分析和解释概率与统计数据,并进行合理的推断和预测;- 培养学生的逻辑思维、问题解决和数据分析能力。
3. 教学内容和方法本课程的教学内容将包括以下几个主要模块:3.1 概率理论- 引入概率的基本概念和性质;- 讲解概率计算方法,包括排列组合、事件独立性等;- 应用概率计算解决实际问题。
3.2 统计分析方法- 介绍统计学的基本原理和方法;- 讲解数据收集和整理的技巧;- 统计分布、参数估计和假设检验等统计分析方法的应用。
3.3 实践案例分析- 利用真实案例数据进行统计分析;- 引导学生运用所学知识解决实际问题;- 培养学生的数据分析和决策能力。
在教学过程中,将采用以下教学方法:- 授课讲解:通过清晰简明的解释,引导学生理解概率与统计的基本概念和方法;- 实例演示:通过实际案例分析,帮助学生理解和应用所学知识;- 分组讨论:组织学生进行小组活动,促进合作研究和问题解决能力;- 实验实践:安排相关实验,培养学生的实际操作和数据分析能力。
4. 教学评估方式为了评估学生对概率与统计知识的掌握程度,将采用以下评估方式:- 课堂小测验:通过课堂小测验检验学生对概率与统计基本概念的理解;- 作业与项目:布置概率与统计相关的作业和项目,测试学生的应用能力;- 期末考试:设立期末考试,全面考察学生对概率与统计的掌握情况。
5. 教学资源支持为了保证教学的顺利进行,将提供以下教学资源支持:- 教材:选择一本权威的概率与统计教材为学生提供基础知识;- 资源库:为学生提供相关的教学资源和案例分析资料;- 实验室设备:提供实验室设备,支持学生进行实践操作。
6. 教学时间安排本课程将持续一学期,根据教学计划,按照以下时间安排进行教学:- 第1-2周:概率理论教学;- 第3-4周:统计分析方法教学;- 第5-12周:实践案例分析教学;- 第13-14周:复和总结。
《概率论与数理统计》 第一章随机事件及其概率§1.1 随机事件一、给出事件描述,要求用运算关系符表示事件: 二、给出事件运算关系符,要求判断其正确性: §1.2 概率古典概型公式:P (A )=所含样本点数所含样本点数ΩA 实用中经常采用“罗列组合”的想法计算补例1:将n 个球随机地放到n 个盒中去,问每个盒子恰有1个球的概率是多少?解:设A :“每个盒子恰有1个球”。
求:P(A)=?Ω所含样本点数:n n n n n =⋅⋅⋅...Α所含样本点数:!1...)2()1(n n n n =⋅⋅-⋅-⋅n n n A P !)(=∴补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少?解:设A i :“信箱中信的最大封数为i”。
(i =1,2,3)求:P(A i )=?Ω所含样本点数:6444443==⋅⋅A 1所含样本点数:24234=⋅⋅836424)(1==∴A PA 2所含样本点数:363423=⋅⋅C1696436)(2==∴A PA 3所含样本点数:4433=⋅C161644)(3==∴A P注:由概率定义得出的几个性质:知识归纳整理1、0<P (A )<12、P(Ω)=1,P(φ) =0 §1.3 概率的加法法则定理:设A 、B 是互不相容事件(AB=φ),则: P (A ∪B )=P (A )+P (B )推论1:设A 1、 A 2、…、 A n 互不相容,则 P(A 1+A 2+...+ A n )= P(A 1) + P(A 2) +…+ P(A n )推论2:设A 1、 A 2、…、 A n 构成完备事件组,则 P(A 1+A 2+...+ A n )=1推论3: P (A )=1-P (A )推论4:若B ⊃A ,则P(B -A)= P(B)-P(A) 推论5(广义加法公式):对任意两个事件A 与B ,有P(A ∪B)=P(A)+P(B)-P(A B) 补充——对偶律:nnAA A A A A ⋂⋂⋂=⋃⋃⋃ (2)121nnAA A A A A ⋃⋃⋃=⋂⋂⋂ (2)121§1.4 条件概率与乘法法则条件概率公式:P(A/B)=)()(B P AB P (P(B)≠0)P(B/A)= )()(A P AB P (P(A)≠0)∴P (AB )=P (A /B )P (B )= P (B / A )P (A )有时须与P (A+B )=P (A )+P (B )-P (AB )中的P (AB )联系解题。
高中概率知识点总结高中概率知识点总结概率,又称或然率、机会率、机率(几率)或可能性,它是概率论的基本概念。
概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。
以下是小编整理的高中概率知识点总结,希望能够帮助到大家!高中概率知识点总结篇1一.算法,概率和统计1.算法初步(约12课时)(1)算法的含义、程序框图①通过对解决具体问题过程与步骤的分析(如,二元一次方程组求解等问题),体会算法的思想,了解算法的含义。
②通过模仿、操作、探索,经历通过设计程序框图表达解决问题的过程。
在具体问题的解决过程中(如,三元一次方程组求解等问题),理解程序框图的三种基本逻辑结构:顺序、条件分支、循环。
(2)基本算法语句经历将具体问题的程序框图转化为程序语句的过程,理解几种基本算法语句--输入语句、输出语句、赋值语句、条件语句、循环语句,进一步体会算法的基本思想。
(3)通过阅读中国古代中的算法案例,体会中国古代对世界发展的贡献。
3.概率(约8课时)(1)在具体情境中,了解随机事件发生的不确定性和频率的稳定性,进一步了解概率的意义以及频率与概率的区别。
(2)通过实例,了解两个互斥事件的概率加法公式。
(3)通过实例,理解古典概型及其概率计算公式,会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。
(4)了解随机数的意义,能运用模拟(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义(参见例3)。
(5)通过阅读材料,了解人类认识随机现象的过程。
2.统计(约16课时)(1)随机抽样①能从现实生活或其他学科中提出具有一定价值的统计问题。
②结合具体的实际问题情境,理解随机抽样的必要性和重要性。
③在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。
④能通过试验、查阅、设计调查问卷等方法收集数据。
(2)用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图(参见例1),体会他们各自的特点。
《概率统计》实验报告实验人员:系(班):矿业工程系机械设计制造及其自动化1404班 学号:20141804408 姓名:李君阳 实验地点:电教楼四层三号机房实验名称:《概率统计》实验时间:2016.5.10,2016.5.17 16:30——18:30.实验目的:1.加强学生的动手能力,让学生掌握对MATLAB 软件的应用。
2.为以后的数学计算节省时间,提高精确度,准确度,合理的利用科学技术。
实验内容:(给出实验程序与运行结果)一、古典概型2、在50个产品中有18个一级品,32个二级品,从中任意抽取30个,求其中恰有20个二级品的概率.解:p=C 3220C 1810c 5030=0.2096>> p=nchoosek(32,20)*nchoosek(18,10)/nchoosek(50,30)p =0.2096二、计算概率1、某人进行射击,设每次射击的命中率为0.02,独立射击200次,试求至少击中两次的概率.2、一铸件的砂眼(缺陷)数服从参数为0.5的泊松分布,求此铸件上至多有1个砂眼的概率和至少有2个砂眼的概率. 解:1.p=1-c 2000∗0.98400-c 2001*0.98199*0.02=0.1458>> p=binopdf(2,200,0.02)p =0.1458 2.P(ζ=0)= 5.00*!05.0-e P(ζ=1)= 5.01*!15.0-e P(ζ1)=0.9098P(ζ)=0.09024、设随机变量()23,2X N ,求()25P X <<;()2P X >解:P(2<X<5)=F(5)-F(2)= )5(1,0σa F -=)235(1,0-F -)232(1,0-F = -=0.08413-(1-0.6915)=0.5328P(|X |>2)=P(X<-2)+P(X>2)=P(X<-2)+1-P(X<2)=0.6977normcdf(5,3,2)-normcdf(2,3,2) ≤2≥吕梁学院《概率统计》实验报告ans =0.5328>> normcdf(-2,3,2)-normcdf(2,3,2)+1ans =0.6977三、作图1、画出N(2,9),N(4,9),N(6,9)的图像进行比较;(图1)画出N(0,1),N(0,4),N(0,9)的图像进行比较.解:y1=normpdf(x,2,3);y2=normpdf(x,4,3);y3=normpdf(x,6,3);plot(x,y1,x,y2,x,y3)>> x=-40:0.01:40;y1=normpdf(x,0,1);y2=normpdf(x,0,2);y3=normpdf(x,0,3);plot(x,y1,x,y2,x,y3)(图2)四、常见统计量的计算1、根据调查,某集团公司的中层管理人员的年薪(单位:万元)数据如下:42 41 39.2 37.6 40.2 40 41 41.4 36.1 43.140.3 39.3 38.4 36.5 38.1 38.5 39.1 40.6 38.3 39.7求其公司中层管理人员年薪的样本均值、样本方差、样本标准差,绘制直方图。
专题学习统计和概率、综合和实践内容分析和建议专题一统计和概率(一)“统计和概率”的内容结构在课程标准中较课程标准实验稿有较大变化。
即在第一学段内容大大减少,只保留3条要求,主要是学会分类、会进行简单的数据收集和整理;第二学段分为“简单数据统计过程”和“随机现象发生的可能性”两部分,共8条;第三学段分为“抽样和数据分析”和“事件的概率”两部分,共11条。
这样调整的原因在于,在实验过程中原来第一学段对于统计和概率内容的要求,按照学生现有的理解水平,学习是有一定困难的,教学设计和实施也有很大难度。
同时,在内容上和后面两个学段有很大的重复。
因此,较大幅度降低了第一学段统计和概率内容的要求,对后两个学段的内容也做相关的调整,如中数、众数等内容从第二学段移到第三学段。
这样使统计和概率内容在三个学段的要求上有明显区分,在难度上也表现出一定的梯度。
在初中阶段“统计和概率”的课程内容主要由数据分析的过程、数据分析的方法、数据的随机性和随机现象及简单随机事件发生的概率构成。
通过本节分析,使教师在教学中,通过让学生参和在实际问题中收集和处理数据,利用数据分析问题、获取信息的过程,掌握统计和概率的基础知识和基本技能。
1.数据分析的过程课程标准中将数据分析观念作为核心概念,为教师理解这部分内容结构提供了重要指导。
在课程标准中,将数据分析观念解释为:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析作出判断,体会数据中蕴涵着信息;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。
数据分析是统计的核心。
”基于这些阐述,为使学生树立数据分析的观念,教师最有效的方法就是让他们投入到数据分析的全过程中去。
在此过程中,学生不仅学习一些必要的知识和方法,同时还将体会数据中蕴涵着信息,提高自己运用数据分析问题、解决问题的能力。
《统计与概率》教案14篇《统计与概率》教案篇1设计说明根据本课时的复习内容和特点,依托教材提供的练习题,从以下两个层次进行复习。
1.引导学生按照指定的标准分类。
这一层次的复习,首先让学生按照颜色分类,采用小组讨论的方式,找出自己分类的数据,然后将数据填入统计表中,初步体会到整理数据的全过程。
在按照颜色分类的基础上,让学生自主完成按照形状进行分类,以巩固整理数据的方法。
2.引导学生按照自选的标准进行分类。
这一层次的复习过程能让学生体验到分类结果的多样性。
通过以上的复习设计,使学生会用简单的统计表、象形统计图来呈现整理的结果,并培养学生从多角度、多层次、多方位地看待事物的意识。
课前准备教师准备 PPT课件学生准备不同形状的平面图形若干教学过程⊙导入新课(课件出示不同形状的平面图形)师:同学们,这些图形都是我们学过的平面图形,谁能告诉大家它们的名称?(教师指名汇报)师:同学们的记忆力真好,今天我们就利用这些平面图形来复习有关分类与整理的知识。
设计意图:通过辨认平面图形,为复习课的展开奠定基础。
⊙复习梳理1.复习按照指定的标准分类。
(课件出示教材94页3题)师:这么多不同颜色、不同形状的卡片混在一起,你们能分别按照它们的颜色和形状把它们分一分吗?(1)按照颜色分类。
师:请同学们小组合作解决,要知道每种颜色的卡片分别有多少张,应该怎么办呢?(学生小组讨论)汇报讨论结果。
方法一:先分一分,再数一数。
先按照红、绿、蓝、黄、粉五种颜色把卡片分成五类,然后数出每一类的张数。
方法二:边数边画。
学生展示画的结果:方法三:用文字方式呈现分类的结果。
红色绿色蓝色黄色粉色5张 3张 6张 2张 4张师:请根据你们用不同方法分类整理的结果,把教材94页3题(1)中的表格填写完整。
(学生自主填写表格)师:根据表格中的数据,请你提出数学问题,并自主解答。
(学生之间根据数据互相提出问题,并解答)(2)按照形状分类。
师:根据按照颜色分类的方法,请同学们按照形状对这些卡片进行分类,并自主填写教材94页3题(2)中的表格。
第一章练习题1. 如图,设1、2、3、4、5、6表示开关,用B表示“电路接通”i A表示“第i个开关闭合”请用i A表示事件B解:2.一大型超市声称,进入商店的小偷有60%可以被电视监测器发现,有40%被保安人员发现,有20%被监测器和保安人员同时发现,试求小偷被发现的概率.解:3. 周昂,李虎和张文丽是同班学生.如果他们到校先后次序的模式的出现的可能性是一样的,那么周昂比张文丽先到校的概率是多少?解:4.甲、乙两城市都位于长江下游,根据一百余年来,气象的记录,知道甲、乙两城市一年中雨天占的比例分别为20%和18%,两地同时下雨的比例为12%,问(1) 乙市为雨天时,甲市为雨天的概率是多少?(2) 甲市为雨天时,乙市为雨天的概率是多少?(3) 甲、乙两城市至少有一个为雨天的概率是多少?解:5.某种动物由出生活到20岁的概率为0.8,活到25岁的概率为0.4,问现年20岁的这种动物活到25岁的概率是多少?解:6.发报台分别以0.6和0.8发出信号”*”和”+”,由于通信受到干扰,当发出信号为”*”时,收报台分别以概率0.8和0.2收到信号”*”和”+”.又若发出信号为”+”时,收报台分别以概率0.9和0.1收到信号”+”和”*”,求当收报台收到信号”*”时,发报台确实发出信号”*”的概率.解:7.某工厂由甲、乙、丙三个车间生产同一种产品,每个车间的产量分别占全厂的25%,35%,40%,各车间产品的次品率分别为5%,4%,2%,求全厂产品的次品率.解:8.某高校甲系二年级1、2、3班的学生人数分别为16、25、25人,其中参加义务献血的人数分别为12、15、20人,从这三个班中随机抽取一个,再从该班的学生名单中任意抽取2人.(1)求第一次抽取的是已献血的人的概率;(2)如果已知第二次抽到的是未参加献血的,求第一次抽到的是已献血的学生的概率.解:9.美国总统常常从经济顾问委员会寻求各种建议.假设有三个持有不同经济理论的顾问(Perlstadt,Kramer,和Oppenheim).总统正在考虑采取一项关于工资和价格控制的新政策,并关注这项政策对失业率的影响.每位顾问就这种影响给总统一个个人预测,他根据以前与这些顾问一起工作的经验,总统已经形成了关于每位顾问有正确的经济理论的可能性的一个先验估计,分别为P(Perlstadt正确)=1/6P(Kramer正确)=1/3P(Oppenheim正确)=1/2假设总统采纳了所提出的政策,一年后,失业率上升了,总统应如何调整他对其顾问的理论正确性的估计.解:10.甲、乙、丙三人向同一架飞机射击.设甲、乙、丙击中的概率分别为0.4,0.5,0.7,又设只有一人击中,飞机坠毁的概率为0.2;若二人击中,飞机坠毁的概率为0.6;若三人击中,飞机必坠毁.求飞机坠毁的概率.解:11.如果)()(C B P C A P ≥,)()(C B P C A P ≥,则()().P A P B ≥证明:12.选择题(1).设C B A ,,三事件两两独立,则C B A ,,相互独立的充分必要条件是( )(A) A 与BC 独立; (B) AB 与C A 独立; (C) AB 与AC 独立; (D) B A 与C A 独立. (2).设当事件A 和B 同时发生时,事件C 必发生,则下述结论正确的是( )(A) 1)()()(-+≤B P A P C P ; (B) 1)()()(-+≥B P A P C P ; (C) )()(AB P C P =; (D) )()(B A P C P =.(3).设事件A 和B 满足B A ⊂,0)(>B P ,则下列选项必然成立的是( )(A) )()(B A P A P <; (B) )()(B A P A P ≤; (C) )()(B A P A P >; (D) )()(B A P A P ≥.(4).n 张奖券中有m 张可以中奖,现有k 个人每人购买一站张,其中至少有一个人中奖的概率为( )(A)knk mn m C C C 11--; (B)k nC m; (C) k nk m n C C --1; (D)∑=ki k ni mC C 1.(5).一批产品的一、二、三等品各占60%、30%、10%,从中任意取出一件,结果不是三等品,则该产品为一等品的概率为( )(A)21; (B) 41; (C) 31; (D) 32.第二章练习题1.一袋中有3个白球5个红球,从中任取2个球,求其中红球个数X的概率函数.解:2.自动生产线在调整以后出现废品的概率为p,生产过程中出现废品时立即重新调整,求两次调整之间生产的合格品数X的分布.解:3.一张考卷上有5道题目,同时每道题列出4个选择答案,其中有一个答案是正确的.某学生凭猜测能答对至少4道题的概率是多少?解:4.分析病史资料表明,因患感冒而最终死亡(相互独立)比例占0.2%.试求,目前正在患感冒的1000个病人中:(1)最终恰有4个人死亡的概率;(3)最终死亡人数不超过2个人的概率.解:5.某公司经理拟将一提案交董事会代表批准,规定如提案获多数代表赞成则通过.经理估计各代表对此提案投赞成票的概率是0.6,且各代表投票情况独立.为以较大概率通过提案,试问经理请三名懂事代表好还是五名好?解:6.一电话交换台每分钟收到呼唤次数服从参数为4的泊松分布,求(1)每分钟恰有8次呼唤的概率;(2)每分钟呼唤次数大于10次的概率.解:7.设某射手有5发子弹,连续向一目标射击,直到击中或子弹用完为止.已知其每次击中的概率为0.8,设X为射击的次数.求(1)X的概率分布;(2)未用完子弹的概率;(3)用完子弹且击中目标的概率;(4)已知用完子弹的条件下,其射中目标的概率.解:8.设随机变量X 的概率密度为:∞<<∞-=-x ce x f x)(,求:(1)常数c ;(2)X 的值落)1,1(-在内的概率; (3)X 的分布函数.解:9.设若)4,3(~N X ,(1)求}3{},2{},104{},52{>>≤<-≤<X P X P X P X P ; (2)确定c ,使得}{}{c X P c X P ≤=>.解:10.设)2,1(~U X ,求23+=X Y 的分布. 解:10.研究了英格兰在1875—1951年内,在矿山发生导致10人以上死亡的事故的频繁程度,得知相继两次事故之间的时间T (以日计)服从指数分布,其概率密度为: 002411)(241≤>⎪⎩⎪⎨⎧=-t t et f t,求分布函数)(t F ,并求概率}10050{<<T P . 解:11.选择题:(1).如果随机变量X 服从指数分布,则随机变量)2,min(X Y =的分布函数( ). (A) 是连续函数; (B) 至少有两个间断点; (C) 是阶梯函数; (D) 恰好有一个间断点.(2).设)1,1(~N X ,概率密度函数为)(x ϕ,下述选项正确的是( ).(A) 5.0)0()0(=≤=≥X P X P ; (B) 5.0)1()1(=≥=≤X P X P ;(C) )()(x x -=ϕϕ,),(+∞-∞∈x ; (D) )(1)(x F x F --=,),(+∞-∞∈x . (3).设!/)(k e a k X P k λλ-==),4,2,0( =k ,是随机变量X 的概率分布,则λ,a 一定满足( ).(A)0>λ; (B) 0>a ; (C) 0>λa ; (D) 0>λ且0>a . (4).设随机变量X 的密度函数为)1(1)(2x x f +=π,则X Y 2=的概率密度函数为( ).(A))41(12x +π; (B))4(22x +π; (C))1(22x +π; (D))4(12x +π.(5) .设随机变量),(~211σμN X ,随机变量),(~222σμN Y ,且1{1}P X μ-<> 2{1},P Y μ-<则必有(A)21σσ>; (B) 21σσ<; (C) 21μμ>; (D) 21μμ<.第三章练习题1.甲乙二人轮流投篮,假定每次甲的命中率为0.4,乙的命中率为o.6,且各次投篮相互独立.甲先投,乙再投,直到有人命中为止.求甲乙投篮次数X 与Y 的联合分布.解:2.设随机变量(X,Y)的联合概率密度为=),(y x f ⎩⎨⎧--其它,0),6(y x k ;40,20<<<<y x求:(1)常数k ;(2));3,1(<<Y X P (3));5.1(<X P (4))4(≤+Y X P解:3.已知X 与Y 同分布且概率密度为⎪⎩⎪⎨⎧<<=其他,030,814)(3x x x f设事件}0{>>=a X A 和}0{>>=a Y B 独立,且9/5)(=⋃B A P ,求常数a .解:4.一批产品中有a 件合格品与b 件次品.每次从这批产品中任取一件产品,共取两次,抽样方式是:(1)放回抽样;(2)不放回抽样.设随机变量X 及Y 分别表示第一次及第二次取出的次品数,写出上述两种情况下二维随机变量(X ,Y )的概率分布及边缘分布,并说明X 与Y 是否独立.解:5.设二维随机变量),(Y X 的联合密度函数为⎪⎩⎪⎨⎧≤≤=其他,01,421),(22y x y x y x f求条件密度函数和条件概率}2143{=>x Y P 解:6.设二维随机变量),(Y X 的概率函数为求:(1))0,1(≤≥Y X P ;(2))02(≤=Y X P ;(3)讨论Y X ,的独立性; 解:7.设X 与Y 两个相互独立的随机变量,其概率密度分别为⎩⎨⎧≤≤=.,0;10,1)(其它x x f X ⎪⎩⎪⎨⎧≤>=-.0,0;0,)(y y e y f y Y 求随机变量Y X Z +=的概率密度.解:8.设随机变量X ,Y 相互独立,并且]1,0[~U X ,)1(~e Y ,求Y X +,},max{Y X ,},min{Y X 的概率密度函数.解:9.设(X ,Y )的分布律为试求:(1)Y X Z +=解:10.选择题:(1).下列函数可以作为二维分布函数的是( ).(A) ⎩⎨⎧>+=.,0,8.0,1),(其他y x y x F (B) ⎪⎩⎪⎨⎧>>⎰⎰=--.,0,0,0,),(00其他y x dsdt ey x F y x t s(C) ⎰⎰=∞-∞---y x ts dsdt ey x F ),(; (D) ⎪⎩⎪⎨⎧>>=--.,0,0,0,),(其他y x ey x F y x(2).设事件B A ,满足41)(=A P ,21)|()|(==A B P B A P .令 ⎩⎨⎧=.,0,,1不发生若发生若A A X ⎩⎨⎧=.,0,,1不发生若发生若B B Y 则===)0,0(Y X P .(A)81; (B) 83; (C) 85; (D) 87.(3).设随机变量X 与Y 相互独立且同分布:21)1()1(====Y P X P ,21)1()1(=-==-=Y P X P ,则==)1(XY P . (A)21; (B) 31; (C) 32; (D) 41. (4).设(),10~,N X (),21~,N Y Y X ,相互独立,令X Y Z 2-=,则~Z ( )(A ))5,2(-N ; (B) )5,1(N ; (C) )6,1(N ; (D) )9,2(N .(5).设二维随机变量),Y X (服从G 上的均匀分布,G 的区域由曲线2x y =与x y =所围,则),Y X (的联合概率密度函数为 .(A )⎩⎨⎧∈=他其,0),(,6),(G y x y x f ; (B )⎩⎨⎧∈=他其,0),(,6/1),(Gy x y x f ;(C )⎩⎨⎧∈=他其,0),(,2),(G y x y x f ; (D )⎩⎨⎧∈=他其,0),(,2/1),(Gy x y x f第四章练习题1. 设随机变量X 的分布律为如下, 求)(X E ,)12(-X E ,)(2X E .解:2. 射击比赛,每人射4次,每次射一发,约定全都不中得0分,只中一弹得15分,中两弹得30分,中三弹得55分,中四弹得100分.甲每次射击命中率为0.6,问他期望得多少分?解:3. 9粒种子分种在3个坑内,每粒种子发芽的概率为0.5.若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种.假定每个坑至多补种一次,每补种1个坑需10元,用ξ表示补种费用,写出ξ的分布列并求 的数学期望.解:4.(1)(2) 求完成该任务的期望天数;(3) 该任务的费用由两部分组成:20000元的固定费用加每天2000元,求整个项目费用的期望值;(4) 求完成天数的方差和标准差.解:5. 设离散型随机变量X的概率分布为(1)(2)试求DXEX,解:6. 设两个相互独立的随机变量X和Y均服从正态分布(1,1/5).如果随机变量X-aY+2满足条件X+-aYD=XaYE)2-[(]+(2)2求(1)a的值;(2))2-aYX(+D-aY(+XE及)2解:7. 游客乘电梯从底层到电视塔的顶层观光,电梯于每个整点的第5分钟、第25分钟和第55分钟从底层起行.一游客在早上八点的第X分钟到达底层候梯处,且X在[0,60]上服从均匀分布,求该游客等候时间Y的数学期望.解:8. 某电力排灌站,一天内停电的概率为0.1(设若停电,全天不能工作),若4天内全不停电,可获得利润6万元;如果停电一次,可获利3万元;如果有二次停电,则获利为0万元;若有三次以上停电,要亏损1万元.求4天内期望利润是多少?解:9. 一台设备由三大部件构成,在设备运行中各部件需要调整的概率相应为0.10,0.20,0.30.假设各部件的状态相互独立,以X表示同时需要调整的部件数,求X的概率分布、数学期望EX和方差DX.解:10. 一商店经销某种商品,每周进货的数量X与顾客对该种商品的需求量Y是相互独立的随机变量,且都服从区间[10,20]上的均匀分布.商店每售出一单位商品可得利润1000元;若需求量超过了进货量,商店可从其他商店调剂供应,这时每单位商品可得利润500元.试计算此商店经销该种商品每周所得利润的期望值.解:11. 已知X ,Y 的相关系数为.,,d cY b aX +=+=ηζρ,求ηζ,的相关系数ζηρ 解:12. 设),0(~),,0(~2221σσN Y N X ,且相互独立Y a X a V Y a X a U 2121,-=+= (1)分别写出U,V 的概率密度函数;(2)求U,V 的相关系数; (3)讨论U,V 的独立性;(4)当U,V 相互独立时,写出(U,V)的联合密度函数解:13. 设A ,B 是二随机事件;随机变量 ⎩⎨⎧-=不出现若,出现若A A X 1,1 ⎩⎨⎧-=不出现若,出现若B B Y 1,1试证明随机变量X 和Y 不相关的充分必要条件是A 与B 相互独立. 解:14.试验证21X Y =与X 不相关,而32X Y =与X 却相关. 解:15.选择题:(1).随机变量X 的概率分布为:)1(21)(+==n n n X P ,),3,2,1( =n .则其数学期望)(X E 为( ).(A) 0; (B) 0.5; (C) 1; (D) 不存在. (2).随机变量X 与Y 独立同分布,令Y X -=ξ,Y X +=η,则随机变量ξ和η必然( ) (A) 独立; (B) 不独立; (C) 相关系数为0; (D) 相关系数不为0. (3).对任意随机变量X 与Y ,则下列等式中一定成立的为( )(A) )()()(Y D X D Y X D +=+; (B) )()()(Y E X E Y X E +=+; (C) )()()(Y D X D XY D =; (D) )()()(Y E X E XY E =.(4).设X 与Y 为任意随机变量,若)()()(Y E X E XY E =,则下述结论中成立的为( )(A) )()()(Y D X D Y X D +=+; (B) )()()(Y D X D XY D =;(C) X 与Y 相互独立; (D) X 与Y 不独立.(5).设离散型随机变量X 的可能取值为1、2、3,且3.2)(=X E ,9.5)(2=X E ,则对应取值1、2、3的概率应为( )(A)1.01=p ,2.02=p ,7.03=p ; (B) 3.01=p ,2.02=p ,5.03=p ; (C) 1.01=p ,4.02=p ,5.03=p ; (D) 2.01=p ,3.02=p ,5.03=p .第五章练习题1.利用Chebychev 不等式证明:能以大于0.97的概率断言,掷1000次均匀硬币,正面出现的次数在400到600次之间.解:2.设随机变量X 的概率密度为⎪⎩⎪⎨⎧≤>=-0,00,)(x x xe x f x用Chebychev 不等式证明 2/1}40{≥<<X P解:3.电视机厂每月生产10000台电视机,但它的显象管车间的正品率为0.8,为了以0.997的概率保证出厂的电视机都装上正品的显象管,该车间每月应生产多少只显象管?解:4.保险公司对20岁男青年卖保险,每年交300元,约定:若在今后5年内投保历史资料表明一个人若能活到25岁并一直投保,则平均保险公司可获利1500元.试问:(1)20岁男青年能活过25岁以上的概率有多大?(2)收300元保险费,而一旦死亡要赔10万元,两者差距似乎很大,而公司还能获利,为什么?设有十万人投保能获利多少?(3)试求对每个20 岁投保人,大致可获利多少?(5)为了准备获利1000000元,应征集多少20岁男青年投保?解:5.药厂断言,该工厂生产的某种药品对于治疗一种疑难的疾病的治愈率为0.8.某医院试用了这种药品,任意抽查了100个服用次药品的病人,如果其中多于75人治愈,医院就接受药厂的这一断言,否则就拒绝之.问:(1)若实际上次药品对这种疾病的治愈率为0.8,那么,医院接受这一断言的概率是多少?(2)若实际上次药品对这种疾病的治愈率为0.7,那么,医院接受这一断言的概率是多少?解:6.某商店负责供应某地区1000人所需商品,其中一商品在一段时间内每人需用一件的概率为0.6,假定在这一段时间内个人购买与否彼此无关,问商店应预备多少件这样的商品,才能以99.7%的概率保证不会脱销(假定该商品在某一段时间内每人最多可以买一件).解:7.选择题(1).设随机变量),(~211σμN X ,),(~222σμN Y ,且}1|{|}1|{|21<-><-μμY P X P ,则必有( ).(A)21σσ>; (B) 21σσ<; (C) 21μμ<; (D) 21μμ>.(2).设随机变量序列}{n X 相互独立,],[~n n U X n -, ,2,1=n ,则对}{n X ( ). (A)可使用切比雪夫大数定律; (B) 不可使用切比雪夫大数定律;(C) 可使用辛钦大数定律; (D) 不可使用辛钦大数定律. (3).设随机事件A 在第i 次独试验中发生的概率为i p ,n i ,,2,1 =.m 表示事件A 在n次试验中发生的次数,则对于任意正数ε恒有=⎪⎪⎭⎫⎝⎛<∑-=∞→εni i n p n n mP 11lim ( ). (A)1; (B) 0; (C)21; (D)不可确定. (4).设 ,,,,21n X X X 相互独立且都服从参数为λ的指数分布,则下述选项中成立的是( ).(A) )(lim 1x x n X Pn i i n Φ=⎪⎪⎪⎪⎭⎫ ⎝⎛≤-∑=∞→λλ; (B) )(lim 1x x nn X P n i i n Φ=⎪⎪⎪⎪⎭⎫⎝⎛≤-∑=∞→; (C) )(lim 1x x nn X P n i i n Φ=⎪⎪⎪⎪⎭⎫⎝⎛≤-∑=∞→λ; (D) )(lim 1x x n X P n i i n Φ=⎪⎪⎪⎪⎭⎫ ⎝⎛≤-∑=∞→λλ. (5).设随机变量序列 ,,,,21n X X X 相互独立同分布, 0)(=i X E ,2)(σ=i X D ,且)(4i X E 存在,则对任意0>ε,下述选项中正确的是( ).(A) 11lim 21=⎪⎪⎭⎫ ⎝⎛<-∑=∞→εσni i n X n P ; (B) 11lim 212≤⎪⎪⎭⎫⎝⎛<-∑=∞→εσni i n X n P ; (C) 11lim 212=⎪⎪⎭⎫ ⎝⎛<-∑=∞→εσni i n X n P ; (D) 01lim 212=⎪⎪⎭⎫⎝⎛<-∑=∞→εσni i n X n P第六章练习题1. 在总体)3.6,52(2N 中随机抽取一容量为36的样本,求样本均值X 落在50.8至53.8之间的概率.解:由题意:)363.6,2.5(~2N X , 8293.0]8729.01[9564.0)1429.1()7143.1()63.6528.50()63.6528.53()8.538.50(=--=-Φ-Φ=-Φ--Φ=<<∴X P 2. 已知某种白炽灯泡的使用寿命服从正态分布, 在某星期所生产的该种灯泡中随机抽取10只,测得其寿命(以小时计)为:1067 919 1196 785 1126 936 918 1156 920 948试用样本数字特征法求出寿命总体的均值μ和方差2σ的估计值,并估计这种灯泡的寿命大于1300小时的概率.解:由题设知:样本容量10=n 样本均值1.997)9489201156918936112678511969191067(101=+++++++++=X 样本方差17305)1.997109489201156918936112678511969191067(91222222222222=⨯-+++++++++=S.0107.09893.01)3026.2(1)55.1311.9971300(1)173051.9971300(1)1300(1)1300(=-=Φ-=-Φ-=-Φ-≈≤-=>X P X P3. 设各种零件的重量都是随机变量, 它们相互独立, 且服从相同的分布,其数学期望为0.5公斤,均方差为0.1公斤,问5000只零件的总重量超过2510公斤的概率是多少?(提示:当n 较大时,随机变量之和n X X X X +++= 21近似地服从正态分布,以下第6题,第7题也适用)解:由题设知5000=n ,已知)50001.0,5.0(~5000500050001N X X X i i 近似∑===33.06700.01)444.0(1)0045.0002.0(1)50001.05.05020.0(1)5020.0(1)5020.0()500025105000()2510(=-=Φ-=Φ-=-Φ-=≤-=>=>=>∴X P X P X P X P4. 部件包括10个部分, 每部分的长度是一个随机变量, 它们相互独立, 且服从同一分布. 其数学期望为2毫米, 均方差为0.05毫米,规定总长度为1.020±毫米时产品合格, 试求产品合格的概率.解:由题设知102,1,05.0)(,2,10 ====i X D EX n i i则总长度∑==101i iXX ,且5.005.010,20210=⨯==⨯=DX EX则产品合格的概率为.1114.01)1414.0(2)5.01.0()5.01.0()1.0201.020(=-Φ=-Φ-Φ=+≤≤-X P 5. 计算机进行加法时, 对每个加数取整(即取最接近于它的整数),设所有的取整误差是相互独立的,且它们都在(-0.5,0.5)上服从均匀分布.(1) 若将1500个数相加,问误差总和的绝对值超过15的概率是多少? (2) 几个数加在一起, 可使得误差总和的绝对值小于10的概率为0.90?解:由题设知15002,1,121)(,0,1500 ====i X D EX n i i则误差总和∑==15001i i X X ,且121500,0==DX EX(1).1802.0)]3416.1(1[2]1)12150015(2[1)15(1)15(=Φ-=-Φ-=≤-=>X P X P(2)∑==ni i n X X 1且12,0n DX EX n == 90.01)1210(21)10(=-Φ==<n X P n441121095.0)1210(=⇒⇒=Φ⇒n n n6.设总体X 具有概率密度 ⎩⎨⎧<<=其它0102)(x x x f从总体X 抽取样本4321,,,X X X X ,求最大顺序统计量max =T (4321,,,X X X X )的概率密度.解:)()]([4)(,)]([)(34t f t F t f t F t F T T ==⎪⎩⎪⎨⎧≥<<≤==⎰∞-111000)()(2t t t t dt t f t F t⎩⎨⎧<<==∴otherst t t f t F t f T 0108)()]([4)(737.已知一台电子设备的寿命T (单位:h )服从指数分布,其概率密度为⎪⎩⎪⎨⎧≤>=-0,00,001.0)(001.0t t e t f t现在检查了100台这样的设备,求寿命最短的时间小于10h 的概率解:设min =M (10021,X X X ))()](1[100)(,)](1[1)(99100m f m F m f m F m F M M -=--=⎩⎨⎧>-==-∞-⎰othersm e dt t f m F mm001)()(001.0⎩⎨⎧>=-=∴-othersm e m f m F m f M 01.0)()](1[100)(1.099则1.01)10(e M P -=<8.设n X X X ,,,21 是来自正态总体),(2σμN 的简单随机样本,2n S 为样本方差,求满足下式的最小值n : 95.0)5.1(22≥≤σn S P .解:因为)1(~)1(222-χσ-n S n n 95.0)5.1(22=≤σn S P 95.0))1(5.1)1((22=-≤σ-⇒n S n P n 27=⇒n9.设1021,,,X X X 为)3.0,0(2N 的一个样本,求∑>=1012}44.1{i i X P解:因为∑=χ10122)9(~3.0/i i X∑=>1012}44.1{i i X P ∑=>=101222}3.0/44.13.0/{i i X P1.0}163.0/{110122=≤-=∑=i i X P10.假定),(21X X 是取自正态总体),0(2σN 的一个样本,试求概率].4)/()[(221221<-+X X X X P解:),1.0(~221N X X σ+),1.0(~221N X X σ-)1(~2)(22221χσ+∴X X ,)1(~2)(22221χσ-∴X X)1,1(~)/()(221221F X X X X -+∴ .7.0]4)/()[(221221=<-+∴X X X X P11.已知321,,X X 是从正态总体),0(2σN 抽取的样本.证明:∑+∑-==-=-16122121612212)(/)(i i i i i i X X X X T )16,16(~F证明:),1.0(~2212N X X ii σ+-),1.0(~2212N X X ii σ--),16(~2)(216122212χσ+∑=-i i i X X ,),16(~2)(216122212χσ-∑=-i i i X X ∑∑=-=-+-=∴16122121612212)(/)(i i i i i i X X X X T)16,16(~2)(/2)(1612221216122212F X X X X i i i i i i ∑∑=-=-ο+ο-=12.选择题(1)、设12(,,,)n X X X 为来自总体X 的一个样本,则n X X X ,,,21 必然满足(C ) (A )独立不同分布 (B )不独立但同分布 (C )独立同分布 (D )无法确定(2)、设),,,(21n X X X 为来自总体),(~2σμN X 的一个样本,其中2,μσ未知,则下 面不是统计量的是(D ) (A )i X (B )11n i i X X n ==∑ (C )211()1n i i X X n =-∑- (D )211()n i i X n μ=-∑ (3)、设总体)16,3(~N X ,126,,,X X X 为来自总体X 的一个样本,X 为样本均值,则 (没正确答案)(A ))1,0(~3N X - (B ))1,0(~)3(4N X - (C ))1,0(~43N X - (D ))1,0(~23N X - (4)、设),,,(21n X X X (1)n >来自总体)1,0(~N X ,X 与S 分别为样本均值和样本标准差,则有(C ) (A )(0,1)X N (B )(0,1)nXN (C) 221()ni i X n χ=∑ (D )(1)Xt n S-(5)、设),,,(21n X X X 为来自总体)1,0(~N X 的一个样本,统计量Y ,则(B )(A )2(1)Y n χ- (B) (1)Yt n - (C) (1,1)Y F n - (D)(1,1)YF n -第七章练习题1. 对目标独立地进行射击,直到命中为止,假设n 轮(n >1)这样射击,各轮射击的次数相应地为n k k k ,,,21 ,试求命中率p 的极大似然估计和矩估计.解:2.设某计算机用来产生某彩票摇奖时所需的10个随机数0,1,2, …, 9.设某人用该机做了100天试验,每天都是第一次摇到数字1为止.此100天中各天的试验次数分布如下:假设每次试验相互独立且产生数字1的概率p 保持不变.(1)求p 的最大然估计值p ˆ;(2)如果所得1.0ˆ≠p,请做出所有可能的解释;(3)求p 的矩估计值p ˆ. 解:3.已知总体的概率密度函数为⎪⎩⎪⎨⎧≤≤+=其它010)1()(x x x f ββ现抽取n =6的样本,样本观察值分别为0.2,0.3,0.9,0.7,0.8,0.7试用矩估计法和极大似然估计法求出β的估计量.解:4.设总体服从瑞利分布00,0,)(22>⎪⎩⎪⎨⎧<≥=-θθθx x ex x f xh 为参数n X X X ,,,21 为简单随机样本求θ的极大似然估计量;(2)该估计量是否为无偏估计量?说明理由.解:5.设随机变量X 在区间],0(θ上服从均匀分布,由此总体抽出的一随机样本n X X X ,,,21 .试证明θ的有偏估计)()1(1ˆn n X n n +=θ及一个无偏估计)()2(1ˆn n X nn +=θ都是θ的一致估计.证明:8.设总体X 在区间],0[θ上服从均匀分布,其中0>θ是未知参数,求θ的最大似然估计量,并判断它是否为θ的无偏估计.解:9.某车间生产的螺杆直径服从正态分布,今随机抽取5只,测得直径(单位:mm )为: 22.5 21.5 22.0 21.8 21.4(1) 已知0.3σ=,求μ的0.95置信区间; (2) σ未知,求μ的0.95置信区间. 解:10.从总体X 中抽取样本321,X X X ,,证明下列三个统计量,632ˆ3211X X X ++=μ,442ˆ3212X X X ++=μ,333ˆ3213X XX ++=μ 都是总体均值μ=)(X E 的无偏估计量;并确定哪个估计量更有效.解:11.从正态总体中抽取容量为5的样本,其观测值为: 1.86 , 3.22 , 1.46 , 4.01 , 2.64 ,σ及标准差σ的0.95置信区间.试求正态总体方差2解:12.为了研究施肥和不施肥对某钟农作物产量的影响,选了十三个小区在其他条件相同的情况下进行对比实验,收获量如下表:均产量之差的置信水平为0.95的置信区间.解:13.从甲乙两个生产蓄电池的工厂的产品中,分别抽取一些样品,测得蓄电池的电容量(A.h)如下:甲厂:144 141 138 142 141 143 138 137;乙厂:142 143 139 140 138 141 140 138 142 136.设两个工厂生产的蓄电池的容量分别服从正态分布),(2xx N σμ及),(2y y N σμ,求: (1)电容量的方差比22yx σσ的置信水平为95%的置信区间;(2)电容量的均值差y x μμ-的置信水平为95%的置信区间(假定22y x σσ=).解:14.从汽车轮胎厂生产的某种轮胎中抽取个10样品进行磨损试验,直至轮胎行驶到磨坏为止,测得它们的行驶路程(km)如下:41250 41010 42650 38970 40200 42500 43500 40400 41870 39800 设汽车行驶路程服从正态分布),(~2σμN X ,求:(1)μ的置信水平为95%的单侧置信下限;(2)σ的置信水平为95%的单侧置信上限.解:16.选择题 (1)、θ为总体X 的未知参数,θ的估计量为θ,则有 (A )θ是一个数,近似等于θ; (B )θ是一个随机变量;(C )θ是一个统计量,且()E θθ=; (D )当n 越大,θ的值可任意靠近θ. (2)、设12(,)X X 为来自任意总体X 的一个容量为2的样本,则在下列EX 的无偏线性估 计量中,最有效的估计量是(A )122133X X + (B )121344X X + (C )122355X X + (D )121()2X X +(3)、设θ是参数θ的无偏估计,且有()0D θ≠,则2θ必为2()θ的(A )无偏估计 (B )一致估计 (C )有效估计 (D )有偏估计(4)、设总体2(,)XN μσ,其中2σ已知,若已知样本容量和置信度1α-均不变,则对于不同的样本观察值,总体均值μ的置信区间的长度(A )变长 (B )变短 (C) 不变 (D )不能确定(5)、已知一批零件的长度X (单位:cm )服从正态总体(,1)N μ,从中随机抽取16个零件,测得其长度的平均值为40cm ,则μ的置信度为0.95的置信区间是 (注:标准正态分布函数值(1.96)0.975,(1.645)0.95Φ=Φ=)(A )(31.95, 40.49) (B) (39.59, 40.41) (C) (-∞, 31.95) (D) (40.49, +∞)第八章练习题1.一个停车场,有12个位置排成一行,某人发现有8个位置停了车,而有4个相连的位置空着。
一、随机事件和概率考试内容:随机事件(可能发生可能不发生的事情)与样本空间(包括所有的样本点) 事件的关系(包含相等和积差互斥对立)与运算(交换分配结合德摸根对差事件文氏图) 完全事件组(所有基本事件的集合) 概率的概念概率的基本性质(非负性规范性可列可加性) 古典型概率几何型概率条件概率概率的基本公式事件的独立性独立重复试验考试要求:1.了解样本空间(基本事件空间)的概念,理解随机事件的概念,掌握事件的关系与运算.2.理解概率、条件概率的概念,掌握概率的基本性质,会计算古典型概率和几何型概率(弄清几何意义),掌握概率的加法公式(PAUB=PA+PB--PAB)、减法公式(P(A--B)=PA--PAB)、乘法公式(PAB=PA*PB|A)、全概率公式(关键是对S进行正确的划分),以及贝叶斯公式.3.理解事件的独立性(PAB=PA*PB)的概念,掌握用事件独立性进行概率计算;理解独立重复试验的概念,掌握计算有关事件概率的方法.整理重点:1. 随机事件:可能发生也可能给不发生的事件。
0<概率<1。
2. 样本空间:实验中的结果的每一个可能发生的事件叫做实验的样本点,实验的所有样本点构成的集合叫做样本空间,大写字母S表示。
3. 事件的关系:(1)包含:事件A发生必然导致事件B发生,称事件B包含事件A。
(2)相等:事件A包含事件B且事件B包含事件A。
(3)和:事件的并,记为A∪B。
(4)差:A-B称为A与B的差,A发生而B不发生,A-B=A-AB。
(5)积:事件的交,事件A与B都发生,记为AB或A∩B。
(6)互斥:事件A与事件B不能同时发生,AB=空集。
(7)对立:A∪B=S。
4. 集合的运算:(1)交换律:A∪B=B∪A AB=BA (2结合律:(A∪B)∪C=A∪(B∪C) (AB)C=A(B C) (3)分配率:A (B∪C)=AB∪AC A∪(BC)=(A∪B)(A∪C) (4)德*摩根定律5. 完全事件组:如果n个事件中至少有一个事件一定发生,则称这n个事件构成完全事件组(特别地:互不相容的完全事件组)。
实验12 数据的基本统计分析一、实验目的随机变量的分布函数,密度曲线,能进行初步的统计分析,大样本数据的处理,直方图.二、实验内容及要求pdf(probability density function.概率密度函数),cdf(cumulative distribution function.累积分布函数),rnd(Random),inv(Inverse),stat(Mean and variance,statistic)1. 随机变量与分布表1.12 密度函数与分布函数如果后缀pdf 分别改为cdf ,inv ,rnd ,stat 就得到相应的随机变量的累积分布函数、分位数、随机数的生成以及均值与方差.计算正态分布的分布函数、概率密度函数值、做出密度函数曲线、求出分位数的功能.【例1.110】 已知2~(2,0.5)X N ,试求:(1){}01P X <<,{}3P X ≤;(2){}0.6827______P X x x ==≤, . (2)做出[-2.5,3.5]上的概率密度曲线; 解:normcdf (,,)p x μσ= 算{}P X x ≤.(1){}01P X <<normcdf (1,2,0.5)normcdf (0,2,0.5)=-=0.0227 {}3P X ≤=normcdf (3,2,0.5)=0.9772 (2)计算正态分布的分位数利用:norminv(,,)x p μσ=norminv(0.6827,2,0.5)x == 2.23763116875765(3)函数normspec([,],,)p a b μσ=做出在[a ,b ]上的正态密度曲线:normspec([ 2.5,3.5],2,0.5)p =-Probability Between Limits is 0.99865Critical V alue0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -3-2-10 1 234图1.38 [-2.5,3.5]上的概率密度曲线2. 数据特征 设12,,,n X X X 是一个简单随机样本,样本的一组观测值12,,,n x x x ,函数分析数据特征,如表1.13所示.表1.13 函数【例1.111】已知数据:459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851计算其数据特征.解:>>a=[ 459, 362,…,310, 851];>>b=a(:) ;mean(b),median(b), trimmean(b,10), geomean(b), harmmean(b), range(b),var(b),std(b),iqr(b),mad(b)注意:切尾平均有两个输入,后者为百分数.结果如表1.14所示.表1.14 结果【例1.112】已知数据:1,1,1,1,1,1,100;计算其数据特征,由此你有何发现?解:>>x=[1,1,1,1,1,1,100];>>y=[mean(x),median(x),geomean(x),harmmean(x),trimmean(x,25);range(x),var(x),std(x),iqr(x),mad(x)]计算结果为:y=15.143 1 1.9307 1.1647 1 99 1400.1 37.4180 24.245如果数据全部为1,则各种平均值都应等于1,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是稳健的.3 统计量计算矩统计量、峰度、偏度和变异系数的函数表1.15所示.表1.15 函数其中,x为数据,n为阶数,若x为矩阵可得矩阵各列的矩、峰度、偏度和变异系数,但是计算变异系数的公式应为:Std(x)./abs(mean(x))(同维向量应该点除).偏度系数s等于3阶中心矩与标准差的3次幂的比,用于刻画数据分布的对称性,当s>0时称正偏,当s<0时称负偏,当s接近于零时,可以认为分布是对称的.峰度系数k等于4阶中心矩与标准差的4次幂的比,它反映了分布曲线的陡缓程度,正态分布的峰度为3,若k>3则表明数据分布有较厚的尾部.变异系数用于刻画数据的变化大小,不同指标的变异系数常用来计算客观性权重.【例1.114】表1.16给出了15种资产的收益率r i(%)和风险损失率q i(%),计算峰度与偏度.表1.16 例题解:>>x=[9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15];>>y=[42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23];>>sx=skewness(x)= 0.4624, kx=kurtosis(x)= 1.8547,>>sy=skewness(y)= -0.4215, ky=kurtosis(y)= 2.2506从计算结果可知:收益率是正偏,而风险损失率为负偏;二者峰度都小于3属于平阔峰.4 有丢失数据时的统计量在解决实际问题时经常遇到有丢失数据的情形,在MATLAB中提供了NAN函数,用于有丢失数据时的统计量.nanmax % 忽略丢失数据NAN的最大值.nanmean% 忽略丢失数据NAN的均值.nanmedian% 忽略丢失数据NAN的中位数.nanmin % 忽略丢失数据NAN的最小值.nanstd % 忽略丢失数据NAN的标准差.nansum % 忽略丢失数据NAN的和.5 大样本数据的处理通常大样本数据有以下的处理方法.(1)标准化将某矩阵的各列(行)元素减去该列(行)的均值,再比上该列的标准差. 【例1.115】将表1.17中的数据标准化.表1.17 各地区“三资”工业企业主要经济效益指标(2001年)解:将数据粘贴到MATLAB的编辑窗口(即建立M文件中).a=[26.19,9.83,54.87,...,29.55,6.11,59.39,0.95,7.08, (94)25];此时,发现有一行数据不全(西藏),为了分析问题的方便,我们可以删除此行(用%),标准化编程如下:>>format long %此步是为了数据输出的数位比较多>>m1=mean(a(2:31,:)); %求各列均值(除去第一行元素)>>m=m1(ones(30,1),:); %30行矩阵各行都是m1>>s1=std(a(2:31,:)); %求各列标准差(除去第一行元素)>>s=s1(ones(30,1),:); %30行矩阵各行都是s1>>A=(a(2:31,:)-m)./s %标准化(2)都与某一个数据进行比较(比如都与全国的各项指标进行比较)>>b1=a(1,:);>>b=b1(ones(30,1),:);>>B=(a(2:31,:)-b)./b6 直方图与概率纸检验函数为了直观地了解随机变量的分布特征,直方图是广泛使用的方法.格式:hist(data,k).说明:data是原始数据,该命令将区间(min(data),max(data))分成k等份,并描绘出频数直方图,k的缺省值为10. 如果需要事先给出小区间,则将区间的中点存放在向量nb然后用命令:[n,x] = hist(data),或[n,x] = hist (data,k),或[n,x] = hist (data,nb),其中,n返回k个小区间的频数,x返回小区间的中点.在MATLAB中的概率纸检验函数.格式:normplot(data)%如果数据data服从正态分布,则做出的图形基本上都位于一条直线上.weibplot(data)%如果数据data 服从威布尔分布,则做出的图形基本上都位于一条直线上,【例1.116】 作出例1.111数据的直方图,该数据服从正态分布还是威布尔分布? 解:输入命令hist( a (:),30)得到图1.39.0 200 400 600 800 1000 1200 10987654321图1.39 直方图从图1.39所示的直方图发现数据比较接近于正态分布,如何检验这一猜测,我们利用MATLAB 命令normplot(a(:))进行检验. Normal Probability PlotData 100 200 300 400 500 600 700 800 900 1000 1100 0.997 0.99 0.980.950.900.750.500.250.100.050.020.01 0.003图1.40 例1.111数据的图形从图1.40中可见数据点基本上都位于直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为600,标准差为196.629,所以数据服从2N.(600,196.629)。