第四讲概率与统计理科答案
- 格式:pdf
- 大小:260.44 KB
- 文档页数:12
专题10 概率与统计1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 A .0.5 B .0.6 C .0.7D .0.8【答案】C【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C .【名师点睛】本题考查抽样数据的统计,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.2.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差 【答案】A【解析】设9位评委评分按从小到大排列为123489x x x x x x <<<<<.则①原始中位数为5x ,去掉最低分1x ,最高分9x 后剩余2348x x x x <<<<,中位数仍为5x ,A 正确; ②原始平均数1234891()9x x x x x x x =<<<<<,后来平均数23481()7x x x x x '=<<<,平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确; ③2222111[()()()]9q S x x x x x x =-+-++-,22222381[()()()]7s x x x x x x '=-'+-'++-',由②易知,C 不正确;④原极差91x x =-,后来极差82x x =-,显然极差变小,D 不正确.故选A . 3.【2019年高考浙江卷】设0<a <1,则随机变量X 的分布列是则当a 在(0,1)内增大时, A .()D X 增大B .()D X 减小C .()D X 先增大后减小D .()D X 先减小后增大【答案】D【分析】研究方差随a 变化的增大或减小规律,常用方法就是将方差用参数a 表示,应用函数知识求解.本题根据方差与期望的关系,将方差表示为a 的二次函数,二次函数的图象和性质解题.题目有一定综合性,注重重要知识、基础知识、运算求解能力的考查. 【解析】方法1:由分布列得1()3aE X +=, 则2222111111211()(0)()(1)()333333926a a a D X a a +++=-⨯+-⨯+-⨯=-+, 则当a 在(0,1)内增大时,()D X 先减小后增大.故选D .方法2:则222221(1)222213()()()0[()]3399924a a a a D X E X E X a +-+=-=++-==-+,则当a 在(0,1)内增大时,()D X 先减小后增大.故选D .【名师点睛】易出现的错误有,一是数学期望、方差以及二者之间的关系掌握不熟,无从着手;二是计算能力差,不能正确得到二次函数表达式.4.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________. 【答案】53【解析】由题意,该组数据的平均数为678891086+++++=,所以该组数据的方差是22222215[(68)(78)(88)(88)(98)(108)]63-+-+-+-+-+-=. 5.【2019年高考全国Ⅱ卷理数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________. 【答案】0.98【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【解析】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10201040++=,所以该站所有高铁平均正点率约为39.20.9840=. 【名师点睛】本题考查了概率统计,渗透了数据处理和数学运算素养,侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.6.【2019年高考全国Ⅰ卷理数】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是______________. 【答案】0.18【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【解析】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【名师点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算. 7.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【答案】(1)a =0.35,b =0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00. 【解析】(1)由已知得0.70=a +0.20+0.15,故a =0.35. b =1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为 2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.8.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某打成10:10平后,每球交换发球权,先多得2分的一方获胜,该比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某双方10:10平后,甲先发球,两人又打了X 个球该比赛结束. (1)求P (X =2);(2)求事件“X =4且甲获胜”的概率. 【答案】(1)0.5;(2)0.1.【解析】(1)X =2就是10∶10平后,两人又打了2个球该比赛结束, 则这2个球均由甲得分,或者均由乙得分. 因此P (X =2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X =4且甲获胜,就是10∶10平后,两人又打了4个球该比赛结束, 且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分. 因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.9.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望; (2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率. 【答案】(1)分布列见解析,()2E X ;(2)20243.【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333kkkP X k k -===.所以,随机变量X 的分布列为随机变量X 的数学期望()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y , 则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y =====. 由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立, 从而由(1)知()({3,1}{2,0})P M P X Y X Y =====(3,1)(2,0)P X Y P X Y ===+== (3)(1)(2)(0)P X P Y P X P Y ===+==824120279927243=⨯+⨯=. 10.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=. (2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”. 由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====. 所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD == ()()()()P C P D P C P D =+ 0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”. 假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化, 则由上个月的样本数据得33011()C 4060P E ==.答案示例1:可以认为有变化. 理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化.理由如下: 事件E 是随机事件,P (E )比较小,一般不容易发生, 但还是有可能发生的,所以无法确定有没有变化.11.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性. 【答案】(1)分布列见解析;(2)(i)证明见解析,(ii) 45 127p =,解释见解析. 【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--, (1)(1)P X αβ==-,所以X 的分布列为(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-, 即114()i i i i p p p p +--=-. 又因为1010p p p -=≠, 所以1{}(0,1,2,,7)i i p p i +-=为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-, 所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=. 4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时, 认为甲药更有效的概率为410.0039257p =≈, 此时得出错误结论的概率非常小,说明这种试验方案合理.12.【广西桂林市、崇左市2019届高三下学期二模联考】在某项测试中,测量结果ξ服从正态分布2(1,)(0)N σσ>,若(01)0.4P ξ<<=,则(02)P ξ<<=A .0.4B .0.8C .0.6D .0.2【答案】B【解析】由正态分布的图象和性质得(02)2(01)20.40.8P P ξξ<<=<<=⨯=.故选B . 【名师点睛】本题主要考查正态分布的图象和性质,考查正态分布指定区间的概率的求法,意在考查学生对这些知识的理解掌握水平和分析推理能力.13.【河南省洛阳市2019届高三第三次统一考试】已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A .100,10B .100,20C .200,10D .200,20【答案】D【解析】由题得样本容量为(350020004500)2%100002%200++⨯=⨯=, 抽取的高中生人数为20002%40⨯=人,则近视人数为400.520⨯=人,故选D .14.【陕西省2019届高三年级第三次联考】同时抛掷2枚质地均匀的硬币4次,设2枚硬币均正面向上的次数为X ,则X 的数学期望是 A .1B .2C .32D .52【答案】A【分析】先计算依次同时抛掷2枚质地均匀的硬币,恰好出现2枚正面向上的概率,进而利用二项分布求数学期望即可.【解析】∵一次同时抛掷2枚质地均匀的硬币,恰好出现2枚正面向上的概率为111224⨯=, ∴1~(4,)4X B ,∴1()414E X =⨯=.故选A . 【名师点睛】求离散型随机变量期望的一般方法是先求分布列,再求期望.如果离散型随机变量服从二项分布~(,)B n p ,也可以直接利用公式()E np ξ=求数学期望.15.【江西省新八校2019届高三第二次联考】某学校高一年级1802人,高二年级1600人,高三年级1499人,先采用分层抽样的方法从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为 A .35,33,30B .36,32,30C .36,33,29D .35,32,31【答案】B【分析】先将各年级人数凑整,从而可确定抽样比;再根据抽样比计算得到各年级抽取人数. 【解析】先将每个年级的人数凑整,得高一:1800人,高二:1600人,高三:1500人,则三个年级的总人数所占比例分别为1849,1649,1549, 因此,各年级抽取人数分别为18983649⨯=,16983249⨯=,15983049⨯=,故选B . 16.【浙江省三校2019年5月第二次联考】已知甲口袋中有3个红球和2个白球,乙口袋中有2个红球和3个白球,现从甲、乙口袋中各随机取出一个球并相互交换,记交换后甲口袋中红球的个数为ξ,则()E ξ=A .145 B .135 C .73D .83【答案】A【分析】先求出ξ的可能取值及取各个可能取值时的概率,再利用1122()i i E p p p ξξξξ=++++可求得数学期望.【解析】ξ的可能取值为2,3,4,2ξ=表示从甲口袋中取出一个红球,从乙口袋中取出一个白球,故339(2)5525P ξ==⨯=;3ξ=表示从甲、乙口袋中各取出一个红球,或从甲、乙口袋中各取出一个白球,故322312(3)555525P ξ==⨯+⨯=;4ξ=表示从甲口袋中取出一个白球,从乙口袋中取出一个红球,故224(4)5525P ξ==⨯=,所以912414()2342525255E ξ=⨯+⨯+⨯=.故选A . 17.【福建省泉州市2019届高三第二次(5月)质检】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则 A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s ><【答案】A【分析】分别根据数据的平均数和方差的计算公式,求得2,x s 的值,即可得到答案.【解析】由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+, 22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<, 所以275s <.故选A .【名师点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.18.【广东省汕头市2019届高三第二次模拟考试(B 卷)】在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分【答案】D【解析】由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得:平均分等于450.1550.15650.2750.3850.15⨯+⨯+⨯+⨯+⨯+950.170.5⨯=,故C 正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为0.05701071.670.3+⨯≈,故D 错误.故选D . 19.【天津市南开中学2019届高三模拟试题】《中国诗词大会》是央视推出的一档以“赏中华诗词,寻文化基因,品生活之美”为宗旨的大型文化类竞赛节目,邀请全国各个年龄段、各个领域的诗词爱好者共同参与诗词知识比拼.“百人团”由一百多位来自全国各地的选手组成,成员上至古稀老人,下至垂髫小儿,人数按照年龄分组统计如下表:(1)用分层抽样的方法从“百人团”中抽取6人参加挑战,求从这三个不同年龄组中分别抽取的挑战者的人数;(2)在(1)中抽出的6人中,任选2人参加一对一的对抗比赛,求这2人来自同一年龄组的概率. 【答案】(1)1,3,2;(2)415. 【分析】(1)先求出样本容量与总体个数的比,由此利用分层抽样的方法能求出从这三个不同年龄组中分别抽取的挑战者的人数;(2)从分层抽样的方法从“百人团”中抽取6人参加挑战,这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2.从抽出的6人中,任选2人参加一对一的对抗比赛,基本事件总数26C 15n ==,这2人来自同一年龄组包含的基本事件个数为2232C C 4m =+=,由此能求出这2人来自同一年龄组的概率.【解析】(1)∵样本容量与总体个数的比是6110818=, ∴样本中包含3个年龄段落的个体数分别是:年龄在[7,20)的人数为6108⨯18=1, 年龄在[20,40)的人数为6108⨯54=3, 年龄在[40,80)的人数为6108⨯36=2, ∴从这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2. (2)从分层抽样的方法从“百人团”中抽取6人参加挑战,这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2.从抽出的6人中,任选2人参加一对一的对抗比赛,基本事件总数为26C 15n ==,这2人来自同一年龄组包含的基本事件个数为2232C C 4m =+=,∴这2人来自同一年龄组的概率415m P n ==. 20.【2019北京市通州区三模】为调查某公司五类机器的销售情况,该公司随机收集了一个月销售的有关数据,公司规定同一类机器销售价格相同,经分类整理得到下表:利润率是指:一台机器销售价格减去出厂价格得到的利润与该机器销售价格的比值. (1)从该公司本月卖出的机器中随机选一台,求这台机器利润率高于0.2的概率;(2)从该公司本月卖出的销售单价为20万元的机器中随机选取2台,求这两台机器的利润率不同的概率;(3)假设每类机器利润率不变,销售一台第一类机器获利1x 万元,销售一台第二类机器获利2x 万元,…,销售一台第五类机器获利5x ,依据上表统计数据,随机销售一台机器获利的期望为()E x ,设123455x x x x x x ++++=,试判断()E x 与x 的大小.(结论不要求证明)【答案】(1)13;(2)1021;(3)()E x x <.【分析】(1)先由题意确定,本月卖出机器的总数,再确定利润率高于0.2的机器总数,即可得出结果;(2)先由题意确定,销售单价为20万元的机器分别:是第一类有5台,第三类有10台,共有15台,记两台机器的利润率不同为事件B ,由11510215C C ()C P B =即可结果;(3)先由题意确定,x 可能取的值,求出对应概率,进而可得出()E x ,再由123455x x x x x x ++++=求出均值,比较大小,即可得出结果.【解析】(1)由题意知,本月共卖出30台机器, 利润率高于0.2的是第一类和第四类,共有10台. 设“这台机器利润率高于0.2”为事件A ,则101()303P A ==. (2)用销售总额除以销售量得到机器的销售单价,可知第一类与第三类的机器销售单价为20万,第一类有5台,第三类有10台,共有15台,随机选取2台有215C 种不同方法, 两台机器的利润率不同则每类各取一台有11510C C 种不同方法,设两台机器的利润率不同为事件B ,则11510215C C 10()C 21P B ==. (3)由题意可得,x 可能取的值为8,5,3,1051(8)306P x ===,21(5)3015P x ===, 1083(3)305P x +===,51(10)306P x ===,因此113177853*******(55)E x =⨯+⨯+⨯+⨯=;又8531032955x ++++==,所以()E x x <.21.【江西省新八校2019届高三第二次联考】某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:从采购单的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示抽取的是精品果的数量,求X 的分布列及数学期望()E X . 【答案】(1)96625;(2)第一种方案;(3)分布列见解析,6()5E X =.【分析】(1)计算出从100个水果中随机抽取一个,抽到礼品果的概率;则可利用二项分布的概率公式求得所求概率;(2)计算出方案2单价的数学期望,与方案1的单价进行比较,选择单价较低的方案;(3)根据分层抽样原则确定抽取的10个水果中,精品果4个,非精品果6个;则X 服从超几何分布,利用超几何分布的概率计算公式可得到每个X 取值对应的概率,从而可得分布列;再利用数学期望的计算公式求得结果.【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201()1005P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5X B , 所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625P X ===, (2)设方案2的单价为ξ,则单价的期望值为134216548848()1618222420.61010101010E ξ+++=⨯+⨯+⨯+⨯==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案.(3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,则36310C 1(0)C 6P X ===;2164310C C 1(1)C 2P X ===; 1264310C C 3(2)C 10P X ===;34310C 1(3)C 30P X ===,所以X 的分布列如下:所以()01236210305E X =⨯+⨯+⨯+⨯= 【名师点睛】本题考查二项分布求解概率、数学期望的实际应用、超几何分布的分布列与数学期望的求解问题,关键是能够根据抽取方式确定随机变量所服从的分布类型,从而可利用对应的概率公式求解出概率.。
专题15概率与统计(选择题、填空题)(理科专用)1.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为1,2,3,且3>2>1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为甲则甲=2(1−2)13+221(1−3)=21(2+3)−4123记该棋手在第二盘与乙比赛,且连胜两盘的概率为乙则乙=2(1−1)23+212(1−3)=22(1+3)−4123记该棋手在第二盘与丙比赛,且连胜两盘的概率为丙则丙=2(1−1)32+213(1−2)=23(1+2)−4123则甲−乙=21(2+3)−4123−22(1+3)−4123=21−23<0乙−丙=22(1+3)−4123−23(1+2)−4123=22−31<0即甲<乙,乙<丙,则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D2.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C 72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率=21−721=23.故选:D.3.【2021年甲卷理科】已知12,F F 是双曲线C 的两个焦点,P 为C 上一点,且121260,3F PF PF PF ∠=︒=,则C 的离心率为()A 72B .132C D 【答案】A 【解析】【分析】根据双曲线的定义及条件,表示出12,PF PF ,结合余弦定理可得答案.【详解】因为213PF PF =,由双曲线的定义可得12222PF PF PF a -==,所以2PF a =,13PF a =;因为1260F PF ∠=︒,由余弦定理可得2224923cos60c a a a a =+-⨯⋅⋅︒,整理可得2247c a =,所以22274a c e ==,即2e =.故选:A 【点睛】关键点睛:双曲线的定义是入手点,利用余弦定理建立,a c 间的等量关系是求解的关键.4.【2021年甲卷理科】将4个1和2个0随机排成一行,则2个0不相邻的概率为()A .13B .25C .23D .45【答案】C 【解析】【分析】采用插空法,4个1产生5个空,分2个0相邻和2个0不相邻进行求解.【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,若2个0相邻,则有155C =种排法,若2个0不相邻,则有2510C =种排法,所以2个0不相邻的概率为1025103=+.故选:C.5.【2021年乙卷理科】在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A .79B .2332C .932D .29【答案】B 【解析】【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出.【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为13323124432A S =-⨯⨯=,所以()2332A S P A S Ω==.故选:B.【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出.6.【2021年新高考1卷】有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】【分析】根据独立事件概率关系逐一判断【详解】11561()()()()6636366P P P P =====甲,乙,丙丁,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁,1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙,故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立7.【2021年新高考2卷】某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是()A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D 【解析】【分析】由正态分布密度曲线的特征逐项判断即可得解.【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误.故选:D.8.【2020年新课标1卷理科】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x=+【答案】D 【解析】【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.9.【2020年新课标2卷理科】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A .10名B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,9001850=,故至少需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.10.【2020年新课标3卷理科】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B 【解析】【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.11.【2020年新高考1卷(山东卷)】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A .62%B .56%C .46%D .42%【答案】C 【解析】【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.12.【2019年新课标1卷理科】我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“——”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .1116【答案】A【分析】本题主要考查利用两个计数原理与排列组合计算古典概型问题,渗透了传统文化、数学计算等数学素养,“重卦”中每一爻有两种情况,基本事件计算是住店问题,该重卦恰有3个阳爻是相同元素的排列问题,利用直接法即可计算.【详解】由题知,每一爻有2种情况,一重卦的6爻有62情况,其中6爻中恰有3个阳爻情况有36C ,所以该重卦恰有3个阳爻的概率为3662C =516,故选A .【点睛】对利用排列组合计算古典概型问题,首先要分析元素是否可重复,其次要分析是排列问题还是组合问题.本题是重复元素的排列问题,所以基本事件的计算是“住店”问题,满足条件事件的计算是相同元素的排列问题即为组合问题.13.【2019年新课标2卷理科】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A 【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ ()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.本题旨在考查学生对中位数、平均数、方差、极差本质的理解.14.【2019年新课标3卷理科】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A.0.5B.0.6C.0.7D.0.8【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.15.【2018年新课标1卷理科】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】【分析】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M ,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%+=>,所以超过了经济收入的一半,所以D 正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.16.【2018年新课标1卷理科】如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3【答案】A 【解析】【分析】首先设出直角三角形三条边的长度,根据其为直角三角形,从而得到三边的关系,然后应用相应的面积公式求得各个区域的面积,根据其数值大小,确定其关系,再利用面积型几何概型的概率公式确定出p 1,p 2,p 3的关系,从而求得结果.【详解】设,,AC b AB c BC a ===,则有222b c a +=,从而可以求得ABC ∆的面积为112=S bc ,黑色部分的面积为22221()()[()]2222c b a S bc πππ=⋅+⋅-⋅-2221(4442c b a bc π=+-+22211422c b a bc bc π+-=⋅+=,其余部分的面积为22311122282a a S bc bc ππ⎛⎫=⋅-=- ⎪⎝⎭,所以有12S S =,根据面积型几何概型的概率公式,可以得到12p p =,故选A.点睛:该题考查的是面积型几何概型的有关问题,题中需要解决的是概率的大小,根据面积型几何概型的概率公式,将比较概率的大小问题转化为比较区域的面积的大小,利用相关图形的面积公式求得结果.17.【2018年新课标2卷理科】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .118【答案】C【解析】【详解】分析:先确定不超过30的素数,再确定两个不同的数的和等于30的取法,最后根据古典概型概率公式求概率.详解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有21045C =种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为31=4515,选C.点睛:古典概型中基本事件数的探求方法:(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法:适用于限制条件较多且元素数目较多的题目.18.【2018年新课标3卷理科】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.3【答案】B【解析】【详解】分析:判断出为二项分布,利用公式()()D X np 1p =-进行计算即可.()()D X np 1p =- p 0.4∴=或p 0.6=()()()()6444661010P X 41P X 61C p p C p p ==-<==-,()221p p ∴-<,可知p 0.5>故答案选B.点睛:本题主要考查二项分布相关知识,属于中档题.19.【2021年新高考1卷】有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则()A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同【答案】CD【解析】【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误.【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD20.【2021年新高考2卷】下列统计量中,能度量样本12,,,n x x x 的离散程度的是()A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【解析】【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.21.【2020年新高考1卷(山东卷)】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑ ,定义X 的信息熵21()log n i i i H X p p ==-∑.()A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n == ,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+= ,则H (X )≤H (Y )【答案】AC【解析】【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-,所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n== ,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m = ).()2222111log log m m i i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅ .()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅+⋅+++⋅+++ 12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++ 由于()01,2,,2i p i m >= ,所以2111i i m i p p p +->+,所以222111log log i i m i p p p +->+,所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.22.【2020年新高考2卷(海南卷)】我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.23.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有=C84=70个结果,这4个点在同一个平面的有= 6+6=12个,故所求概率==1270=635.故答案为:635.24.【2022年新高考2卷】已知随机变量X服从正态分布2,2,且o2<≤2.5)=0.36,则o>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为∼2,2,所以<2=>2=0.5,因此>2.5=>2−2<≤2.5=0.5−0.36=0.14.故答案为:0.14.25.【2019年新课标1卷理科】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________.【答案】0.18【解析】【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【详解】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算.26.【2019年新课标2卷理科】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840=.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.。
重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。
概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。
取代了传统意义上的应用题,成为高考中的亮点。
解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。
求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。
相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。
定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。
标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。
有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。
对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。
新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
随机事件及其概率1.1 随机事件习题1试说明随机试验应具有的三个特点.习题2将一枚均匀的硬币抛两次,事件A,B,C分别表示“第一次出现正面”,“两次出现同一面”,“至少有一次出现正面”,试写出样本空间及事件A,B,C中的样本点.1.2 随机事件的概率1.3 古典概型与几何概型1.4 条件概率1.5 事件的独立性复习总结与总习题解答习题3. 证明下列等式:习题6.习题7习题9习题10习题12习题13习题14习题15习题16习题18习题20习题21习题23习题24习题26第二章随机变量及其分布2.1 随机变量习题1随机变量的特征是什么?解答:①随机变量是定义在样本空间上的一个实值函数.②随机变量的取值是随机的,事先或试验前不知道取哪个值.③随机变量取特定值的概率大小是确定的.习题2试述随机变量的分类.解答:①若随机变量X的所有可能取值能够一一列举出来,则称X为离散型随机变量;否则称为非离散型随机变量.②若X的可能值不能一一列出,但可在一段连续区间上取值,则称X为连续型随机变量.习题3盒中装有大小相同的球10个,编号为0,1,2,⋯,9, 从中任取1个,观察号码是“小于5”,“等于5”,“大于5”的情况,试定义一个随机变量来表达上述随机试验结果,并写出该随机变量取每一个特定值的概率.解答:分别用ω1,ω2,ω3表示试验的三个结果“小于5”,“等于5”,“大于5”,则样本空间S={ω1,ω2,ω3},定义随机变量X如下:X=X(ω)={0,ω=ω11,ω=ω2,2,ω=ω3则X取每个值的概率为P{X=0}=P{取出球的号码小于5}=5/10,P{X=1}=P{取出球的号码等于5}=1/10,P{X=2}=P{取出球的号码大于5}=4/10.2.2 离散型随机变量及其概率分布习题1设随机变量X服从参数为λ的泊松分布,且P{X=1}=P{X=2}, 求λ.解答:由P{X=1}=P{X=2}, 得λe-λ=λ^2/2e^-λ,解得λ=2.习题2设随机变量X的分布律为P{X=k}=k15,k=1,2,3,4,5,试求(1)P{12<X<52; (2)P{1≤X≤3};(3)P{X>3}.解答:(1)P{12<X<52=P{X=1}+P{X=2}=115+215=15;(2)P{≤X≤3}=P{X=1}+P{X=2}+P{X=3}=115+215+315=25;(3)P{X>3}=P{X=4}+P{X=5}=415+515=35.习题3已知随机变量X只能取-1,0,1,2四个值,相应概率依次为12c,34c,58c,716c, 试确定常数c, 并计算P{X<1∣X≠0}.解答:依题意知,12c+34c+58c+716c=1, 即3716c=1,解得c=3716=2.3125.由条件概率知P{X<1∣X≠0}=P{X<1,X≠0}P{X≠0}=P{X=-1}P{X≠0}=12c1-34c=24c-3=26.25=0.32.习题4一袋中装有5只球,编号为1,2,3,4,5. 在袋中同时取3只,以X表示取出的3只球中的最大号码,写出随机变量X的分布律.解答:随机变量X的可能取值为3,4,5.P{X=3}=C22⋅1C53=110, P{X=4}=C32⋅1C53=310, P{X=5}=C42⋅1C53=35,所以X的分布律为求因代营业务得到的收入大于当天的额外支出费用的概率.解答:因代营业务得到的收入大于当天的额外支出费用的概率为:P{3X>60}, 即P{X>20},P{X>20}=P{X=30}+P{X=40}=0.6.就是说,加油站因代营业务得到的收入大于当天的额外支出费用的概率为0.6.习题6设自动生产线在调整以后出现废品的概率为p=0.1, 当生产过程中出现废品时立即进行调整,X代表在两次调整之间生产的合格品数,试求:(1)X的概率分布;(2)P{X≥5};(3)在两次调整之间能以0.6的概率保证生产的合格品数不少于多少?解答:(1)P{X=k}=(1-p)kp=(0.9)k×0.1,k=0,1,2,⋯;(2)P{X≥5}=∑k=5∞P{X=k}=∑k=5∞(0.9)k×0.1=(0.9)5;(3)设以0.6的概率保证在两次调整之间生产的合格品不少于m件,则m应满足P{X≥m}=0.6,即P{X≤m-1}=0.4. 由于P{X≤m-1}=∑k=0m-1(0.9)k(0.1)=1-(0.9)m,故上式化为1-0.9m=0.4, 解上式得m≈4.85≈5,因此,以0.6的概率保证在两次调整之间的合格品数不少于5.习题7设某运动员投篮命中的概率为0.6, 求他一次投篮时,投篮命中的概率分布.解答:此运动员一次投篮的投中次数是一个随机变量,设为X, 它可能的值只有两个,即0和1.X=0表示未投中,其概率为p1=P{X=0}=1-0.6=0.4,X=1表示投中一次,其概率为p2=P{X=1}=0.6.则随机变量的分布律为设X表示取出3件产品的次品数,则X的所有可能取值为0,1,2,3. 对应概率分布为P{X=0}=C73C103=35120, P{X=1}=C73C31C103=36120,P{X=2}=C71C32C103=21120, P{X=3}=C33C103=1120.X的分布律为2.3 随机变量的分布函数习题1F(X)={0,x<-20.4,-2≤x<01,x≥0,是随机变量X的分布函数,则X是___________型的随机变量.解答:离散.由于F(x)是一个阶梯函数,故知X是一个离散型随机变量.习题2设F(x)={0x<0x20≤1,1x≥1问F(x)是否为某随机变量的分布函数.解答:首先,因为0≤F(x)≤1,∀x∈(-∞,+∞).其次,F(x)单调不减且右连续,即F(0+0)=F(0)=0, F(1+0)=F(1)=1,且F(-∞)=0,F(+∞)=1,(2)P{X<2∣X≠1}=P{X=-1}P{X≠1}=23.习题5设X的分布函数为F(x)={0,x<0x2,0≤x<1x-12,1≤x<1.51,x≥1.5,求P{0.4<X≤1.3},P{X>0.5},P{1.7<X≤2}.解答:P{0.4<X≥1.3}=P{1.3}-F(0.4)=(1.3-0.5)-0.4/2=0.6,P{X>0.5}=1-P{X≤0.5}=1-F(0.5)=1-0.5/2=0.75,P{1.7<X≤2}=F(2)-F(1.7)=1-1=0.习题6设随机变量X的分布函数为F(x)=A+Barctanx(-∞<x<+∞),试求:(1)系数A与B; (2)X落在(-1,1]内的概率.解答:(1)由于F(-∞)=0,F(+∞)=1,可知{A+B(-π2)A+B(π2)=1=0⇒A=12,B=1π,于是F(x)=12+1πarctanx,-∞<x<+∞;(2)P{-1<X≤1}=F(1)-F(-1)=(12+1πarctan1)-[12+1πarctanx(-1)]=12+1π⋅π4-12-1π(-π4)=12.习题7在区间[0,a]上任意投掷一个质点,以X表示这个质点的坐标.设这个质点落在[0,a]中任意小区间内的概率与这个小区间的长度成正比例,试求X的分布函数.解答:F(x)=P{X≤x}={0,x<0xa,0≤x<a.1,x≥a2.4 连续型随机变量及其概率密度习题1设随机变量X的概率密度为f(x)=12πe-(x+3)24(-∞<x<+∞),则Y=¯∼N(0,1).解答:应填3+X2.由正态分布的概率密度知μ=-3,σ=2由Y=X-μσ∼N(0,1), 所以Y=3+X2∼N(0,1).习题2已知X∼f(x)={2x,0<x<10,其它, 求P{X≤0.5};P{X=0.5};F(x).解答:P{X≤0.5}=∫-∞0.5f(x)dx=∫-∞00dx+∫00.52xdx=x2∣00.5=0.25,P{X=0.5}=P{X≤0.5}-P{X<0.5}=∫-∞0.5f(x)dx-∫-∞0.5f(x)dx=0.当X≤0时,F(x)=0;当0<x<1时,F(x)=∫-∞xf(t)dt=∫-∞00dt+∫0x2tdt=t2∣0x=x2;当X≥1时,F(x)=∫-∞xf(t)dt=∫-∞00dt+∫0x2tdt+∫1x0dt=t2∣01=1,故F(x)={0,x≤0x2,0<x<1.1,x≥1习题3设连续型随机变量X的分布函数为F(x)={A+Be-2x,x>00,x≤0,试求:(1)A,B的值;(2)P{-1<X<1}; (3)概率密度函数F(x).解答:(1)\becauseF(+∞)=limx→+∞(A+Be-2x)=1, ∴A=1;又\becauselimx→0+(A+Be-2x)=F(0)=0, ∴B=-1.(2) P{-1<X<1}=F(1)-F(-1)=1-e-2.(3)f(x)=F′(x)={2e-x,x>00,x≤0.习题4服从拉普拉斯分布的随机变量X的概率密度f(x)=Ae-∣x∣, 求系数A及分布函数F(x).解答:由概率密度函数的性质知,∫-∞+∞f(x)dx=1,即∫-∞+∞Ae-∣x∣dx=1,而∫-∞+∞Ae-∣x∣dx=∫-∞0Aexdx+∫0+∞Ae-xdx=Aex∣-∞0+(-Ae-x∣0+∞)=A+A=2A或∫-∞+∞Ae-xdx=2∫0+∞Ae-xdx=-2Ae-x∣0+∞=2A,所以2A=1, 即A=1/2.从而f(x)=12e-∣x∣,-∞<x<+∞,又因为F(x)=∫-∞xf(t)dt,所以当x<0时,F(x)=∫-∞x12e-∣t∣dt=12∫-∞xetdt=12et∣-∞x=12ex;当x≥0时,F(x)=∫-∞x12e-∣x∣dt=∫-∞012etdt+∫0x12e-tdt=12et∣-∞0-12e-t∣0x=12-12e-x+12=1-12e-x,从而F(x)={12ex,x<01-12e-x,x≥0.习题5某型号电子管,其寿命(以小时计)为一随机变量,概率密度f(x)={100x2,x≥1000,其它,某一电子管的使用寿命为X, 则三个电子管使用150小时都不需要更换的概率.解答:设电子管的使用寿命为X, 则电子管使用150小时以上的概率为P{X>150}=∫150+∞f(x)dx=∫150+∞100x2dx=-100x∣150+∞=100150=23,从而三个电子管在使用150小时以上不需要更换的概率为p=(2/3)3=8/27.习题6设一个汽车站上,某路公共汽车每5分钟有一辆车到达,设乘客在5分钟内任一时间到达是等可能的,试计算在车站候车的10位乘客中只有1位等待时间超过4分钟的概率.解答:设X为每位乘客的候车时间,则X服从[0,5]上的均匀分布. 设Y表示车站上10位乘客中等待时间超过4分钟的人数. 由于每人到达时间是相互独立的.这是10重伯努力概型. Y服从二项分布,其参数n=10,p=P{X≥4}=15=0.2,所以P{Y=1}=C101×0.2×0.89≈0.268.习题7设X∼N(3,22).(1)确定C, 使得P{X>c}=P{X≤c};(2)设d满足P{X>d}≥0.9,问d至多为多少?解答:因为X∼N(3,22), 所以X-32=Z∼N(0,1).(1)欲使P{X>c}=P{X≤c},必有1-P{X≤c}=P{X≤c},即P{X≤c}=1/2,亦即Φ(c-32)=12, 所以 c-32=0, 故c=3.(2)由P{X>d}≥0.9可得1-P{X≤d}≥0.9,即P{X≤d}≤0.1.于是Φ(d-32)≤0.1,Φ(3-d2)≥0.9.查表得3-d2≥1.282,所以d≤0.436.习题8设测量误差X∼N(0,102), 先进行100次独立测量,求误差的绝对值超过19.6的次数不小于3的概率. 解答:先求任意误差的绝对值超过19.6的概率p,p=P{∣X∣>19.6}=1-P{∣X∣≤19.6}=1-P{∣X10∣≤1.96=1-[Φ(1.96)-Φ(-1.96)]=1-[2Φ(1.96)-1]=1-[2×0.975-1]=1-0.95=0.05.设Y为100次测量中误差绝对值超过19.6的次数,则Y∼b(100,0.05).因为n很大,p很小,可用泊松分布近似,np=5=λ,所以P{Y≥3}≈1-50e-50!-51e-51!-52e-52!=1-3722-5≈0.87.习题9某玩具厂装配车间准备实行计件超产奖,为此需对生产定额作出规定. 根据以往记录,各工人每月装配产品数服从正态分布N(4000,3600).假定车间主任希望10%的工人获得超产奖,求:工人每月需完成多少件产品才能获奖?解答:用X表示工人每月需装配的产品数,则X∼N(4000,3600).设工人每月需完成x件产品才能获奖,依题意得P{X≥x}=0.1,即1-P{X<x}=0.1,所以1-F(x)=0.1, 即1-Φ(x-400060)=0.1, 所以Φ(x-400060)=0.9.查标准正态人分布表得Φ(1.28)=0.8997,因此x-400060≈1.28,即x=4077件,就是说,想获超产奖的工人,每月必须装配4077件以上.习题10某地区18岁女青年的血压(收缩压,以mm-HG计)服从N(110,122). 在该地区任选一18岁女青年,测量她的血压X.(1)求P{X≤105},P{100<X≤120};(2)确定最小的x, 使P{X>x}≤0.005.解答:已知血压X∼N(110,122).(1)P{X≤105}=P{X-11012≤-512≈1-Φ(0.42)=0.3372,P{100<X≤120}=Φ(120-11012)-Φ(100-11012)=Φ(0.833)-Φ(-0.833)=2Φ(0.833)-1≈0.595.(2)使P{X>x}≤0.05,求x, 即1-P{X≤x}≤0.05, 亦即Φ(x-11012)≥0.95,查表得x-10012≥1.645,从而x≥129.74.习题11设某城市男子身高X∼N(170,36), 问应如何选择公共汽车车门的高度使男子与车门碰头的机会小于0.01.解答:X∼N(170,36), 则X-1706∼N(0,1).设公共汽车门的高度为xcm,由题意P{X>x}<0.01, 而P{X>x}=1-P{X≤x}=1-Φ(x-1706)<0.01,即Φ(x-1706)>0.99, 查标准正态表得x-1706>2.33, 故x>183.98cm.因此,车门的高度超过183.98cm时,男子与车门碰头的机会小于0.01.习题12某人去火车站乘车,有两条路可以走. 第一条路程较短,但交通拥挤,所需时间(单位:分钟)服从正态分布N(40,102); 第二条路程较长,但意外阻塞较少,所需时间服从正态分布N(50,42), 求:(1)若动身时离开车时间只有60分钟,应走哪一条路线?(2)若动身时离开车时间只有45分钟,应走哪一条路线?解答:设X,Y分别为该人走第一、二条路到达火车站所用时间,则X∼N(40,102),Y∼N(50,42).哪一条路线在开车之前到达火车站的可能性大就走哪一条路线.(1)因为P{X<60}=Φ(60-4010)=Φ(2)=0.97725,P{Y<60}=Φ(60-504)=Φ(2.5)=0.99379,所以有60分钟时应走第二条路.(2)因为P{X<45}=Φ(45-4010)=Φ(0.5)=0.6915,P{X<45}=Φ(45-504)=Φ(-1.25)=1-Φ(1.25)=1-0.8925=0.1075所以只有45分钟应走第一条路.2.5 随机变量函数的分布当c>0时,fY(y)={1c(b-a),ca+d≤y≤cb+d0,其它,当c<0时,fY(y)={-1c(b-a),cb+d≤y≤ca+d0,其它.习题4设随机变量X服从[0,1]上的均匀分布,求随机变量函数Y=eX的概率密度fY(y).解答:f(x)={1,0≤x≤10,其它,f=ex,x∈(0,1)是单调可导函数,y∈(1,e), 其反函数为x=lny, 可得f(x)={fX(lny)∣ln′y,1<y<e0,其它={1y,1<y<e0,其它.习题5设X∼N(0,1),求Y=2X2+1的概率密度.解答:因y=2x2+1是非单调函数,故用分布函数法先求FY(y).FY(y)=P{Y≤y}=P{2X2+1≤y}(当y>1时)=P{-y-12≤X≤y-12=∫-y-12y-1212πe-x2dx,所以fY(y)=F′Y(y)=22πe-12⋅y-12⋅122y-1,y>1, 于是fY(y)={12π(y-1)e-y-14,y>10,y≤1.习题6设连续型随机变量X的概率密度为f(x), 分布函数为F(x), 求下列随机变量Y的概率密度:(1)Y=1X; (2)Y=∣X∣.解答:(1)FY(y)=P{Y≤y}=P{1/X≤y}.①当y>0时,FY(y)=P{1/X≤0}+P{0<1/X≤y}=P{X≤0}+P{X≥1/y}=F(0)+1-F(1/y),故这时fY(y)=[-F(1y)]′=1y2f(1y);;②当y<0时,FY(y)=P{1/y≤X<0}=F(0)-F(1/y),故这时fY(y)=1y2f(1y);③当y=0时,FY(y)=P{1/X≤0}=P{X<0}=F(0),故这时取fY(0)=0, 综上所述fY(y)={1y2⋅f(1y),y≠00,y=0.(2)FY(y)=P{Y≤y}=P{∣X∣≤y}.①当y>0时,FY(y)=P{-y≤X≤y}=F(y)-F(-y)这时fY(y)=f(y)+f(-y);②当y<0时,FY(y)=P{∅}=0, 这时fY(y)=0;③当y=0时,FY(y)=P{Y≤0}=P{∣X∣≤0}=P{X=0}=0,故这时取FY(y)=0, 综上所述fY(y)={f(y)+f(-y),y>00,y≤0.习题7某物体的温度T(∘F)是一个随机变量, 且有T∼N(98.6,2), 已知θ=5(T-32)/9, 试求θ(∘F)的概率密度.解答:已知T∼N(98.6,2). θ=59(T-32), 反函数为T=59θ+32,是单调函数,所以fθ(y)=fT(95y+32)⋅95=12π⋅2e-(95y+32-98.6)24⋅95=910πe-81100(y-37)2.习题8设随机变量X在任一区间[a,b]上的概率均大于0, 其分布函数为FY(x), 又Y在[0,1]上服从均匀分布,证明:Z=FX-1(Y)的分布函数与X的分布函数相同.解答:因X在任一有限区间[a,b]上的概率均大于0, 故FX(x)是单调增加函数,其反函数FX-1(y)存在,又Y在[0,1]上服从均匀分布,故Y的分布函数为FY(y)=P{Y≤y}={0,y<0y,0≤y≤11,y>0,于是,Z的分布函数为FZ(z)=P{Z≤z}=P{FX-1(Y)≤z}=P{Y≤FX(z)}={0,FX(z)<0FX(z),0≤FX(z)≤1,1,FX(z)>1由于FX(z)为X的分布函数,故0≤FX(z)≤1.FX(z)<0和FX(z)>1均匀不可能,故上式仅有FZ(z)=FX(z), 因此,Z与X的分布函数相同.总习题解答习题1从1∼20的整数中取一个数,若取到整数k的概率与k成正比,求取到偶数的概率.解答:设Ak为取到整数k, P(Ak)=ck, k=1,2,⋯,20.因为P(⋃K=120Ak)=∑k=120P(Ak)=c∑k=120k=1,所以c=1210,P{取到偶数}=P{A2∪A4∪⋯∪A20} =1210(2+4+⋯+20)=1121.习题2若每次射击中靶的概率为0.7, 求射击10炮,(1)命中3炮的概率;(2)至少命中3炮的概率;(3)最可能命中几炮.解答:若随机变量X表示射击10炮中中靶的次数. 由于各炮是否中靶相互独立,所以是一个10重伯努利概型,X服从二项分布,其参数为n=10,p=0.7, 故(1)P{X=3}=C103(0.7)3(0.3)7≈0.009;(2)P{X≥3}=1-P{X<3}=1-[C100(0.7)0(0.3)10+C101(0.7)1(0.3)9+C102(0.7)2(0.3)8]≈0.998;(3)因X∼b(10,0.7), 而k0=[(n+1)p]=[(10+1)]×0.7=[7.7]=7,故最可能命中7炮.习题3在保险公司里有2500名同一年龄和同社会阶层的人参加了人寿保险,在1年中每个人死亡的概率为0.002,每个参加保险的人在1月1日须交120元保险费,而在死亡时家属可从保险公司里领20000元赔偿金,求:(1)保险公司亏本的概率;(2)保险公司获利分别不少于100000元, 200000元的概率.解答:1)以“年”为单位来考虑,在1年的1月1日,保险公司总收入为2500×120元=30000元.设1年中死亡人数为X, 则X∼b(2500,0.002), 则保险公司在这一年中应付出200000X(元),要使保险公司亏本,则必须200000X>300000即X>15(人).因此,P{保险公司亏本}=P{X>15}=∑k=162500C2500k(0.002)k×(0.998)2500-k≈1-∑k=015e-55kk!≈0.000069,由此可见,在1年里保险公司亏本的概率是很小的.(2)P{保险公司获利不少于100000元}=P{300000-200000X≥100000}=P{X≤10}=∑k=010C2500k(0.002)×(0.998)2500-k≈∑k=010e-55kk!≈0.986305,即保险公司获利不少于100000元的概率在98%以上.试求:(1)q的值;(2)X的分布函数.解答:(1)\because离散型随机变量的概率函数P{X=xi}=pi, 满足∑ipi=1,且0≤pi≤1,∴{1/2+1-2q+q2=10≤1-2q≤1q2≤1,解得q=1-1/2. 从而X的分布律为下表所示:(2)由F(x)=P{X≤x}计算X的分布函数F(x)={0,1/2,2-1/2,1,x<-1-1≤x<00≤x<0x≥1.习题7设随机变量X的分布函数F(x)为F(x)={0,x<0Asinx,0≤x≤π/2,1,x>π/2则A=¯,P{∣X∣<π/6}=¯.解答:应填1;1/2.由分布函数F(x)的右连续性,有F(π2+0)=F(π2)⇒A=1.因F(x)在x=π6处连续,故P{X=π6=12,于是有P{∣X∣<π6=P{-π6<X<π6=P{-π6<X≤π6=F(π6)-F(-π6)=12..习题8使用了x小时的电子管,在以后的Δx小时内损坏的概率等于λΔx+o(Δx),其中λ>0是常数,求电子管在损坏前已使用时数X的分布函数F(x),并求电子管在T小时内损坏的概率.解答:因X的可能取值充满区间(0,+∞),故应分段求F(x)=P{X≤x}.当x≤0时,F(x)=P{X≤x}=P(∅)=0;当x>0时,由题设知P{x<X≤x+Δx/X}=λΔx+o(Δx),而P{x<X≤x+Δx/X}=P{x<X≤x+Δx,X>x}P{X>x}=P{x<X≤x+Δx}1-P{X≤x}=F(x+Δx)-F(x)1-F(x),故F(X+Δx)-F(x)1-F(x)=λΔx+o(Δx),即F(x+Δx)-F(x)Δx=[1-F(x)][λ+o(Δx)Δx],令o(Δx)→0,得F′(x)=λ[1-F(x)].这是关于F(x)的变量可分离微分方程,分离变量dF(x)1-F(x)=λdx,积分之得通解为C[1-F(x)]=e-λx(C为任意常数).注意到初始条件F(0)=0, 故C=1.于是F(x)=1-e-λx,x>0,λ>0,故X的分布函数为F(x)={0,x≤01-e-λx,x>0(λ>0),从而电子管在T小时内损坏的概率为P{X≤T}=F(T)=1-e-λT.习题9设连续型随机变量X的分布密度为f(x)={x,0<x≤12-x,1<x≤20,其它,求其分布函数F(x).解答:当x≤0时,F(x)=∫-∞x0dt=0;当0<x≤1时,F(x)=∫-∞xf(t)dt=∫-∞00tdt+∫0xtdt=12x2;当1<x≤2时,F(x)=∫-∞xf(t)dt=∫-∞00dt+∫01tdt+∫1x(2-t)dt=0+12+(2t-12t2)∣1x=-1+2x-x22;当x>2时,F(x)=∫-∞00dt+∫01tdt+∫12(2-t)dt+∫2x0dt=1,故F(x)={0,x≤212x2,0<x≤1-1+2x-x22,1<x≤21,x>2.习题10某城市饮用水的日消费量X(单位:百万升)是随机变量,其密度函数为:f(x)={19xe-x3,x>00,其它,试求:(1)该城市的水日消费量不低于600万升的概率;(2)水日消费量介于600万升到900万升的概率.解答:先求X的分布函数F(x). 显然,当x<0时,F(x)=0, 当x≥0时有F(x)=∫0x19te-t3dt=1-(1+x3)e-x3故F(x)={1-(1+x3)e-x3,x≥00,x<0,所以P{X≥6}=1-P{X<6}=1-P(X≤6}=1-F(6)=1-[1-(1+x3)e-x3]x=6=3e-2,P{6<X≤9}=F(9)-F(6)=(1-4e-3)-(1-3e-2)=3e-2-4e-3.习题11已知X∼f(x)={cλe-λx,x>a0,其它(λ>0),求常数c及P{a-1<X≤a+1}.解答:由概率密度函数的性质知∫-∞+∞f(x)dx=1,而∫-∞+∞f(x)dx=∫-∞a0dx+∫a+∞cλe-λxdx=c∫a+∞e-λxd(λx)=-ce-λx\vlinea+∞=ce-λa,所以ce-λa=1,从而c=eλa.于是P{a-1<X≤a+1}=∫a-1a+1f(x)dx=∫a-1a0dx+∫aa+1λeλae-λxdx=-eλae-λx\vlineaa+1=-eλa(e-λ(a+1)-e-λa)=1 -e-λ.注意,a-1<a, 而当x<a时,f(x)=0.习题12已知X∼f(x)={12x2-12x+3,0<x<10,其它, 计算P{X≤0.2∣0.1<X≤0.5}.解答:根据条件概率;有P{X≤0.2∣0.1<X≤0.5}=P{X≤0.2,0.1<X≤0.5}P{0.1<X≤0.5}=P{0.1<X≤0.2}P{0.1<X≤0.5}=∫0.10.2(12x2-12x+2) dx∫0.10.5(12x2-12x+3)dx=(4x3-6x2+3x)∣0.10.2(4x3-6x2+3x)∣0.10.5=0.1480.256=0.578125.习题13若F1(x),F2(x)为分布函数,(1)判断F1(x)+F2(x)是不是分布函数,为什么?(2)若a1,a2是正常数,且a1+a2=1. 证明:a1F1(x)+a2F2(x)是分布函数.解答:(1)F(+∞)=limx→+∞F(x)=limx→+∞F1(x)+limx→+∞F2(x)=1+1=2≠1故F(x)不是分布函数.(2)由F1(x),F2(x)单调非减,右连续,且F1(-∞)=F2(-∞)=0,F1(+∞)=F2(+∞)=1,可知a1F1(x)+a2F2(x)单调非减,右连续,且a1F1(-∞)+a2F2(-∞)=0,a1F1(+∞)+a2F2(+∞)=1.从而a1F1(x)+a2F2(x)是分布函数.习题14设随机变量X的概率密度ϕ(x)为偶函数,试证对任意的a>0, 分布函数F(x)满足:(1)F(-a)=1-F(a); (2)P{∣X∣>a}=2[1-F(a)].解答:(1)F(-a)=∫-∞-aϕ(x)dx=∫a+∞ϕ(-t)dt=∫a+∞ϕ(x)dx=1-∫-∞aϕ(x)dx=1-F(a).(2)P{∣X∣>a}=P{X<-a}+P{X>a}=F(-a)+P{X≥a}F(-a)+1-F(a)=2[1-F(a)].习题15设K在(0,5)上服从均匀分布,求x的方程4x2+4Kx+K+2=0有实根的概率.解答:因为K∼U(0,5), 所以fK(k)={1/5,0<k<50,其它,方程4x2+4Kx+K+2=0有实根的充要条件为(4K)2-4⋅4(K+2)≥0,即K2-K-2≥0,亦即(k-2)(K+1)≥0,解得K≥2(K≤-1舍去), 所以P{方程有实根}=P{K≥2}=∫2515dx=35.习题16某单位招聘155人,按考试成绩录用,共有526人报名,假设报名者考试成绩X∼N(μ,σ2), 已知90分以上12人,60分以下83人,若从高分到低分依次录取,某人成绩为78分,问此人是否能被录取?解答:要解决此问题首先确定μ,σ2, 因为考试人数很多,可用频率近似概率.根据已知条件P{X>90}=12/526≈0.0228,P{X≤90}=1-P{X>90}≈1-0.0228}=0.9772;又因为P{X≤90}=P{X-μσ≤90-μσ, 所以有Φ(90-μσ)=0.9772, 反查标准正态表得90-μσ=2 ①同理:P{X≤60}=83/526≈0.1578; 又因为P{X≤60}=P{X-μσ≤60-μσ,故Φ(60-μσ)≈0.1578.因为0.1578<0.5,所以60-μσ<0, 故Φ(μ-60σ)≈1-0.1578=0.8422, 反查标准正态表得μ-60σ≈1.0 ②联立①,②解得σ=10,μ=70, 所以,X∼N(70,100).某人是否能被录取,关键看录取率. 已知录取率为155526≈0.2947, 看某人是否能被录取,解法有两种:方法1:P{X>78}=1-P{X≤78}=1-P{x-7010≤78-7010=1-Φ(0.8)≈1-0.7881=0.2119,因为0.2119<0.2947(录取率), 所以此人能被录取.方法2:看录取分数线. 设录取者最低分为x0, 则P{X≥x0}=0.2947(录取率),P{X≤x0}=1-P{X≥x0}=1-0.2947=0.7053,P{X≤x0}=P{x-7010≤x0-7010=Φ{x0-7010=0.7053,反查标准正态表得x0-7010≈0.54, 解得x0≈75. 此人成绩78分高于最低分,所以可以录取.习题17假设某地在任何长为t(年)的时间间隔内发生地震的次数N(t)服从参数为λ=0.1t的泊松分布,X表示连续两次地震之间间隔的时间(单位:年).(1)证明X服从指数分布并求出X的分布函数;(2)求今后3年内再次发生地震的概率;(3)求今后3年到5年内再次发生地震的概率.解答:(1)当t≥0时,P{X>t}=P{N(t)=0}=e-0.1t,∴F(t)=P{X≤t}=1-P{X>t}=1-e-0.1t;当t<0时,F(t)=0,∴F(x)={1-e-0.1t,x≥00,x<0,X服从指数分布(λ=0.1);(2)F(3)=1-e-0.1×3≈0.26;(3)F(5)-F(3)≈0.13.习题18100件产品中,90个一等品,10个二等品,随机取2个安装在一台设备上,若一台设备中有i个(i=0,1,2)二等品,则此设备的使用寿命服从参数为λ=i+1的指数分布.(1)试求设备寿命超过1的概率;(2)已知设备寿命超过1,求安装在设备上的两个零件都是一等品的概率 .解答:(1)设X表示设备寿命. A表示“设备寿命超过1”,Bi表示“取出i个二等品”(i=0,1,2),则X的密度函数为fX(x)={λe-λx,x>00,x≤0 (λ=i+1,i=0,1,2),P(B0)=C902C1002, P(B1)=C901C102C1002, P(B2)=C102C1002,P(A∣B0)=∫1+∞e-xdx=e-1, P(A∣B1)=∫1+∞2e-2xdx=e-2,P(A∣B2)=∫1+∞3e-3xdx=e-3,由全概率公式:P(A)=∑i=02P(Bi)P(A∣Bi)≈0.32.(2)由贝叶斯公式:P(B0∣A)=P(B0)P(A∣B0)P(A)≈0.93.试求Y=X2的分布律.解答:所以注:随机变量的值相同时要合并,对应的概率为它们概率之和.习题20设随机变量X的密度为fX(x)={0,x<02x3e-x2,x≥0,求Y=2X+3的密度函数.解答:由Y=2X+3, 有y=2x+3,x=y-32,x′=12,由定理即得fY(x)={0,y<3(y-32)3e-(y-32),y≥3.习题21设随机变量X的概率密度fX(x)={e-x,x>00,其它,求Y=eX的概率密度.解答:因为α=min{y(0),y(+∞)}=min{1,+∞}=1,β=max{y(0),y(+∞)}=max{1,+∞}=+∞.类似上题可得fY(y)={fX[h(y)]∣h′(y)∣,1<y<+∞0,其它={1/y2,1<y<+∞0,其它.习题22设随便机变量X的密度函数为fX(x)={1-∣x∣,-1<x<10,其它,求随机变量Y=X2+1的分布函数与密度函数.解答:X的取值范围为(-1,1), 则Y的取值范围为[1,2). 当1≤y<2时,FY(y)=P{Y≤y}=P{X2+1≤y}=P{-Y-1≤x≤y-1}=∫-y-1y-1(1-∣x∣)dx=2∫0y-1(1-x)dx=1-(1-y-1)2,从而Y的分布函数为FY(y)={0,y<11-(1-y-1)2,1≤y<2,1,其它Y的概率密度为fY(y)={1y-1-1,1<y<20,其它.第三章多维随机变量及其分布3.1 二维随机变量及其分布求a.解答:由分布律性质∑i⋅jPij=1, 可知1/6+1/9+1/18+1/3+a+1/9=1,解得a=2/9.习题2(1)2.设(X,Y)的分布函数为F(x,y),试用F(x,y)表示:(1)P{a<X≤b,Y≤c};解答:P{a<X≤b,Y≤c}=F(b,c)-F(a,c).习题2(2)2.设(X,Y)的分布函数为F(x,y),试用F(x,y)表示:(2)P{0<Y≤b};解答:P{0<Y≤b}=F(+∞,b)-F(+∞,0).习题2(3)2.设(X,Y)的分布函数为F(x,y),试用F(x,y)表示:(3)P{X>a,Y≤b}.解答:P{X>a,Y≤b}=F(+∞,b)-F(a,b).习题3(1)3.设二维离散型随机变量的联合分布如下表:试求:(1)P{12<X<32,0<Y<4;解答:P{12<X<23,0<Y<4P{X=1,Y=1}+P{X=1,Y=2}+P{X=1,Y=3}=P{X=1,Y=1}+P{X=1,Y=2}+P{X=1,Y=3}=14+0+0=14.习题3(2)3.设二维离散型随机变量的联合分布如下表:试求:(2)P{1≤X≤2,3≤Y≤4};解答:P{1≤X≤2,3≤Y≤4}=P{X=1,Y=3}+P{X=1,Y=4}+P{X=2,Y=3}+P{X=2,Y=4}=0+116+0+14=516.习题3(3)3.设二维离散型随机变量的联合分布如下表:试求:(3)F(2,3).解答:F(2,3)=P(1,1)+P(1,2)+P(1,3)+P(2,1)+P(2,2)+P(2,3)=14+0+0+116+14+0=916.习题4设X,Y为随机变量,且P{X≥0,Y≥0}=37,P{X≥0}=P{Y≥0}=47,求P{max{X,Y}≥0}.解答:P{max{X,Y}≥0}=P{X,Y至少一个大于等于0} =P{X≥0}+P{Y≥0}-P{X≥0,Y≥0}=47+47-37=57.习题5(X,Y)只取下列数值中的值:(0,0),(-1,1),(-1,13),(2,0)且相应概率依次为16,13,112,512, 请列出(X,Y)的概率分布表,并写出关于Y的边缘分布.解答:(1)因为所给的一组概率实数显然均大于零,且有16+13+112+512=1, 故所给的一组实数必是某二维随机变量(X,Y)的联合概率分布. 因(X,Y)只取上述四组可能值,故事件:{X=-1,Y=0}, {X=0,Y=13, {X=0,Y=1},{X=2,Y=13,{X=2,Y=1}均为不可能事件,其概率必为零. 因而得到下表:(2)P{Y=0}=P{X=-1,Y=0}+P{X=0,Y=0}+P{X=2,Y=0} =0+16+512=712,同样可求得P{Y=13=112,P{Y=1}=13,关于的Y边缘分布见下表:Y 01/31pk 7/121/121/3习题6设随机向量(X,Y)服从二维正态分布N(0,0,102,102,0), 其概率密度为f(x,y)=1200πex2+y2200,求P{X≤Y}.解答:由于P{X≤Y}+P{X>Y}=1,且由正态分布图形的对称性,知P{X≤Y}=P{X>Y},故P{X≤Y}=12.习题7设随机变量(X,Y)的概率密度为f(x,y)={k(6-x-y),0<x<2,2<y<40,其它,(1)确定常数k; (2)求P{X<1,Y<3}; (3)求P{X<1.5}; (4)求P{X+Y≤4}.解答:如图所示(1)由∫-∞+∞∫-∞+∞f(x,y)dxdy=1,确定常数k.∫02∫24k(6-x-y)dydx=k∫02(6-2x)dx=8k=1,所以k=18.(2)P{X<1,Y<3}=∫01dx∫2318(6-x-y)dy=38.(3)P{X<1.5}=∫01.5dx∫2418(6-x-y)dy=2732.(4)P{X+Y≤4}=∫02dx∫24-x18(6-x-y)dy=23.习题8已知X和Y的联合密度为f(x,y)={cxy,0≤x≤1,0≤y≤10,其它,试求:(1)常数c; (2)X和Y的联合分布函数F(x,y).解答:(1)由于1=∫-∞+∞∫-∞+∞f(x,y)dxdy=c∫01∫01xydxdy=c4,c=4.(2)当x≤0或y≤0时,显然F(x,y)=0;当x≥1,y≥1时,显然F(x,y)=1;设0≤x≤1,0≤y≤1,有F(x,y)=∫-∞x∫-∞yf(u,v)dudv=4∫0xudu∫0yvdv=x2y2.设0≤x≤1,y>1,有F(x,y)=P{X≤1,Y≤y}=4∫0xudu∫01ydy=x2.最后,设x>1,0≤y≤1,有F(x,y)=P{X≤1,Y≤y}=4∫01xdx∫0yvdv=y2.函数F(x,y)在平面各区域的表达式F(x,y)={0,x≤0或y≤0x2,0≤x≤1,y>1x2y2,0≤x≤1,0≤y≤1.y2,x>习题9设二维随机变量(X,Y)的概率密度为f(x,y)={4.8y(2-x),0≤x≤1,x≤y≤10,其它,求边缘概率密度fY(y).解答:fX(x)=∫-∞+∞f(x,y)dy={∫0x4.8y(2-x)dy,0≤x≤10,其它={2.4x2(2-x),0≤x≤10,其它.fY(y)=∫-∞+∞f(x,y)dx={∫0y4.8y(2-x)dx,0≤y≤10,其它={2.4y(4y-y2),0≤y≤10,其它.习题10设(X,Y)在曲线y=x2,y=x所围成的区域G里服从均匀分布,求联合分布密度和边缘分布密度.解答:区域G的面积A=∫01(x-x2)dx=16, 由题设知(X,Y)的联合分布密度为f(x,y)={6,0≤x≤1,x2≤y≤x0,其它,从而fX(x)=∫-∞+∞f(x,y)dy=6∫x2xdy=6(x-x2),0≤x≤1,即fX(x)={6(x-x2),0≤x≤10,其它fY(y)=∫-∞+∞f(x,y)dx=6∫yydx=6(y-y),0≤y≤1,即fY(y)={6(y-y),0≤y≤10,其它.3.2 条件分布与随机变量的独立性对应X的值,将每行的概率相加,可得P{X=i}.对应Y的值(最上边的一行), 将每列的概率相加,可得P{Y=j}.(2)当Y=51时,X的条件分布律为P{X=k∣Y=51}=P{X=k,y=51}P{Y=51}=pk,510.28, k=51,52,53,54,55.列表如下:故(1)在Y=1条件下,X的条件分布律为(2)在X=2的条件下,Y的条件分布律为表(a)表(b)解答:由X与Y相互独立知P{X=xi,Y=yi}=P{X=xi}P{Y=yj),从而(X,Y)的联合概率分布为亦即表P{X+y=1}=P{X=-2,y=3}+P{X=0,Y=1}=116+148=112,P{X+Y≠0}=1-P{X+Y=0}=1-P{X=-1,Y=1}-P{X=12,Y=-12=1-112-16=34.习题6某旅客到达火车站的时间X均匀分布在早上7:55∼8:00, 而火车这段时间开出的时间Y的密度fY(y)={2(5-y)25,0≤y≤50,其它,求此人能及时上火车站的概率.解答:由题意知X的密度函数为fX(x)={15,0≤x≤50,其它, 因为X与Y相互独立,所以X与Y的联合密度为:fXY(x,y)={2(5-y)125,0≤y≤5,0≤x≤50,其它,故此人能及时上火车的概率为P{Y>X}=∫05∫x52(5-y)125dydx=13.习题7设随机变量X与Y都服从N(0,1)分布,且X与Y相互独立,求(X,Y)的联合概率密度函数.解答:由题意知,随机变量X,Y的概率密度函数分别是fX(x)=12πe-x22,fY(y)=12πe-y22因为X与Y相互独立,所以(X,Y)的联合概率密度函数是f(x,y)=12πe-12(x+y)2.习题8设随机变量X的概率密度f(x)=12e-∣x∣(-∞<x<+∞),问:X与∣X∣是否相互独立?解答:若X与∣X∣相互独立,则∀a>0, 各有P{X≤a,∣X∣≤a}=P{X≤a}⋅P{∣X∣≤a},而事件{∣X∣≤a}⊂{X≤a},故由上式有P{∣X∣≤a}==P{X≤a}⋅P{∣X∣≤a},⇒P{∣X∣≤a}(1-P{X≤a})=0⇒P{∣X≤a∣}=0或1=P{X≤a}⋅(∀a>0)但当a>0时,两者均不成立,出现矛盾,故X与∣X∣不独立.习题9设X和Y是两个相互独立的随机变量,X在(0,1)上服从均匀分布,Y的概率密度为fY(y)={12e-y2,y>00,y≤0,(1)求X与Y的联合概率密度;(2)设有a的二次方程a2+2Xa+Y=0, 求它有实根的概率.解答:(1)由题设易知fX(x)={1,0<x<10,其它,又X,Y相互独立,故X与Y的联合概率密度为f(x,y)=fX(x)⋅fY(y)={12e-y2,0<x<1,y>00,其它;(2)因{a有实根}={判别式Δ2=4X2-4Y≥0}={X2≥Y},故如图所示得到:P{a有实根}=P{X2≥Y}=∫∫x2>yf(x,y)dxdy=∫01dx∫0x212e-y2dy=-∫01e-x22dx=1-[∫-∞1e-x22dx-∫-∞0e-x22dx] =1-2π[12π∫-∞1e-x22dx-12π∫-∞0e-x22dx]=1-2π[Φ(1)-Φ(0),又Φ(1)=0.8413,Φ(0)=0.5,于是Φ(1)-Φ(0)=0.3413,所以P{a有实根}=1-2π[Φ(1)-Φ(0)]≈1-2.51×0.3413=0.1433.3.3 二维随机变量函数的分布习题1设随机变量X和Y相互独立,且都等可能地取1,2,3为值,求随机变量U=max{X,Y}和V=min{X,Y}的联合分布.解答:由于U≥V,可见P{U=i,V=j}=0(i<j).此外,有P{U=V=i}=P{X=Y=i}=1/9(i=1,2,3), P{U=i,V=j}=P{X=i,Y=j}+P{X=j,Y=i}=2/9(i>j),于是,随机变量U和V的联合概率分布为试求:(1)Z=X+Y; (2)Z=XY; (3)Z=X/Y; (4)Z=max{X,Y}的分布律.解答:与一维离散型随机变量函数的分布律的计算类型,本质上是利用事件及其概率的运算法则.注意,Z的相同值的概率要合并.于是(1)(2)Z的分布密度为fZ(z)={ze-z22,z>00,z≤0.习题5设随机变量(X,Y)的概率密度为f(x,y)={12(x+y)e-(x+y),x>0,y>00,其它,(1)问X和Y是否相互独立?(2)求Z=X+Y的概率密度.解答:(1)fX(x)=∫-∞+∞f(x,y)dy={∫0+∞12(x+y)e-(x+y)dy,x>00,x≤0\under2line令x+y=t{∫x+∞12te-tdt=12(x+1)e-x,x>00,x≤0,由对称性知fY(y)={12(y+1)e-y,y>00,y≤0,显然f(x,y)≠fX(x)fY(y),x>0,y>0,所以X与Y不独立.(2)用卷积公式求fZ(z)=∫-∞+∞f(x,z-x)dx.当{x>0z-x>0 即{x>0x<z时,f(x,z-x)≠0,所以当z≤0时,fZ(z)=0;当z>0时,fZ(z)=∫0z12xe-xdx=12z2e-z.于是,Z=X+Y的概率密度为fZ(z)={12z2e-z,z>00,z≤0.习题6设随机变量X,Y相互独立,若X服从(0,1)上的均匀分布,Y服从参数1的指数分布,求随机变量Z=X+Y 的概率密度.解答:据题意,X,Y的概率密度分布为fX(x)={1,0<x<10,其它, fY(y)={e-y,y≥00,y<0,由卷积公式得Z=X+Y的概率密度为fZ(z)=∫-∞+∞fX(x)fY(z-x)dx=∫-∞+∞fX(z-y)fY(y)dy =∫0+∞fX(z-y)e-ydy.由0<z-y<1得z-1<y<z,可见:当z≤0时,有fX(z-y)=0, 故fZ(z)=∫0+∞0⋅e-ydy=0;当z>0时,fZ(z)=∫0+∞fX(z-y)e-ydy=∫max(0,z-1)ze-ydy=e-max(0,z-1)-e-z,即fZ(z)={0,z≤01-e-z,0<z≤1e1-z-e-z,z>1.习题7设随机变量(X,Y)的概率密度为f(x,y)={be-(x+y),0<x<1,0<y<+∞,0,其它.(1)试确定常数b;(2)求边缘概率密度fX(x),fY(y);(3)求函数U=max{X,Y}的分布函数.解答:(1)由∫-∞+∞∫-∞+∞f(x,y)dxdy=1,确定常数b. ∫01dx∫0+∞be-xe-ydy=b(1-e-1)=1,所以b=11-e-1,从而f(x,y)={11-e-1e-(x+y),0<x<1,0<y<+∞,0,其它.(2)由边缘概率密度的定义得fX(x)={∫0+∞11-e-1e-(x+y)dy=e-x1-e-x,0<x<1,0,其它,fY(x)={∫0111-e-1e-(x+y)dx=e-y,0<y<+∞,0,其它(3)因为f(x,y)=fX(x)fY(y),所以X与Y独立,故FU(u)=P{max{X,Y}≤u}=P{X≤u,Y≤u}=FX(u)FY(u),其中FX(x)=∫0xe-t1-e-1dt=1-e-x1-e-1,0<x<1,所以FX(x)={0,x≤0,1-e-x1-e-1,0<x<1,1,x≥1.同理FY(y)={∫0ye-tdt=1-e-y,0<y<+∞,0,y≤0,因此FU(u)={0,u<0,(1-e-u)21-e-1,0≤u<1,1-e-u,u≥1.。
1、以下茎叶图记录了甲、乙两名射击运动员训练的成绩(环数),射击次数为4次.(1)试比较甲、乙两名运动员射击水平的稳定性;(2)每次都从甲、乙两组数据中随机各选取一个进行比对分析,共选取了4次(有放回选取).设选取的两个数据中甲的数据大于乙的数据的次数为ξ,求ξ的分布列及数学期望. 【答案】(1)甲运动员的射击水平平稳;ξ的分布列如下: 01234P23834=⨯=ξE .试题分析:(1)按照平均数及方差公式分别计算甲乙的平均数及方差,方差小的射击水平稳定;(2)经分析,随机变量ξ的取值分别是0,1,2,3,4,且ξ~)83,4(B ,易得其分布列,并有期望公式求出期望值. 试题解析:(1)8==乙甲x x25])810()89()87()86[(41)(2222=-+-+-+-=甲x D29])810()810()87()85[(41)(2222=-+-+-+-=乙x D∵<)(甲x D )(乙x D ∴甲运动员的射击水平平稳.(2)当乙选取5环时,一定满足要求,此时的概率为1411⨯=P 当乙选取7环时,甲只能从9环、10环中选取,此时的概率为8121412=⨯=P ∴甲的成绩大于乙的成绩的概率为8321=+=P P P 依题意,ξ的取值分别是0,1,2,3,4,且ξ~)83,4(B∴(运算式子形式表示也可)因此,ξ的分布列如下: 01234P∴23834=⨯=ξE .考点:数据的数字特征---方差、均值. 【解析】2、假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料: 使用年限x 2 3 4 5 6 维修费用y 2.23.85.56.57.0若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程 y bxa =+ 的回归系数 ,ab . (3)估计使用年限为10年时,维修费用是多少?()1221,ni ii nii x y nx ybay bx xn x==-==--∑∑ 【答案】(1)散点图见解析;(2) 1.230.08y x =+;(3)12.38万元. 试题分析:(1)在平面直角坐标系中以x 为横坐标,以y 为纵坐标,作出()2,2.2,()3,3.8,()4,5.5,()5,6.5,()6,7五点,得表中数据的散点图;(2)由表中数据先求出,x y ,再求出55211,i iii i x y x==∑∑,然后求出根据公式求出 ,ab ,进而得出线性回归方程 1.230.08y x =+;(3)将10x =代入线性回归方程 1.230.08y x =+,得出 y ,并对问题做出回答.试题解析:(1)坐标系内作出点()()()()()2,2.2,3,3.8,4,5.5,5,6.5,6,7可得散点图如下:(2)由上表知,2345645x ++++==, 2.2 3.8 5.5 6.5755y ++++==512 2.23 3.84 5.55 6.567112.3i ii x y==⨯+⨯+⨯+⨯+⨯=∑522222212345690ii x==++++=∑,所以()5152221112.35451.239054i ii ii x y nx ybxn x==--⨯⨯===-⨯-∑∑5 1.2340.08ay bx =-=-⨯= 。
概率论与数理统计课后习题答案1. 引言概率论与数理统计是统计学的基础课程之一,通过学习这门课程,我们可以理解和运用概率和统计的概念和方法,从而分析和解决实际问题。
本文档将提供《概率论与数理统计》课后习题的详细答案。
2. 习题答案第一章:概率论的基本概念和基本原理1.1 选择题a.概率是以【答案】】D.形式结果给出的。
b.从一副有 52 张牌的扑克牌中,任意取一张牌,其点数是 7 的概率是【答案】】C.$\\frac{4}{52}$。
1.2 计算题a.设 A, B 是两个事件,已知 P(A) = 0.5,P(B) = 0.4,且P(A ∪ B) = 0.7,求P(A ∩ B)。
【解答】根据概率的加法定理可知,P(P∪P)=P(P)+P(P)−P(P∩P)代入已知数据,得到:0.7=0.5+0.4−P(P∩P)解上式得到P(A ∩ B) = 0.2。
所以,P(A ∩ B) = 【答案】0.2。
b.有两个相互独立的事件 A 和 B,且 P(A) = 0.3,P(A∪ B) = 0.5,求 P(B)。
【解答】由于事件 A 和 B 是相互独立的,所以根据概率的乘法定理可知,P(P∪P)=P(P)×P(P)代入已知数据,得到:0.5=0.3×P(P)解上式得到 P(B) = 0.5 ÷ 0.3 = 1.67。
所以,P(B) = 【答案】1.67。
第二章:随机变量及其分布2.1 选择题a.设 X 是一个随机变量,其概率密度函数为:$$ f(x) = \\begin{cases} \\frac{1}{2}x & 0 < x < 2 \\\\ 0 &其他 \\end{cases} $$则 P(X < 1) = 【答案】】C. 0.25。
b.对 X 的分布函数 F(x) = 1 - e^{-x}, 其中x ≥ 0,下列说法中错误的是【答案】】B. F(x) 是一个概率密度函数。
概率与数理统计习题答案概率论与数理统计是数学中的一个重要分支,它在科学研究、工程技术、经济管理以及社会科学等领域都有着广泛的应用。
这门课程通常包括概率论的基本概念、随机变量及其分布、多变量随机变量及其分布、大数定律和中心极限定理、统计量的分布、参数估计、假设检验等内容。
在概率论与数理统计的学习过程中,解决习题是巩固理论知识和提高解题技巧的重要手段。
以下是一些习题的解题思路和答案示例:1. 随机事件的概率计算:- 事件A的概率P(A)可以通过其对立事件的补集来计算,即P(A) = 1 - P(A')。
- 如果事件A和事件B互斥,则P(A∪B) = P(A) + P(B)。
2. 条件概率:- 条件概率P(A|B)表示在事件B发生的条件下事件A发生的概率,计算公式为P(A|B) = P(A∩B) / P(B),前提是P(B) > 0。
3. 随机变量及其分布:- 离散型随机变量的分布可以通过概率质量函数(PMF)来描述,连续型随机变量的分布则通过概率密度函数(PDF)来描述。
- 随机变量X的期望值E(X)和方差Var(X)是描述其分布的重要参数。
4. 多变量随机变量及其分布:- 联合分布函数描述了两个或多个随机变量的联合概率分布。
- 边缘分布函数是联合分布函数的特例,它描述了单个随机变量的分布。
5. 大数定律和中心极限定理:- 大数定律指出,随着样本量的增加,样本均值趋向于总体均值。
- 中心极限定理表明,在一定条件下,大量独立随机变量的和趋于正态分布。
6. 统计量的分布:- 统计量如样本均值、样本方差等的分布是统计推断的基础。
7. 参数估计:- 点估计提供了一个估计值,而区间估计则提供了一个估计区间,通常涉及到置信区间的计算。
8. 假设检验:- 假设检验用于判断样本数据是否足以支持某个假设,通常涉及到p值的计算和显著性水平的确定。
在解决具体习题时,需要根据题目的具体要求,选择合适的概率论和数理统计方法进行计算。
第四章4.3.2 独立性检验A级必备知识基础练A.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大B.对分类变量X与Y的随机变量χ2的观测值k来说,k越小,“X与Y有关系”的可信程度越小C.从独立性检验可知:有95%的把握认为吸烟与患肺病有关,我们说某人吸烟,那么他一定有95%的可能患有肺病D.从独立性检验可知:有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关2.[探究点二]疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下2×2列联表:总计50 50 100现从试验动物中任取一只,取得“注射疫苗”的概率为25,则下列判断错误的是( )A.注射疫苗发病的动物数为10B.从该试验未注射疫苗的动物中任取一只,发病的概率为23C.能在犯错误的概率不超过0.1%的前提下,认为该疫苗有效D.该疫苗的有效率为75%3.[探究点二·福建厦门一中期末](多选题)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如下所示的2×2列联表:经计算χ2=100×(64×10-16×10)280×20×74×26≈7.484 4,则可以推断出( )附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).A.该市一天空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,χ2的值不会发生变化C.没有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关D.能在犯错误的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SO2浓度有关4.[探究点一]为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行问卷调查,得到如下的2×2列联表:则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关.5.[探究点一]下表是不完整的2×2列联表,其中3a=c,b=2d,则a= .B级关键能力提升练6.[河南濮阳高二期中]在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A.在100个高血压患者中一定有肥胖的人B.在100个肥胖的人中至少有99人患有高血压C.在100个高血压患者中可能没有肥胖的人D.肥胖的人至少有99%的概率患有高血压7.(多选题)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )A.120B.130C.240D.2508.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:已知工作人员从所有统计的人中任取一位,取到喜欢西班牙队的人的概率,则有的把握认为是否喜欢西班牙队与年龄有关.为35C级学科素养创新练9.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示:(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请判断能否在犯错误的概率不超过5%的前提下,认为是否为“环保关注者”与性别有关?(2)若问卷得分不低于80分的人称为“环保达人”.视频率为概率.①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又有女“环保达人”的概率;②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得两次抽奖活动;其他参与的市民获得一次抽奖活动.每次抽奖获得红包的金额和对应的概率如下表:现某市民要参加此次问卷调查,记X(单位:元)为该市民参加问卷调查获得的红包金额,求X的分布列及均值.附表及公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.参考答案4.3.2 独立性检验1.C2.D 由题知,注射疫苗动物共40只,未注射共60只, 补充列联表,由此可得A,B正确.计算得χ2=100×(20×10-40×30)260×40×50×50≈16.67>10.828,故能在犯错误的概率不超过0.1%的前提下认为该疫苗有效,C正确.D错误.故选D.3.AD 补充完整列联表如下:对于A 选项,该市一天中,空气中PM2.5浓度不超过75μg/m 3,且SO 2浓度不超过150μg/m 3的概率估计值为64100=0.64,故A 正确;对于B 选项,χ2=1000×(640×100-160×100)2800×200×740×260≈74.844≠7.4844,故B 不正确;因为7.4844>6.635,由表可知,有超过99%的把握认为该市一天空气中PM2.5浓度与SO 2浓度有关,故D 正确,C 错误.故选AD. 4.0.5% 根据所给的列联表,得到 χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关. 5.15 由题意得{a +b =55,c +d =120-55,又3a=c,b=2d,所以{a +2d =55,3a +d =65,解得a=15.6.C 因为在犯错误的概率不超过0.01的前提下认为这个结论是成立的,所以要有99%的把握认为“高血压与肥胖有关”.结论成立的可能性,与有多少个人患高血压无关,更谈不上概率,A,B,D 不正确,C 正确.故选C.7.AB 依题意,设男、女学生的人数均为5x(x∈N+),则被调查的男、女学生的总人数为10x.建立如下2×2列联表:则χ2=10x(8x 2-3x2)25x·5x·3x·7x =10x21,又3.841<10x21≤6.635,所以80.661<10x≤139.335.故选AB.8.95% 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A,由已知得P(A)=q+35100=35,所以q=25,p=25,a=40,b=60,χ2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841,故有95%的把握认为是否喜欢西班牙队与年龄有关.9.解(1)由图中表格可得2×2列联表如下:性别环保关注者总计非“环保关注者”是“环保关注者”将2×2列联表中的数据代入公式,得χ2=100×(45×15-30×10)225×75×55×45≈3.030<3.841,所以在犯错误的概率不超过5%的前提下,不能认为是否为“环保关注者”与性别有关.(2)视频率为概率,我市所有的“环保达人”中是男“环保达人”的概率为35,女“环保达人”的概率为25,①抽取的3名市民中既有男“环保达人”又有女“环保达人”的概率为P=1-253-353=1825.②该市民是“环保达人”的概率为12.X 可能的取值为10,20,30,40. P(X=10)=12×34=38,P(X=20)=12×14+12×34×34=1332,P(X=30)=12×C 21×14×34=316,P(X=40)=12×14×14=132.所以X 的分布列为E(X)=10×38+20×1332+30×316+40×132=754.。