统计学二项分布习题,DOC
- 格式:doc
- 大小:73.00 KB
- 文档页数:8
《统计学》课程部分习题参考答案(龚凤乾)1.试针对统计学的三种任务各举一例。
答:见授课题板。
2.举例说明统计分组可以完成的任务。
答:见授课题板。
3.举一个单向复合分组表的例子,再举一个双向复合分组表的例子。
答:单向复合分组表的例如下4.某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题:(1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量;(2)研究专业技术人员总体的职称结构比例是否合理;(3)描述专业技术人员总体的年龄分布状况;(4)研究专业技术人员完成的科研成果数是否与其最后学历有关。
请回答:(1)该项调查研究的调查对象是该市全部专业技术人员;(2)该项调查研究的调查单位是该市每一位专业技术人员;(3)该项调查研究的报告单位是该市每一位专业技术人员;(4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目学历、职称、年龄、科研成果数。
5根据上表指出:(1)上表变量数列属于哪一种变量数列;(2)上表中的变量、变量值、上限、下限、次数(频数);(3)计算各组组距、组中值、频率。
答:(1)连续型组距式分组;(2)连续型组距式分组的组距=本组上限—本组下限;组中值=(上限+下限)/2;频率= ii f f /6.某地区人口统计数据如下表,请在此表的空白处添加以下数字:组距、组中值、频率、上限以下累计频数。
注:年龄以“岁”为单位计算,小数部分按舍尾法处理。
7.对下列指标进行分类。
(只写出字母标号即可)A 手机拥有量B 商品库存额C 市场占有率D 人口数E 出生人口数F 单位产品成本G 人口出生率H 利税额 (1)时期性总量指标有: EH ;(2)时点性总量指标有: ABD ; (3)质量指标有: CFG ;(4)数量指标有: ABDEH ; (5)离散型变量有: ADE ;(6)连续型变量有: BCFGH 。
8.现在把某地区1999年末全部个体经营工业单位作为研究对象。
对这个统计总体,设计了“1999年末全部个体经营工业单位总数”和上述这个个体经营工业单位总体的“1999年全年产品销售收入”两个统计指标。
第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (10)第6章统计量及其抽样分布 (11)第7章参数估计 (11)第8章假设检验 (13)第9章分类数据分析 (14)第10章方差分析 (16)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (30)第1章导论 (30)第2章数据的搜集 (30)第3章数据的图表展示 (30)第4章数据的概括性度量 (31)第5章概率与概率分布 (32)第6章统计量及其抽样分布 (33)第7章参数估计 (33)第8章假设检验 (34)第9章分类数据分析 (34)第10章方差分析 (36)第11章一元线性回归 (37)第12章多元线性回归 (38)第13章时间序列分析和预测 (40)第14章指数 (41)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
欢迎阅读(一)单项选择题1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则( )A .样本患病率p =X /n 服从B (n , π)B .n 人中患高血压的人数X 服从B (n , π)C .患病人数与样本患病率均不服从B (n , π)D .患病人数与样本患病率均服从B (n , π)答案:B[评析] 本题考点:二项分布概念的理解。
二项分布中所指的随机变量X 代表n 次试验中出现某种结果的次数,具体到本题目就是指抽查的n2 [n ,π)案为D 。
3. A C [记。
4. 95% A C [评析]本题考点:Poisson 分布的正态近似性。
当X 较大(一般大于50)时,Poisson 分布近似正态分布,按照正态分布资料的计算公式计算该地区井水中平均每升细菌含量的95%可信区间,再除以1000即得平均每毫升井水中细菌的平均含量(设1000X Y =,有1000100001000==X Y S S )。
(二) 是非题从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X 代表所取出球中的红色球数,则X 服从二项分布B (10,0.5)。
( )答案:正确。
[评析] 本题考点:二项分布的定义。
二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。
所以,此题目所述情况满足以上三个条件,X服从二项分布B (10,0.5)。
(三)计算题炮击命中目标的概率为0.2,共发射了14发炮弹。
已知至少要两发炮弹命中目标才能摧毁之,试求摧毁目标的概率。
答案:0.802[评析]本题的考点:二项分布概率函数的理解和应用能力。
摧毁目标的概率即有两发或两发以上炮弹命中目标的概率,此概率又等于1减去只有一发命中1. = X1+X22.4.5.的数量,若进行100次这样的抽查,其中的95次所得数据应在以下范围内()。
考核分为3部分:1. 平时成绩,主要以到课情况为依据。
一般占总成绩10%左右。
2. 上机SAS软件操作考试。
一般占总成绩的20%~40%。
3. 期末卷面理论考核,占总成绩的50%~70%。
下面的统计学试题供同学们参考:《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体(population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异(variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
第一部分:单选题(一)1、一位教授计算了全班20个学生考试成绩均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?()A 全班65%的同学的考试成绩高于平均值B全班65%的同学的考试成绩高于中数C全班65%的同学的考试成绩高于众数D全班同学的考试成绩是负偏态2、一个N=10的总体,若其离差平方和是200,则其离差的和Σ(X i-μ)是()A 14.14B 200C 数据不足,无法计算D 以上都不对3、中数在一个分布中的百分等级是()。
A 50B 75C 25D 50~514、平均数是一组数据的()。
A 平均差B 平均误C 平均次数D 平均值5、六名考生在作文题上的得分为12、8、9、10、13、15,其中数为()。
A 12B 11C 10D 96、下列描述数据集中情况的统计量是()。
A M M dμB M0 M d SC S ωσD M M d M g7、对于下列实验数据:1,108,11,8,5,6,8,8,7,11,描述其集中趋势用()最为适宜,其值是()A 平均数,14.4B 中数,8.5C 众数,8 D众数,118、一个n=10的样本其均值是21,在这个样本中增添了一个分数,得到的新样本均值是25,这个增添的分数值为()。
A 40B 65C 25D 219、有一组数据其均值是20,对其中的每一个数据都加上10,那么得到的这组新数据的均值是()。
A 20B 10C 15D 3010、有一组数据其均值是25,对其中的每一个数据都乘以2,那么得到的这组新数据的均值是()。
A 25B 50C 27D 211、一个有10 个数据的样本,它们中的每一个分别与20相减后所得的差相加是100,那么这组数据的均值是()。
A 20B 10C 30D 5012、下列数列4、6、7、8、11、12的中数为()。
A 7.5B 15C 7D 813、下列易受极端数据影响的统计量是()。
§12.5 二项分布及其应用解密考纲:对事件的独立性与条件概率、独立重复试验与二项分布的考查在高考中三种题型均有呈现. 一、选择题1.甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分). 甲组:76,90,84,86,81,87,86,82,85,83 乙组:82,84,85,89,79,80,91,89,79,74现从这20名学生中随机抽取一人,将“抽出的学生为甲组学生”记为事件A ;“抽出学生的英语口语测试成绩不低于85分”记为事件B ,则P (AB ),P (A |B )的值分别是( ) A .14,59B .14,49C .15,59D .15,492.已知某射击运动员,每次击中目标的概率都是0.8,则该射击运动员射击4次至少击中3次的概率为( ) A .0.85 B .0.819 2 C .0.8D .0.753.从甲袋中摸出1个红球的概率为13,从乙袋中摸出1个红球的概率为12,从两袋中各摸出一个球,则23等于( )A .2个球都不是红球的概率B .2个球都是红球的概率C .至少有1个红球的概率D .2个球中恰有1个红球的概率4.已知盒中装有3只螺口灯泡与7只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为( ) A .310B .29C .78D .795.袋子A 和B 中装有若干个均匀的红球和白球,从A 中摸出一个红球的概率是13,从B 中摸出一个红球的概率为p .若A ,B 两个袋子中的球数之比为1∶2,将A ,B 中的球装在一起后,从中摸出一个红球的概率是25,则p 的值为( )A .13B .1330C .1730D .126.将一枚硬币连掷5次,如果出现k 次正面向上的概率等于出现k +1次正面向上的概率,那么k 的值为( ) A .0 B .1 C .2 D .3二、填空题7.如图所示的电路有a ,b ,c 三个开关,每个开关开或关的概率都是12,且是相互独立的,则灯泡甲亮的概率为 .8.一盒中放有大小相同的10个小球,其中8个黑球,2个红球,现甲、乙二人先后各自从盒子中无放回地任意抽取2个小球,已知甲取到了2个黑球,则乙也取到2个黑球的概率是 .9.设事件A 在每次试验中发生的概率相同,且在三次独立重复试验中,若事件A 至少发生一次的概率为6364,则事件A 恰好发生一次的概率为 .三、解答题10.某中学为丰富教职工生活,国庆节举办教职工趣味投篮比赛,有A ,B 两个定点投篮位置,在A 点投中一球得2分,在B 点投中一球得3分.规则是:每人投篮三次按先A 后B 再A 的顺序各投篮一次,教师甲在A 和B 点投中的概率分别是12和13,且在A ,B 两点投中与否相互独立.(1)若教师甲投篮三次,求教师甲投篮得分X 的分布列;(2)若教师乙与教师甲在A ,B 点投中的概率相同,两人按规则各投三次,求甲胜乙的概率.11.甲、乙两位小学生各有2008年奥运吉祥物“福娃”5个(其中“贝贝”“晶晶”“欢欢”“迎迎”和“妮妮”各一个),现以投掷一个骰子的方式进行游戏,规则如下:当出现向上的点数是奇数时,甲赢得一个福娃;否则乙赢得甲一个福娃,规定掷骰子的次数达9次时,或在此前某人已赢得所有福娃时游戏终止.记游戏终止时投掷骰子的次数为ξ. (1)求掷骰子的次数为7的概率; (2)求ξ的分布列及数学期望E (ξ).12.(在一种电脑屏幕保护画面中,符号“○”和“×”随机地反复出现,每秒钟变化一次,每次变化只出现“○”和“×”之一,其中出现“○”的概率为p ,出现“×”的概率为q .若第k 次出现“○”,则记a k =1;出现“×”,则记a k =-1,令S n =a 1+a 2+…+a n . (1)当p =q =12时,记ξ=|S 3|,求ξ 的分布列;(2)当p =13,q =23时,求S 8=2且S i ≥0(i =1,2,3,4)的概率.参考答案一、选择题 1.【答案】A【解析】 ∵P (A )=12,P (B )=920,P (AB )=14,∴P (A |B )=P (AB )P (B )=59.2.【答案】B【解析】 P =C 340.83·0.2+C 440.84=0.819 2.3.【答案】C【解析】 因为从两个袋中各摸出一个球都不是红球的概率为⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-12=13, 所以至少有1个红球的概率为1-13=23.4.【答案】D【解析】 设事件A 为“第1次抽到的螺口灯泡”,事件B 为“第2次抽到的是卡口灯泡”, 则P (A )=310,P (AB )=310×79=730,则所求概率为P (B |A )=P (AB )P (A )=730310=79.5.【答案】B【解析】 设A 中有x 个球,B 中有y 个球,则因为A ,B 两个袋子中的球数之比为1∶2,将A ,B 中的球装在一起后,从中摸出一个红球的概率是25,所以13x +py x +y =25且x y =12,解得p =1330.6.【答案】C【解析】 C k 5⎝⎛⎭⎫125=C k +15⎝⎛⎭⎫125,∴k +(k +1)=5,k =2. 二、填空题 7.【答案】18【解析】 ∵a ,c 闭合,b 断开,灯泡甲亮,∴概率为18.8.【答案】1528【解析】 记事件“甲取到2个黑球”为A ,“乙取到2个黑球”为B , 则有P (B |A )=P (AB )P (A )=C 26C 28=1528,即所求事件的概率是1528.9.【答案】964【解析】 假设事件A 在每次试验中发生说明试验成功,设每次试验成功的概率为p ,由题意得,事件A 发生的次数X ~B (3,p ),则有1-(1-p )3=6364,得p =34,则事件A 恰好发生一次的概率为C 13×34×⎝⎛⎭⎫1-342=964. 三、解答题10.解:(1)设“教师甲在A 点投中”的事件为A ,“教师甲在B 点投中”的事件为B . 依题可知X 的可能取值为0,2,3,4,5,7.P (X =0)=P (A ·B ·A )=⎝⎛⎭⎫1-122×⎝⎛⎭⎫1-13=16, P (X =2)=P (A ·B ·A +A ·B ·A )=C 12×12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-12=13, P (X =3)=P (A ·B ·A )=⎝⎛⎭⎫1-12×13×⎝⎛⎭⎫1-12=112, P (X =4)=P (A ·B ·A )=12×⎝⎛⎭⎫1-13×12=16, P (X =5)=P (A ·B ·A +A ·B ·A )=C 12×12×13×⎝⎛⎭⎫1-12=16, P (X =7)=P (A ·B ·A )=12×13×12=112.则教师甲投篮得分X 的分布列为(2)这五种情形之间彼此互斥,因此所求事件的概率为P =13×16+112×⎝⎛⎭⎫16+13+16×⎝⎛⎭⎫16+13+112+16×⎝⎛⎭⎫16+13+112+16+112×⎝⎛⎭⎫1-112=1948. 11.解:(1)当ξ=7时,“甲赢”即“第七次甲赢,前6次赢5次,且前5次中必输1次”,依题意,每次甲赢或乙赢的概率均为12,∴P (ξ=7)=2×C 15×12×⎝⎛⎭⎫124×12×12=564. (2)设游戏终止时骰子向上的点数是奇数出现的次数为m ,向上的点数是偶数出现的次数为n ,则由⎩⎪⎨⎪⎧|m -n |=5,m +n =ξ,5≤ξ≤9或⎩⎪⎨⎪⎧|m -n |<5,m +n =9得: 当m =5,n =0或m =0,n =5时,ξ=5; 当m =6,n =1或m =1,n =6时,ξ=7; 当m =7,n =2或m =2,n =7时,ξ=9; 当m =5,n =4或m =4,n =5时,ξ=9; 当m =6,n =3或m =3,n =6时,ξ=9; ∴ξ的可能取值是5,7,9.每次投掷甲赢得乙一个福娃与乙赢得甲一个福娃的可能性相同,其概率都是12.P (ξ=5)=2×⎝⎛⎭⎫125=116,P (ξ=7)=564,P (ξ=9)=1-P (ξ=5)-P (ξ=7)=5564, ∴ξ的分布列是E (ξ)=5×116+7×564+9×5564=27532.12.解:(1)因为ξ=|S 3|的取值为1,3,又p =q =12,所以P (ξ=1)=C 13⎝⎛⎭⎫12×⎝⎛⎭⎫122×2=34, P (ξ=3)=⎝⎛⎭⎫123+⎝⎛⎭⎫123=14. 所以ξ的分布列为(2)当S 8=2时,即前八秒出现“○”5次,“×”3次,又已知S i ≥0(i =1,2,3,4),若第一、三秒出现“○”,则其余六秒可任意出现“○”3次;若第一、二秒出现“○”,第三秒出现“×”,则后五秒可任意出现“○”3次. 故所求的概率P =(C 36+C 35)×⎝⎛⎭⎫135×⎝⎛⎭⎫233=30×838=8037⎝⎛⎭⎫或802 187.。
医学统计学题库完整第⼀章绪论习题⼀、选择题1.统计⼯作和统计研究的全过程可分为以下步骤:(D )A. 调查、录⼊数据、分析资料、撰写论⽂B. 实验、录⼊数据、分析资料、撰写论⽂C. 调查或实验、整理资料、分析资料D. 设计、收集资料、整理资料、分析资料E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为⼩概率事件。
A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.⾓度资料3.某偏僻农村144名妇⼥⽣育情况如下:0胎5⼈、1胎25⼈、2胎70⼈、3胎30⼈、4胎14⼈。
该资料的类型是( A )。
4.分别⽤两种不同成分的培养基(A 与B )培养⿏疫杆菌,重复实验单元数均为5个,记录48⼩时各实验单元上⽣长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹⾎糖测量值,属于( C )资料。
6.⽤某种新疗法治疗某病患者41⼈,治疗结果如下:治愈8⼈、显效23⼈、好转6⼈、恶化3⼈、死亡1⼈。
该资料的类型是(B )。
7.某⾎库提供6094例ABO ⾎型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男⽣的⾝⾼数据属于(C )。
⼆、问答题1.举例说明总体与样本的概念.答:统计学家⽤总体这个术语表⽰⼩异的对象全体,通常称为⽬标总体,⽽资料常来源于⽬标总体的⼀个较⼩总体,称为研究总体。
实际中由于研究总体的个体众多,甚⾄⽆限多,因此科学的办法是从中抽取⼀部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男⼦为总体⽬标,1951年英国全部注册医⽣作为研究总体,按照实验设计随机抽取的⼀定量的个体则组成了研究的样本。
(一)单项选择题1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则()A .样本患病率p=X/n 服从B (n,π)B .n 人中患高血压的人数X 服从B (n,π)C .患病人数与样本患病率均不服从B (n,π)D .患病人数与样本患病率均服从B (n,π)答案:B [评析]本题考点:二项分布概念的理解。
二项分布中所指的随机变量X 代表n 次试验中出现某种结果的次数,具体到本题目就是指抽查的n 个人中患高血压的人数,因此答案为B 。
2.二项分布近似正态分布的条件是()A .n 较大且π接近0B .n 较大且π接近1C .n 较大且π接近0或1D .n 较大且π接近0.5答案:D[评析]本题考点:二项分布的正态近似特性。
从对二项分布特性的描述中可知:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π,)1(n )。
π不接近0也不接近1,等同于π接近0.5,因而此题目答案为D 。
3.以下分布中,其均数和方差总是相等的是()A .正态分布 B. 对称分布 C.Poisson 分布D. 二项分布答案:C[评析]本题考点:Poisson 分布的特性。
Poisson 分布P (μ)的参数只有一个,即μ。
它的均数和方差均等于μ,这一点大家需要牢记。
4. 测得某地区井水中细菌含量为10000/L,据此估计该地区每毫升井水中细菌平均含量的95%可信区间为()A .1000096.110000B. 1096.110 C.10001000096.110 D. 1000096.110答案:C[评析]本题考点:Poisson 分布的正态近似性。
当X 较大(一般大于50)时,Poisson 分布近似正态分布,按照正态分布资料的计算公式计算该地区井水中平均每升细菌含量的95%可信区间,再除以1000即得平均每毫升井水中细菌的平均含量(设1000XY,有1000100001000XYS S )。
二项分布概念及图表二项分布就是重复n次独立的伯努利试验。
在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。
目录1 定义▪统计学定义▪医学定义2 概念3 性质4 图形特点5 应用条件6 应用实例定义统计学定义在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。
这样的单次成功/失败试验又称为伯努利试验。
实际上,当时,二项分布就是伯努利分布,二项分布是显著性差异的二项试验的基础。
医学定义在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。
二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
考虑只有两种可能结果的随机试验,当成功的概率()是恒定的,且各次试验相互独立,这种试验在统计学上称为伯努利试验(Bernoulli trial)。
如果进行次伯努利试验,取得成功次数为的概率可用下面的二项分布概率公式来描述:P=C(X,n)*π^X*(1-π)^(n-X)P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!),注意:第二个等号后面的括号里的是上标,表示的是方幂。
那么就说这个属于二项分布。
其中P称为成功概率。
记作ξ~B(n,p)期望:Eξ=np;方差:Dξ=npq;其中q=1-p证明:由二项式分布的定义知,随机变量X是n重伯努利实验中事件A发生的次数,且在每次试验中A发生的概率为p。
期末复习题---统计学第⼀章1.总体是指()。
A 我们所要研究的所有基本单位的总和B 个体的数量⽅⾯C 总体单位具有的特征或属性D ⼀部分单位2.统计所研究的是()。
A 总体的数量⽅⾯B 个体的数量⽅⾯C 总体或个体的数量⽅⾯D 总体或个体的属性⽅⾯3.《政治算术》学派的代表⼈物是()A.海门尔.康令B.阿亨⽡尔C.威廉.配第D.凯特勒第⼆章⼀、单选1.平均指标反映( )。
A. 总体分布的集中趋势B. 总体分布的离散趋势C. 总体分布的⼤概趋势 D. 总体分布的⼀般趋势2. 众数是()。
A. 出现次数最少的次数B. 出现次数最少的标志值C. 出现次数最多的标志值 D. 出现次数最多的频数3、加权算术平均数的⼤⼩()。
A. 主要受各组标志值⼤⼩的影响,⽽与各组次数的多少⽆关B. 主要受各组次数⼤⼩的影响,⽽与各组标志值的多少⽆关C. 既受各组标志值⼤⼩的影响,⼜受各组次数多少的影响D. 既与各组标志值的⼤⼩⽆关,也与各组次数的多少⽆关4、从均值为100、标准差为10的总体中,抽出⼀个的简单随机样本,样本均值的数学期望和⽅差分别为()。
A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2 5.数据的计量尺度由低到⾼、由粗到精可以分为()。
A .列名尺度、间隔尺度、⽐率尺度、顺序尺度B .间隔尺度、列名尺度、⽐率尺度、顺序尺度50 nC.列名尺度、顺序尺度、间隔尺度、⽐率尺度D.列名尺度、⽐率尺度、顺序尺度、间隔尺度6.在⼀组数据中,每个数据类型出现的次数称为()。
A.参数 B.频数 C.众数 D.组数7.对于右偏分布,均值、中位数和众数之间的关系是()A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数8、企业按资产总额分组()A:只能使⽤品质标志分组; B:只能使⽤组距式分组;C:可以⽤品质标志分组,也可以⽤组距式分组;D:⽆法分组。
9、权数对算术平均数的影响作⽤,实质上取决于()。
各章练习题答案第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1)茎叶图如下:(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.8 箱线图如下:(特征请读者自己分析)2.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
二项分布概念及图表二项分布就就是重复n次独立得伯努利试验。
在每次试验中只有两种可能得结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否得概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。
▪统计学定义▪医学定义2 概念3 性质4 图形特点5 应用条件6 应用实例定义统计学定义在概率论与统计学中,二项分布就是n个独立得就是/非试验中成功得次数得离散概率分布,其中每次试验得成功概率为p。
这样得单次成功/失败试验又称为伯努利试验。
实际上,当时,二项分布就就是伯努利分布,二项分布就是显著性差异得二项试验得基础。
医学定义在医学领域中,有一些随机事件就是只具有两种互斥结果得离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果得有效与无效,某种化验结果得阳性与阴性,接触某传染源得感染与未感染等。
二项分布(binomial distribution)就就是对这类只具有两种互斥结果得离散型随机事件得规律性进行描述得一种概率分布。
考虑只有两种可能结果得随机试验,当成功得概率()就是恒定得,且各次试验相互独立,这种试验在统计学上称为伯努利试验(Bernoulli trial)。
如果进行次伯努利试验,取得成功次数为得概率可用下面得二项分布概率公式来描述:P=C(X,n)*π^X*(1-π)^(n-X)二项分布公式二项分布公式P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!),注意:第二个等号后面得括号里得就是上标,表示得就是方幂。
那么就说这个属于二项分布。
其中P称为成功概率。
记作ξ~B(n,p)期望:Eξ=np;方差:Dξ=n pq;其中q=1-p证明:由二项式分布得定义知,随机变量X就是n重伯努利实验中事件A发生得次数,且在每次试验中A发生得概率为p。
(一)单项选择题
1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则()
A .样本患病率p =X /n 服从
B (n ,π)
[评析]本题考点:二项分布的正态近似特性。
从对二项分布特性的描述中可知:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π,)1(ππ-n )。
π不接近0也不接近1,等同于π接近0.5,因而此题目答案为D 。
3. 以下分布中,其均数和方差总是相等的是()
A.正态分布B.对称分布
C.Poisson分布D.二项分布
答案:C
[评析]本题考点:Poisson分布的特性。
Poisson分布P(μ)的参数只有一个,即μ。
它的均数和方差均
C
从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X代表所取出球中的红色球数,则X服从二项分布B(10,0.5)。
()
答案:正确。
[评析]本题考点:二项分布的定义。
2
二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;
②每次试验的条件不变;③各次试验独立。
此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。
所以,此题目
3.Bernoulli试验
(二)单项选择题:
1.X1、X2分别服从二项分布B(n1,p1)、B(n2,p2),且X1、
X
相互独立,若要X=X1+X2也服从二项分布,则需满足下列条件()。
2
A.X1=X2B.n1=n2
C.p1=p2D.n1p1=n2p2
2.二项分布B(n,p)的概率分布图在下列哪种条件下为对称分布()。
A.n=50B.p=0.5
C.np=1D.p=1
C.95~105D.74.2~125.8
(三)简答题
1.服从二项分布及Poisson分布的条件分别是什么?
2.二项分布、Poisson分布分别在何种条件下近似正态分布?
3.在何种情况下,可以用率的标准误S p描述率的抽样误差?
4
(四)计算题
1.已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区10位成人的血清,其中3人为阳性。
该地区成人乙肝表面抗原阳性率是否高于全国平均水平?
2.对甲、乙两种降压药进行临床疗效评价,将某时间段内入院的
则称此随机变量X服从以n、π为参数的二项分布(B i n o m i a l D i s t r i b u t i o n),记为X~B(n,π)。
2.Poisson分布:若离散型随机变量X的取值为0,1,…,n,且相应的取值概率为
6
μμ-==e k k X P k
!)((μ>0)
则称随机变量X 服从以μ为参数的Poisson 分布(PoissonDistribution ),记为X ~P (μ)。
3.Bernoulli 试验:将感兴趣的事件A 出现的试验结果称为“成功”,事件A 不出现的试验结果称为“失败”,这类试验就称为Bernoulli
20),其分布近似于正态分布。
3.当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p 描述率的抽样误差。
(四)计算题
1.建立检验假设
H0:该地区成人乙肝表面抗原阳性率为10%;
H1:该地区成人乙肝表面抗原阳性率大于10%。
α=0.05。
从总体率为10%的人群随机抽取10人,3人或3人以上阳性的概
著差别,甲药比乙药有效率高。
3.放射性物质含量为4克/千克的矿石每千克的平均脉冲记数为μ=100*4=400/小时,μ值较大,可利用Poisson分布的近似正态分布特性进行计算。
H0:两矿区矿石中该放射性物质含量相等,即后一矿区矿石发生
8 脉冲频率的总体均数为400/小时;H 1:两矿区矿石中该放射性物质含量不相等,即后一矿区矿石发生脉冲频率的总体均数不等于400/小时。
α=0.05。
30400400
1000=-=u >2.58,P <0.01。
在α=0.05水平上,拒绝H 0,接受H 1,即两矿区矿石中该放射性。