武汉大学统计学复习题
- 格式:doc
- 大小:456.50 KB
- 文档页数:15
一、基本概念题(请在下面概念中选择4个,除对概念本身解释外,必须举例对概念予以说明,不能多选)(每题4分)1、季节比率2、同度量因素3、随机原则4、环比发展速度5、置信水平与置信区间6、标准差系数二、理论分析简答题(请在下列题中选择3题作答,不能多选,也不能少选)(每题8分)1、请列举三个在统计分析方法(除平均数章节以外的)中带有平均含义或者应用到平均数理论的例子,并适当说明。
2、请阐述并适当举例说明标志变动度的应用背景。
3、简述并适当举例说明时期指标和时点指标的区别。
4、分析假设检验中两类错误的概念与意义。
5、请从经济、社会、自然、人文等几个方面至少列举3个需要应用到假设检验方法分析的实例,给予适当说明。
6、试举例说明生活中用到简单随机抽样和分层抽样的列子,并说明各自的适用条件。
三、计算分析题(请在下列题中选择4题作答,不能多选,也不能少选)(每题15分)1、请自拟订数据和现象,计算相关系数,要求相关系数为负。
2、如果我们要评价几所大学的学生六级英语考试成绩的平均水平和成绩的稳定性,你认为应该应用统计学的什么方法进行定量分析,试举例计算说明方法的应用。
3、某商场销售下列三种商品,有资料如下:(第二季度数据自定)商品名称计量单位商品销售额(万元)第二季度价格比第一季度价格增减% 09年第一季度09年第二季度甲乙丙件台辆150254020-5试从相对量和绝对量两个方面计算销售总额的变动受价格和销售量的影响程度,并做相应的分析。
4、请自行拟订一组抽样数据,并据此计算。
要求满足以下几个条件:1)数据为组距开口组数据; 2)计算平均数;3)进行平均数的区间估计,置信度自己拟订。
5、设某啤酒厂近5年分季度销售量资料如下(单位:吨):年份t 一季度二季度三季度四季度合计第1年第2年第3年第4年第5年-2-1123237558810786170227268327188346518685856合计同季平均季节指数js(1)请按同季期平均法计算季节指数;(2)若配合直线趋势方程进行预测,请估计第6年的销售量(只需按每年数据进行计算)。
《统计学》试题库第一章:统计基本理论和基本概念一、填空题1、统计是统计工作、统计学和统计资料的统一体,统计资料是统计工作的成果,统计学是统计工作的经验总结和理论概括。
2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。
3、统计工作可划分为设计、调查、整理和分析四个阶段。
4、随着研究目的的改变,总体和个体是可以相互转化的。
5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。
6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。
7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。
8、社会经济统计具有数量性、总体性、社会性、具体性等特点。
9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。
10、统计标志按是否可用数值表示分为品质标志和数量标志;按在各个单位上的具体表现是否相同分为可变标志和不变标志。
11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。
12、数量指标用绝对数表示,质量指标用相对数或平均数表示。
13、在统计中,把可变的数量标志和统计指标统称为变量。
14、由于统计研究目的和任务的变更,原来的总体变成总体单位,那么原来的指标就相应地变成标志,两者变动方向相同。
二、是非题1、统计学和统计工作的研究对象是完全一致的。
(×)2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。
(√)3、统计学是对统计实践活动的经验总结和理论概括。
(√)4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。
(√)5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
(×)6、某同学计算机考试成绩80分,这是统计指标值。
(×)7、统计资料就是统计调查中获得的各种数据。
(×)8、指标都是用数值表示的,而标志则不能用数值表示。
统计学复习题及答案1. 什么是统计学?答:统计学是一门应用数学,它涉及数据的收集、分析、解释、展示和预测。
2. 描述统计学和推断统计学有什么区别?答:描述统计学关注于数据的总结和描述,而推断统计学则使用样本数据来推断总体特征。
3. 列举三种常见的概率分布。
答:正态分布、二项分布和泊松分布。
4. 什么是中心极限定理?答:中心极限定理表明,当样本量足够大时,独立同分布的随机变量之和的分布将趋近于正态分布。
5. 什么是置信区间?答:置信区间是一个区间估计,它给出了总体参数的一个可能范围,并且该范围有一定的置信水平。
6. 解释什么是假设检验。
答:假设检验是一种统计方法,用于根据样本数据来判断一个关于总体的假设是否成立。
7. 什么是相关系数?答:相关系数是度量两个变量之间线性关系强度和方向的统计量。
8. 什么是回归分析?答:回归分析是一种统计方法,用于研究变量之间的关系,特别是一个或多个自变量对因变量的影响。
9. 什么是方差分析?答:方差分析是一种统计方法,用于比较三个或更多组数据的均值是否存在显著差异。
10. 什么是标准差?答:标准差是衡量数据分散程度的一个指标,它是方差的平方根。
11. 什么是均值?答:均值是一组数据的算术平均值,它是所有数据值的总和除以数据的数量。
12. 什么是中位数?答:中位数是一组数据的中间值,当数据按照大小顺序排列时,位于中间位置的数值。
13. 什么是众数?答:众数是一组数据中出现次数最多的数值。
14. 什么是样本?答:样本是从总体中抽取的一部分个体,用于代表总体进行研究。
15. 什么是总体?答:总体是指研究中所有可能的个体的集合。
16. 什么是抽样误差?答:抽样误差是指由于样本的随机性导致样本统计量与总体参数之间的差异。
17. 什么是系统误差?答:系统误差是由于测量或实验设计中的偏差导致的误差,它会导致测量结果持续地偏离真实值。
18. 什么是数据的正态性?答:数据的正态性指的是数据分布接近正态分布,即呈现出对称的钟形曲线。
统计学试题(一)及其答案一、单项选择题(每小题2分,共20分)1.社会经济统计的数量特点表现在()。
A.它是一种纯数量的研究B.它是从事物量的研究开始来认识事物的本质C.它是从定性认识开始以定量认识为最终目的D.它是在质与量的联系中研究社会经济现象的数量方面2.若不断重复某次调查,每次向随机抽取的100人提出同一个问题,则每次都能得到一个回答“是”的人数百分数,这若干百分数的分布称为:()。
A.总体平均数的次数分布B.样本平均的抽样分布C.总体成数的次数分布D.样本成数的抽样分布3.当变量数列中各变量值的频数相等时()。
A.该数列众数等于中位数B.该数列众数等于均值C.该数列无众数D.该众数等于最大的数值4.描述数据离散程度的测度值中,最常用的是()。
A.全距B.平均差C.标准差D.标准差系数5.计算无关标志排队等距抽样的抽样误差,一般近似采用()。
A.多阶段抽样的误差公式B.简单随机抽样的误差公式C.分层抽样的误差公式D.整群抽样的误差公式6.将报告期两个城市物业管理费用的物价水平进行综合对比,属于()。
A.强度相对数B.动态相对数C.结构影响指数D.静态指数7.某地区商品销售额增长了5%,商品零售价格平均增长2%,则商品销售量增长()。
A.7% B.10% C.2.94% D.3%8.对于有线性相关关系的两变量建立的直线回归方城Y=a+bx中,回归系数b ()。
A.肯定是正数B.显著不为0C.可能为0 D.肯定为负数9.若产品产量增加,生产费用不变,则单位产品成本指数()。
A.上升B.下降C.不变D.不确定10.下列现象中具有侠义相关系数的现象的是()。
A.定期存款的利率与利息B.某种商品的销售额与销售价格C.居民收入与商品销售额D.电视机产量与粮食产量二、多选题:(每小题3分,共15分)1.推断统计学研究的主要问题()。
A.如何科学确定目标总体范围B.如何科学地从总体中抽样样本C.怎样控制样本对总体的代表性误差D.怎样消除样本对总体代表性误差E.如何科学地由所抽样本去推断总体2.若国外净要素收入为正数,则正确的数量关系为()。
模拟题一一、单选题(每题2分,共40分)1. 在同一总体中作样本含量相等的随机抽样,有99%的样本均数在下列哪项范围内_____。
A x ±2.58x sB x ±1.96x sC μ±2.58x σD μ±1.96x σE μ±2.58x s2.对于一组呈非正态分布的资料,反映其平均水平应使用哪个指标_______。
A 几何均数 B 中位数 C 上四分位数 D 四分位数间距 E 算术均数3. 关于构成比,不正确的是____。
A 构成比中某一部分比重的增减相应地会影响其他部分的比重B 构成比说明某现象发生的强度大小C 构成比说明某一事物内部各组成部分所占的分布D 若内部构成不同,可对率进行标准化E 构成比之和必为100%4. 以下属于分类变量的是_____。
A IQ 得分B 心率C 住院天数D 性别E 胸围5.在两样本均数比较的t 检验中,无效假设是 。
A 两样本均数不等B 两样本均数相等C 两总体均数不等D 两总体均数相等E 样本均数等于总体均数6. 由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指_____。
A 两总体均数不等 B 两样本均数不等C 两样本均数和两总体均数都不等D 其中一个样本均数和总体均数不等E 以上都不是7.在同一总体中作样本含量相等的随机抽样,有95%的样本均数在下列哪项范围内 。
A x ±2.58x sB x ±1.96x sC μ±2.58x σD μ±1.96x σE μ±2.58x s8.已知肺活量越大,表示人体肺功能越强,假设肺活量呈正态分布,现测定了200例正常人的肺活量值,则其95%正常值范围为_____。
A < x +1.65sB > x -1.65sC x -1.96s ~ x +1.96sD < P 5E > P 95 9.以下不属于方差分析前提条件的是_____。
《统计学》试题及答案(解答仅供参考)第一套一、名词解释1. 样本:在统计学中,样本是从总体中抽取的一部分个体,用于推断总体的特性。
2. 概率:概率是描述随机事件发生可能性的数值,范围在0到1之间。
3. 中位数:在一个数据集中,将所有数据按照大小排序后位于中间位置的数值称为中位数。
4. 方差:方差是描述一组数据分散程度的统计量,是各个数据与其平均数离差平方的平均数。
5. 相关系数:相关系数是衡量两个变量之间线性关系强度和方向的统计指标,其值介于-1和1之间。
二、填空题1. 在统计学中,______是描述数据集中趋势的常用指标,包括平均数、中位数和众数。
答案:集中趋势2. 如果一个随机变量的所有可能取值出现的概率相等,则该随机变量服从______分布。
答案:均匀分布3. 在进行假设检验时,我们通常会设定______水平,以决定拒绝原假设的标准。
答案:显著性水平(或称alpha水平)4. ______是通过观察样本来估计总体参数的一种方法。
答案:抽样5. 在回归分析中,______表示因变量的变化中能被自变量解释的比例。
答案:判定系数(R^2)三、单项选择题1. 下列哪种图表最适合展示各分类变量的频数分布?()A. 条形图B. 折线图C. 散点图D. 直方图答案:A2. 当两个随机变量完全正相关时,相关系数为()。
A. 0B. 1C. -1D. 无法确定答案:B3. 下列哪个统计量可用于度量数据的离散程度?()A. 平均数B. 中位数C. 众数D. 标准差答案:D4. 在t检验中,如果p值小于0.05,我们可以()。
A. 接受原假设B. 拒绝原假设C. 不能确定D. 都可以答案:B5. 在线性回归模型中,如果某个自变量的系数为负,那么这个自变量与因变量的关系是()。
A. 正相关B. 负相关C. 无关D. 不确定答案:B四、多项选择题1. 下列哪些是描述性统计分析的主要内容?()A. 平均数B. 中位数C. 众数D. 方差E. 相关系数答案:A、B、C、D、E2. 下列哪些是常用的概率分布?()A. 正态分布B. 均匀分布C. 泊松分布D. 二项分布E. 卡方分布答案:A、B、C、D、E3. 统计学中,总体与样本的关系是:A. 总体是全部数据,样本是部分数据B. 总体是随机抽取的部分数据,样本是全部数据C. 总体是固定不变的,样本是可以变动的D. 总体是随机的,样本也是随机的答案:A、C、D4. 下列哪种情况适合使用卡方检验?()A. 检验两个分类变量之间是否存在关联性B. 比较两组样本的平均值是否有显著差异C. 研究一个连续变量是否符合正态分布D. 预测一个响应变量的未来值E. 分析一个因素对实验结果的影响答案:A5. 在进行线性回归分析时,以下哪些假设通常需要满足?()A. 因变量和自变量之间存在线性关系B. 自变量之间不存在多重共线性C. 残差服从正态分布D. 同一样本中的观测值是独立的E. 样本数据必须是完整的,不能有缺失值答案:A、B、C、D五、判断题1. 标准差越大,数据的离散程度越大。
2010—2011学年第二学期武汉大学经管院 统计学原理 课程期末考试试卷(B )1、最早使用统计学这一学术用语的是( ) A 政治算术学派 B 社会统计学派 C 国势学派 D 数理统计学派2、对百货商店工作人员进行普查,调查对象是( ) A 各百货商店B 各百货商店的全体工作人员C 一个百货商店D 每位工作人员3、下列调查中,调查单位与填报单位一致的是( )A 企业设备调查B 人口普查C 农村耕地调查D 工业企业现状调查4、定基增长速度与环比增长速度的关系为( ) A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 5、按季节平均法测定季节比率时,各季的季节比率之和应等于( ) A 100% B 400% C 120% D 1200%6、某城市2009年末有人口750万人,有零售商业网点3万个,则该城市的商业网点密度指标是( ) A 2.5千人/个 B 250人/个 C 0.25个/千人D 250个/人7、2009年某地区新批准73个利用外资项目,这个指标属于( ) A 时点指标 B 时期指标一、单项选择题(本大题共20道小题,每小题1分,共20分)。
在每小题列出的四个备选项中只有一个是符合要求的,请将其代码填写在下面的方格内。
C 动态相对指标D 比较相对指标8、某企业报告期产量比基期增长了10% ,生产费用增长了8%,则其产品单位成本降低了()A 1.8%B 2%C 20%D 18%9、某居民在维持基本生活水准情况下,按报告期的物价购买消费品多支付20元,按基期价格购买的消费品支出是400元,则价格指数为()A 95%B 110%C 90%D 105%10、抽样极限误差是指抽样指标和总体指标之间()A 抽样误差的平均数B 抽样误差的标准差C抽样误差的可靠程度D 抽样误差的最大可能范围11、用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()A 2倍B 3倍C 4倍D 5倍12、在假设检验中,由于抽样偶然性,接受了实际不成立的H假设,则()A 犯第Ⅰ类错误B 犯第Ⅱ类错误C 推断正确D犯第Ⅰ类错误和推断正确都有可能13、机床厂某日从两台机器所加工的同一种零件中,分别抽取两个样本,检验两台机床的加工精度是否相同,则提出假设()A012112:;:H Hμμμμ=≠B2222220111:;:H Hσσσσ=≠C012112:;:H Hμμμμ≤>D2222220111:;:H Hσσσσ≤>14、在对总体参数的假设检验中,若给定显著水平(01)αα<<,则犯第Ⅰ类错误的概率为()A αB 1α-C /2αD 不能确定15、几何法平均发展速度等于()。
大学统计学考试题及答案一、选择题(每题3分,共30分)1. 以下哪项不是描述统计学研究内容的?A. 数据收集B. 数据分析C. 数据解释D. 统计推断答案:C2. 统计学中的“总体”指的是:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的个体答案:A3. 在统计学中,随机变量的期望值是指:A. 随机变量的平均值B. 随机变量的中位数C. 随机变量的众数D. 随机变量的方差答案:A4. 下列哪个选项是描述数据的集中趋势的?A. 方差B. 标准差C. 平均数D. 极差答案:C5. 以下哪个统计量用于度量数据的离散程度?A. 均值B. 中位数C. 众数D. 标准差答案:D6. 相关系数的取值范围是多少?A. -1到1之间B. 0到1之间C. 1到无穷大D. -无穷大到无穷大答案:A7. 以下哪个选项不是假设检验的步骤?A. 提出假设B. 收集数据C. 计算检验统计量D. 做出决策答案:D8. 在回归分析中,自变量是指:A. 因变量B. 被解释变量C. 解释变量D. 无关变量答案:C9. 以下哪个选项是时间序列分析的目的?A. 预测未来趋势B. 描述过去数据C. 进行假设检验D. 进行数据分类答案:A10. 以下哪个选项是统计学中的抽样误差?A. 由于随机抽样导致的误差B. 由于测量工具不准确导致的误差C. 由于数据录入错误导致的误差D. 由于样本量不足导致的误差答案:A二、填空题(每题3分,共30分)1. 在统计学中,________是指一组数据中出现次数最多的数值。
答案:众数2. 标准差是衡量数据________程度的统计量。
答案:离散3. 统计学中的“样本”是指从总体中随机抽取的________。
答案:一部分4. 相关系数的绝对值越接近1,表示两个变量之间的________越强。
答案:相关性5. 假设检验中的“零假设”通常表示没有________效应。
答案:显著6. 在回归分析中,如果自变量增加一个单位,因变量相应增加的单位数称为________。
2013~2014学年第二学期XX大学经济与管理学院《统计学》(A卷)开卷时间: 19:00~21:00学号____________姓名____________学院____________专业___________分数___________一、名词解释(5选4,多选无效,每题4.5分)1、同度量因素2、抽样误差3、相关关系4、离散系数5、时点数二、理论辨析题(6选4,多选无效,每小题7分)l、举例说明总体、样本、参数、统计量这几个概念及它们之间的区别和联系。
2、假设检验的基本思路是什么?请从经济学、管理学等不同角度谈谈假设检验的应用背景。
3、为什么要设计统计调查方案,一个完整接的统计调查方案应该包括哪些内容?4、相关与回归分析的关系?5、方差分析的研究对象、解决思路是什么?6、谈谈你对大数据的认识。
三、分析计算题(6选3,多选无效,每小题18分)1、某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成新措施的户数比例的置信区间,置信水平为94.45%(Z=2)(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设允许的估计误差E=0.08,置信水平为95.45%)2、举一例,计算平均数和标准差,要求用组距数列。
3、某市某产品连续四年各季度的出口额资料如下(单位:万元):要求计算该市该产品出口额的季节指数,并对其季节变动情况做简要分析(第三年资料请自己拟定)。
4,对企业总成本的变动分析最常用的方法是统计指数体系的总量指标两因素分析,请自拟数据分析某一企业总成本的变动受产量和单位产品成本的影响。
(要求两个因素影响是相反的)。
5、某企业某种产品产量与单位成本资料如下:(l)计算系数,说明相关程度。
(2)确定单位成本对产量的直线回归方程,指出产量每增加1000件时,单位成本平均下降多少元?(3)如果单位成本为70元时,产量应为多少?(4)计算估计标准误差。
统计学复习题和答案1. 什么是总体和样本?它们之间有什么区别?2. 解释什么是参数估计,并给出一个例子。
3. 描述中心趋势的度量方法,并解释它们的适用场景。
4. 什么是标准差?它在数据分析中的作用是什么?5. 什么是正态分布?它的特点是什么?6. 解释什么是假设检验,并给出一个实际应用的例子。
7. 什么是相关系数?它如何帮助我们理解变量之间的关系?8. 描述线性回归分析的基本原理,并解释其在实际问题中的应用。
9. 什么是置信区间?它在统计推断中的作用是什么?10. 解释什么是样本量,为什么样本量的大小会影响研究结果的可靠性?答案1. 总体是指研究中所有可能的观察对象的集合,而样本是从总体中随机抽取的一部分观察对象。
总体通常很大,而样本是总体的一个代表性子集。
2. 参数估计是指使用样本统计量来估计总体参数的过程。
例如,使用样本均值来估计总体均值。
3. 中心趋势的度量方法包括均值、中位数和众数。
均值适用于数据分布对称的情况,中位数适用于数据分布不对称或包含异常值的情况,众数用于描述数据中出现频率最高的值。
4. 标准差是衡量数据分布离散程度的一个指标,它表示数据点与均值的平均距离。
标准差越大,数据的波动性越大。
5. 正态分布是一种连续概率分布,其特点是数据分布呈对称的钟形曲线,均值、中位数和众数三者相等。
6. 假设检验是一种统计方法,用于确定样本数据是否足以支持或反对某个关于总体的假设。
例如,检验一个新药是否比现有药物更有效。
7. 相关系数是衡量两个变量之间线性关系强度和方向的统计量。
它的值范围在-1到1之间,值越接近1或-1,表示变量之间的关系越强。
8. 线性回归分析是一种用于预测一个变量(因变量)与一个或多个其他变量(自变量)之间线性关系的统计方法。
它在经济、社会科学和生物统计学等领域有广泛应用。
9. 置信区间是一个范围,表示在给定的置信水平下,总体参数可能的取值范围。
它在统计推断中用于表达对总体参数估计的不确定性。
《统计学》复习题和答案《统计学》复习题⼀、单选题1.某城市进⾏⼯业企业未安装设备普查.个体是( B )A.⼯业企业全部未安装设备 B.⼯业企业每⼀台未安装设备C.每个⼯业企业的未安装设备 D.每⼀个⼯业企业2.⼯业企业的设备数.产品产值是( A )A.连续变量 B.离散变量C.前者是连续变量.后者是离散变量 D.前者是离散变量.后者是连续变量3.对某班学⽣按年龄分成16-18岁、19-21岁、22-24岁三组.则24岁是( A )A. 最⼤值 B. 组中值 C. 第三组的上限 D. 第三组的组中值4.⼀个组的上限与下限之差称为( D )A. 组中值B. 组数C. 全距D. 组距5.连续变量数列中.其末组为开⼝组.下限是1000.相邻组的组中值为975.则末组的组中值为( D )A. 987.5B. 1000C. 1025D. 10506. 在建筑业设备普查中.每个建筑企业是( B )A. 调查对象B. 填报单位C. 调查单位D. 调查项⽬7.向上累计次数表⽰截⽌到某⼀组为⽌( A )A.上限以下的累计次数 B.下限以上的累计次数C.各组分布的次数 D.各组分布的频率8. ⼀组样本数据为3、3、1、5、13、12、11、9、7。
这组数据的中位数是( D )A.3B.13C.7.1D.79.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
在对称的钟形分布中( A )A.算术平均数=中位数=众数B.算术平均数>中位数>众数C.算术平均数<中位数<众数D.中位数>算术平均数.>众数10.⽤不考虑顺序的不重复抽样⽅法.从8个⼈中抽选3个⼈.所得样本可能数⽬的公式为( B )A .)!38(!3!8-B .38 C .)!38(!8- D .)!38(!3)!138(--+11.某同学的英语成绩为80分.则“成绩”是( A )A .品质标志B .数量标志C .标志值D .数量指标 12.了解某地区⼯业企业职⼯的情况.下列哪个是统计指标( C ) A .该地区每名职⼯的⼯资额 B .该地区职⼯的⽂化程度 C .该地区职⼯的⼯资总额 D .该地区职⼯从事的⼯种 13.对于统计分组设计.下列哪种说法是错误的( B )A. 分组时各组之间界限要明确.不允许重叠和交叉 B. 总体中的每⼀个单位.不都应只属于其中的⼀个组 C. 分组时.不能出现有任何⼀个单位⽆组可归的情况 D. 分组⽅案中.拟定的所有组⼀定要能够包容总体的所有单位 14.随着总体范围的扩⼤.据以计算的质量指标数值( D ) A. ⼀定增⼤ B. 肯定不变C. ⼀定缩⼩D. 和总体范围扩⼤⽆直接关系15.对某市全部商业企业职⼯的⽣活状况进⾏调查.调查对象是( B ) A. 该市全部商业企业 B. 该市全部商业企业职⼯ C. 该市每⼀个商业企业 D. 该市商业企业的每⼀名职⼯ 16. 下列调查中.调查单位与填报单位⼀致的是( D ) A. 企业设备调查 B. ⼈⼝普查 C. 农村耕畜调查 D. ⼯业企业现状调查17.某连续变量分为五组:第⼀组为40—50.第⼆组为50—60.第三组为60—70.第四组为70—80.第五组为80以上.依习惯上规定( B )A .50在第⼀组.70在第四组B .60在第⼆组.80在第五组C .70在第四组.80在第五组D .80在第四组.50在第⼆组18. 次数分布有朝数量⼤的⼀边偏尾.曲线⾼峰偏向数量⼩的⽅向.该分布曲线属于( D )A.正态分布曲线 B.J型分布曲线C.右偏分布曲线 D.左偏分布曲线19. 某地区有10万⼈⼝.共80个商业⽹点.平均每个商业⽹点要服务1250⼈.这个指标是( A )A.平均指标B.强度相对指标C.总量指标D.发展⽔平20.将对⽐的基数抽象为10.则计算出来的相对数称为( D )A.倍数B.百分数C.系数D.成数⼆、多选题1.下列属于连续变量的是( ACE )A.⼚房⾯积 B.职⼯⼈数 C.原材料库存量D.设备数量 E.产值2.下列各项中.属于品质标志分组的有( AB )A. 职⼯按性别分组B. ⼯⼈按⼯种分组C. 职⼯按⼯龄分组D. 企业按利润额分组E. 企业按经济类型分组3.统计分组的主要作⽤有( ABCD )A.研究总体内部各个组成部分之间的相互关系B.研究总体的内部结构C.描述相互关联的统计变量之间的依存关系D.描述统计变量的分布情况E.根据研究⽬的选择分组标志4. 某市为了解本年年末的煤炭库存情况.特别向各单位颁发调查表要求填报.这种调查属于( BCD )A. 统计报表制度B. 普查C. 专门调查D. 经常性调查E. ⼀次性调查5.在统计上.通常使⽤的频率分布图主要有( ACD )A.直⽅图 B.散点图 C.折线图 D.曲线图6.从均值为200、标准差为50的总体中.抽取⼀个容量为100的简单随机样本.则有( BD )A.样本均值的期望值是2 B.样本均值的期望值是200C.样本均值的标准差是5D.样本的均值的标准差是50 7.简单随机抽样根据取样的⽅式不同分为( AE )A.重复抽样 B.等距抽样 C.整群抽样D.分层抽样 E.不重复抽样8.影响组距数列分布的要素有( BCD )A.组类 B.组限 C.组距D.组中值 E.组数据9.分布在各组的总体单位数称为( AE )A.次数 B.频率 C.⽐率D.次数密度 E.频数10.下列属于数值平均数的有( ABD )A.算术平均数B.调和平均数C.中位数D.⼏何平均数E.众数11.下列关于确定组限的说法中正确的是( ABC )A.不能把不同性质的单位划分在⼀个组B.尽量让组中值同分到组内各单位的标志值的平均数接近C.有重叠组限与⾮重叠组限之分D.重叠组限的含义是上限在本组内.下限不在本组内E.当资料中有特⼤、特⼩异常值时.可相应采取开⼝组的形式.开⼝组不存在组中值12. 在全国⼯业普查中.每个⼯业企业是( BDE )A. 调查总体B. 调查单位C. 调查对象D. 报告单位E. 总体单位13. 统计调查表的形式有( AD )A. 单⼀表B. 简单表C. 分组表D. ⼀览表E. 复合分组表14.对于组距数列以下各项表述正确的有( ABCDE )A.最⼩组下限要低于最⼩变量值 B.最⼤组上限要⾼于最⼤变量值C.组的确定要有利于表现总体分布规律 D.连续变量相邻组限⼀般要重合E.离散变量相邻组限⼀般要间断15.下列属于时点指标的有( AE )A.某地区⼈⼝数B.某地区死亡⼈⼝数C.某地区出⽣⼈⼝数D.某地区⽣产总值E.某地区的学校数16.下列指标中属于平均指标的有( BC )A.⼈均国民收⼊B.⼈⼝平均年龄C.粮⾷亩产量D.⼈⼝密度E.⼈⼝⾃然增长率17.等距抽样按样本单位抽取的⽅法不同分为( BCE )A.⽆关标志等距抽样 B.随机起点等距抽样C.中点等距抽样 D.有关标志等距抽样E.对称等距抽样18.当现象完全相关时:( BC )- C.r=1 D.r=0.5 A.r=0 B.r=1-E.r=5.019.测定现象之间有⽆相关关系的⽅法有( ABC )A.编制相关表 B.绘制相关图 C.对客观现象做定性分析D.计算估计标准误 E.配合回归直线20.根据连续五年的历史资料计算得到各季的季节⽐率为( ABCDE )A.120% B.80% C.50% D.140% E.150%三、名词解释1.统计指标体系:统计指标体系是指若⼲个相互联系的统计指标所构成的总体.⽤以说明被研究现象各个⽅⾯相互依存和相互制约的关系.从不同⾓度、不同侧⾯全⾯反映研究对象的总体状况。
武汉大学《数理统计》2022—2023学年第一学期期末试卷一、单项选择题1、设总体X~E(λ),则λ的矩估计和极大似然估计分别为()A、B、C、D、2、极大似然估计必然是( )。
A、相合估计 B、似然函数的极值点C、似然方程的根 D、无偏估计3、设总体为来自该总体的样本,为样本均值,为样本方差,则的极大似然估计为A、B、sC、D、s24、设X1,X2…X20,是来自总体N(μ,σ2)的样本,则统计量_____为σ2的无偏估计量。
()A、B、C、D、5、设随机变量 X的概率密度函数是,则 a=()A.0.5B.1C.2D.ln26、A、 B C D7、设随机变量 X与 Y相互独立,则 P{X=-2|Y=1}=()A.0.25B.0.3C.0.4D.0.58、A.1/4B.1/2C.2D.49、设二维连续型随机变量(X,Y)的分布函数是?X,Y),则有X> 1,Y≤2} =()A.(1,2)B.(1,2)C. (1,+∞)−?(1,2)D.(+∞,2)−?(1,2)10、已知随机变量 X~N(-2,2),则下列随机变量中,服从 N(0,1)分布的是()A、 B、 C、D、二、填空题(总分30分)1、总体X ~N(μ,σ2),则11+μ的极大似然估计值为________2、设总体X 的概率密度为其中为未知参数,x1,x2,…,xn 为来自X 的样本,则的矩估计= _____。
3、设总体X 的分布律为其中p 为未知参数,0<p <1,设为来自该总体的样本,为样本均值,则p 的矩估计______.4、设总体X 的概率密度为f(x;),其中为未知数,且, x 1,x 2,…,x n 为来自总体X 的一个样本, 为样本均值.若为的无偏估计,则常数c=______.5、假设总体X 服从参数为的泊松分布,X 1,X 2,…,X n 是来自总体X 的简单随机样本,其均值为,样本方差S 2=。
已知为的无偏估计,则=______.6、7、设随机变量(X,Y)的概率密度为f(x,y)=,则X 的边缘概率密度f x (x)= ________________.8、设随机变量(X,Y)服从区域D 上的均匀分布,其中区域D 是直线y=x ,x=1和x 轴所围成的三角形区域,则(X,Y)的概率密度f(x,y)= ________________.9、设某个假设检验的拒绝域为W ,当原假设H 0成立时,样本(x 1,⎩⎨⎧≤≤≤≤其他2y 0,1x 0xyx 2,…,x n )落入W 的概率是0.1,则犯第一类错误的概率为________.10、已知一元线性回归方程为________.三、综合题(总分40分)1、设总体X 的概率密度其中未知参数θ>-1,x 1,x 2…,x n 是来自该总体的一个样本,求参数θ的矩估计和极大似然估计.2、设总体X 服从指数分布,概率密度(1)求λ的矩估计;(2)求λ的极大似然估计。
大学统计学考试题及答案一、选择题(每题2分,共20分)1. 下列哪个选项是统计学中的平均数?A. 众数B. 中位数C. 均值D. 方差答案:C2. 在统计学中,标准差是用来衡量什么?A. 数据的分布情况B. 数据的集中趋势C. 数据的离散程度D. 数据的相关性答案:C3. 如果一个数据集的方差为0,这意味着什么?A. 数据集中的所有数据点都不相同B. 数据集中的所有数据点都相同C. 数据集没有离散性D. 数据集没有对称性答案:B4. 下列哪个统计量可以用来衡量两个变量之间的线性关系?A. 相关系数B. 回归系数C. 方差D. 标准差答案:A5. 在进行假设检验时,如果p值小于显著性水平,我们通常会:A. 拒绝零假设B. 接受零假设C. 无法做出决策D. 需要更多的数据答案:A6. 一个总体的平均值用哪个希腊字母表示?A. αB. βC. μD. σ答案:C7. 在统计学中,样本容量至少应该是多少,才能被认为是一个有效的样本?A. 2B. 30C. 5D. 没有固定标准答案:D8. 中心极限定理适用于哪种类型的分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:B9. 下列哪项不是描述性统计的内容?A. 数据的收集B. 数据的图表表示C. 数据的概括和总结D. 数据的推断答案:D10. 在统计学中,一个数据集的四分位数将数据集分为几个部分?A. 2B. 3C. 4D. 5答案:B二、填空题(每题3分,共30分)11. 统计学中的________是用来描述数据集中趋势的一个量,它是指数据集中出现次数最多的数值。
答案:众数12. 如果一个数据集的标准差是5,那么它的离散程度________(填“大”或“小”)。
答案:大13. 在进行回归分析时,我们通常使用________来预测因变量的值。
答案:回归方程14. 统计学中的________检验是用来检验两个独立样本均值是否有显著差异的一种方法。
2014-2015学年第二学期武汉大学经济与管理学院《统计学》(B卷)开卷时间:120分钟学号姓名学院专业分数一、名词解释(5选4,多选无效,每小题4.5分)1、抽样误差2、线性相关3、总指数4、时期数5、回归系数二、理论辨析题(6选4,多选无效,每小题7分)1、简述方差分析的基本思想。
2、平均数理论是统计学的基础,请你谈谈其理论在统计指数理论和抽样理论中是如何体现的?你有何认识。
3、同度量因素有什么作用?4、大数据对传统统计分析方法有什么机遇和挑战?5、什么是随机原则?在抽样调查中为什么要遵循随机原则?6、举例说明相关分析与回归分析的异同。
三、分析计算题(6选3,多选无效,每小题18分)1、如果我们要评价几所大学的学生英语水平的稳定性,你认为应该应用统计学的什么方法进行定量分析,试举例计算说明方法的应用。
3、某一酿造厂长新引进一种酿醋曲种,以原曲种为对照进行试验。
已知原曲种酿出的食醋醋酸含量平均数为9.75%,其标准差为5.30%,现在采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均数为11.99%。
试以0.01显著性水平检验,能否由这30个醋样的平均数判断新曲种好于原曲种?(第三年资料请自己拟订)。
5、南孚AAA电池的寿命(单位:分钟)的95%的置信区间是430<μ<470。
假设这个结果是根据一个容量为100的样本得出的。
请问:(1)样本均值是多少?样本标准差是多少?(2)构建99%的置信区间。
6、道琼斯工业指数(DJA)是一个受到广泛关注的股市指标。
下表是连续某些年的DJA值。
(请注意:学号尾数为偶数的同学,请用8年的资料预测第九年的DJA值。
)。
第一章 绪论思考题:1. 医药统计研究的过程是什么?2. 统计资料主要分为哪几种类型?3. 什么是总体;什么是样本。
4. 概率与常用概率分布练习与思考1.瓶中装有100片药片,其中有5片次品,从中任取10片,求: (1)10片全是正品的概率; (2)恰有2片次品的概率。
2.10把钥匙中有3把能打开锁,任取2把,求能打开锁的概率。
3.设A ,B ,C 是三个随机事件,试用A ,B ,C 表示下列事件: (1)A 不发生而B ,C 都发生;(2)A 不发生而B ,C 中至少有一个发生; (3)A ,B ,C 中至少有两个发生; (4)A ,B ,C 中恰有两个发生。
4.某药厂的针剂车间灌注一批注射液,需4道工序,已知由于割瓶时掉入玻璃屑而成废品的概率为0.5,由于安瓿洗涤不洁而造成废品的概率为0.2,由于灌药时污染而成废品的概率为0.1,由于封口不严而成废品的概率为0.8,试求产品合格的概率。
5.甲乙两个反应罐在1小时内需要工人照顾的概率分别为0.1和0.2。
求在1小时内: (1)甲乙两罐都需要照顾的概率; (2)甲乙两罐都不需要照顾的概率;(3)一罐需要照顾而一罐不需要照顾的概率。
6.设()0.2, ()0.3, (/)0.3,P A P B P A B ===试求:(1)()P AB ; (2)(/)P B A ; (3)()P AB ; (4)()P A B +。
7.三个射手向一敌机射击,射中的概率分别为0.4,0.6,0.7。
如果一人射中,敌机被击落的概率为0.2;二人射中,敌机被击落的概率为0.6;三人射中则必被击落。
已知敌机被击中,求该机是三人击中的概率?8.已知X 的可能取值为0,±1,±2,且}1|{|}2{,6.0}1|{|,3.0}0{,4.0}21{==≥=≤===<<-X P X P X P X P X P试求:X 的概率分布? 9.已知在8次独立试验中,事件A 至少发生一次的概率为0.57,试求在一次试验中事件A 发生的概率?10.当投掷五枚分币时,已知至少出现两个正面,问:正面数刚好是三个的条件概率? 11.设X 服从泊松分布,且已知{}{}12P X P X ===,求{}4P X =。
12.设k 在[0,5]上服从均匀分布,求方程02442=+++k kx x 有实根的概率? 13.设随机变量X 的概率密度函数为1()xf x<=⎩其它求:(1)常数c;(2)X落在区间1122⎛⎫-⎪⎝⎭,的概率。
14.设随机变量X的概率密度函数为cos2()2A x xf xxππ⎧≤⎪⎪=⎨⎪>⎪⎩试求:(1)系数A;(2)求X的分布函数;(3)X落在0,4π⎛⎫⎪⎝⎭内的概率。
15.设随机变量X的分布函数为()01x xeF xx>⎧-=⎨≤⎩试求:(1){}23P X≤<;(2)求X的概率密度函数。
16.设~(0,1)X N,计算:(1){}2.35P X<;(2){}1.54P X<。
17.设~(3,4)X N,计算:(1){}25P X<≤;(2){}2.5P X<;18.设~(0,1)X N,试求λ,满足(1) {}0.99;P Xλ<=(2) {}0.95;P Xλ<=(3) {}{}P X P Xλλ≤=>。
19.已知),160(~2σNX,若8.0}200120{≥<<XP,问:允许σ最多为多少?20.将一枚硬币抛掷10000次,出现正面5800次,认为这枚硬币不均匀是否合理?试说明理由。
21.设随机变量X的概率分布为2{},1,2,3,3xP X x C x⎛⎫===⎪⎝⎭试求:(1)C;(2)()E X。
22.有n把钥匙,其中只有一把能打开锁。
今任取一把试开,若每把钥匙试开一次后除去,试求:(1)打开此门所需次数的概率分布;(2)打开此门所需次数的总体均值与方差。
23.设随机变量X 的概率分布为:32}{31}{====b X P a X P 又()0 ; ()10E X D X ==,确定系数,a b 。
24.X 试求:(1)常数λ (2)()E X ; (3)(23)E X -; (4)(21)D X +。
25.设随机变量X 的概率密度为1|1|02()x x f x --≤≤⎧=⎨⎩其他 试求:(1)()E X ;(2)()D X 。
26.设随机变量X 的分布函数度为01()arcsin 1111x F x A B x x x <-⎧⎪=+-≤<⎨⎪≥⎩试求常数,A B ; 并求()E X ,()D X 。
第三章 数据特征与统计描述一、选择题1.用图形表示某地10年来三种疾病的发病率在各年的升降速度,宜绘制( ) A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图2.计算某抗体滴度的平均水平,一般宜选择( )A.算术均数B.几何均数C.中位数D.百分位数 3.比较身高与体重的变异程度宜用的指标是( )A.标准差B.标准误C.四分位间距D.变异系数E.全距 4.观察值2、 5、 10、 7、 9、 8、 20、 100的平均数是( )A.20.14B.6.15C.8.5D.20E.10 5.用均数和标准差可全面描述下列哪项资料的特征( )A.正偏态分布B.负偏态分布C.正态分布D.对数正态分布E.任何分布的计量资料 6.直方图可用于( )A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度 7.统计图表的要求是( )A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时,分组数目一般为()A.5~10B.8~15C.10~30D.15~20E.>209.平均数作为一种统计指标是用来分析()A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是:A.全距B.标准差C.方差D.变异系数E.以上均是二、简答题1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?2.频数表的用途有哪些?3.简述统计表和统计图的主要结构。
4.常见的统计图有哪些?如何根据资料性质来选择适当的统计图?三、计算题1.抽样调查100名长期应用氨茶碱的哮喘患儿血浆总胆固醇含量(mmol/L),数据如表3-16。
表3-16 100名哮喘患儿血浆总胆固醇含量(mmol/L)5.02 4.78 5.01 5.04 4.92 4.98 4.97 5.05 5.08 5.125.01 5.06 4.87 5.06 5.00 5.04 5.17 4.91 4.97 4.974.95 4.94 4.99 4.985.07 5.15 5.05 5.10 5.09 4.865.00 4.82 4.98 4.93 4.97 4.95 4.90 5.08 4.94 4.974.865.11 4.95 5.01 5.08 5.04 5.04 5.11 4.99 4.994.815.10 4.73 5.09 5.03 4.95 4.78 4.96 5.07 5.014.885.06 4.77 4.87 5.14 5.21 4.81 5.14 4.88 5.084.92 4.975.01 4.97 4.89 4.99 5.01 5.00 4.99 5.174.95 4.925.16 5.03 5.23 5.06 5.15 4.84 4.91 4.975.07 4.89 5.17 4.99 5.00 5.00 4.89 4.93 4.83 4.97(1)试编制频数分布表,概括其分布特征。
(2)计算均数、标准差。
(3)计算中位数、四分位间距(4)比较均数与中位数,并说明用哪一个指标比较合适。
2.某医生对933名正常人进行了转氨酶的调查,其频数分布如表3-17。
表3-17 933名正常人转氨酶的频数分布(1)933名正常人转氨酶平均水平是多少?(2)计算四分位数及四分位数间距。
(3)计算90%的医学参考值范围。
3.根据资料的类型与分布特点,选择合适的平均指标反映各组资料的平均水平,并给出具体的计算结果?⑴8例某病患者疗前血液尿素氮(mmol/L)的测定结果为:4.6、5.1、3.0、5.6、4.4、3.5、5.2、5.0。
⑵7例某癌患者治疗后存活的天数为:128、79、243、65、49、162、1154。
⑶6例感染者BKV HAI 抗体最高滴度之倒数的测定结果为:320、640、640、1280、2560、5120。
4.某地1978年各种传染病的病例数与构成百分比为:痢疾6026(50.2%),肝炎2336(19.8%),流脑900(7.5%),麻疹1260(10.5%),其他1440(12.0%),1980年各种传染病的病例数与构成百分比为:痢疾3685(48.6%),肝炎2111(27.9%),流脑522(6.9%),麻疹410(5.4%),其它850(11.2%),根据此资料作统计表。
5.某医院用某三药治疗慢性支气管炎的疗效如下:药物 病例数 痊愈数 痊愈率(%)甲 83 33 40 乙 90 41 45 丙852428试根据上述数据绘制合适的统计图。
6.某地1951~1956年肺结核与白喉的死亡率(1/10万)如下,请绘制线图和半对数线图,并说明两种图有何不同。
年份 1951 1952 1953 1954 1955 1956 肺结核 164.4 135.8 79.9 64.7 74.5 63.0 白 喉 18.72.52.51.01.21.0第四章 抽样分布与参数估计一、最佳选择题1. F 分布、t 分布、2χ分布和正态分布各有几个参数( )? A. 1,1,1,1 B. 2,2,2,2 C. 2,1,1,2 D .1,2,2,1 E. 2,1,1,1 2.关于以0为中心的t 分布,错误的是( ) A. t 分布图是一簇曲线B. t 分布图是单峰分布B. 当ν→∝时,t →Zt 分布图以0为中心,左右对称E.相同ν时,t 越大,P 越大3.某指标的均数为X ,标准差为S ,由公式()1.96, 1.96X S X S -+计算出来的区间,常称为( )。
A. 99%参考值范围B. 95%参考值范围C. 99%置信区间D. 95%置信区间E. 90%置信区间4.样本率p 与总体率π均已知时,计算样本率p 的抽样误差的公式为( )。
5.在已知均数为μ, 标准差为σ的正态总体中随机抽样,X μ-≥( )的概率为5%。
A.1.96σB. 1.96X σC. 0.05/2,t S νD. 0.05/2,X t S νE. 0.05/2,X t νσ 二、思考题1. 标准误与标准差的区别。