统计学试题3
- 格式:doc
- 大小:84.00 KB
- 文档页数:4
统计学复习题一、单选题1.一个统计总体()。
A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标2、在重庆地区经济普查中,总体单位是()A.重庆地区所有经济单位B.重庆地区每个区县C.重庆地区每个经济单位负责人D.重庆地区每个经济单位3、某班学生数学考试成绩有65、75、85、80,这四个数是()A.特征B.统计量C.变量D.数据4、总量数据是()的答案。
A.绝对数B.平均数C.相对数D.众数5、()不是统计的基本功能A.管理功能B.咨询功能C.信息功能D.监督功能6.序次级数据可以用来( )。
A.比较大小B.加减运算C.计算平均数D.计算比率7、区别重点调查与典型调查的主要标志是()A. 调查单位的多少B. 调查项目的多少C. 调查单位的性质不同D. 调查的组织形式不同8、对占煤炭开采量75%的大矿井进行劳动生产率调查;统计机关在住有全国城市人口一半以上的各大城市的超市零售价格水平进行系统调查。
这些都是()A. 全面调查B. 抽样调查C. 重点调查D. 典型调查9.普查工作可以()A.经常进行 C.根据需要随时进行B.只能进行一次 D.根据需要每隔一段时间进行一次10.抽样调查与典型调查的根本区别在于()A. 调查的范围不同B. 选取调查单位的方法不同C. 组织方式不同D. 作用不同11、统计机关在住有全国城市人口一半以上的各大城市的超市零售价格水平进行系统调查。
这是()A. 全面调查B. 抽样调查C. 重点调查D. 典型调查12、某连续变量数列,末组定义为500元以上,其邻近组的组中值为480元,则末组组中值为()元。
A.520B.510C.530D.54013.分组时若某一总体单位的变量值刚好等于相邻组上、下限时,应将其归入( )A.下限所在组B.上限所在组C.任意一组均可D.另立新组14.将统计总体按某一标志分组后,其结果是()A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性15、一般情况下,按年龄分组的人口死亡率表现为()A.钟型分布B.正J型分布C. U型分布D. S型分布16、分配数列有两个组成要素,他们是()A. 总体容量与变量数B.组距与组数C. 分组名称与各组次数D.变量与数据17、某企业2006年职工平均工资为5000元,标准差为100元,2007年职工平均工资增长了20%,标准差增大到150元。
统计学考试题及答案一、选择题(每题2分,共20分)1. 以下哪个不是描述性统计的范畴?A. 均值B. 中位数C. 众数D. 回归分析2. 标准差是衡量数据的:A. 集中趋势B. 离散程度C. 偏态D. 峰态3. 在正态分布中,数据的分布形态是:A. 双峰B. 单峰C. U形D. 无规律4. 以下哪个是参数估计的目的?A. 描述总体B. 描述样本C. 估计总体参数D. 进行假设检验5. 假设检验中的零假设(H0)通常表示:A. 研究者希望证明的效应B. 没有效应或效应为零C. 效应显著D. 效应不显著二、简答题(每题10分,共30分)6. 简述中心极限定理的内容及其在实际应用中的意义。
7. 解释什么是置信区间,并说明其在统计推断中的作用。
8. 描述什么是相关系数,并解释其在数据分析中的重要性。
三、计算题(每题25分,共50分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。
请计算: - 均值- 中位数- 众数- 方差- 标准差10. 假设某产品的质量控制数据服从正态分布,平均重量为100克,标准差为5克。
如果从这批产品中随机抽取100个样本,计算样本均值在95%置信水平下的置信区间。
统计学考试答案一、选择题1. D(回归分析属于推断统计)2. B(标准差是衡量数据离散程度的指标)3. B(正态分布是单峰分布)4. C(参数估计的目的是估计总体参数)5. B(零假设通常表示没有效应或效应为零)二、简答题6. 中心极限定理指出,大量独立同分布的随机变量之和在次数趋于无穷大时趋于正态分布,无论原始分布是什么。
这一定理在抽样调查、质量控制等领域有广泛应用。
7. 置信区间是用于估计总体参数的一个区间范围,它表示在多次抽样的情况下,有特定比例(如95%)的样本统计量会落在这个区间内。
它在统计推断中帮助我们对总体参数进行估计。
8. 相关系数是度量两个变量之间线性关系强度和方向的统计指标。
统计学题库3-1-8
问题:
[单选]为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()
A.A、简单随机抽样
B.B、分层抽样
C.C、系统抽样
D.D、整群抽样
问题:
[单选]为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是()
A.A、简单随机抽样
B.B、分层抽样
C.C、系统抽样
D.D、整群抽样
问题:
[单选]在一项调查中,调查单位和填报单位()
A.A、无区别,是一致的
B.B、有区别,是不一致的
C.C、无区别,是人为确定的
D.D、有区别,但有时是一致的
出处:山东11选5 https://;
问题:
[单选]对家用电器的平均寿命进行调查,应该采用()
A.A、普查
B.B、重点调查
C.C、典型调查
D.D、抽样调查
问题:
[多选]下列属于原始数据的是()
A.A、统计部门掌握的数据
B.B、说明总体单位特征的数据
C.C、说明总体特征的数据
D.D、还没有经过分组汇总的数据
E.E、直接向调查单位登记得到的数据
问题:
[问答题,简答题]进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?
问题:
[单选]在累计次数分布中,某组的向下累计次数表明()
A.A、大于该组上限的次数是多少
B.B、大于该组下限的次数是多少
C.C、小于该组上限的次数是多少
D.D、小于该组下限的次数是多少。
统计学考试试题及答案统计学是一门研究数据收集、处理、分析和解释的科学。
以下是一份统计学考试试题及答案,供参考。
一、选择题(每题2分,共20分)1. 以下哪项不是描述性统计的组成部分?A. 均值B. 方差C. 标准差D. 抽样答案:D2. 总体参数与样本统计量的主要区别是什么?A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 总体参数和样本统计量都是固定的D. 总体参数和样本统计量都是变化的答案:A3. 正态分布的特点是:A. 均值等于中位数B. 均值不等于中位数C. 标准差等于0D. 均值大于标准差答案:A4. 相关系数的取值范围是:A. (-1, 1)B. (0, 1)C. (-∞, ∞)D. (1, ∞)答案:A5. 以下哪种情况适合使用t检验?A. 总体标准差未知B. 总体标准差已知C. 样本量很大D. 样本量很小答案:A二、简答题(每题10分,共20分)1. 简述中心极限定理的内容及其在实际应用中的意义。
答案:中心极限定理指出,在一定条件下,大量相互独立的随机变量之和经过标准化后趋于正态分布,无论这些随机变量本身是什么分布。
这一定理在实际应用中非常重要,因为它允许我们使用正态分布的性质来估计总体参数,即使我们不知道总体的具体分布。
2. 解释什么是置信区间,并说明其在统计推断中的作用。
答案:置信区间是一个范围,用于估计总体参数的值。
它基于样本统计量和概率分布来构建,表示我们对总体参数的估计值有一定的信心。
在统计推断中,置信区间提供了一种量化不确定性的方法,帮助我们理解估计的可靠性。
三、计算题(每题15分,共30分)1. 给定一组数据:23, 27, 31, 35, 39, 43, 47, 51, 55, 59。
计算这组数据的平均值和标准差。
答案:平均值(均值)= (23+27+31+35+39+43+47+51+55+59) / 10 = 39 标准差= √[(Σ(xi - 均值)²) / (n-1)] = √[(Σ(23-39)²+ ... + (59-39)²) / 9] ≈ 11.362. 假设某班级学生的平均成绩为80分,标准差为10分。
模拟试题三一、单项选择题(下列每小题备选答案中,只有一个符合题意的答案。
请将选定答案的字母编号填入下表中对应题目的空格内。
本类题共15分,每小题1分)1. 连续变量分组,若第一组为200以下,第二组为200-300,第三组为300-400,第四组为400以上,则数据()A. 200在第一组B. 200在第二组C. 200在第三组D. 200在第四组2. 某种产品产量2014年比2013年增长了10%,2015年比2013年增长了12%,则2015年比2014年增长了()A. 12%÷10%B.(112%÷110%)—1C. 112%÷110%D. 110%÷112%3. 统计指数按其所考察的范围不同,可以分为()A.个体指数和总指数 B.数量指标指数和质量指标指数C.动态指数和静态指数 D.简单指数和加权指数4. 统计研究的前提条件是()A. 大量性B. 变异性C. 可靠性D. 灵活性5.某厂A产品的总成本比去年增长了50%,产量增长了25%,则单位成本上升了()A.25% B.2%C.75% D.20%6. 在统计的三层涵义中,统计学与统计活动的关系是()A.过程与成果的关系 B.理论与实践的关系C.本质与内容的关系 D.无关系7. 要了解50个学生的学习情况,则总体单位是()A.50个学生 B.50个学生的学习成绩C.每一个学生 D.每一个学生的学习成绩8.属于时点总量指标的是()A.2016年的产品产量 B.2016年的死亡人数C.2016年增加工资的职工人数 D.2016年的外资企业数9.把两个地区2016年的苹果产量进行对比,所得的相对数()A.比例相对指标 B.比较相对指标C.动态相对指标 D.强度相对指标10. 相关分析是研究()A.变量之间的数量关系B.变量之间的变动关系C.变量之间相互关系的密切程度 D.变量之间的因果关系11. 抽样调查必须遵守的原则是()A. 准确性原则B. 可靠性原则C. 随机性原则D. 灵活性原则12. 某学校对学生早餐饮用牛奶情况进行调查,三次试调查,愿饮用鲜牛奶的同学占比率分别为83%、90%、70%,若据资料计算愿饮用鲜牛奶同学数,通常P应取()A. 83%B. 90%C. 70%D. 81%13.已知某地区1949年至2010年各年的粮食产量,计算该地区粮食产量的平均发展速度应开()A. 59次方B. 62次方C. 61次方D. 60次方14.要使抽样平均误差减少一半,(其它情况不变),则抽样单位数必须()A. 增加到4倍B. 增加4倍C. 增加到2倍D. 增加2倍15.当相关系数的绝对值为1时,估计标准误差等于()A. 0B. 1C. —1D. —0.99二、多项选择题(下列每小题备选答案中,有两个或两个以上符合题意的正确答案。
《统计学》测试题一、名词解释(5道题)1. 总体答:总体是指在统计研究中,所研究的对象的全体,它可以是有限个或无限个个体的集合。
例如,某次调查中所有被调查的人的集合就是调查的总体。
2. 样本答:样本是从总体中抽取的一部分个体,样本应具有代表性,以便通过对样本的分析推断总体的特性。
3. 均值答:均值是指一组数据的算术平均值,是通过将所有数据值相加然后除以数据的数量得到的一个集中趋势的测度值。
4. 标准差答:标准差是指数据集中各数据与其均值之间的离散程度,是方差的平方根,用来反映数据的分散程度。
5. 假设检验答:假设检验是指通过样本数据对总体参数作出推断的方法,用于判断一个假设是否合理,根据统计量的分布进行推断和决策。
二、填空题(5道题)1. 在统计学中,__ 是用来描述总体特征的,而__ 是用来描述样本特征的。
答:参数,统计量2. 正态分布曲线的两个参数是__ 和__。
答:均值,标准差3. 当样本量增加时,样本均值的标准误差将__。
答:减小4. 在假设检验中,如果p值小于显著性水平α,我们__ 原假设。
答:拒绝5. 回归分析中,__ 用于衡量模型解释变量对因变量的解释程度。
答:决定系数三、单项选择题(5道题)1. 正态分布的均值和标准差分别为0和1,则称为:a) 均匀分布b) 标准正态分布c) 对数正态分布d) 指数分布答:b) 标准正态分布2. 样本均值是总体均值的:a) 不偏估计量b) 偏倚估计量c) 无关估计量d) 不可靠估计量答:a) 不偏估计量3. 在统计中,用来描述两个变量之间线性关系的统计量是:a) 均值b) 方差c) 相关系数d) 中位数答:c) 相关系数4. 以下哪种抽样方法是每个个体被选中的概率相等?a) 简单随机抽样b) 分层抽样c) 系统抽样d) 整群抽样答:a) 简单随机抽样5. 在回归分析中,残差是指:a) 因变量的实际值与预测值之间的差异b) 自变量的实际值与预测值之间的差异c) 自变量的实际值与均值之间的差异d) 因变量的实际值与均值之间的差异答:a) 因变量的实际值与预测值之间的差异四、多项选择题(5道题)1. 以下属于描述统计的方法有:a) 均值b) 中位数c) 标准差d) 回归分析答:a) 均值,b) 中位数,c) 标准差2. 下面哪些是抽样方法?a) 系统抽样b) 随机抽样c) 分层抽样d) 对比抽样答:a) 系统抽样,b) 随机抽样,c) 分层抽样3. 假设检验中的基本步骤包括:a) 提出假设b) 选择显著性水平c) 计算检验统计量d) 根据p值作出决策答:a) 提出假设,b) 选择显著性水平,c) 计算检验统计量,d) 根据p值作出决策4. 正态分布的特性包括:a) 对称性b) 单峰性c) 位置不变性d) 尾部渐近于零答:a) 对称性,b) 单峰性,d) 尾部渐近于零5. 下列哪些是描述数据离散程度的指标?a) 方差b) 标准差c) 四分位差d) 均值答:a) 方差,b) 标准差,c) 四分位差五、判断题(5道题)1. 样本方差是总体方差的无偏估计量。
(单选题)1: 当()时,均值只受变量值大小的影响,而与次数无关。
A: 变量值较大而次数较小
B: 变量值较大且次数较大
C: 各变量值出现的次数相同
D: 变量值较小且次数较小
正确答案: C
(单选题)2: 当数据分布不规则时,其均值()。
A: 趋于变量值大的一方
B: 趋于变量值小的一方
C: 趋于权数大的变量值
D: 趋于哪方很难断定
正确答案: D
(单选题)3: 某地区农民家庭的年平均收入1995年为1500元,1996年增长了8%,那么1996年与1995年相比之下,每增长一个百分点增加的收入额为()。
A: 7元
B: 8元
C: 15元
D: 40元
正确答案: C
(单选题)4: 当变量值中有一项为零,则不能计算()。
A: 算术平均数和调和平均数
B: 众数或中位数
C: 算术平均数和几何平均数
D: 调和平均数和几何平均数
正确答案: D
(单选题)5: X~b(n,p),大样本情况下,H0:p=p0,这时H0的拒绝域为()。
A: |Z|≥Zα
B: Z≤Zα/2
C: Z≥Zα/2
D: |Z|≥Zα/2
正确答案: D
(单选题)6: 若H0:μ≤μ0,抽出一个样本,其均值<μ0,则()。
A: 肯定拒绝原假设
B: 有可能拒绝原假设
C: 肯定接受原假设
D: 有可能接受原假设
正确答案: C
(单选题)7: 在组距数列中,如果每组的组中值都增加10个单位,而各组次数不变,则均值。
《统计学原理》模拟试题学号:姓名:成绩:一、单项选择题(15分)1.在全距一定的条件下,组距大小与组数多少是( b )A.正比关系 B.反比关系 C.有时正比关系,有时反比关系D.两者无关系2.下列相对数中,属于同一时间不同空间对比的指标是( c )A.结构相对数 B.强度相对数 C.比较相对数 D.动态相对数3.下列指标中属于数量指标的是( B )A. 劳动生产率B. 产量C. 人口密度D. 资金利税率4.在统计调查中,调查标志的承担者是( B )A. 调查对象B. 调查单位C. 填报单位D. 调查表5. 反映社会经济现象总规模和总水平的指标是( A )A.总量指标 B.相对指标 C.平均指标 D.标志变异指标6.某数列两个极端数值之差是( B )A.平均数 B.全距 C.组距 D.标准差7.变量数列中各组频率的总和应该是( C )A.小于100% B.大于100% C.等于100% D.不等于100%C8. 下列属于总量指标的是( C )A.出勤率 B.合格率 C.工资总额 D.平均工资9.若把全部产品分为合格品与不合格品,所采用的标志属于( A )A.是非标志 B.不变标志 C.数量标志 D.品质标志10.基期为前一期水平的增长量是( C )A.平均增长量 B.累计增长量 C.逐期增长量 D.年距增长量11.某厂生产费今年比去年增长50%,产量增长25%,则单位成本上升了( A )A.20% B.25% C.2% D.75%12.调查大庆、胜利、大港、中原等几大油田,以了我国石油工业生产的基本情况,这种调查属于( C )A.普查 B.抽样调查 C.重点调查 D.典型调查13.时间数列中,各个指标数值可以相加的是:( B )A.时点数列 B.时期数列 C.相对数时间数列 D.平均数时间数列14.统计分组的核心问题是( A )A.选择分组标志 B.确定组数 C.确定分组形式 D.划分各组界限15.已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价应采用( C )A.简单算术平均数 B.加权算术平均数 C.加权调和平均数D.几何平均数二、多项选择题(12分)1.下列标志变异指标中,用无名数表示的有( BE )A.全距 B.平均差系数 C.标准差D.平均差 E.标准差系数2.分析时间数列的速度指标有( BCD )A.发展水平 B.发展速度 C.增长速度D.平均发展速度 E.平均发展水平3.普查不属于( CD )A.一次性调查 B.全面调查 C.非全面调查D.经常性调查 E. 专门调查4.统计调查按调查资料方法不同,可分为( ADE )A.直接观察法 B.全面调查 C.非全面调查D.问卷调查法 E. 采访法5.下列各项中,属于数量标志的有( BE )A. 性别B. 年龄C. 职务D. 民族E. 工资6.构成时间数列的两个基本要素是( CE )A.主词 B.宾词 C.现象所属的时间D.次数 E. 统计指标值三、判断题(15分)1、划分连续型变量的组线时,相邻组的组线必须重合。
江西财经大学统计学院《统计学》模拟试题三[请将答案写在答题纸上]一、单项选择题(每题1分,共15分) 1.性别、年龄这样的概念,可以用来( )。
A.表示个体的特征 B.作为指标来使用 C.表示总体的特征 D.作为变量来使用 2.下列各项指标中,属于强度相对数的是( )。
A.商品流转次数 B.产品合格率 C.发展速度 D.工人劳动生产率3.在抽样单位数相同的情况下,整群抽样和其他抽样方法比较抽样误差( )。
A.较大 B.较小 C.相等 D.相反4.已知一时期数列有30年的数据,采用移动平均法测定原时间数列的长期趋势,若采用5年移动平均,修匀后的时间数列有多少年的数据( )。
A. 30B. 28C. 26D. 255.某镇1997年社会商品零售额为12000万元,2001年增至15600万元,这四年中物价上涨了4%,则商品零售量指数为( )。
A.130%B.104%C.80%D.125%6.假设你在做一个总体比率的区间估计,总体资料未知,比率的总体方差没有以往的数据,也不能根据样本资料计算出来,这时,此方差应取( )。
A.30% B.25% C.40% D.50%7.下列直线回归方程中,肯定错误的是( )。
A.x y32ˆ+= r=0.88 B.x y54ˆ+= r=0.55 C.x y510ˆ+-= r=-0.90 D.x y90.0100ˆ--= r=-0.83 8.估计标准误差是反映了( )。
A.平均数代表性的指标B.相关关系的指标C.回归直线的代表性指标D.序时平均数的代表性指标 9.统计分组的关键问题( )。
A.做好统计资料的整理工作B.正确地选择分组标志与划分各组界限C.注意统计资料的准确性与科学性D.应抓住事物的本质与规律10.按地理区域划片进行的区域抽样,其抽样方法属于( )。
A.纯随机抽样 B.等距抽样 C.类型抽样 D.整群抽样11.国民经济核算体系产生于20世纪( )年代。
统计试题一、单项选择(每小题1分,计10分)1、以下哪本书标志统计学的诞生()。
A.《近代欧洲各国国势学论》B.《政治算术》C.《对死亡公报的自然和政治观察》D.《社会物理学》2、下列属于统计标志的是()。
A.商品为红色B.人的性别C.成绩分为优、良D.体温为38℃3、统计研究的基本方法包括()。
A.调查方法、汇总方法、分析方法B.调查方法、整理方法、预测方法C.绝对数法、相对数法、平均数法D.大量观察法、综合分析法、归纳推断法4、要了解某市工业企业生产设备情况,则统计总体单位是()。
A.该市全部工业企业B.该市每一个工业企业C.该市工业企业的每一台设备D.该市工业企业的全部生产设备5、已知某分组数列的最后一组为500 以上,该组次数是10,又知其邻组为400-500,则最后一组的组中值是( )。
A.400 B.450 C.500 D.5506、在两组数列中,若甲数列的标准差小于乙的,则()。
A.两数列平均数代表性相同B.甲数列平均数代表性高于乙数列C.乙数列平均数代表性高于甲数列D.不能确定哪一数列均数代表性高7、下列指标中,属于质量指标的是()。
A.合格品数B.职工总数C.资金产值率D.工资总额8、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少()。
A.3% B.10% C.75% D.6.7%9、二项分布的方差为()。
A.n(1-n)p B.np(1-p)C.np D.n(1-p)10、某商店3年中商品流转额平均每年增加1万元,则商品流转额发展速度()。
A.年年增长B.年年下降C.年年不变D.无法确定二、多项选择(每小题2分,计10分)1、下列统计指标中,属于时期指标的有()。
A.某企业职工人数B.某校大学生毕业人数C.某帐户储蓄余额D.某商场销售额E.某地区出生人口数2、对统计总体进行分组时,采用等距分组还是异距分组,决定于()。
A.现象的特点B.变量值的多少C.次数的多少D.数据分布是否均匀E.组数的多少3、下列应采用算术平均数计算的有()。
A.已知工资总额和工人数,求平均工资B.已知计划完成百分比和计划产值,求平均计划完成百分比C.已知计划完成百分比和实际产值,求平均计划完成百分比D.已知某厂1995年至2000年产值,求平均发展速度E.已知各级工人月工资和相应工人数,求工人平均工资4、用抽样指标估计总体指标时,所谓优良的估计应具备()。
A.客观性B.无偏性C.一致性D.准确性E.有效性5、某水产公司1993年产值为2000万元,2000年产值为1993年的300%,则年平均增长速度及年平均增长量为()。
A.年平均增长速度=16.99% B.年平均增长速度=14.72%C.年平均增长速度=20.09% D.年平均增长量=571.43万元E.年平均增长量=500万元三、填空(每空0.5分,计10分)1、数理统计学派的主要代表人物是()的()。
2、众数决定于()最多的变量值,因此不受()的影响;中位数只受()的影响,不受其()的影响。
3、相对指标包括()、比例相对数、()、()、动态相对数和计划完成相对数。
4、标志变异指标反映了总体分布的()。
5、某企业2004年工业总产值是2003年的8倍,说明该企业04年产值较上年翻()番。
6、某工厂生产某产品20000件,其中一等品16000件,则一等品率为(),其是非标志的标准差为()。
7、编制时间序列的基本原则是保证各个指标值具有()。
8、我国上证综合指数采用()方法编制,而香港恒生指数采用()方法编制。
9、相关关系中,按所研究变量的变动方向可分为(),()。
10、在Microsoft Windows下,一个Excel文件称为一个(),由若干个工作表和()组成。
四、简答题(每小题5分,计20分)1、时点序列的特点如何?2、分层抽样与整群抽样分组的作用各是什么?3、简要说明一般平均数与序时平均数的异同点。
4、样本回归模型与总体回归模型有何区别?五、计算题(要求列出计算公式和算式,计50分)1、40名学生的考试成绩如下,试进行适当的统计分组,并编制频数分布表,简要分析学生考试成绩的分布特征。
(8分)61 51 76 62 60 63 64 65 58 5076 67 68 69 59 69 74 90 70 7279 91 90 95 81 82 97 88 87 7380 84 86 86 85 71 72 72 74 832、某车间去年职工人数时点资料如下:(8分)日期1月1日3月1日4月1日10月1日12月31日人数(人)634 654 637 640 652要求:计算该车间去年全年职工平均人数。
3、某房地产投资公司出售五个楼盘面积与售价资料如下:(16分)楼盘面积(百平方米)9 15 10 11 10售价(千元)36 80 44 55 351)分析楼盘面积和楼盘售价之间是否存在线性相关关系;2)建立一元线性回归方程;3)检验回归方程显著性(显著水平10%);4)楼盘面积为12百平方米时,估计其售价。
[ t0.05(3)=2.3534,t0.05(4)=2.1318,t0.05(5)=2.0150 ]4、设有三种工业类股票的价格和发行量数据如下:(8分)股票名称价格(元)发行量(万股)前日收盘本日收盘A 6.42 6.02 12000B 12.36 12.50 3500C 14.55 15.60 2000试计算股票价格指数,并对股价指数的变动作简要分析。
5、某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(小时)(10分)3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.24.4 2.05.4 2.66.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5 求该学校大学生平均上网时间95%的置信区间。
[ Z0.025=1.96,t0.025(36)=2.0281,t0.025(35)=2.0301,t0.025(34)=2.0322 ]06-07(1)统计答案06-07学年第1学期统计学试题参考答案及评分标准一、单项选择(每小题1分,计10分)1、B2、B3、D4、C5、D6、D7、C8、D9、B 10、D二、多项选择(每小题2分,计10分)1、BDE2、ED3、BE4、BCE5、AD三、填空(每空0.5分,计10分)1、(比利时)(凯特勒)2、(出现次数)(极端值)(位置)(变量值)3、(结构相对数)(比相对数较)(强度相对数)4、(离中趋势)5、(3 )6、(80% )(40% )7、(一致性)8、(派氏综合指数)(拉氏综合指数)9、(正相关)(负相关)10、(工作簿)(图表)四、简答题(20分)1、变量值不能相加;(2)变量值大小与时间长短没有直接关系;(1.5)数据的取得一般采用间断登记的方法。
(1.5)2、分层抽样分组的作用是尽量缩小组内的差异;(2.5)整群抽样分组的目的是尽量扩大群内的差异。
(2.5)3、相同点:两者都将所研究现象的个别数量差异抽象化,概括地反映现象的一般水平。
(2)不同点:1)说明的问题不同:一般平均数将总体各单位之间的数量差异抽象化,从静态上反映现象在一定时间、地点条件下所达到的一般水平;序时平均数将现象在不同时间的数量差异抽象化,从动态上表明同类现象在不同时间的一般水平。
(1.5)2)计算基础不同:一般平均数根据变量数量计算;序时平均数根据时间序列计算。
(1.5)4、1)总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。
2)总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b和b1是随机变量,其数值随样本观测值不同而变动。
3)总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。
五、计算题(50分)1、(8分)解:绝大多数同学成绩集中在60—80之间,其中70-80分占27.5%(2)成绩人数频率%60以下 4 1060-70 10 2570-80 11 27.580-90 10 2590以上 5 12.5合计40 100.0(表内6分,每行汇总正确各1分) 2、(8分)解:公式2分,算式2分,结果4分。
3、(16分)解:∑∑∑∑∑=====2919138822506275522xy y y x x1)根据散点图或9692.0/)(/)(/)(2222=---=∑∑∑∑∑∑∑nx x n y y ny x xy r 存在线性关系(4) 2)回归方程:68.75.3410=-=b b x y68.75.34ˆ+-=(4) 3) 显著性检验:=---=∑∑∑2102n xy b y b ys 5.45=-=∑∑nx x ss b /)(221 1.09==1/1b s b t 7.0459 > t0.05(3)=2.3534 存在显著线性关系(4)4) 估计售价=66.5712*68.75.34=+-千元(4)4、(8分)解:%52.981494001471901011===∑∑qp qp I p 股价指数下降1.48%(2、1、2、1)∑∑-=-22101011qp q p (2)5、(10分)解:52.036609.1*96.1*609.11)(317.32/2===∆=--===∑∑ns Z n x x s n x x x α三步骤:2、3、3置信区间:(2.797,3.837)(2)642123*2/)652640(6*2/)640637(1*2/)637654(2*2/)654634(222211221110=⎪⎪⎩⎪⎪⎨⎧+++++++=++++++++=-n n n n f f f f y y f y y f y y y。