应用统计试题
- 格式:doc
- 大小:35.50 KB
- 文档页数:1
应用统计期末试题及答案一、选择题1.以下哪个不属于统计学的基本特征?A.数据的整理B.数据的分析C.数据的收集D.数据的存储答案:D2.统计学最基本的分支是:A.计量经济学B.经济数学C.运筹学D.数理统计学答案:D3.以下哪个不是统计推断的主要内容?A.假设检验B.抽样调查C.回归分析D.方差分析答案:C4.在进行推断统计时,样本大小的影响是:A.样本越大,结果越可靠B.样本越小,结果越可靠C.样本大小对结果没有影响D.样本大小不确定是否影响结果答案:A5.在统计学实证研究中,显著性水平通常设定为:A.0.01B.0.05C.0.10D.根据具体研究而定答案:B二、填空题1. 样本标准差的计算公式为______。
答案:s=√(Σ(Xi-X)²/(n-1))2. 定量数据常用的测度是______。
答案:均值3. 相对频数是指某一现象发生的______。
答案:次数与总次数的比值4. 抽样的目的是为了_________。
答案:对总体进行估计和推断5. 当P值小于显著性水平时,我们应该_________。
答案:拒绝原假设三、计算题某电商平台想要评估新推出的促销活动对销售额的影响,随机抽取了100个订单,并记录了促销前后的销售额。
其中,促销前的均值为120元,标准差为30元;促销后的均值为150元,标准差为40元。
已知总体分布近似满足正态分布。
1.请判断这次促销活动是否真正对销售额有显著的影响?答:首先,我们可以进行两个样本均值的差异检验。
设定原假设H0为促销前后销售额均值无显著差异,备择假设H1为促销后销售额均值较促销前有显著提高。
计算检验统计量:t = (x1 - x2) / √(s1²/n1 + s2²/n2)= (150 - 120) / √((30²/100 + 40²/100))查表或使用统计软件可得t值,自由度为(n1 + n2 - 2) = 198。
应用统计基础试题及答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述数据集中趋势的统计量?A. 众数B. 方差C. 标准差D. 极差答案:A2. 在统计学中,标准正态分布的均值是:A. -1B. 0C. 1D. 2答案:B3. 以下哪个选项是描述数据离散程度的统计量?A. 平均数B. 中位数C. 众数D. 极差答案:D4. 假设检验中的“显著性水平”通常用哪个希腊字母表示?A. αB. βC. γD. δ5. 相关系数的取值范围是:A. -1到1B. 0到1C. -1到0D. 0到-1答案:A6. 以下哪个选项是描述数据分布形状的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C7. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 众数D. 偏度答案:C8. 在统计学中,完全正相关的情况下,相关系数的值是:A. 0B. 1C. -1D. 2答案:B9. 以下哪个选项是描述数据分布离散程度的统计量?B. 众数C. 方差D. 极差答案:C10. 以下哪个选项是描述数据分布偏斜方向的统计量?A. 均值B. 标准差C. 偏度D. 极差答案:C二、多项选择题(每题3分,共15分)1. 下列哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 在统计学中,以下哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 极差D. 标准差答案:AB3. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差D. 平均数答案:ABC4. 在假设检验中,以下哪些是常见的检验类型?A. t检验B. 方差分析C. 卡方检验D. 回归分析答案:ABC5. 以下哪些统计量可以用来描述数据的分布?A. 均值B. 众数C. 偏度D. 峰度答案:ABCD三、判断题(每题1分,共10分)1. 标准差是衡量数据集中趋势的统计量。
(×)2. 相关系数的绝对值越接近1,表示变量之间的相关性越强。
应用统计学试题及答案一. 单项选择题 (10%, 每题1分)1.要了解某企业职工的文化水平情况,则总体单位是()。
A.该企业的全部职工B.该企业每一个职工的文化程度C.该企业的每一个职工D.该企业全部职工的平均文化程度2.对一批食品进行质量检验,最适宜采用的调查方法是()。
A.全面调查B.抽样调查C.典型调查D.重点调查3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是()。
A.产值B.工厂数C.各组的产值数D.各组的工厂数4.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是()。
A.时期指标B.时点指标C.前者为时期指标,后者为时点指标D.前者为时点指标,后者为时期指标5.离散程度大小与平均数代表性之间存在()。
A.正比关系B.反比关系C.恒等关系D.依存关系6.下面4个动态数列中,属于时点数列的是()。
A.历年招生人数动态数列B.历年增加在校生人数动态数列C.历年在校生人数动态数列D.历年毕业生人数动态数列7.在材料单耗综合指数中,每种产品的材料单耗指标是()。
A.质量指标B.数量指标C.相对指标D.总量指标A、提高B、下降C、不变D、条件不够,无法判断8.某企业产品为连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()。
A.整群抽样 B.简单随机抽样C.类型抽样 D.纯随机抽样9.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y =10 + 70x,这意味着年劳动生产率每提高1 000元时,工人工资平均()。
A.增加70元B.减少70元C.增加80元 D.减少80元10.对某市全部商业企业职工的生活状况进行调查,调查对象是()。
A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业每一名职工二. 多项选择题 (20%, 每题2分)1.下面说法正确的是()。
A.性别、文化程度、企业所属行业类型都是品质标志B.企业的职工人数、企业管理人员数都是数量标志C.某地区职工的工资总额是统计指标D.在校学生的年龄是连续变量2.我国第六次人口普查的标准时间是2010年11月1日零时,下列情况应统计人口数的有()。
应用统计学考试试题一、选择题(每题 3 分,共 30 分)1、下列数据中,属于分类数据的是()A 年龄B 工资C 性别D 体重2、为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生调查,这种抽样方法是()A 简单随机抽样B 分层抽样C 系统抽样D 整群抽样3、设随机变量 X 的概率密度函数为$f(x)=\begin{cases}2x, &0<x<1 \\ 0, &\text{其他}\end{cases}$,则 P(05 < X < 15) =()A 075B 05C 025D 14、设随机变量 X 服从参数为λ的泊松分布,且 P(X = 1) = P(X = 2),则λ =()A 1B 2C 3D 45、设总体 X 服从正态分布$N(\mu,\sigma^2)$,其中$\sigma^2$已知,$\mu$未知。
从总体中抽取样本容量为 n 的样本,样本均值为$\overline{x}$,则$\mu$的置信水平为 1 $\alpha$的置信区间为()A $(\overline{x} z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}})$B $(\overline{x} t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}})$C $(\overline{x} z_{\alpha}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha}\frac{\sigma}{\sqrt{n}})$D $(\overline{x} t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}})$6、在假设检验中,原假设为 H0,备择假设为 H1,如果原假设被拒绝,则()A 可能犯第一类错误B 可能犯第二类错误C 两类错误都可能犯D 两类错误都不可能犯7、对于两个独立样本均值之差的检验,当两个总体方差未知但相等时,检验统计量为()A $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{\sigma_1^2}{n_1} +\frac{\sigma_2^2}{n_2}}}$B $T =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2}}}$C $F =\frac{s_1^2}{s_2^2}$D $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{(n_1 1)s_1^2 +(n_2 1)s_2^2}{n_1 + n_2 2}(\frac{1}{n_1} +\frac{1}{n_2})}}$8、方差分析中,用于检验不同水平下总体均值是否相等的统计量是()A F 统计量B T 统计量C Z 统计量D $\chi^2$统计量9、相关系数的取值范围是()A -1, 1B 0, 1C (∞,+∞)D 0, +∞)10、在线性回归模型中,判定系数 R²越接近 1,说明()A 回归方程的拟合程度越好B 回归方程的拟合程度越差C 自变量对因变量的影响越大D 自变量对因变量的影响越小二、填空题(每题 3 分,共 30 分)1、数据的类型包括_____、_____和_____。
应用统计学试题和答案六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。
试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。
已知:8.2,6.12==S x 0455.0=α则有: 202275.02==Z Z α 平均误差=4.078.22==n S 极限误差8.04.0222=⨯==∆nS Z α据公式 22S x x n α±=±∆代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)x i 40 50 50 70 80 生产费用(万元)y i130 140 145 150 156 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 2。
附:1080512)(=∑-=i x x i 8.392512)(=∑-=i y y i 58=x 2.144=y 17900512=∑=i x i 104361512=∑=i y i 4243051=∑=y x i i i 3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β ==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑n x n y ββ 10144.2 – 0.567×58=111.314估计的回归方程为:y =111.314+0.567x② 计算判定系数:222122()0.56710800.884392.8()x x R y y β-⨯===-∑∑4、某家具公司生产三种产品的有关数据如下:产品名称 总生产费用/万元 报告期产量比基期增长(%)基期 报告期 写字台 45.4 53.6 14.0椅子 30.0 33.8 13.5书柜 55.2 58.5 8.6计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。
应用统计试题及答案一、选择题1.统计学是一门研究什么的科学?A. 数字B. 数据C. 模型D. 计算答案:B. 数据2.统计学的基本任务是什么?A. 数据分析B. 模型建立C. 结果预测D. 变量选择答案:A. 数据分析3.以下哪个是统计学的一个分支?A. 物理学B. 化学C. 经济学D. 历史学答案:C. 经济学4.统计学中,样本是指什么?A. 全体实验对象B. 全体研究对象C. 随机选取的一部分对象D. 不具备代表性的对象答案:C. 随机选取的一部分对象5.哪个指标用于衡量数据的离散程度?A. 均值B. 中位数C. 标准差D. 方差答案:D. 方差二、填空题1.描述数据离散程度的指标是__________。
答案:标准差2.样本容量为100,抽样误差为0.05,那么置信度为__________。
答案:0.953.样本的均值称为__________。
答案:样本均值4.样本容量为200,样本均值为25,样本标准差为5,总体标准差为10,那么样本的标准误差为__________。
答案:0.35365.样本的方差称为__________。
答案:样本方差三、计算题1.某城市有60%的居民喜欢看电影,现在随机调查了200名居民,其中有120人表示喜欢看电影。
根据这个调查结果,估计该城市所有居民喜欢看电影的比例,并给出95%的置信区间。
答案:样本比例 = 120/200 = 0.6标准误差 = sqrt(0.6(1-0.6)/200) = 0.0346置信区间 = 样本比例 ± 1.96 ×标准误差= 0.6 ± 1.96 × 0.0346= [0.5322, 0.6678]结论:根据这个调查结果,我们可以估计该城市所有居民喜欢看电影的比例为0.6,并且有95%的置信度认为比例在0.5322到0.6678之间。
2.某农场种植了1000棵苹果树,调查其中200棵树的产量,平均每棵树的产量为150斤,样本标准差为30斤。
应用统计学模拟测试题库一、选择题(每题 5 分,共 50 分)1、下列数据中,属于分类数据的是()A 年龄B 工资C 性别D 体重2、为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生调查,这种抽样方法是()A 简单随机抽样B 分层抽样C 系统抽样D 整群抽样3、一组数据的众数是()A 出现次数最多的变量值B 出现次数最少的变量值C 按顺序排列居于中间位置的变量值D 最大的变量值4、下列关于样本均值的说法中,正确的是()A 样本均值是总体均值的无偏估计B 样本均值是总体均值的有偏估计C 样本均值的抽样分布是正态分布D 样本均值的抽样分布与总体分布相同5、在假设检验中,原假设和备择假设()A 都有可能成立B 都有可能不成立C 只有一个成立而且必有一个成立D 原假设一定成立,备择假设不一定成立6、对于两个变量之间的线性关系,下列说法正确的是()A 相关系数的绝对值越大,线性关系越强B 相关系数的绝对值越小,线性关系越强C 相关系数为 0 时,线性关系最强D 相关系数为 1 时,线性关系最弱7、下列指数中,属于质量指数的是()A 销售额指数B 销售量指数C 价格指数D 产量指数8、时间序列中,逐期增长量之和等于()A 累计增长量B 平均增长量C 定基增长量D 环比增长量9、进行回归分析时,预报变量的取值()A 只能由解释变量唯一确定B 可以由解释变量和随机误差共同确定C 不能由解释变量确定D 与解释变量无关10、在方差分析中,组内方差()A 只包含随机误差B 只包含系统误差C 既包含随机误差,也包含系统误差D 有时包含随机误差,有时包含系统误差二、填空题(每题 5 分,共 30 分)1、统计数据的类型分为_____、_____和_____。
2、数据的集中趋势测度指标包括_____、_____和_____。
3、抽样误差是由于_____引起的样本统计量与总体参数之间的差异。
应用统计考研试题及答案一、单项选择题(每题2分,共10分)1. 在统计学中,总体参数是指()A. 从样本数据中得到的统计量B. 描述总体特征的数值C. 描述样本特征的数值D. 用于推断总体的样本统计量2. 下列哪项不是描述数据集中趋势的度量()A. 平均数B. 中位数C. 众数D. 极差3. 假设检验中,犯第一类错误的概率用α表示,那么犯第二类错误的概率用()表示。
A. βB. γC. δD. ε4. 在回归分析中,如果自变量和因变量之间的关系是线性的,那么这种关系可以表示为()A. y = β0 + β1x + εB. y = β0 + β1x^2 + εC. y = β0 + β1x + β2x^2 + εD. y = β0 + β1x^3 + ε5. 下列哪项是时间序列数据的特点()A. 数据点是随机的B. 数据点按照时间顺序排列C. 数据点之间没有关联D. 数据点可以任意排序二、简答题(每题5分,共10分)1. 请简述样本容量对抽样分布的影响。
2. 请解释什么是“大数定律”及其在实际应用中的意义。
三、计算题(每题15分,共30分)1. 某工厂生产的产品中,次品率估计为2%。
假设从这批产品中随机抽取100个进行检查,记录次品数X。
(1) 确定X的分布类型;(2) 计算在抽取的100个产品中,至少有3个次品的概率;(3) 如果已知有5个次品,计算这批产品中次品率超过2%的置信水平。
2. 某地区对家庭收入进行调查,得到以下数据:月收入在3000元以下的有50户,3000-5000元的有120户,5000元以上的有30户。
根据这些数据,计算该地区家庭收入的平均值和标准差。
四、论述题(共20分)1. 论述相关性与回归分析之间的关系,并说明在实际应用中如何确定自变量和因变量。
应用统计考研试题答案一、单项选择题1. B2. D3. A4. A5. B二、简答题1. 样本容量对抽样分布的影响主要体现在样本容量越大,抽样分布越接近正态分布,即满足大数定律。
自考应用统计试题及答案一、选择题(每题2分,共20分)1. 在统计学中,用来描述一组数据集中趋势的指标是()。
A. 平均数B. 方差C. 标准差D. 众数答案:A2. 下列哪个选项不是描述数据离散程度的统计量?()A. 方差B. 标准差C. 均值D. 极差答案:C3. 回归分析中,用来衡量自变量对因变量影响程度的统计量是()。
A. 相关系数B. 回归系数C. 回归标准误D. 回归方程答案:B4. 假设检验中,用于判断原假设是否成立的统计量是()。
A. t统计量B. F统计量C. Z统计量D. 卡方统计量答案:D5. 下列哪个选项不是统计图?()A. 条形图B. 折线图C. 饼图D. 表格答案:D6. 抽样调查中,样本容量的确定主要取决于()。
A. 总体数量B. 总体的变异程度C. 抽样误差D. 调查目的答案:B7. 以下哪个不是时间序列分析的组成部分?()A. 水平B. 趋势C. 季节性D. 离散性答案:D8. 描述两组数据之间关系的统计方法是()。
A. 描述性统计B. 推断性统计C. 相关性分析D. 回归分析答案:C9. 以下哪个选项是概率分布?()A. 正态分布B. 泊松分布C. 二项分布D. 所有以上答案:D10. 在统计学中,用于衡量两个变量之间线性关系强度的指标是()。
A. 相关系数B. 回归系数C. 回归标准误D. 回归方程答案:A二、填空题(每题3分,共15分)1. 一组数据的中位数是将数据从小到大排列后,位于中间位置的数值,如果数据个数为奇数,则中位数是第____个数。
答案:(数据个数+1)/22. 标准差是方差的______次方根。
答案:平方3. 相关系数的取值范围在-1到1之间,相关系数为0表示两变量之间______相关。
答案:无4. 回归分析中,回归系数的估计值是通过______方法得到的。
答案:最小二乘法5. 卡方检验是一种非参数检验方法,它用于检验两个分类变量之间的______。
北京交通大学考试试题(第2次)
课程名称:应用统计学 2013-2014学年第1学期
1、一家研究机构想估计城市居民步行到离家最近的地铁口的平均时间,为此随机抽取了18名地铁乘客进行了调查,数据如下(单位:分钟)
试估计居民从家门口到最近地铁口平均时间的置信区间。
(10分)
2、税务管理官员怀疑一些企业都有偷税漏税行为。
在对由800个企业构成的随机样本的检查中,发现有144个企业有偷税漏税行为。
在99%的置信水平下,估计偷税漏税企业比例的置信区间。
(10分)
3、根据以往的生产经验数据,某种产品的废品率为3%。
若要求允许误差不超过4%,显著性水平为5%,应抽取多大的样本?(10分)
4、一项研究发现,2005年新购买小汽车的人中有40%是女性,在2010年所作的一项调查中,随机抽取120个新车主中有57人为女性,在α=0.05的显著性水平下,检验2010年新车主中女性的比例是否有显著增加,建立原假设并进行检验。
(15分)
5、某城市家庭每天的平均消费额为90元。
从该城市中随机抽取10个家庭组成一个样本。
调查数据如下:85,84, 94, 96, 105, 110, 74, 86, 98,115。
在α=0.05下,试对家庭每天平均消费额为90元的假设进行检验。
(15分)
6、某电子企业准备用四种方法组装一种新电子产品。
为确定哪种方法生产效率最高,随机抽取了60名工人,并指定每名工人只使用其中的一种方法。
通过对每个工人生产的产品数量进行方差分析,可得到如下结果:
(1)完成上面的方差分析表;
(2)若显著性水平α=0.05,检验四种方法组装的产品数量之间是否有显著差异;(3)在上面的方差分析中包含了哪些基本假定?
(4)方差分析中多重比较的作用是什么?(20分)
7、试举例说明在假设检验中应如何设立假设。
(20分)。