武汉大学MBA《数据模型与决策》往年试题
- 格式:doc
- 大小:131.50 KB
- 文档页数:5
《数据模型与决策》练习题及答案1 《管理统计学》习题解答(2010年秋MBA周末二班,邢广杰,学号: ) 第3章描述性统计量(一) P53 第1题抽查某系30个教工,年龄如下所示:61,54,57,53,56,40,38,33,33,45,28,22,23,23,24,22,21,45,42,36,36,35,28,25,37,35,42,35,63,21(i)求样本均值、样本方差、样本中位数、极差、众数;(ii)把样本分为7组,且组距相同。
作出列表数据和直方图;(iii)根据分组数据求样本均值、样本方差、样本中位数和众数。
解:n1(i)样本均值=37.1岁 x,x,in,i1nn211222样本方差=189.33448 s,(X,X),(X,nX),,iin-1n-1,,i1i1把样本按大小顺序排列:21,21,22,22,23,23,24,25,28,28,33,33,35,35,35,36,36,37,38,40,42,42,45,45,53,54,56,57,61,631样本中位数=(35+36)/2=35.5岁 m,(X,X)nn()(,1)222R,X,X,极差63-21=42岁 (n)(1)m,众数35岁 0(ii)样本分为7组、且组距相同的列表数据、直方图如下所示累计频教工分组教工年龄组中值数教职工岁数分组频数图f频数() 分组(岁) (x) i(16,23] 6 19.5 6 108(23,30] 4 26.5 106(30,37] 8 33.5 18 频数频数4(37,44] 4 40.5 222(44,51] 2 47.5 24 0(51,58] 4 54.5 28 23303744515865教职工岁数(58,65] 2 61.5 30(iii)根据分组数据求样本均值、样本方差、样本中位数和众数。
k1样本均值=36.3岁 X,Xif,in,i11kk211222样本方差=174.3724 s,(X,X)f,(Xf,nX),,iiiin-1n-1,,i1i1n30,F,1022样本中位数=34.375岁 m,I,i,30,7f8ff,84,mm-1众数33.5岁 mIi307,,,,,02fff2844,,,,,mm-1m,1 (二) P53 第2题某单位统计了不同级别的员工的月工资水平资料如下:月工资(元) 800 1000 1200 1500 1900 2000 2400员工数(人) 5 8 25 36 24 16 6累计频数 5 13 38 74 98 114 120求样本均值、样本标准差、样本中位数和众数。
1、一个投资基金考虑将其资金投入到三支股票中去形成投资组合,通过市场分析及统计预测,这三(1)、该投资基金希望获得一个投资组合,使得在期望收益率达到15%以上的条件下风险(方差)最小。
(2)、该投资基金希望获得一个投资组合,使得在风险(方差)不超过10%的条件下期望收益率最大。
解: 设股票1的比例为x1,股票2的比例为x2,股票3的比例为x3(1)Min Z= 12x12+9x22+6x32+36x1x2+10x1x3-8x2x3s.t. x1+x2+x3=1;x1,x2,x3>=0;16%x1+14%x2+10%x3>=15%(2)Max Z= 16%x1+14%x2+10%x3s.t. x1+x2+x3=1;x1,x2,x3>=0;12x12+9x22+6x32+36x1x2+10x1x3-8x2x3<=10%2、某工厂决定开发新产品,需要对产品品种做出决策,现在有三种产品A1,A2,A3可供生产开发.未来市场对产品需求情况有三种,即较大、中等、较小,经过估计各种方案在各种自然状态下的效问题(1)根据最大期望收益准则选择最优方案。
(2)根据最小期望机会损失准则选择最优方案。
解: (1) 各个方案的期望收益:A1: 0.3*60+0.4*40+0.3*(-30)=25A2: 0.3*40+0.4*25+0.3*(-10)=19A3: 0.3*20+0.4*15+0.3*10=15顾根据最大期望收益准则选择的最优方案是A1.(2) 各个方案的期望机会损失:可见根据最小期望机会损失准则选择A1方案。
3、公司A生产甲、乙两种产品,每种产品的生产都需要使用3种资源,已知单位产品的利润和资源使用量如下表,现在公司需要合理安排生产计划,使得利润最大化。
问题(1)写出该资源分配问题的整数规划模型。
(2)检验下面的点A(2,2)、B(3,3)、C(2,4)、D(4,2)、E(3,4)、F(4,3),哪些点是可行解,可行解中哪一个使目标函数值最大?解: (1)设生产甲产品x1件,乙产品x2件Max Z= 2x1+3x2s.t. 3x1+3x2<=20;2x1+x2<=10;2x1+4x2<=20;x1,x2为整数;x1,x2>=04、某食品公司希望用二种原料生产一种食品,各种原料包含的营养成份和采购成本都不相同,公司管理层希望能够确定食品中各种原料的数量,使得食品能够以最低的成本达到一定的营养要求。
《数据模型与决策》复习(附参考答案)2018.9一、填空题(五题共15分)1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是 ① 。
解:N(167.48,0.609)考查知识点:已知总体服从正态分布,求样本均值的分布。
2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。
根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为 ② 。
解:[1040,1936]考查知识点:区间估计的求法。
正态总体均值的区间估计是[n s Z X α--1,nsZ X α-+1] 其中X 是样本平均数,s 是样本的标准差,n 是样本数。
详解:直接带公式得:区间估计是 [n s Z X α--1,nsZ X α-+1]= [100224021488-,100224021488+]=[1040,1936]3. 从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。
假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。
已知小李第一胎是女孩,那么她的第三胎生男孩的概率是 ③ 。
解 p=0.4653考查知识点:离散概率计算方法。
详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩 G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩P (B3)=P (B3B2)+P (B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P (B3))= P(B3|B2)P(B2)+P(B3|G2)P(G2)=0.48×(1-0.55)+(1-0.55) ×0.55=0.46534. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。
MBA数据模型与决策考卷及答案一、选择题(每题1分,共5分)A. 线性模型B. 非线性模型C. 网络模型D. 层次分析法模型A. 期望收益B. 折现率C. 净现值D. 敏感性分析A. 敏感性分析B. 概率树C. 决策树D. 蒙特卡洛模拟A. 目标函数为线性函数B. 约束条件为非线性函数C. 变量之间存在相关性D. 变量取值范围为整数A. ExcelB. SPSSC. MATLABD. AutoCAD二、判断题(每题1分,共5分)1. 数据模型只能用于定量分析,不能用于定性分析。
()2. 在决策过程中,确定性决策的风险一定低于不确定性决策。
()3. 敏感性分析可以找出影响项目收益的关键因素。
()4. 多目标规划问题中,各个目标函数之间一定是相互矛盾的。
()5. 网络计划技术(PERT)是一种确定型网络图。
()三、填空题(每题1分,共5分)1. 数据模型的三个基本要素是变量、______和关系。
2. 决策树分析中,节点分为______节点和______节点。
3. 在线性规划问题中,目标函数和约束条件均为______函数。
4. 概率树分析是一种______分析工具,适用于评估项目风险。
5. 数据挖掘的五个基本步骤包括:数据准备、______、数据挖掘、结果评估和______。
四、简答题(每题2分,共10分)1. 简述蒙特卡洛模拟的基本原理。
2. 什么是网络计划技术(PERT)?它有哪些优点?3. 简述线性规划在企业管理中的应用。
4. 如何运用决策树分析解决实际问题?5. 数据挖掘技术在市场营销中的作用是什么?五、应用题(每题2分,共10分)1. 某企业生产两种产品,产品A的利润为50元/件,产品B的利润为80元/件。
生产一件产品A需要2小时,生产一件产品B需要3小时。
企业每月共有240小时的生产能力,请问如何安排生产计划,使得总利润最大化?2. 某项目有三种投资方案,方案一的投资额为100万元,收益率为10%;方案二的收益率为12%,投资额为150万元;方案三的投资额为200万元,收益率为15%。
《数据模型与决策》复习题及参考答案《数据模型与决策》复习题及参考答案第一章绪言一、填空题1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。
2.运筹学的核心是运用数学方法研究各种系统的优化途径及方案,为决策者提供科学决策的依据。
3.模型是一件实际事物或现实情况的代表或抽象。
4、通常对问题中变量值的限制称为约束条件,它可以表示成一个等式或不等式的集合。
5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。
运筹学研究和解决问题的效果具有连续性。
6.运筹学用系统的观点研究功能之间的关系。
7.运筹学研究和解决问题的优势是应用各学科交叉的方法,具有典型综合应用特性。
8.运筹学的发展趋势是进一步依赖于_计算机的应用和发展。
9.运筹学解决问题时首先要观察待决策问题所处的环境。
10.用运筹学分析与解决问题,是一个科学决策的过程。
11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。
12.运筹学中所使用的模型是数学模型。
用运筹学解决问题的核心是建立数学模型,并对模型求解。
13用运筹学解决问题时,要分析,定议待决策的问题。
14.运筹学的系统特征之一是用系统的观点研究功能关系。
15.数学模型中,“s〃t”表示约束。
16.建立数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。
17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。
二、单选题1.建立数学模型时,考虑可以决策者控制的因素是第 1 页共40页A.销售数量B.销售价格C.顾客的需求D.竞争价格 2.我们可以通过来验证模型最优解。
A.观察B.应用C.实验D.调查 3.建立运筹学模型的过程不包括阶段。
A.观察环境B.数据分析C.模型设计D.模型实施 4.建立模型的一个基本理是去揭晓那些重要的或有关的 A数量B变量 C 约束条件 D 目标函数5.模型中要求变量取值A可正B可负C非正D非负 6.运筹学研究和解决问题的效果具有A 连续性B 整体性C 阶段性D 再生性7.运筹学运用数学方法分析与解决问题,以达到系统的最优目标。
数据模型与决策试卷一、建模计算分析题(30分)下面两个题目任选一个做即可1艾伦是一个个人投资者,有70000美元可用于不同的投资。
不同投资的年回报率分别为:政府债券8.5%,存款5%,短期国库券6.5%,增长股基金13%。
所有的投资都要满1年后才对收益进行评估。
然而,每项投资都会有不同的风险,因此建议进行多元投资。
艾伦想知道每项投资各位多少可以使收益最大化。
下面的方针可以使投资具有多样性,从而降低投资者的风险:(1)对政府债券的投资比例不要超过全部投资的20%。
(2)在存款方面的投资不要超过其他3种投资的总和。
(3)在存款和短期国库券方面的投资至少要占全部投资的30%(4)为了投资安全,在存款和短期国库券方面的投资与在政府债券和增长股基金方面的投资比例至少是1.2:1。
(5)艾伦想把70000美元全部用来投资。
如果全部投资不再正好是70000美元,其他条件不变,则模型应该如何变化?2某投资咨询公司,为大量的客户管理高达1.2亿元的资金。
公司运用一个很有价值的模型,为每个客户安排投资量,分别投资在股票增长基金、收入基金和货币市场基金。
为了保证客户投资的多元化,公司对这三种投资的数额加以限制。
一般来说,投资在股票方面的资金应该占总投资的20%~40%,投资在收入基金方面的资金应该确保在20%~50%,货币市场方面的投资至少应该占30%。
此外,公司还尝试着引入了风险承受能力指数,以迎合不同投资者的需求。
如该公司的一位新客户希望投资800000元。
对其风险承受能力进行评估得出其风险指数为0.05。
公司的风险分析人员计算出,股票市场的风险指数是0.10,收入基金的风险指数是0.07,货币市场的风险指数是0.01,整个投资的风险指数是各项投资占投资的百分率与其风险指数乘积的代数和。
此外该公司预测股票基金的年收益是18%,收入基金的收益率是12.5%,货币市场基金的收益率是7.5%。
现在基于以上信息,公司应该如何安排这位客户的投资呢?建立线性规划模型,求出使总收益最大的解,并根据模型写出管理报告。
《数据模型与决策》复习(附参考答案)2018.9一、填空题(五题共15分)1.已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是①。
解:N(167.48,0.609)考查知识点:已知总体服从正态分布,求样本均值的分布。
2.某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。
根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为②。
解:[1040,1936]考查知识点:区间估计的求法。
正态总体均值的区间估计是[X-Z上,X + Z与] 1-a n'n1-a nn 其中X是样本平均数,s是样本的标准差,n是样本数。
详解:直接带公式得:区间估计是— s _ s2240 2240[X—Z -=, X + Z ,]= [1488 —2^^,1488 + 2^^] 山nn山.nn x100 * 100=[1040,1936]3.从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。
假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。
已知小李第一胎是女孩,那么她的第三胎生男孩的概率是③。
解p=0.4653考查知识点:离散概率计算方法。
详解:假设B1二第1胎生男孩,B2二第2胎生男孩,B3二第3胎生男孩G1二第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩P(B3)二P(B3B2)+P(B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P(B3))= P(B3|B2)P(B2)+P(B3|G2)P(G2)=0.48 义(1-0.55) + (1-0.55)义 0.55=0.46534.调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。
《数据模型与决策》复习试题和参考题答案一、选择题1. 下列哪种数据模型不是数据库系统常用的数据模型?()A. 关系模型B. 层次模型C. 网状模型D. 面向对象模型2. 以下哪项不是数据库系统的主要功能?()A. 数据存储B. 数据检索C. 数据更新D. 数据加密3. 在关系数据库中,下列哪个概念表示表之间的关系?()A. 外键B. 主键C. 候选键D. 索引4. 下列哪种决策方法属于定量决策方法?()A. 直觉决策法B. 经验决策法C. 线性规划法D. 逻辑推理法5. 以下哪个概念不属于数据挖掘的范畴?()A. 关联规则B. 聚类分析C. 决策树D. 文本挖掘二、填空题6. 数据模型通常包括________、________和________三个基本要素。
7. 数据库系统的核心是________。
8. 在关系数据库中,为了实现表之间的连接,通常使用________。
9. 数据挖掘的方法主要包括________、________和________。
10. 线性规划法在决策过程中主要用于解决________问题。
三、判断题11. 数据模型是数据库设计和实现的基础,它描述了数据如何存储、组织和访问。
()12. 数据库系统只能用于存储数据,不能进行数据检索和更新操作。
()13. 在关系数据库中,主键可以唯一标识表中的每一行数据。
()14. 数据挖掘是一种从大量数据中提取有价值信息的方法,它包括关联规则、聚类分析和决策树等技术。
()15. 定量决策方法主要依赖于数学模型和算法,通常比定性决策方法更加准确和有效。
()四、简答题16. 简述数据模型的作用。
17. 简述数据库系统的四个主要功能。
18. 简述数据挖掘的主要应用领域。
19. 简述线性规划法的基本原理。
五、综合题20. 设某公司销售三种产品A、B、C,每种产品的销售价格、成本和销售量如下表所示。
请根据这些数据,计算该公司每种产品的利润,并确定哪种产品的销售利润最高。
1. 从调查对象(总体)中抽取一部分单位组成样本,然后根据样本调查的结果,对总体情况进行推断,称之为抽样调查。
抽取一部分单位时应遵照( )A .判断原则 B.参与原则 C.随机原则 D.程序原则2. 先从总体中随机抽取一个较大的样本,获得第一重样本,然后再从第一重样本中随机抽取一个较小的样本即第二重样本,利用这第二重样本,对研究目标进行统计推断,这种抽样组织方式叫做( )A.类型抽样调查B.简单抽样调查C.阶段抽样调查D.双相抽样调查3. 在调查工作已经完成,进入数据编辑和整理阶段所用的评估数据质量的方法统称为( )A.相对技术B.抽样技术C.后验技术D.误差分析4. 在统计分组的基础上形成的样本单位在各个组间的分配,叫做( )A.直方图B.交叉分类表C.频数D.频数分布5. 在频数分布中,观察值中出现次数最多的数值就是( )A.算术平均数B.众数C.四分位数D.中位数6. 在若干个能够互相比较的资料组中,把产生变异的原因明确区分出来的方法,叫做( )A.方差分析B.回归分析C.描述分析D.样本推断7. 对一元线性回归i i i x y εβα++= ,β反映了自变量对因变量的( )A.正向影响B.负向影响C.边际影响D.回归影响8. 时间序列各期增长量接近于常数,可拟合( )A.指数曲线模型B.直线模型C.抛物线模型D.指数平滑模式9. 顾客在排队系统中等待时间和服务时间的和叫做( )A.排队长B.队长C.等待时间D.逗留时间10. 在库存管理中,需求是库存系统的( )A.输出B.输入C.订货D.变量11. 运用数据模型开展定量分析,其根本目标是( )A .管理决策 B.数量分析 C.理论指导 D.科学管理12. 主要为搜集某一时点或一定时期内现象总量资料而专门组织的、一次性全面调查称为( )A.抽样调查B.实验设计C.普查D.参与观察13. 从总体N 个单位中抽取n 个单位组成样本时,保证每一个单位被抽出来的概率相等,这种抽样方法叫做( )A.等距抽样B.简单随机抽样C.分层抽样D.整群抽样14. 把非定量的文献史料、语言习惯等带有特征的因素设法转化成可以量化处理的数据,然后对这些数据进行定量分析并做出判断的方法叫做( )A.内容分析法B.间接调查法C.判断调查法D.阶段抽样调查15.语义上表现出明显的等级或顺序关系的定类资料,称为()A.定量资料B.定类数据C.调查资料D.定序资料16.各个组中的频数与所有组频数之和的比率叫做()A.累积频数B.频率C.频数D.累积频率17.观察值之间的差异程度或频数分布的分散程度,称为()A.集中趋势B.离散趋势C.方差D.极差18.从总体N个单位中抽取n个单位作为样本,每次从总体中抽取一个单位,凡是被抽中的单位不再放回到原来的总体中,接下来抽选的样本单位,只是从剩下的总体单位中进行抽取,这种抽样方式叫做()A.不重复抽样B.简单抽样C.随机抽样D.双相抽样19.EXCEL中,拟合优度系数计算的函数是()A.INTERCEPTB.SLOPEC.RSQD.LINEST20.在单因素等重复试验中,因素影响的均方为0.2986、误差影响均方0.0472,则F统计量的值是()A.0.1581B.0.2514C.0.3458D.6.3263答案:1-5.CDCDB 6-10.ACBDA 11-15.ACBAD 16-20BBACD。
《数据模型与决策》复习题及参考答案第一章绪言一、填空题1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。
2.运筹学的核心是运用数学方法研究各种系统的优化途径及方案,为决策者提供科学决策的依据。
3.模型是一件实际事物或现实情况的代表或抽象。
4、通常对问题中变量值的限制称为约束条件,它可以表示成一个等式或不等式的集合。
5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。
运筹学研究和解决问题的效果具有连续性。
6.运筹学用系统的观点研究功能之间的关系。
7.运筹学研究和解决问题的优势是应用各学科交叉的方法,具有典型综合应用特性。
8.运筹学的发展趋势是进一步依赖于_计算机的应用和发展。
9.运筹学解决问题时首先要观察待决策问题所处的环境。
10.用运筹学分析与解决问题,是一个科学决策的过程。
11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。
12.运筹学中所使用的模型是数学模型。
用运筹学解决问题的核心是建立数学模型,并对模型求解。
13用运筹学解决问题时,要分析,定议待决策的问题。
14.运筹学的系统特征之一是用系统的观点研究功能关系。
15.数学模型中,“s·t”表示约束。
16.建立数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。
17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。
二、单选题1.建立数学模型时,考虑可以由决策者控制的因素是( A )A.销售数量 B.销售价格 C.顾客的需求 D.竞争价格2.我们可以通过( C )来验证模型最优解。
A.观察 B.应用 C.实验 D.调查3.建立运筹学模型的过程不包括( A )阶段。
A.观察环境 B.数据分析 C.模型设计 D.模型实施4.建立模型的一个基本理由是去揭晓那些重要的或有关的( B )A数量 B变量 C 约束条件 D 目标函数5.模型中要求变量取值( D )A可正 B可负 C非正 D非负6.运筹学研究和解决问题的效果具有( A )A 连续性B 整体性C 阶段性D 再生性7.运筹学运用数学方法分析与解决问题,以达到系统的最优目标。
武汉⼤学MBA课程:《数据、模型与决策》全部课堂笔记及考试题经济与管理学院MBAEconomics and Management School of Wuhan University×××级×××班《数据、模型与决策》试题出题⼈:刘伟考试形式:闭卷考试时间:2007年7⽉×⽇120分钟姓名_______学号_______ 记分_______⼀、名词解释及简答题(各题5分)1、众数2、直⽅图3、变异系数4、相关系数5、虚拟变量6、置信区间7、最⼩⼆乘(平⽅)法8、线性回归模型9、多重共线性10、完全多重共线性11、不完全多重共线性12、虚拟变量模型 13、总体回归函数14、何为虚变量回归模型?为什么将虚变量值设为取0、1 ?15、回归⽅程的显著性检验与回归系数的显著性检验什么区别与联系?16、在回归⽅程的最⼩⼆乘法估计中,对回归模型有哪些基本假设?17、回归⽅程的显著性检验与回归系数的显著性检验什么区别与联系?18、为什么从计量经济学模型得到的预测值不是⼀个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩⼩置信区间?19、影⼦价格20、对偶规划21、模型22、约束条件23、⽬标函数24、决策变量25、协⽅差26、拟合优度检验⼆、计算题(各题10分)1、500家美国公司1993年底的平均资产为11270(单位:百万美元),标准差为2780(百万美元)。
这些公司的平均价格收益⽐为31,标准差为8。
请问哪⼀个指标的差异⼤?2、有⼀种电⼦元件,要求其使⽤寿命不得低于1000⼩时,现抽25件,测得其均值950⼩时,⽅差为900⼩时。
已知该种元件寿命服从正态分布,.;(1)写出该种电⼦元件使⽤寿命的置信区间,取α=005(2)若已知使⽤寿命的标准差σ=100,写出该种电⼦元件使⽤寿命的.;在置信区间,取α=005α=005.下,且已知σ=100这批元件合格否?3、某商店的⽇销售额服从正态分布,据统计去年的⽇均销售额是2.74万元,标准差是0.08万元,经装修后,在100个销售⽇中,平均⽇销售额为3.82万元。
MBA数据模型与决策考卷一、选择题(每题2分,共20分)A. 变量B. 参数C. 数据源D. 数据分析工具A. 信息增益B. 权重C. 相关性D. 方差A. 线性回归模型B. 逻辑回归模型C. 神经网络模型D. 决策树模型A. 目标函数B. 约束条件C. 变量非负D. 变量连续A. 加权评分模型B. 层次分析法C. 数据包络分析法D. 主成分分析法A. 欧氏距离B. 曼哈顿距离C. 杰卡德距离D. 马氏距离A. 移动平均法B. 指数平滑法C. 自回归移动平均模型D. 聚类分析法A. 敏感度B. 确定性C. 稳定性D. 风险A. 数据库B. 模型库C. 知识库D. 网络库A. 净现值B. 内部收益率C. 投资回收期D. 利润率二、简答题(每题10分,共30分)1. 简述数据模型的分类及其特点。
2. 请阐述决策树的基本原理及其在商业决策中的应用。
3. 简述线性规划与非线性规划的区别。
三、计算题(每题15分,共30分)1. 某企业生产两种产品,产品A的利润为10元/件,产品B的利润为15元/件。
生产一件产品A需要2小时,生产一件产品B需要3小时。
企业每月共有240小时的生产时间,且市场需求量分别为100件和80件。
请用线性规划方法求解该企业如何分配生产时间以获得最大利润。
数据:{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}四、案例分析题(20分)某电商企业想要提高用户转化率,现有一份用户行为数据,包括用户年龄、性别、浏览时长、次数、购买次数等。
请结合数据模型与决策方法,为该企业提出一套提高用户转化率的策略。
五、论述题(10分)请结合实际案例,论述数据模型与决策在企业战略管理中的应用价值。
一、选择题答案1. D2. A3. C4. D5. D6. A7. D8. A9. D10. A二、简答题答案1. 数据模型分类及特点:统计模型:基于概率论和统计学原理,特点是可以处理不确定性数据。
优化模型:基于数学规划,特点是可以求解最优解。
MBA数据模型与决策考卷及答案一、选择题(每题1分,共5分)A. 线性回归模型B. 决策树模型C. 主成分分析模型D. 聚类分析模型A. 信息增益B. 均方误差C. 相关系数D. F值A. 加权评分模型B. 层次分析法C. 数据包络分析法D. 逻辑回归分析法A. 目标函数线性B. 约束条件线性C. 变量非负D. 变量连续A. SPSSB. ExcelC. SASD. MATLAB二、判断题(每题1分,共5分)1. 数据模型可以用来描述现实世界中的数据关系和规律。
(√)2. 在决策分析中,只需要关注定量数据,无需考虑定性数据。
(×)3. 熵值法可以用于评估决策树的节点纯度。
(√)4. 线性规划问题中,目标函数和约束条件都必须是线性的。
(√)5. 数据挖掘就是从大量数据中提取有价值信息的过程。
(√)三、填空题(每题1分,共5分)1. 在决策树中,用于分割节点的属性称为______属性。
2. 多属性决策方法中,加权评分模型的核心是确定各属性的______。
3. 线性规划问题中,目标函数的取值称为______。
4. 在数据挖掘过程中,将原始数据转换为适合挖掘的格式的过程称为______。
5. ______是一种基于样本相似度的分类方法。
四、简答题(每题2分,共10分)1. 简述决策树的基本原理。
2. 什么是线性规划?它有哪些应用场景?3. 简述主成分分析的基本步骤。
4. 聚类分析的主要目的是什么?5. 请列举三种常用的多属性决策方法。
五、应用题(每题2分,共10分)1. 某企业拟投资两个项目,项目A的预期收益为100万元,风险系数为0.6;项目B的预期收益为150万元,风险系数为0.8。
请使用加权评分模型为企业选择投资项目。
2. 某公司生产两种产品,产品1的单件利润为10元,产品2的单件利润为15元。
生产一件产品1需要2小时,生产一件产品2需要3小时。
公司每月最多生产100件产品,且生产时间不超过240小时。
专业课原理概述部分一、选择题(每题1分,共5分)1. 数据模型的三个基本要素是()A. 数据结构、数据操作、数据约束B. 数据结构、数据类型、数据操作C. 数据结构、数据存储、数据操作D. 数据结构、数据处理、数据约束A. 根节点B. 叶节点C. 中间节点D. 边缘节点A. 目标函数是线性的B. 约束条件是线性的C. 变量之间是独立的D. 目标函数和约束条件必须都是最小化A. 最早开始时间B. 最迟完成时间C. 自由时差D. 期望时差A. 库存水平B. 库存周转率C. 库存占用资金D. 库存损耗率1. 数据模型是对现实世界的一种抽象表示。
()2. 在决策树中,信息增益越大的特征越重要。
()3. 线性规划问题只能求解最小化问题。
()4. 网络分析中的关键路径是指项目中耗时最长的路径。
()5. 安全库存是为了应对不确定需求而设置的额外库存。
()三、填空题(每题1分,共5分)1. 数据模型的三个基本要素包括数据结构、数据操作和______。
2. 在决策树中,______节点表示决策结果,______节点表示决策条件。
3. 线性规划问题中,目标函数可以是最大化或______。
4. 网络分析中,最早开始时间等于其前序活动的______时间。
5. 库存管理中,库存周转率等于销售成本除以______。
四、简答题(每题2分,共10分)1. 简述数据模型的作用。
2. 解释决策树剪枝的目的。
3. 线性规划问题的主要应用领域有哪些?4. 网络分析中的关键路径法有何意义?5. 如何计算库存周转率?五、应用题(每题2分,共10分)1. 某企业生产两种产品,产品A和产品B。
生产一个单位产品A 需要2小时,生产一个单位产品B需要3小时。
企业每月最多可投入180小时的生产时间。
产品A的利润为100元/个,产品B的利润为150元/个。
请建立线性规划模型,求解最大利润。
1. 请结合实际案例分析数据模型在企业管理中的应用。
2. 请分析决策树算法在信贷风险评估中的作用。
《数据、模型与决策》1.最短路径问题一辆运桔车从洛杉矶到圣路易斯运送桔子,如图所示。
从洛杉矶出发的运输图图中各分支上的数值表明其连接的两个节点之间的运输时间。
问题:用Excel软件求解从洛杉矶到圣路易斯的最短路径。
要求:(1)要给出线性规划的代数模型,(2)给出线性规划的Excel模型截图,(3)要给出目标函数、某个中间节点和起始节点计算公式的Excel截图,(4)要给出“规划求解”的各项设置条件的截图,(5)最后要给出计算结果的界面截图。
2.AHP法计算题(25分)南方发展公司为其商场选择了三个备选地址:亚特兰大(A)、伯明翰(B)、夏洛特(C)。
具体选择哪个地址的评价涉及如下四个准则:(1)消费者的市场状况(规模和年龄结构),(2)收入水平,(3)基础设施(公共设施和道路状况),(4)交通运输(邻近州际高速以利于供货和消费者)。
在这四个准则下3个方案的比较矩阵和四个准则的比较矩阵如下。
问题:运用AHP方法在Excel上对上述3个方案建模并进行等级排序。
要求:(1)四个准则下3个方案的重要度向量至少给出一个求解过程的Excel 截图,(2)要给出四个准则下3个方案的重要度矩阵的Excel截图,(3)要给出四个准则的重要度向量求解的Excel截图,(4)要给出3个方案的综合重要度向量求解的Excel截图并指出哪个方案为最佳方案,(5)最后要给出一致性检验Excel求解过程的截图。
3.Excel仿真题(30分)“计算机世界”是销售计算机及相关设备的公司,该公司经理拟确定每周该订购的笔记本电脑数量是1台还是2台更好。
决策主要涉及的随机变量是每周销售量(x),根据以往的销售情况x在0~4台之间变化,另外每销售1台笔记本电脑的收益为4300美元,每缺货一台将损失500$,且当供给大于需求时的库存成本为每台50$。
笔记本电脑过去100周的需求销售情况如下表所示。
计算机世界公司笔记本销售情况表问题:假定过去销售情况是稳定的,则根据以上所给的参数,设计Excel仿真模型,并通过仿真100周给出最优的决策方案。
数据、模型与决策习题一、判断题(你认为下列命题是否正确, 对正确的打“√”;错误的打“×”) 1..若线性规划无最优解则其可行域无界.. ) 2.在邻接矩阵中, 全零的列所对应的点为汇点..) 3.线性规划的最优解一定是基本最优解.. )4.可行解集非空时, 则在极点上(凸多边形顶点)至少有一点达到最优....)5.基本解对应的基是可行... )6. 线性规划的最优解是基本解( )7. 可行解是基本解( )8.单纯形法计算中, 选取检验数为最大正数对应的 作为进基变量, 将使目标函数值得到最快的增长.. )9.在给定显著性水.. 下,,........ 时,拒绝即可认为 与 之间确有线性关系( ) 10.凡基本解一定是可行解.. ) 11.正反馈系统具有自我增强功能...)12.选取检验数为最小值对应的 作为进基变量, 将使目标函数值得到最快的增长...) 13.马尔柯夫链的特性为: 事物的第n 次实验结果仅取决于(n-1)次实验结果...) 14.对于非确定性问题, 无论采取何种预测方法, 也不可能得到精确的预测结果...) 15.可达矩阵表明了各点长度不大于n-1通路的可达情况.. )16.在采用层次分析法评价过程中, 由专家构造的判断矩阵也必须进行一致性检验...) 17.决策的定义是:从若干个备选方案中选择一个最优的(满意)方案, 并加以实施.. ) 18.科学决策就是依靠决策者的个人阅历、知识和智慧来对可行方案进行选择的过程. ) 19.小中取大原则—悲观原则, 是一种悲观保守的决策策略, 而大中取大原则—乐观原则才是一种积极进取的决策策....................... . )20.决策树针对的是具有风险性特征事物的一种决策方法. ) 二、填空题1 一元线性回归模型是( ), 其中 ( )是自变量, ( )是因变量, ( 和 )是( )。
y ˆk x x x ,,,212 由 , 得出 , , 其中 等于( ), 等于( ), 则用于一元线性回归模型 , 表示为( )。
经济与管理学院
Economics and Management School of Wuhan University
×××级×××班《数据、模型与决策》试题
出题人:刘 伟 考试形式:闭卷 考试时间:2007年7月×日 120分钟
姓名_______ 学号_______ 记分_______
一、名词解释及简答题(各题5分)
1、众数
2、直方图
3、变异系数
4、相关系数
5、虚拟变量
6、置信区间
7、最小二乘(平方)法
8、线性回归模型
9、多重共线性 10、完全多重共线性 11、不完全多重共线性
12、虚拟变量模型 13、总体回归函数
14、何为虚变量回归模型?为什么将虚变量值设为取 0、1 ?
15、回归方程的显著性检验与回归系数的显著性检验什么区别与联系?
16、在回归方程的最小二乘法估计中,对回归模型有哪些基本假设?
17、回归方程的显著性检验与回归系数的显著性检验什么区别与联系?
18、为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置
信度的含义是什么?在相同的置信度下如何才能缩小置信区间?
19、影子价格 20、对偶规划 21、模型 22、约束条件 23、目标函数
24、决策变量 25、协方差 26、拟合优度检验
二、计算题(各题10分)
1、500家美国公司1993年底的平均资产为11270(单位:百万美元),标准差为2780(百万美元)。
这些公司的平均价格收益比为31,标准差为8。
请问哪一个指标的差异大?
2、有一种电子元件,要求其使用寿命不得低于1000小时,现抽25件,测
得其均值950小时,方差为900小时。
已知该种元件寿命服从正态分布,
(1)写出该种电子元件使用寿命的置信区间,取α=005.;
(2)若已知使用寿命的标准差σ=100,写出该种电子元件使用寿命的
置信区间,取α=005.;在
α=005.下,且已知σ=100这批元件合格否?
3、某商店的日销售额服从正态分布,据统计去年的日均销售额是2.74万元,
MBA
标准差是0.08万元,经装修后,在100个销售日中,平均日销售额为3.82
万元。
若标准差不变,问装修后的这段时间的日均销售额与装修前相比,有无显
著性差异(α=001.)。
4、对于一元回归模型(20分)
1i i i Y X βμ=+
(1)写出参数的最小二乘估计过程;(2)计算残差ˆi i
Y Y -的算术平均值; 5、根据8个企业的广告支出X 和销售收入Y 的资源,求得:
, , ,
试用普通最小二乘法确定销售收入Y 对广告支出X 的回归直线,并计算判定系数。
6、分析某地区年消费量C 与居民人均可支配收入Y 、价格水平P 、人均储蓄额S 之间的关系。
利用1980年至2001年的数据,构造并估计得如下模型:
2ˆ85260.650.210.130.95t t t t C Y P S R =+--=
t=(2.56) (4.02) (-0.76)(-2.98) F=452 D.W=1.01
(1)解释该模型的经济含义 (2)分析该模型的检验问题(0.01α=)
(3)描述用该模型进行预测 (4)对该模型有何修改建议?
7、某种商品的销售收入依赖于广告支出,相应的样本回归方程为
I Y 6.068+=∧
其中I 是广告支出。
已知 I =600,8000)(2=-∑i i I I ,300)(2=-∑∧i
i i Y Y ;
当I 0=2000时,
(1)计算销售收入Y 的点预测,
(2)计算在95%的置信水平下,销售收入的预测区间(t 0.025=2.23)。
8、为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了2000名7~17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?
(3)哪一位调查研究人员有可能得到这2100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?
9、根据表,计算1990年到1997年期间,我国商品零售价格总指数的平均值和标准差。
表1 1990-1997年我国商品零售价格总指数(上年=100)
10、试在家庭对某商品的消费需求函数Y=α+βX+μ中(以加法形式)引入虚拟变量,用以反映季节因素(淡、旺季)和收入层次差异(高、低)对消费需求的影响,并写出各类消费函数的具体形式。
11、设某种试验成功的概率为0.7,现独立地进行10次这样的试验。
问是否可以用一个服从二项分布的随机变量来描述这10次试验中成功的次数?如何描述?请写出它的分布以及分布的数学期望和标准差。
12、某零件的寿命服从均值为1200小时,标准差为50小时的正态分布。
随机地抽取一只零件,试求:
(1)它的寿命不低于1300小时的概率;
(2)它的寿命在1100小时和1300小时之间的概率;
(3)它的寿命不低于多少小时的概率为95%?
{标准正态分布函数
0(2)0.97725
Φ=,
0(1.645)0.95
Φ=}
13、某市有50%的住户订日报,有65%的住户订晚报,有85%的住户至少订两种报纸的一种,求同时订这两种报的住户的百分比。
14、某厂产品的合格率为96%,合格品中一级品率为75%。
从产品中任取一件为一级品的概率是多少?
15、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%。
25岁以下青年在小学、初中、高中以上文化程度各组中的比例分别为20%,50%,70%。
从该厂随机抽取一名职工,发现其年龄不到25岁,问他具有小学、初中、高中以上文化程度的概率各为多少?
16、某人花2元钱买彩票,他抽中100元奖的概率是0.1%,抽中10元奖的概率是1%,抽中1元奖的概率是1/2,假设各种奖不能同时抽中,求:
(1)此人收益的概率分布;
(2)此人收益的期望值。
17、一工厂生产的电子管寿命X(以小时计算)服从期望值为μ=160正态分布,若要求P{120<X<200}≥0.08,允许标准差σ最大为多少?
{标准正态分布函数
0(0.1004)0.54
Φ=}
18、假设某学者估计消费(关于收入的)函数,并获得以下结果(括号中为t检验值):
=6.5 + 0.65Y i
(3.1)(8.7)
R2=0.98 n=19
1)、请在显著性水平为5%的基础上检验关于收入系数的假设H0:β=0
2)、确定参数估计量的标准方差;
3)、构造β的95%的置信区间。
19、研究某一地区居民年食品支出与消费支出的关系,调查10 年的统计资料见下表
求(1)食品支出y 对消费支出x 的一元线性回归方程;
(2)检验一元线性回归方差的显著性;
(3)当消费支出x = 42 时,食品支出的预测值;
20、设有模型Y= β0+β1X1+β2X2 +u ,试在下列条件下
(1)β1+ β2=1(2)β1= β2
分别求出β1和β2的最小二乘估计量
21、以企业研发支出(R&D)占销售额的比重未被解释变量Y,以企业销售额X1与利润占
销售额的比重X2为解释变量,一个容量为64的样本企业的估计结果如下:
Y=0.572+0.12logX1+0.25X2
(1.37)(0.22)(0.046)
R2=0.89
其中括号中为系数估计值的标准差。
(1)解释logX1的系数。
如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不随X1而变化的假设。
分别在5%和10%显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?
22、考虑以下预测的回归方程:
t = -120+0.25F t +3.3R t , =0.50 其中,t 为t 年的玉米产量(单位:吨/亩),F t 为第t 年的施肥强度(单位:千克/亩),
R t 为第t 年的降水量(单位:毫米)。
问:
(1)从F 和R 对Y 的影响方面,说出本方程中系数0.10和5.33的含义。
(2)常数项-120是否意味着玉米的负产量可能存在?
(3)假定βF 的真实值为0.40,则估计值是否有偏?为什么? (4)假定该方程并不满足所有经典模型假设,即并不是最佳线性无偏估计值,是否意
味着βR 的真实值绝对不等于5.33?为什么?
23、考虑某地区的消费Y 与收入X ,利用n=60的样本数据,计算得
335X =∑,365Y =∑,25935X =∑, 246136Y =∑, 8254XY =∑ 试:(1)计算消费Y 与收入X 间的相关系数;
(2)建立变量Y 依变量X 变化的线性回归方程;
(3)计算回归方程的拟合系数R 2;
(4)讨论方程的显著性(0.05α=).。