当前位置：文档之家› 数据模型与决策(02-09年硕士入学考试)

数据模型与决策(02-09年硕士入学考试)

《统计预测与决策》第四版徐国祥复习试卷及答案(四套)

试卷一一、单项选择题（共10小题，每题1分，共10分） 1 统计预测方法中，以逻辑判断为主的方法属于（）。 A 回归预测法 B 定量预测法 C 定性预测法 D 时间序列预测法 2 下列哪一项不是统计决策的公理（）。 A 方案优劣可以比较 B 效用等同性 C 效用替换性 D 效用递减性 3 根据经验D-W统计量在（）之间表示回归模型没有显著自相关问题。 A 1.0-1.5 B 1.5-2.5 C 1.5-2.0 D 2.5-3.5 4 当时间序列各期值的二阶差分相等或大致相等时,可配合( )进行预测。 A 线性模型 B抛物线模型 C指数模型 D修正指数模型 5 （）是指国民经济活动的绝对水平出现上升和下降的交替。 A 经济周期 B 景气循环 C 古典经济周期 D 现代经济周期 6 灰色预测是对含有（）的系统进行预测的方法。 A 完全充分信息 B 完全未知信息 C 不确定因素 D 不可知因素 7 状态空间模型的假设条件是动态系统符合（）。 A 平稳特性 B 随机特性 C 马尔可夫特性 D 离散性 8 不确定性决策中“乐观决策准则”以（）作为选择最优方案的标准。 A 最大损失 B 最大收益 C 后悔值 D α系数 9 贝叶斯定理实质上是对（）的陈述。 A 联合概率 B 边际概率 C 条件概率 D 后验概率 10 景气预警系统中绿色信号代表（）。 A 经济过热 B 经济稳定 C 经济萧条 D 经济波动过大二、多项选择题（共5小题，每题3分，共15分） 1 构成统计预测的基本要素有（）。 A 经济理论 B预测主体 C数学模型 D实际资料 2 统计预测中应遵循的原则是（）。 A 经济原则 B连贯原则 C可行原则 D 类推原则 3 按预测方法的性质，大致可分为（）预测方法。 A 定性预测 B 情景预测 C时间序列预测 D回归预测

数据模型与决策试题

山东大学管理学院秋季MBA2011级（石家庄班）数据、模型与决策试题2012年6月 1．（10分）线性回归模型是否满足假设要通过哪几个方面来检验？每个方面的含义是什么？根据什么指标或图形来检验好坏？ 2．（15分）以下结果是应用什么软件的什么方法计算输出的，简述软件操作过程。并从结果中分析计算过程、各部分数据的意义及最后的方程（T值除外）。 --------------------------------------------------------------- XXXX: EARN 与 SIZE, EMPL, ... 入选用 Alpha: 0.05 删除用 Alpha: 0.1，响应为 14 个自变量上的 EARN，N = 50 步骤 1 2 3 4 5 常量 11.85 -348.99 -413.26 -403.41 -368.55 P45 0.0351 0.0321 0.0304 0.0321 0.0319 T 值 5.94 6.65 7.43 9.46 10.00 P 值 0.000 0.000 0.000 0.000 0.000 INC 11.9 12.9 10.3 10.3 T 值 5.11 6.55 5.98 6.34 P 值 0.000 0.000 0.000 0.000 NREST 1.29 1.43 1.40 T 值 4.49 5.96 6.22 P 值 0.000 0.000 0.000 SIZE 0.54 0.56 T 值 4.76 5.27 P 值 0.000 0.000 PRICE -2.13 T 值 -2.61 P 值 0.012 S 67.4 54.6 46.0 37.9 35.7 R-Sq 42.33 62.90 74.21 82.85 85.15 R-Sq（调整） 41.13 61.32 72.53 81.32 83.47 Mallows Cp 120.5 63.1 32.5 9.5 4.9 ------------------------------------------------------------------------------- 3．（20分）桑杰伊·托马斯(Sanjay Thomas)是斯隆管理学院的二年级MBA学生。作为上学期有关企业家课程设计的一部分，桑杰伊实际上已经对东海岸城市具有印度烹调风格的饭店的样本进行了概率分析，并首先对他婶婶的饭店进行了分析。在调整了有关波士顿地区的标准生活费用的数据以后，桑杰伊利用这些资料制定了温馨小扁豆饭店的成本和收入的标准。这些数据是基于饭店位于哈佛广场，拥有50个座位，并贷款进行了饭店的内部结构装修，以及租赁了饭店的所有资本性设备。桑杰伊估计经营温馨小扁豆饭店每月的非劳动固定成本是3995美元。他还估计了食品的可变成本是每餐为11美元。在饭店事务的许多不确定因素中，有三种不确定变量在概率等式中趋向于起主导作用：每月销售膳食的数量，每餐饭的收入，以及饭店的(固定)劳动力成本。根据他与许多饭店业主的交流，桑杰伊能够估计这三个关键性的不确定变量的实际分布，这些变量如下： ----销售膳食的数量。像温馨小扁豆饭店这样坐落于哈佛广场，并拥有50个座位容量的饭店，每月销售的膳食数量将服从一个均值为μ=3 000和标准离差为σ=1 000 的正态分布。

数据分析与决策模型

《数据分析与决策模型》课后感言上周我学习《数据分析与决策模型》这门课程，我本来对这门学科很是陌生，工作中从来没有接触过这样深奥的理论，本以为我学完也是一头雾水，出乎意料的是，在老师耐心讲解下，我还懂得很多，逐渐对它深感兴趣，课堂也受益匪浅。顾名思义，《数据分析与决策模型》是利用一系列看似枯燥的数据，通过应用恰当的数学公式计算和假设推理，帮助我们提高管理水平和进行科学决策的重要课程。随机变量的“数学期望值”μ是概率分布的平均值，也是我们做投资决定的重要依据。李教授以赌场提供的“blackj ack(二十一点)保险为例，通过计算得出投资回报期望值μ＝0.92，投资回报小于1（假定投资总额为1）的事实，得出了不应该买赌场保险的结论，利用概率论证实了久赌必输的事实。“正态分布”是期望值μ和标准差σ的结晶。我们通常所看到的“正态分布”的钟形曲线，就是因为不同的μ和σ，而变得高矮胖瘦，不一而足。日常生活中的很多随机变量的概率分布问题，都可以近似地用正态分布来研究描述。通过计算Z分数（值），就可判断X值的概率，对于投资者来说，也就是投资后获得多大回报的概率。“中心极限定律”则告诉我们，不管总体服从什么分布，当样本容量n＞＝30时，X近似于正态分布，都可以用正态分布的相关理论进行计算和推论。以往我虽然接触过一些统计、概率方面的基础知识，但像这样系统全面的学习还是第一次，通过这一课程，我学到了抽样调查、假设检验、回归分析和关于建立模型的知识。在课程学习中我对统计软件产生了强烈兴趣。在我看来数据分析是以统计学为基础的，统计学提供了一套完整的科学方法论，而统计软件则是实现的手段。在商业应用中，我们往往要面对大量庞杂的数据，这时如果没有统计软件的帮助是不可想象的。像教授在课程中介绍的minitab软件就很符合我的需要。它具有很好的人机界面和完善的输出结果；功能全面，系统地集成了多种成熟的统计分析方法；有完善的数据定义、操作和管理功能；方便地生成各种统计图形和统计表格；使用方式简单，有完备的联机帮助功能；软件开放性好，能方便地和其他软件进行数据交换。为了多加练习，我在公司和家里电脑上都安装了minitab软件，初步尝试了对数据进行标准化处理、频数分布分析、描述性统计分析、多选项分析等等，得出了计算数据和统计图形，可以看出数据的离散程度、集中趋势和分散程度，单变量的比重。在操作中，我深刻体会到要想熟练运用统计软件，熟练掌握和运用统计知识是基础，据此才能弄清楚数据分析的目的与对应的分析方法。

武汉大学MBA《数据模型与决策》往年试题

经济与管理学院 Economics and Management School of Wuhan University ×××级×××班《数据、模型与决策》试题出题人：刘伟考试形式：闭卷考试时间：2007年7月×日 120分钟姓名_______ 学号_______ 记分_______ 一、名词解释及简答题（各题5分） 1、众数 2、直方图 3、变异系数 4、相关系数 5、虚拟变量 6、置信区间 7、最小二乘（平方）法 8、线性回归模型 9、多重共线性 10、完全多重共线性 11、不完全多重共线性 12、虚拟变量模型 13、总体回归函数 14、何为虚变量回归模型？为什么将虚变量值设为取 0、1 ？ 15、回归方程的显著性检验与回归系数的显著性检验什么区别与联系？ 16、在回归方程的最小二乘法估计中，对回归模型有哪些基本假设？ 17、回归方程的显著性检验与回归系数的显著性检验什么区别与联系？ 18、为什么从计量经济学模型得到的预测值不是一个确定的值？预测值的置信区间和置信度的含义是什么？在相同的置信度下如何才能缩小置信区间？ 19、影子价格 20、对偶规划 21、模型 22、约束条件 23、目标函数 24、决策变量 25、协方差 26、拟合优度检验二、计算题（各题10分） 1、500家美国公司1993年底的平均资产为11270（单位：百万美元），标准差为2780（百万美元）。这些公司的平均价格收益比为31，标准差为8。请问哪一个指标的差异大? 2、有一种电子元件，要求其使用寿命不得低于1000小时，现抽25件，测得其均值950小时，方差为900小时。已知该种元件寿命服从正态分布，（1）写出该种电子元件使用寿命的置信区间，取α=005.；（2）若已知使用寿命的标准差σ=100，写出该种电子元件使用寿命的置信区间，取α=005.；在 α=005.下，且已知σ=100这批元件合格否？ 3、某商店的日销售额服从正态分布，据统计去年的日均销售额是2.74万元， MBA

数据、模型与决策例题分析

数据、模型与决策 3 线性规划问题的计算机求解及应用举例第7题（1）线性规划模型（2）线性规划模型代数式公司所做决策的变量是每种原料合金的数量，因此引入决策变量 i x 表示第i 种原料合金的数量()1,2,3,4,5,6i =。建立此问题的数学模型为： 123456min 1008075859495Z x x x x x x =+++++ 6 1234561 6 12345616 12345616025304030404020352025405030..204050353010300(1,2,3,4,5,6)i i i i i i i x x x x x x x x x x x x x x s t x x x x x x x x i ===? +++++=??? ? +++++=?????+++++=????≥=?? ∑∑∑

第8题（1）线性规划模型（2）线性规划模型代数式公司所做决策的变量是每种原料数，因此引入决策变量i x 表示第i 种原料数()1,2,3,4i =。建立此问题的数学模型为： 1234min 0.80.40.60.4Z x x x x =+++ 12341234 1234123485204080250 35853565190..152560151601089840 x x x x x x x x s t x x x x x x x x +++≥??+++≥?? +++≥??+++≥?

第9题线性规划模型代数式车间所做决策的变量是(1,2,3)i A i =机床生产(1,2)j B j =零件数，因此引入决策变量ij x 表示加工(1,2)j B j =零件使用的(1,2,3)i A i =机床台数。建立此问题的数学模型为： 111221223132max 304565403542Z x x x x x x =+++++ 1112212231328060..300(1,2,3,1,2) ij x x x x s t x x x i j +≤? ?+≤? ? +≤??≥==? （1）线性规划模型（2）使用sumproduct 函数

2014年7月江苏省高等教育自学考试30447数据、模型与决策试题

2014年7月江苏省高等教育自学考试30447数据、模型与决策一、单项选择题（每小题1分，共10分）在下列每小题的四个备选答案中选出一个正确答案，并将其字母标号填入题干的括号内。1．运用数据模型开展定量分析，其根本目标是( ) A．管理决策B．数量分析C．理论指导D．科学管理 2．主要为搜集某一时点或一定时期内现象总量资料而专门组织的、一次性全面调查称为( ) A．抽样调查B．实验设计C．普查D．参与观察 3．从总体N个单位中抽取n个单位组成样本时，保证每一个单位被抽出来的概率相等，这种抽样方法叫做( ) A．等距抽样B．简单随机抽样C．分层抽样D．整群抽样 4．把非定量的文献史料、语言习惯等带有特征的因素设法转化成可以量化处理的数据，然后对这些数据进行定量分析并做出判断的方法叫做( ) A．内容分析法B．间接调查法C．判断调查法D．阶段抽样调查 5．语义上表现出明显的等级或顺序关系的定类资料，称为( ) A．定量资料B．定类数据C．调查资料D．定序资料 6．各个组中的频数与所有组频数之和的比率叫做( ) A．累积频数B．频率C．频数D．累积频率 7．观察值之间的差异程度或频数分布的分散程度，称为( ) A．集中趋势B．离散趋势C．方差D．极差 8．从总体N个单位中抽取n个单位作为样本，每次从总体中抽取一个单位，凡是被抽中的单位不再放回到原来的总体中，接下来抽选的样本单位，只是从剩下的总体单位中进行抽取，这种抽样方式叫做( ) A．不重复抽样B．简单抽样C．随机抽样D．双相抽样 9．EXCEL中，拟合优度系数计算的函数是( ) A．INTERCEPT B．SLOPE C．RSQD．LINEST 10．在单因素等重复实验中，因素影响的均方为0.2986、误差影响均方0.0472，则F统计量的值是( ) A．0.1581 B．0.2514 C．0 3458 D．6.3263 二、填空题（每小题1分，共10分） 11．从定量角度研究管理问题，是主要工具。 12．先从总体中随机抽取一个较大的样本，获得第一重样本，然后再从第一重样本中随机抽取一个较小的样本即第二重样本，利用这第一二重样木，对研究目标进行统计推断，这种抽样组织方式叫做。 13．在单因素不等重复实验中，因素影响的均方6889.13、实验误差影响均方1408.97，则统计量的值是。 14．相比于定距资料，定比资料拥有。 15．均匀分布的离散程度最大，因此若的计算结果越大，意味着频数分布的离散程度也越大。16．X1，X2，…，X n为f（x；θ）的一个简单随机样本，θ是总体参数，由样本确定的估计量为1=1（X1，X2，…，X n）和2=2（X1，X2，…，X n），对于给定的α(0<α<1)，能使P（1≤θ≤2）=1-α成立，则称1-α为。 17．在若干个能够互相比较的资料组中，把产生变异的原因加以明确区分的方法和技术叫做。18．多元回归分析中，拟合优度系数R2是的递增函数。

运筹学数据模型与决策教材习题答案

教材习题答案 1.2 工厂每月生产A 、B 、C 三种产品 ,单件产品的原材料消耗量、设备台时的消耗量、资源限量及单件产品利润如表1－22所示．和130.试建立该问题的数学模型,使每月利润最大．【解】设x 1、x 2、x 3分别为产品A 、B 、C 的产量，则数学模型为 1231231 23123123max 1014121.5 1.2425003 1.6 1.21400 150250260310120130,,0 Z x x x x x x x x x x x x x x x =++++≤??++≤??≤≤?? ≤≤??≤≤?≥?? 1.3 建筑公司需要用6m 长的塑钢材料制作A 、B 两种型号的窗架．两种窗架所需材料规格及数量如表1－23所示：【解】设x j （j =1,2,…，14）为第j 种方案使用原材料的根数，则（1）用料最少数学模型为

14 1 12342567891036891112132347910121314 min 2300322450 232400 23234600 0,1,2,,14 j j j Z x x x x x x x x x x x x x x x x x x x x x x x x x x x x x j ==?+++≥? ++++++≥?? ++++++≥??++++++++≥??≥=?∑ 用单纯形法求解得到两个基本最优解 X (1)=( 50 ,200 ,0 ,0,84 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=534 X (2)=( 0 ,200 ,100 ,0,84 ,0,0 ,0 ,0 ,0 ,0 ,150 ,0 ,0 );Z=534 （2）余料最少数学模型为 13413141234256789103689111213 2347910121314 min 0.60.30.70.40.8230032245023240023234600 0,1,2,,14 j Z x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x j =+++++?+++≥? ++++++≥??++++++≥??++++++++≥??≥=? 用单纯形法求解得到两个基本最优解 X (1)=( 0 ,300 ,0 ,0,50 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=0，用料550根 X (2)=( 0 ,450 ,0 ,0,0 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=0，用料650根显然用料最少的方案最优。 1.7 图解下列线性规划并指出解的形式： (1) 12 121212 max 2131,0Z x x x x x x x x =-++≥?? -≥-??≥? 【解】最优解X ＝（1/2，1/2）；最优值Z=－1/2

数据-模型与决策练习题含答案

1、某企业目前的损益状况如在下：销售收入（1000件×10元/件） 10 000 销售成本：变动成本（1000件×6元/件） 6 000 固定成本 2 000 销售和管理费（全部固定） 1 000 利润 1 000 （1）假设企业按国家规定普调工资，使单位变动成本增加4％，固定成本增加1％，结果将会导致利润下降。为了抵销这种影响企业有两个应对措施：一是提高价格5％，而提价会使销量减少10％；二是增加产量20％，为使这些产品能销售出去，要追加500元广告费。请做出选择，哪一个方案更有利？（2）假设企业欲使利润增加50％，即达到1 500元，可以从哪几个方面着手，采取相应的措施。 2、某企业每月固定制造成本1 000元，固定销售费100元，固定管理费150元；单位变动制造成本6元，单位变动销售费0.70元，单位变动管理费0.30元；该企业生产一种产品，单价10元，所得税税率50％；本月计划产销600件产品，问预期利润是多少?如拟实现净利500元，应产销多少件产品? 3、某企业生产甲、乙、丙三种产品，固定成本500000元，有关资料见下表（单位：元）：要求：（1）计算各产品的边际贡献；（2）计算加权平均边际贡献率；（3）根据加权平均边际贡献率计算预期税前利润。 4、某企业每年耗用某种材料3 600千克，单位存储成本为2元，一次订货成本25元。则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少？ 5．有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下：

（1）说明两变量之间的相关方向；（2）建立直线回归方程；（3）估计生产性固定资产（自变量）为1100万元时总产值（因变量）的可能值。 6、某商店的成本费用本期发生额如表所示，采用账户分析法进行成本估计。首先，对每个项目进行研究，根据固定成本和变动成本的定义及特点结合企业具体情况来判断，确定它们属于哪一类成本。例如，商品成本和利息与商店业务量关系密切，基本上属于变动成本；福利费、租金、保险、修理费、水电费、折旧等基本上与业务量无关，视为固定成本。其次，剩下的工资、广告和易耗品等与典型的两种成本性态差别较大，不便归入固定成本或变动成本。对于这些混合成本，要使用工业工程法、契约检查法或历史成本分析法，寻找一个比例，将其分为固定和变动成本两部分。 7、某企业每年耗用某种材料3 600千克，单位存储成本为2元，一次订货成本25元。则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少？ 8、某生产企业使用A零件，可以外购，也可以自制。如果外购，单价4元，一次订

2014年4月江苏省高等教育自学考试30447数据、模型与决策试题

2014年4月江苏省高等教育自学考试 30447数据、模型与决策一、单项选择题（每小题1分，共10分）在下列每小题的四个备选答案中选出一个正确答案，并将其字母标号填入题干的括号内。1．从调查对象（总体）中抽取一部分单位组成样本，然后根据样本调查的结果，对总体情况进行推断，称之为抽样调查。抽取一部分单位时应遵照( ) A．判断原则B．参与原则C．随机原则D．程序原则 2．先从总体中随机抽取一个较大的样本，获得第一重样本，然后再从第一重样本中随机抽取一个较小的样本即第二重样本，利用这第二重样本，对研究目标进行统计推断，这种抽样组织方式叫做( ) A．类型抽样调查B．简单抽样调查 C．阶段抽样调查D．双相抽样调查 3.在调查工作已经完成，进入数据编辑和整理阶段所用的评估数据质量的方法统称为( ) A．相对技术B．抽样技术C．后验技术D．误差分析 4．在统计分组的基础上形成的样本单位在各个组间的分配，叫做( ) A．直方图B．交叉分类表C．频数D．频数分布 5．在频数分布中，观察值中出现次数最多的数值就是( ) A．算术平均数B．众数C．四分位数D．中位数 6.在若干个能够互相比较的资料组中，把产生变异的原因明确区分出来的方法，叫做( ) A．方差分析B．回归分析C．描述分析D．样本推断 7．对一元线性回归y i=α+βx i+εi，β反映了自变量对因变量的( ) A．正向影响B．负向影响C．边际影响D．回归影响 8．时间序列中各项观察的一阶差分为常数，可拟合( ) A．指数曲线模型B．直线趋势方程C．抛物线模型D．指数平滑模型 9．顾客在排队系统中等待时间和服务时间的和叫做( ) A．排队长B．队长C．等待时间D．逗留时间 10．在库存管理中，需求是库存系统的( ) A．输出B．输入C．订货D．变量二、填空题（每小题1分，共10分） 11．运用数据模型开展分析，是根本目标。 12．文化程度属于定性资料中的资料。 13．各个组中的频数与所有组频数之和的比率叫做。 14．把每个观察数据划分成两个部分，一是主部一是余部，并分别用植物的“茎”和“叶”形象地称呼，然后把数据的主部按从小到大的顺序纵向排列，再在每个数据的主部后面列出余部，由此得到的统计图称之为。 15．对顾客就某款产品使用效果询问的结果是：很不满意、不满意、满意、满意、很满意、很满意、不满意、满意、满意，则顾客的代表性意见是。 16．χ2分布的形状随自由度n的增大而逐渐趋向于。 17．在单因素方差分析中，S b2为组间离差平方和，反映了各组平均数与的差异情况。18．时间序列中的每一项观察值，称为时间序列的，反映客观现象发展变化在各个不同时间上所达到的状态、规模或水平。

《数据模型与决策》试题答案

2008—2009第二学期《数据模型与决策》课考试题姓名：学号：成绩：【说明：共5题，答题时间共计120分钟】一、试述你对以下概念的理解：（32分）（1）企业内部数据，即通常从企业会计、营销、生产运行中收集的数据。（2）样本，即总体的一个子集。（3）回归模型，即刻画因变量与一个或多个自变量之间相互关系的模型。（4）德尔斐法，是判断预测的普遍方法，通过让许多专家匿名回答一系列调查问卷来实现。在每一轮回答后，答案将匿名共享，让专家知道其他专家的意见。通过了解其他专家的意见，将增加看法的统一性并促使意见不一致的人去考虑其他因素。（5）正态分布，其形态就是钟形曲线。正态分布是对称的且中位数等于平均数，即有一半的面积在平均数以上，另一半的面积在平均数以下。正态分布可以用两个参数来描述；均值（位置参数）、方差（刻度参数）。当均值变化时，分布在x轴上的位置也会变化；而当方差增加或减少时，分布相应地会变宽或窄。（6）变异系数，是一种间接测度数据离散程度的方法，它一般由平均数求得：变异系数（CV）=标准方差/平均数（7）标准差，是测度离散程度的一种方法。它是方差的开平方求得的。总体和样本标准差分别为：

（8）显著性水平，即发生第一类错误（即原假设事实上是正确的，但是假设检验错误的拒绝了它）的概率a。二、对于下表这样一组给定的数据，我们可以用表格、图形、回归模型3种方式来表达10个公司销售收入与营销费用之间的关系。试问：这3种方式的表达思路有什么异同？（15分）公司编号12345678910销售收入（Y）5000 3000 1200 2000 10000 4000 800 7000 9000 12000 营销费用（X）675 550 275 325 1375 525 193 950 975 1650 答：表格：我们仅从数据中可以看到营销费用与销售收入大约成正向关系，即营销费用增加，销售收入增加。图形：我们可以从图形中更加直观的揭示数据中包含的特征与规律，即能够大体的看清营销费用变动导致销售收入变动的程度。回归：通过回归分析可以确定自变量变化时对因变量产生影响的大小，即能够确认营销费用的变化时销售费用能够变化的大小。三、在“数据模型与决策”课程中，有许多定量分析的模型与方法。请回答下面的问题：（18分）（1）归纳总结各种模型方法的共同点；（2）根据你的喜好选择一种方法，举例说明其解决问题的思路。答:在课程中，我们主要应用图表、假设检验、回归分析的定量分析模型与方法，这些模型与方法共同组成一整套决策模型体系，都是对量化的数据进行分析，得出可以量化的模型来揭示数据内在联系。个人而言，回归分析的是比较好的方法，因为它包含图表、假设检验的方法，

数据模型与决策习题解答

第二章习题(P46) 14.某天40只普通股票的收盘价（单位：元/股）如下： 29.625 18.000 8.625 18.500 9.250 79.375 1.250 14.000 10.000 8.750 24.250 35.250 32.250 53.375 11.500 9.375 34.000 8.000 7.625 33.625 16.500 11.375 48.375 9.000 37.000 37.875 21.625 19.375 29.625 16.625 52.000 9.250 43.250 28.500 30.375 31.125 38.000 38.875 18.000 33.500 （1）构建频数分布*。（2）分组，并绘制直方图，说明股价的规律。（3）绘制茎叶图*、箱线图，说明其分布特征。（4）计算描述统计量，利用你的计算结果，对普通股价进行解释。解：（1）将数据按照从小到大的顺序排列 1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 3 2.25, 3 3.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375，结合（2）建立频数分布。（2）将数据分为6组，组距为10。分组结果以及频数分布表。为了方便分组数据样本均值与样本方差的计算，将基础计算结果也列入下表。根据频数分布与累积频数分布，画出频率分布直方图与累积频率分布的直方图。

《大数据时代下的数据挖掘》试题和答案与解析

《海量数据挖掘技术及工程实践》题目一、单选题（共80题） 1)( D )的目的缩小数据的取值范围，使其更适合于数据挖掘算法的需要，并且能够得到和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准？ (A) (a)警察抓小偷，描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务？(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型，通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务？(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法？ (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下：5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频（等深）划分时，15在第几个箱子内？ (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型：(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作：( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法： (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是： (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法？ (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为：(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130人，四年级110人。则年级属性的众数是： (A) A.一年级 B.二年级 C.三年级 D.四年级

数据模型与决策复习题及参考答案

《数据模型与决策》复习题及参考答案第一章绪言一、填空题 1．运筹学的主要研究对象是各种有组织系统的管理问题，经营活动。 2．运筹学的核心是运用数学方法研究各种系统的优化途径及方案，为决策者提供科学决策的依据。 3．模型是一件实际事物或现实情况的代表或抽象。 4、通常对问题中变量值的限制称为约束条件，它可以表示成一个等式或不等式的集合。 5．运筹学研究和解决问题的基础是最优化技术，并强调系统整体优化功能。运筹学研究和解决问题的效果具有连续性。 6．运筹学用系统的观点研究功能之间的关系。 7．运筹学研究和解决问题的优势是应用各学科交叉的方法，具有典型综合应用特性。 8．运筹学的发展趋势是进一步依赖于_计算机的应用和发展。 9．运筹学解决问题时首先要观察待决策问题所处的环境。 10．用运筹学分析与解决问题，是一个科学决策的过程。 11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。12．运筹学中所使用的模型是数学模型。用运筹学解决问题的核心是建立数学模型，并对模型求解。 13用运筹学解决问题时，要分析，定议待决策的问题。 14．运筹学的系统特征之一是用系统的观点研究功能关系。 15.数学模型中，“s·t”表示约束。 16．建立数学模型时，需要回答的问题有性能的客观量度，可控制因素，不可控因素。 17．运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。二、单选题 1.建立数学模型时，考虑可以由决策者控制的因素是（A ）

A．销售数量B．销售价格C．顾客的需求D．竞争价格2．我们可以通过（C ）来验证模型最优解。 A．观察B．应用C．实验D．调查 3．建立运筹学模型的过程不包括（A ）阶段。 A．观察环境B．数据分析C．模型设计D．模型实施4.建立模型的一个基本理由是去揭晓那些重要的或有关的（ B ） A数量B变量 C 约束条件 D 目标函数 5.模型中要求变量取值（ D ） A可正B可负C非正D非负 6.运筹学研究和解决问题的效果具有（ A ） A 连续性 B 整体性 C 阶段性 D 再生性 7.运筹学运用数学方法分析与解决问题，以达到系统的最优目标。可以说这个过程是一个（C） A解决问题过程B分析问题过程C科学决策过程D前期预策过程 8.从趋势上看，运筹学的进一步发展依赖于一些外部条件及手段，其中最主要的是（ C ） A数理统计B概率论C计算机D管理科学 9.用运筹学解决问题时，要对问题进行（ B ） A 分析与考察 B 分析和定义 C 分析和判断 D 分析和实验三、多选 1模型中目标可能为（ABCDE ） A输入最少B输出最大 C 成本最小D收益最大E时间最短 2运筹学的主要分支包括（ABDE ） A图论B线性规划 C 非线性规划 D 整数规划 E目标规划四、简答 1．运筹学的计划法包括的步骤。答：观察、建立可选择的解、用实验选择最优解、确定实际问题。

数据模型与决策课程案例分析

数据模型与决策课程案例一生产战略一、问题提出好身体公司（BFI）在长岛自由港工厂生产健身练习器械。最近他们设计了两种针对家庭锻炼所广泛使用的举重机。两种机器都是用了BFI专利技术，这种技术提供给使用者除了机器本身运动功能之外的一些其他额外的运动功能。直到现在，这种功能也只有在很昂贵的、应用于理疗的举重机上才可以获得。在最近的交易展销会上，举重机的现场演示引起了交易者浓厚的兴趣，实际上，BFI现在收到的订单数量已经超过了这个时期BFI的生产能力。管理部门决定开始这两种器械的生产。这两种器械分别被BFI 公司命名为BodyPlus100和BodyPlus200，由不同的原材料生产而成。 BodyPlus100由一个框架、一个压力装置、一个提升一下拉装置组成。生产一个框架需要4小时机器制造和焊接时间，2小时喷涂和完工时间；每个压力装置需要2小时机器制造和焊接时间，1小时喷涂和完工时间，每个提升一下拉装置需要2小时机器制造和焊接时间，2小时喷涂和完工时间。另外，每个BodyPlus100还需要2小时用来组装、测试和包装。每个框架的原材料成本是450美元，每个压力装置的成本是300美元，每个提升一下拉装置是250美元。包装成本大约是每单位50美元。 BodyPlus200包括一个框架、一个压力装置、一个提升一下拉装置和一个腿部拉伸装置。生产一个框架需要5小时机器制造和焊接时间，4小时喷涂和完工时间；生产一个压力装置需要3小时机器制造和焊接时间，2小时喷涂和完工时间；生产每个提升一下拉装置需要2小时机器制造和焊接时间，2小时喷涂和完工时间，另外，每个BodyPlus200还需要2小时用来组装、测试和包装。每个框架的原材料成本是650美元，每个压力装置的成本是400美元，每个提升一下拉装置是250美元，每个腿部拉伸装置的成本是200美元。包装成本大约是每单位75美元。在下一个生产周期，管理部门估计有600小时机器和焊接时间，450小时喷涂和完工时间，140小时组装、测试和包装时间是可用的。现在的每小时劳动力成本是机器制造和焊接时间20美元，喷涂和完工时间15美元，组装、测试和包装12美元。虽然对于BFI来说由于新机器的独特功能可能还会获得一些价格的灵活性，但BodyPlus100的市场建议价格是2400美元，BodyPlus200是3500美元。授权的BFI销售商可以以市场价格的70%来购买产品。 BFI的总裁相信BodyPlus200 的独特功能可以帮助BFI 成为高端锻炼器械的领导者。所以，他认为BodyPlus200的数量至少会占到整个生产数量的25%。】管理报告分析BFI的生产问题，为公司的总裁准备一份报告，告诉他们你的发现和建议。报告包括以下几个方面（不仅于此）：（1）BodyPlus100和BodyPlus200的建议生产数量是多少（2）BodyPlus200的数量占生产数量至少25%的要求会怎样影响利润（3）为了增加利润应扩展哪方面的努力把你的线性规划模型和图形解作为你报告的附录部分。二、问题分析与模型建立根据案例对好身体公司（BFI）两种器械产品BodyPlus100和BodyPlus200的描述，用表

(完整word版)《数据挖掘》试题与答案

一、解答题（满分30分，每小题5分） 1. 怎样理解数据挖掘和知识发现的关系？请详细阐述之首先从数据源中抽取感兴趣的数据，并把它组织成适合挖掘的数据组织形式；然后，调用相应的算法生成所需的知识；最后对生成的知识模式进行评估，并把有价值的知识集成到企业的智能系统中。知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程，其最终目标是掌握数据的模式。流程步骤：先理解要应用的领域、熟悉相关知识，接着建立目标数据集，并专注所选择的数据子集；再作数据预处理，剔除错误或不一致的数据；然后进行数据简化与转换工作；再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型；最后经过解释和评价成为有用的信息。 2. 时间序列数据挖掘的方法有哪些，请详细阐述之时间序列数据挖掘的方法有： 1）、确定性时间序列预测方法:对于平稳变化特征的时间序列来说，假设未来行为与现在的行为有关，利用属性现在的值预测将来的值是可行的。例如，要预测下周某种商品的销售额，可以用最近一段时间的实际销售量来建立预测模型。 2）、随机时间序列预测方法:通过建立随机模型，对随机时间序列进行分析，可以预测未来值。若时间序列是平稳的，可以用自回归(Auto Regressive，简称AR)模型、移动回归模型(Moving Average，简称MA)或自回归移动平均(Auto Regressive Moving Average，简称ARMA)模型进行分析预测。 3）、其他方法:可用于时间序列预测的方法很多，其中比较成功的是神经网络。由于大量的时间序列是非平稳的，因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练，通过数学统计模型估计神经网络的各层权重参数初值，就可能建立神经网络预测模型，用于时间序列的预测。

数据模型与决策试卷2018

2018级硕士研究生课程考试试题课程名称：数据、模型与决策适用专业：2018级MBA 一、名词解释（每题5，共20分） 1．灵敏度分析 2．最大流问题 3．决策树 4．仿真 1.灵敏度分析在根据一定数据求得最优解后，当这些数据中某一个或某几个发生变化时，对最优解会产生什么影响。或者说，要使最优解保持不变，各个数据可以有多大的幅度的变动。这种研究线性规划模型的原始数据变化对最优解产生的影响就叫做线性规划的灵敏度分析。 2. 最大流问题给一个有向图D=(V ,A)，在V 中指定了一点，称为发点(记为v s )，和另一点，称为收点(记为v t )，其余的点叫中间点。对于每一个弧(v i ，v j )∈A,对应有一个c(v i ，v j )≥0(或简写为c ij )，称为弧的容量。通常把这样的D 叫作一个网络。记作D=(V ，A ，C)。对D 中的任一弧(v i ，v j )有流量f(v i ，v j ) (有时也简记作f ij )，称集合f={f ij }为网络D 上的一个流。满足1）容量限制条件：对每一弧(v i ，v j )∈A ，0≤f ij ≤c ij ；2）平衡条件：流出量＝流入量，即对每个i(i ≠s, t)有 (,)(,)0i j j i ij ji v v A v v A f f ∈∈- =∑ ∑ 的流 f 称为可行流。最大流问题就是在网络中，寻找流量最大的可行流，即求一个流{f ij }，使其流量v(f)达到最大，且满足：0≤f ij ≤c ij (v i ，v j )∈A ， ()()()()() ,ij ji v f i s f f i s t v f i t ?=?-=≠??-=? ∑∑ 。 3．决策树决策树又称为判定树，是数据挖掘技术中的一种重要的分类方法，它是一种以树结构（包括二叉树和多叉树）形式来表达的预测分析模型。具体方法是：通过把实例从根节点排列到某个叶子节点来分类实例；叶子节点即为实例所属的分类；树上每个节点说明了对实例的某个属性的测试，节点的每个后继分支对应于该属性的一个可能值。决策树起源于Marin 和Stone 为了研究人类概念模型而得来，于1966年提出。主要算法有：CART 算法，ID3算法，C4.5算法，SLIQ 分类方法，SPRINT 法，PUBLIC 法等等。 4．仿真科学研究通常有三种途径；理认推导、科学实验和仿真模拟。人们在认识自然、利用自然过程中，为了更好地完成这一能动过程，需要对物质世界及非物质世界进行实验研究。然而试验分析对某些真实系统可能是不允许的。因此，在实践中出现了用模型来代替真实系统做试验的方法，以解决上述无法直接对真实系统进行试验分析的问题。仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。仿真是一门建立在相似理论，控制理论，系统科学和计算机基础上的综合性和试验性学科。二、简答题（每题10分，共30分） 1．线性规划模型由哪些部分组成？线性规划模型有哪些性质？答：线性规划模型由决策变量、目标函数、约束条件等组成构成。线性规划模型的具体性质包括：1）目标函数是决策变量的线性函数；2）约束条件是决策变量的线性等式或不等式。 2．什么是概率决策的期望值方法？决策树方法与期望值法有何关系？答：决策的前提条件存在确定、不确定及风险三种情况，在不确定及存在风险情况下进行决策，可以依据不确定事件及风险发生的概率计算相应的期望值，通过期望收益最大化或期望损失最小化进行决策，即为概率决策的期望值方法。决策树法是指借助树状图，按照客观概率的大小，计算出各个方案的期望值，并对各个方案期望值进行比较，从中选择一个最为满意方案的方法。因此，决策树法属于概率决策期望值方法的一种。 3．有些什么类型的仿真？什么是仿真的Monte Carlo 进程？答：仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。大致可分成：计算机仿真、半物理仿真及全物理仿真。计算机仿真也被称为纯数学仿真，它是一种通过建立与

文档之家