当前位置:文档之家› 数据模型与决策试题及参考答案

数据模型与决策试题及参考答案

数据模型与决策试题及参考答案
数据模型与决策试题及参考答案

《数据模型与决策》复习(附参考答案)

2018.9

一、填空题(五题共15分)

1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是 ① 。 解:N(167.48,0.609)

考查知识点:已知总体服从正态分布,求样本均值的分布。

2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为 ② 。 解:[1040,1936]

考查知识点:区间估计的求法。正态总体均值的区间估计是[n s Z X α

--1,n

s

Z X α-+1] 其中X 是样本平均数,s 是样本的标准差,n 是样本数。 详解:直接带公式得:区间估计是 [n s Z X α

--1,n

s

Z X α-+1]= [100224021488-,100224021488+]

=[1040,1936]

3. 从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是 ③ 。 解 p=0.4653

考查知识点:离散概率计算方法。

详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩 G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩

P (B3)=P (B3B2)+P (B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P (B3))

= P(B3|B2)P(B2)+P(B3|G2)P(G2)

=0.48×(1-0.55)+(1-0.55) ×0.55

=0.4653

4. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。

解p=0.5

考查知识点:了解正态分布概率含义。

5. 结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是。(请在0.3、0.6和0.9中选一个)

考查知识点:了解相关系数。

本题答案:孩子与父母平均身高的相关性比较高,应该选0.9

6. 简述模拟仿真的关键步骤。

考查知识点:模拟仿真的思想

二、单项选择题(五题共15分)

1. 下列事件中,属于小概率事件的随机事件是()

A. 抛一枚均匀的硬币2次,结果全是正面

B.抛一枚均匀的硬币3次,结果全是正面

C. 抛一枚均匀的硬币4次,结果全是正面

D.小王某天上班路上捡到10元钱

解: D

考查知识点:认识哪些事件是小概率事件?

2. 关于假设检验,下列说法正确的是()。

A. P值<0.05,拒绝原假设

B. P值<0.05,接受原假设

C. P值>0.05,拒绝原假设

D. P值>0.05,接受原假设

解: A

考查知识点:假设检验的思想

3. 天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预报其实是一个置信度为95%的区间。描述置信度与精确度的关系。

4. 不确定型决策方法。

5. 检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用()。

A. U检验

B. t检验

C. 2检验

D. F检验

解 C

考查知识点:分组数据检验方法。

三、简答题(两题共40分)

1. 货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:

表2 货车的行驶时间与行驶距离的远近及运送货物的次数统计

利用Excel,得到下列输出结果,回答后面的三个问题。

回归统计

Multiple R 0.913

R Square 0.833

Adjusted R

Square

0.785

标准误差0.616

观测值10

方差分析

df SS MS F Sig F

回归分析 2 13.253 6.626 17.464 0.002 残差7 2.656 0.379

总计9 15.909

Coefficients 标准误差 t Stat P-value

Lower 95%

Upper 95%

Intercept

A

0.802 2.762 0.028 0.318 4.110 X Variable 1 2.688 0.792 3.395 0.012 0.816 4.560 X Variable 2 0.377

0.109

3.449 0.011 0.119 0.635

(1) 从上述输出结果看,这个模型拟合效果如何? (2) 上表中的截距A 为多少?

(3) 写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。 (4) 倘若某次行驶距离为50公里,跑4次,估计花费多少时间?

解:(1) 从模型检验的F 值为17.464对应的p 值等于0.002小于5%看模型拟合效果很好,另外,R 2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。 (2) 上表中的截距A=(0.318+4.11)/2=2.214.

(3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:

21377.0688.22.214y

?x x ++= (4) 将x1=0.5,x2=4次带入回归方程21377.0688.22.214y

?x x ++=,得花费时间约为5.07小时。

考查知识点:回归方法的操作、模型选择、估计和预测。

2.(10分) Westdata 公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:

(1)给出Westdata 公司决策问题的支付矩阵(收益表);

(2)请您利用最大风险最大化方法(乐观法)、最大风险最小化方法(悲观法)和最小最大后悔值法给Westdata的决策者推荐方案。

解:

乐观法:

决策:选择外包。

悲观法:

决策:选择自营。

最小最大后悔值法:

决策:选择外包。

考查知识点:不同决策准则下的决策方法

四、计算题(三题共30分)

1. (10分)某开发商面临有两种选择,投资建设百货商场(T),放弃建设百货商场(Q)。但建设百货商场可能面临未来人流量太少(X),也可能面临未来人流量大(D)。利润矩阵见下表(单位:万元)。开发商现在犹豫是否需要进行市场调研。调研成本是5万元。咨询将产生两种结果,认为人流量大(Y)和人流量小(N)。相关概率如下所示:P(X)=0.4,P(D)=0.6,P(Y)=0.8,P(N)=0.2,P(X|Y)=0.1,P(D|Y)=0.9,P(X|N)=0.8,P(D|N)=0.2

表3 某市物流中心建设与未来经济形势关系分析

(1)画出此问题的决策树;

(2)确定最优决策。

解(1)决策树如下:

(2)最优决策是:先调研,若专家认为未来人流量大就投资,若专家认为未来人流量小就放弃,这样的决策平均收益将达到680万元。

考查知识点:决策树的应用

2.(10分)全国汽车租赁公司所面临的问题:全国汽车租赁公司必须为一年当中确切时

间、确切租赁区域所拥有的汽车数量做出决定。以南卡罗莱纳、默特尔区域为例,管理层想知道应该在劳动节的那个周末提供多少量标准汽车?

全国汽车租赁公司的情况比较适宜于使用单一周期库存模型,公司必须在周末之前对可用的标准汽车进行统计,在周末,顾客的需求会导致缺货或剩余记Q=可用的标准汽车数量,则当Q比顾客的需求大,汽车租赁公司的汽车有剩余,单位剩余的成本就是高

估需求的成本,假设该成本为每辆汽车80美元(这个数据可以由过去的市场调查获得),另一方面,则当Q 小于顾客的需求,汽车租赁公司将会租出所有的汽车,并且产生缺货现象。每缺一辆汽车将产生200美元的低估成本,这个数字包含利润损失及顾客没能租到车而产生的对公司信誉降低的成本。

现在的问题是:那个周末应该准备多少汽车呢? 解:记Cu=200美元(低估需求的单位成本), Co=80美元(高估需求的单位成本) 最佳的汽车数量Q*应该满足下述等式:

Q*+1的期望损失= Q*的期望损失 ----- (1) Q*+1的期望损失=Co*P (需求≤Q*) ---- (2) Q*的期望损失=Cu*P (需求>Q*) ---------(3) P (需求≤Q*)+ P (需求>Q*)=1 --------(4)

由(1)--(4)可得:u

o u

C C C Q P +=≤)

(需求*

将Co=80美元、 Cu=200美元带入上式得 7143.080

200200

*=+=

≤)(需求Q P

现在可以利用汽车租赁需求的概率分布来确定Q*了,根据该公司近年来的汽车租赁数据的直方图判断,五一节那个周末的汽车需求分布,近似服从正态分布N (150,196),即均值为150辆,标准差是14辆,查一查标准正态分布表可知,当均值高于0.57个标准差时(考试时不能查表,这个数会告诉您),正态分布左侧的面积(概率)是0.7143,于是有:1581457.0150*=?+=Q . 考查知识点:库存管理方法的实际应用

3. (10分)某企业生产甲乙两种产品,已知生产一件甲产品需要电力6千瓦时、钢材12千克、工时8个、利润为7元;生产一件乙产品需要电力9千瓦时、钢材6千克、工时5个、利润为5元。该企业现有这三种资源的数量分别为720千瓦时、600千克、480个。请回答下列问题:

(1) 写出该线性规划问题的一般形式;

(2) 甲乙两种产品各生产多少时,才能获得最大利润?最大利润是多少?

(3) 在利润最大时,该企业哪种资源过剩? (4) 给出各个资源的影子价格(即资源出售价格)。 利用Excel 规划求解的相关输出如下 单元格 名字 初值

终值

$C$2 x=

1 15 $C$3 y= 1 70

单元格 名字 单元格值 公式 状态

型数值

$C$5 6x+9y= 720 $C$5<=720 到达限制值 0 $C$6 12x+6y= 600 $C$6<=600 到达限制值 0 $C$7 8x+5y= 470 $C$7<=480 未到限制值 10 $C$2 x= 15 $C$2>=0 未到限制值 15 $C$3

y=

70 $C$3>=0 未到限制值 70

单元格 名字 终值 拉格朗日乘数

$C$5 6x+9y= 720 0.25 $C$6 12x+6y= 600 0.458333333 $C$7 8x+5y= 470 0

解:设生产甲乙两种产品的数量分别为x ,y ,则 (1)线性规划问题为: Max{7x+5y}

s.t. ???????≥≤+≤+≤+0

,4805y x 86006127209y x 6y x y x

(2)由规划求解表可见,当x=15 y=70 时,利润达到最大,最大为455元。 (3)在利润最大时,该企业工时过剩,过剩10个工时。

(4)给出各个资源的影子价格就是输出表中的拉格朗日乘数,各个资源的影子价格分别是: 电力为0.25元/千瓦、46元/吨、0元/个。在实际中的应用 考查知识点:线性规划方法,在实际中的应用。

《统计预测与决策》第四版 徐国祥 复习试卷及答案(四套)

试卷一 一、单项选择题(共10小题,每题1分,共10分) 1 统计预测方法中,以逻辑判断为主的方法属于()。 A 回归预测法 B 定量预测法 C 定性预测法 D 时间序列预测法 2 下列哪一项不是统计决策的公理()。 A 方案优劣可以比较 B 效用等同性 C 效用替换性 D 效用递减性 3 根据经验D-W统计量在()之间表示回归模型没有显著自相关问题。 A 1.0-1.5 B 1.5-2.5 C 1.5-2.0 D 2.5-3.5 4 当时间序列各期值的二阶差分相等或大致相等时,可配合( )进行预测。 A 线性模型 B抛物线模型 C指数模型 D修正指数模型 5 ()是指国民经济活动的绝对水平出现上升和下降的交替。 A 经济周期 B 景气循环 C 古典经济周期 D 现代经济周期 6 灰色预测是对含有()的系统进行预测的方法。 A 完全充分信息 B 完全未知信息 C 不确定因素 D 不可知因素 7 状态空间模型的假设条件是动态系统符合()。 A 平稳特性 B 随机特性 C 马尔可夫特性 D 离散性 8 不确定性决策中“乐观决策准则”以()作为选择最优方案的标准。 A 最大损失 B 最大收益 C 后悔值 D α系数 9 贝叶斯定理实质上是对()的陈述。 A 联合概率 B 边际概率 C 条件概率 D 后验概率 10 景气预警系统中绿色信号代表()。 A 经济过热 B 经济稳定 C 经济萧条 D 经济波动过大 二、多项选择题(共5小题,每题3分,共15分) 1 构成统计预测的基本要素有()。 A 经济理论 B预测主体 C数学模型 D实际资料 2 统计预测中应遵循的原则是()。 A 经济原则 B连贯原则 C可行原则 D 类推原则 3 按预测方法的性质,大致可分为()预测方法。 A 定性预测 B 情景预测 C时间序列预测 D回归预测

数据模型与决策试题

山东大学管理学院秋季MBA2011级(石家庄班) 数据、模型与决策试题2012年6月 1.(10分)线性回归模型是否满足假设要通过哪几个方面来检验?每个方面的含义是什么?根据什么指标或图形来检验好坏? 2.(15分)以下结果是应用什么软件的什么方法计算输出的,简述软件操作过程。并从结果中分析计算过程、各部分数据的意义及最后的方程(T值除外)。 --------------------------------------------------------------- XXXX: EARN 与 SIZE, EMPL, ... 入选用 Alpha: 0.05 删除用 Alpha: 0.1,响应为 14 个自变量上的 EARN,N = 50 步骤 1 2 3 4 5 常量 11.85 -348.99 -413.26 -403.41 -368.55 P45 0.0351 0.0321 0.0304 0.0321 0.0319 T 值 5.94 6.65 7.43 9.46 10.00 P 值 0.000 0.000 0.000 0.000 0.000 INC 11.9 12.9 10.3 10.3 T 值 5.11 6.55 5.98 6.34 P 值 0.000 0.000 0.000 0.000 NREST 1.29 1.43 1.40 T 值 4.49 5.96 6.22 P 值 0.000 0.000 0.000 SIZE 0.54 0.56 T 值 4.76 5.27 P 值 0.000 0.000 PRICE -2.13 T 值 -2.61 P 值 0.012 S 67.4 54.6 46.0 37.9 35.7 R-Sq 42.33 62.90 74.21 82.85 85.15 R-Sq(调整) 41.13 61.32 72.53 81.32 83.47 Mallows Cp 120.5 63.1 32.5 9.5 4.9 ------------------------------------------------------------------------------- 3.(20分)桑杰伊·托马斯(Sanjay Thomas)是斯隆管理学院的二年级MBA学生。作为上学期有关企业家课程设计的一部分,桑杰伊实际上已经对东海岸城市具有印度烹调风格的饭店的样本进行了概率分析,并首先对他婶婶的饭店进行了分析。在调整了有关波士顿地区的标准生活费用的数据以后,桑杰伊利用这些资料制定了温馨小扁豆饭店的成本和收入的标准。这些数据是基于饭店位于哈佛广场,拥有50个座位,并贷款进行了饭店的内部结构装修,以及租赁了饭店的所有资本性设备。桑杰伊估计经营温馨小扁豆饭店每月的非劳动固定成本是3995美元。他还估计了食品的可变成本是每餐为11美元。在饭店事务的许多不确定因素中,有三种不确定变量在概率等式中趋向于起主导作用:每月销售膳食的数量,每餐饭的收入,以及饭店的(固定)劳动力成本。根据他与许多饭店业主的交流,桑杰伊能够估计这三个关键性的不确定变量的实际分布,这些变量如下: ----销售膳食的数量。像温馨小扁豆饭店这样坐落于哈佛广场,并拥有50个座位容量的饭店,每月销售的膳食数量将服从一个均值为μ=3 000和标准离差为σ=1 000 的正态分布。

武汉大学MBA《数据模型与决策》往年试题

经济与管理学院 Economics and Management School of Wuhan University ×××级×××班《数据、模型与决策》试题 出题人:刘 伟 考试形式:闭卷 考试时间:2007年7月×日 120分钟 姓名_______ 学号_______ 记分_______ 一、名词解释及简答题(各题5分) 1、众数 2、直方图 3、变异系数 4、相关系数 5、虚拟变量 6、置信区间 7、最小二乘(平方)法 8、线性回归模型 9、多重共线性 10、完全多重共线性 11、不完全多重共线性 12、虚拟变量模型 13、总体回归函数 14、何为虚变量回归模型?为什么将虚变量值设为取 0、1 ? 15、回归方程的显著性检验与回归系数的显著性检验什么区别与联系? 16、在回归方程的最小二乘法估计中,对回归模型有哪些基本假设? 17、回归方程的显著性检验与回归系数的显著性检验什么区别与联系? 18、为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置 信度的含义是什么?在相同的置信度下如何才能缩小置信区间? 19、影子价格 20、对偶规划 21、模型 22、约束条件 23、目标函数 24、决策变量 25、协方差 26、拟合优度检验 二、计算题(各题10分) 1、500家美国公司1993年底的平均资产为11270(单位:百万美元),标准差为2780(百万美元)。这些公司的平均价格收益比为31,标准差为8。请问哪一个指标的差异大? 2、有一种电子元件,要求其使用寿命不得低于1000小时,现抽25件,测 得其均值950小时,方差为900小时。已知该种元件寿命服从正态分布, (1)写出该种电子元件使用寿命的置信区间,取α=005.; (2)若已知使用寿命的标准差σ=100,写出该种电子元件使用寿命的 置信区间,取α=005.;在 α=005.下,且已知σ=100这批元件合格否? 3、某商店的日销售额服从正态分布,据统计去年的日均销售额是2.74万元, MBA

2014年7月江苏省高等教育自学考试30447数据、模型与决策试题

2014年7月江苏省高等教育自学考试30447数据、模型与决策一、单项选择题(每小题1分,共10分) 在下列每小题的四个备选答案中选出一个正确答案,并将其字母标号填入题干的括号内。1.运用数据模型开展定量分析,其根本目标是( ) A.管理决策B.数量分析C.理论指导D.科学管理 2.主要为搜集某一时点或一定时期内现象总量资料而专门组织的、一次性全面调查称为( ) A.抽样调查B.实验设计C.普查D.参与观察 3.从总体N个单位中抽取n个单位组成样本时,保证每一个单位被抽出来的概率相等,这种抽样方法叫做( ) A.等距抽样B.简单随机抽样C.分层抽样D.整群抽样 4.把非定量的文献史料、语言习惯等带有特征的因素设法转化成可以量化处理的数据,然后对这些数据进行定量分析并做出判断的方法叫做( ) A.内容分析法B.间接调查法C.判断调查法D.阶段抽样调查 5.语义上表现出明显的等级或顺序关系的定类资料,称为( ) A.定量资料B.定类数据C.调查资料D.定序资料 6.各个组中的频数与所有组频数之和的比率叫做( ) A.累积频数B.频率C.频数D.累积频率 7.观察值之间的差异程度或频数分布的分散程度,称为( ) A.集中趋势B.离散趋势C.方差D.极差 8.从总体N个单位中抽取n个单位作为样本,每次从总体中抽取一个单位,凡是被抽中的单位不再放回到原来的总体中,接下来抽选的样本单位,只是从剩下的总体单位中进行抽取,这种抽样方式叫做( ) A.不重复抽样B.简单抽样C.随机抽样D.双相抽样 9.EXCEL中,拟合优度系数计算的函数是( ) A.INTERCEPT B.SLOPE C.RSQD.LINEST 10.在单因素等重复实验中,因素影响的均方为0.2986、误差影响均方0.0472,则F统计量的值是( ) A.0.1581 B.0.2514 C.0 3458 D.6.3263 二、填空题(每小题1分,共10分) 11.从定量角度研究管理问题,是主要工具。 12.先从总体中随机抽取一个较大的样本,获得第一重样本,然后再从第一重样本中随机抽取一个较小的样本即第二重样本,利用这第一二重样木,对研究目标进行统计推断,这种抽样组织方式叫做。 13.在单因素不等重复实验中,因素影响的均方6889.13、实验误差影响均方1408.97,则统计量的值是。 14.相比于定距资料,定比资料拥有。 15.均匀分布的离散程度最大,因此若的计算结果越大,意味着频数分布的离散程度也越大。16.X1,X2,…,X n为f(x;θ)的一个简单随机样本,θ是总体参数,由样本确定的估计量为1=1(X1,X2,…,X n)和2=2(X1,X2,…,X n),对于给定的α(0<α<1),能使P(1≤θ≤2)=1-α成立,则称1-α为。 17.在若干个能够互相比较的资料组中,把产生变异的原因加以明确区分的方法和技术叫做。18.多元回归分析中,拟合优度系数R2是的递增函数。

运筹学 数据模型与决策教材习题答案

教材习题答案 1.2 工厂每月生产A 、B 、C 三种产品 ,单件产品的原材料消耗量、设备台时的消耗量、资源限量及单件产品利润如表1-22所示. 和130.试建立该问题的数学模型,使每月利润最大. 【解】设x 1、x 2、x 3分别为产品A 、B 、C 的产量,则数学模型为 1231231 23123123max 1014121.5 1.2425003 1.6 1.21400 150250260310120130,,0 Z x x x x x x x x x x x x x x x =++++≤??++≤??≤≤?? ≤≤??≤≤?≥?? 1.3 建筑公司需要用6m 长的塑钢材料制作A 、B 两种型号的窗架.两种窗架所需材料规格及数量 如表1-23所示: 【解】 设x j (j =1,2,…,14)为第j 种方案使用原材料的根数,则 (1)用料最少数学模型为

14 1 12342567891036891112132347910121314 min 2300322450 232400 23234600 0,1,2,,14 j j j Z x x x x x x x x x x x x x x x x x x x x x x x x x x x x x j ==?+++≥? ++++++≥?? ++++++≥??++++++++≥??≥=?∑ 用单纯形法求解得到两个基本最优解 X (1)=( 50 ,200 ,0 ,0,84 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=534 X (2)=( 0 ,200 ,100 ,0,84 ,0,0 ,0 ,0 ,0 ,0 ,150 ,0 ,0 );Z=534 (2)余料最少数学模型为 13413141234256789103689111213 2347910121314 min 0.60.30.70.40.8230032245023240023234600 0,1,2,,14 j Z x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x j =+++++?+++≥? ++++++≥??++++++≥??++++++++≥??≥=? 用单纯形法求解得到两个基本最优解 X (1)=( 0 ,300 ,0 ,0,50 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=0,用料550根 X (2)=( 0 ,450 ,0 ,0,0 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=0,用料650根 显然用料最少的方案最优。 1.7 图解下列线性规划并指出解的形式: (1) 12 121212 max 2131,0Z x x x x x x x x =-++≥?? -≥-??≥? 【解】最优解X =(1/2,1/2);最优值Z=-1/2

数据-模型与决策练习题含答案

1、某企业目前的损益状况如在下: 销售收入(1000件×10元/件) 10 000 销售成本: 变动成本(1000件×6元/件) 6 000 固定成本 2 000 销售和管理费(全部固定) 1 000 利润 1 000 (1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。请做出选择,哪一个方案更有利? (2)假设企业欲使利润增加50%,即达到1 500元,可以从哪几个方面着手,采取相应的措施。 2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费0.70元,单位变动管理费0.30元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少?如拟实现净利500元,应产销多少件产品? 3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元): 要求: (1)计算各产品的边际贡献; (2)计算加权平均边际贡献率; (3)根据加权平均边际贡献率计算预期税前利润。 4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少? 5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:

(1)说明两变量之间的相关方向; (2)建立直线回归方程; (3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。 6、某商店的成本费用本期发生额如表所示,采用账户分析法进行成本估计。 首先,对每个项目进行研究,根据固定成本和变动成本的定义及特点结合企业具体情况来判断,确定它们属于哪一类成本。例如,商品成本和利息与商店业务量关系密切,基本上属于变动成本;福利费、租金、保险、修理费、水电费、折旧等基本上与业务量无关,视为固定成本。 其次,剩下的工资、广告和易耗品等与典型的两种成本性态差别较大,不便归入固定成本或变动成本。对于这些混合成本,要使用工业工程法、契约检查法或历史成本分析法,寻找一个比例,将其分为固定和变动成本两部分。 7、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。 则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少? 8、某生产企业使用A零件,可以外购,也可以自制。如果外购,单价4元,一次订

2014年4月江苏省高等教育自学考试30447数据、模型与决策试题

2014年4月江苏省高等教育自学考试 30447数据、模型与决策 一、单项选择题(每小题1分,共10分) 在下列每小题的四个备选答案中选出一个正确答案,并将其字母标号填入题干的括号内。1.从调查对象(总体)中抽取一部分单位组成样本,然后根据样本调查的结果,对总体情况进行推断,称之为抽样调查。抽取一部分单位时应遵照( ) A.判断原则B.参与原则C.随机原则D.程序原则 2.先从总体中随机抽取一个较大的样本,获得第一重样本,然后再从第一重样本中随机抽取一个较小的样本即第二重样本,利用这第二重样本,对研究目标进行统计推断,这种抽样组织方式叫做( ) A.类型抽样调查B.简单抽样调查 C.阶段抽样调查D.双相抽样调查 3.在调查工作已经完成,进入数据编辑和整理阶段所用的评估数据质量的方法统称为( ) A.相对技术B.抽样技术C.后验技术D.误差分析 4.在统计分组的基础上形成的样本单位在各个组间的分配,叫做( ) A.直方图B.交叉分类表C.频数D.频数分布 5.在频数分布中,观察值中出现次数最多的数值就是( ) A.算术平均数B.众数C.四分位数D.中位数 6.在若干个能够互相比较的资料组中,把产生变异的原因明确区分出来的方法,叫做( ) A.方差分析B.回归分析C.描述分析D.样本推断 7.对一元线性回归y i=α+βx i+εi,β反映了自变量对因变量的( ) A.正向影响B.负向影响C.边际影响D.回归影响 8.时间序列中各项观察的一阶差分为常数,可拟合( ) A.指数曲线模型B.直线趋势方程C.抛物线模型D.指数平滑模型 9.顾客在排队系统中等待时间和服务时间的和叫做( ) A.排队长B.队长C.等待时间D.逗留时间 10.在库存管理中,需求是库存系统的( ) A.输出B.输入C.订货D.变量 二、填空题(每小题1分,共10分) 11.运用数据模型开展分析,是根本目标。 12.文化程度属于定性资料中的资料。 13.各个组中的频数与所有组频数之和的比率叫做。 14.把每个观察数据划分成两个部分,一是主部一是余部,并分别用植物的“茎”和“叶”形象地称呼,然后把数据的主部按从小到大的顺序纵向排列,再在每个数据的主部后面列出余部,由此得到的统计图称之为。 15.对顾客就某款产品使用效果询问的结果是:很不满意、不满意、满意、满意、很满意、很满意、不满意、满意、满意,则顾客的代表性意见是。 16.χ2分布的形状随自由度n的增大而逐渐趋向于。 17.在单因素方差分析中,S b2为组间离差平方和,反映了各组平均数与的差异情况。18.时间序列中的每一项观察值,称为时间序列的,反映客观现象发展变化在各个不同时间上所达到的状态、规模或水平。

《数据模型与决策》试题答案

2008—2009第二学期《数据模型与决策》课 考试题 姓名:学号:成绩: 【说明:共5题,答题时间共计120分钟】 一、试述你对以下概念的理解:(32分) (1)企业内部数据,即通常从企业会计、营销、生产运行中收集的数据。 (2)样本,即总体的一个子集。 (3)回归模型,即刻画因变量与一个或多个自变量之间相互关系的模型。 (4)德尔斐法,是判断预测的普遍方法,通过让许多专家匿名回答一系列调查问卷来实现。在每一轮回答后,答案将匿名共享,让专家知道其他专家的意见。通过了解其他专家的意见,将增加看法的统一性并促使意见不一致的人去考虑其他因素。 (5)正态分布,其形态就是钟形曲线。正态分布是对称的且中位数等于平均数,即有一半的面积在平均数以上,另一半的面积在平均数以下。正态分布可以用两个参数来描述;均值(位置参数)、方差(刻度参数)。当均值变化时,分布在x轴上的位置也会变化;而当方差增加或减少时,分布相应地会变宽或窄。 (6)变异系数,是一种间接测度数据离散程度的方法,它一般由平均数求得:变异系数(CV)=标准方差/平均数 (7)标准差,是测度离散程度的一种方法。它是方差的开平方求得的。总体和样本标准差分别为:

(8)显著性水平,即发生第一类错误(即原假设事实上是正确的,但是假设检验错误的拒绝了它)的概率a。 二、对于下表这样一组给定的数据,我们可以用表格、图形、回归模型3种方式来表达10个公司销售收入与营销费用之间的关系。试问:这3种方式的表达思路有什么异同?(15分) 公司编号12345678910销售收入(Y)5000 3000 1200 2000 10000 4000 800 7000 9000 12000 营销费用(X)675 550 275 325 1375 525 193 950 975 1650 答: 表格:我们仅从数据中可以看到营销费用与销售收入大约成正向关系,即营销费用增加,销售收入增加。 图形:我们可以从图形中更加直观的揭示数据中包含的特征与规律,即能够大体的看清营销费用变动导致销售收入变动的程度。 回归:通过回归分析可以确定自变量变化时对因变量产生影响的大小,即能够确认营销费用的变化时销售费用能够变化的大小。 三、在“数据模型与决策”课程中,有许多定量分析的模型与方法。请回答下面的问题:(18分) (1)归纳总结各种模型方法的共同点; (2)根据你的喜好选择一种方法,举例说明其解决问题的思路。 答:在课程中,我们主要应用图表、假设检验、回归分析的定量分析模型与方法,这些模型与方法共同组成一整套决策模型体系,都是对量化的数据进行分析,得出可以量化的模型来揭示数据内在联系。 个人而言,回归分析的是比较好的方法,因为它包含图表、假设检验的方法,

数据模型与决策习题解答

第二章习题(P46) 14.某天40只普通股票的收盘价(单位:元/股)如下: 29.625 18.000 8.625 18.500 9.250 79.375 1.250 14.000 10.000 8.750 24.250 35.250 32.250 53.375 11.500 9.375 34.000 8.000 7.625 33.625 16.500 11.375 48.375 9.000 37.000 37.875 21.625 19.375 29.625 16.625 52.000 9.250 43.250 28.500 30.375 31.125 38.000 38.875 18.000 33.500 (1)构建频数分布*。 (2)分组,并绘制直方图,说明股价的规律。 (3)绘制茎叶图*、箱线图,说明其分布特征。 (4)计算描述统计量,利用你的计算结果,对普通股价进行解释。 解:(1)将数据按照从小到大的顺序排列 1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 3 2.25, 3 3.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。 (2)将数据分为6组,组距为10。分组结果以及频数分布表。为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。 根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。

最新数据模型与决策课程大作业打印版.doc

数据模型与决策课程大作业 以我国汽油消费量为因变量,乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归(数据为年度时间序列数据)。试根据得到部分输出结果,回答下列问题:1)“模型汇总表”中的R方和标准估计的误差是多少? 2)写出此回归分析所对应的方程; 3)将三个自变量对汽油消费量的影响程度进行说明; 4)对回归分析结果进行分析和评价,指出其中存在的问题。 1)“模型汇总表”中的R方和标准估计的误差是多少? 答案:R方为0.993^2=0.986 ;标准估计的误差为120910.147^(0.5)=347.72 2)写出此回归分析所对应的方程; 答案:假设汽油消费量为Y,乘用车销量为a,城镇化率为b,90#汽油吨价/城镇居民人均可支配收入为c,则回归方程为: Y=240.534+0.00s027a+8649.895b-198.692c 3)将三个自变量对汽油消费量的影响程度进行说明; 乘用车销量对汽油消费量相关系数只有0.00027,数值太小,几乎没有影响,但是城镇化率对汽油消费量相关系数是8649.895,具有明显正相关,当城镇化率每提高1,汽油消费量增加8649.895。乘用90#汽油吨价/城镇居民人均可支配收入相关系数为-198.692,呈

明显负相关,即乘用90#汽油吨价/城镇居民人均可支配收入每增加1个单位,汽油消费量降低198.692个单位。a, b, c三个自变量的sig 值为0.000、0.000、0.009,在显著性水平0.01情形下,乘用车消费量对汽油消费量的影响显著为正。 (4)对回归分析结果进行分析和评价,指出其中存在的问题。 在学习完本课程之后,我们可以统计方法为特征的不确定性决策、以运筹方法为特征的策略的基本原理和一般方法为基础,结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因素进行了模拟回归,并运用软件计算出回归结果,故根据回归结果,对具体回归方程,回归准确性,自变量影响展开分析。 Anova表中,sig值是t统计量对应的概率值,所以t和sig两者是等效的,sig要小于给定的显著性水平,越接近于0越好。F是检验方程显著性的统计量,是平均的回归平方和平均剩余平方和之比,越大越好。在图表中,回归模型统计值F=804.627,p值为0.000,因此证明回归模型有统计学意义,表现回归极显著。即因变量与三个自变量之间存在线性关系。 系数表中,除了常数项系数显著性水平大于0.05,不影响,其它项系数都是0.000,小于0.005,即每个回归系数均具有意义。

数据,模型,和决策

第一章(管理科学简介) P5(1)管理科学介绍 管理科学本质:是对与定量因素有关的管理问题通过应用科学的方法进行辅助管理决策制定的一门学科. 管理科学发展过程:快速发展开始于20世纪四五十年代 起初的动力来自于第二次世界大战 另一个里程碑是1947年丹捷格发明单纯形罚 更大的推动作用的是计算机革命的爆发 管理决策:管理者考虑管理科学对定量因素进行分析得出的结果后,再考虑管理科学以外的众多无形因素,然后根据其最佳判断做出决策 管理科学小组系统和考察时步骤:定义问题与收集数据——构件数学模型——从模型中形成对于一个问题进行求解的基于计算机的程序——测试模型并在必要时进行修正——应用模型分析问题以及提出管理建议——帮助实施被管理者采纳的小组建议 课后问题: 1.管理科学什么时候有了快速发展?快速发展开始于20世纪四五十年代 2.商学院以外还广泛使用的对管理科学学科的叫法:运筹学 3.管理科学研究提供给管理者什么? 对问题涉及的定量因素进行分析并向开明的管理者提出建议 4.管理科学以哪些领域作为基础?科学领域:数学,计算机社会领域:经济学 5.什么是决策支持系统?辅助管理决策制定的交互式基于计算机的系统 6.与管理问题有关的一般定量因素有哪些?生产数量,收入,成本,资源 P11(2)一个例子:盈亏平衡分析 步骤:分析问题——建立模型——敏感性分析,电子表格模型提供上述三者了方便的途径如果预测销售数量<盈亏平衡点,Q=0 预测销售数量>盈亏平衡点,Q=预测销售数量 敏感性分析目的:研究如果一个估计值发生了变化,将会给模型带来什么样的变化 Min(a,b):取a,b中的最小值 If(A,b,c):如果表达式A为真,则值为b,否则为c 第二章(线性规划:基本概念) P31(3)在电子表格上建立恩德公司问题的模型 1.开始在电子表格上建立线性规划模型时需要回答的三个问题: 要做出的决策是什么? 在做出这些决策上有哪些约束条件? 这些决策的全部绩效测度是什么? 2.以下各个单元格的作用 数据单元格:显示数据的单元格 可变单元格:需要做出决策的单元格 输出单元格:依赖于可变单元格的输出结果的单元格 目标单元格:在生产率做出决策时目标值定为尽可能大的特殊单元格 3.该案例中每个输出单元格(包括目标单元格)的Excel等式的形式:可以表达为一个SUMPRODUCT函数,这里的每一项是一个数据单元格和可变单元格的乘积 P33(4)电子表格的数学模型 1.电子表格模型与代数模型相同的初始步骤: 收集相关数据

《大数据时代下的数据挖掘》试题和答案与解析

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

数据模型与决策复习题及参考答案

《数据模型与决策》复习题及参考答案 第一章绪言 一、填空题 1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。 2.运筹学的核心是运用数学方法研究各种系统的优化途径及方案,为决策者提供科学决策的依据。 3.模型是一件实际事物或现实情况的代表或抽象。 4、通常对问题中变量值的限制称为约束条件,它可以表示成一个等式或不等式 的集合。 5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。运筹学研究和解决问题的效果具有连续性。 6.运筹学用系统的观点研究功能之间的关系。 7.运筹学研究和解决问题的优势是应用各学科交叉的方法,具有典型综合应用特性。 8.运筹学的发展趋势是进一步依赖于_计算机的应用和发展。 9.运筹学解决问题时首先要观察待决策问题所处的环境。 10.用运筹学分析与解决问题,是一个科学决策的过程。 11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。12.运筹学中所使用的模型是数学模型。用运筹学解决问题的核心是建立数学模型,并对模型求解。 13用运筹学解决问题时,要分析,定议待决策的问题。 14.运筹学的系统特征之一是用系统的观点研究功能关系。 15.数学模型中,“s·t”表示约束。 16.建立数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。 17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。 二、单选题 1.建立数学模型时,考虑可以由决策者控制的因素是(A )

A.销售数量B.销售价格C.顾客的需求D.竞争价格2.我们可以通过(C )来验证模型最优解。 A.观察B.应用C.实验D.调查 3.建立运筹学模型的过程不包括(A )阶段。 A.观察环境B.数据分析C.模型设计D.模型实施4.建立模型的一个基本理由是去揭晓那些重要的或有关的( B ) A数量B变量 C 约束条件 D 目标函数 5.模型中要求变量取值( D ) A可正B可负C非正D非负 6.运筹学研究和解决问题的效果具有( A ) A 连续性 B 整体性 C 阶段性 D 再生性 7.运筹学运用数学方法分析与解决问题,以达到系统的最优目标。可以说这个过 程是一个(C) A解决问题过程B分析问题过程C科学决策过程D前期预策过程 8.从趋势上看,运筹学的进一步发展依赖于一些外部条件及手段,其中最主要的 是( C ) A数理统计B概率论C计算机D管理科学 9.用运筹学解决问题时,要对问题进行( B ) A 分析与考察 B 分析和定义 C 分析和判断 D 分 析和实验 三、多选 1模型中目标可能为(ABCDE ) A输入最少B输出最大 C 成本最小D收益最大E时间最短 2运筹学的主要分支包括(ABDE ) A图论B线性规划 C 非线性规划 D 整数规划 E目标规划 四、简答 1.运筹学的计划法包括的步骤。 答:观察、建立可选择的解、用实验选择最优解、确定实际问题。

《数据模型与决策》学习心得

《数据模型与决策》学习心得 ——运用运筹学的理念定会取得“运筹帷幄,决胜千里” 运筹学问题和运筹思想可以追溯到古代,它和人类实践活动的各种决策并存。现在普遍认为,运筹学是近代应用数学的一个分支,主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼,然后利用数学方法进行解决。界定运筹学作为在科学界的一门独立学科的出现,应当说是在1951年,即P. M. Morse和G. E. Kimball 的专着“运筹学方法”出版的那一年。运筹学的思想贯穿了企业管理的始终,运筹学对各种决策方案进行科学评估,为管理决策服务,使得企业管理者更有效合理地利用有限资源。优胜劣汰,适者生存,这是自然界的生存法则,也是企业的生存法则。只有那些能够成功地应付环境挑战的企业,才是得以继续生存和发展的企业。作为企业的管理者,把握并运用好运筹学的理念定会取得“运筹帷幄之中,决胜千里之外”之功效。 一、企业发展原则与战略管理 企业战略管理是企业在宏观层次通过分析、预测、规划、控制等手段,充分利用本企业的人、财、物等资源,以达到优化管理,提高经济效益的目的。随着我国经济市场化的日益加深,市场竞争日趋激烈,我国企业面临着更多的环境因素的影响与冲击。企业要求得生存与发展,必须运筹帷幄,长远谋划,根据自身的资源来制定最优的经营战略,以战略统揽全局。企业战略过程包括,明确企业战略目标,制定战略规划,作出和执行战略决策,并最后对战略作出评价。企业战略管理作为企业管理形态的一种创新,应是以市场为导向的管理、

是有关企业发展方向的管理、是面向未来的管理、是寻求内资源与外资源相协调的管理、是寻找企业的长期发展为目的。也就是将企业看作一个系统,来寻求系统内外的资源合理分配与优化,这正体现了运筹学的思想。我国企业战略管理的内容应根据自己的国情,制定对应的战略。主要侧重规定企业使命、分析战略环境、制定战略目标。中国现在绝大部分商品已由卖方市场转为买方市场,知识经济正向我们走来,全球经济一体化的程度在加深,我国企业不仅直接参与国内市场,还将更直接面临与世界跨国公司之间的角逐,企业间竞争的档次和水平日益提高,因而企业将面临更加复杂的竞争环境。只有确定了宏伟的奋斗目标,才能使企业凝集全部的力量,众志成城,向一个共同方向努力,争取实现有限资源的最有效的利用。显然,运筹学理念的作用举足轻重。 二、企业生产计划与市场营销 1、生产计划。使用运筹学方法从总体上确定适应需求的生产、贮存和劳动力安排等计划,以谋求最大的利润或最小的成本,运筹学主要用线性规划、整数规划以及模拟方法来解决此类问题。线性规划问题的数学模型是指求一组满足一个线性方程组(或线性不等式组,或线性方程与线性不等式混合组)的非负变量,使这组变量的一个线性函数达到最大值或最小值的数学表达式. 建立数学模型的一般步骤: (1)确定决策变量(有非负约束);对于一个企业来说,一般是直生产某产品的计划数量。 (2)写出目标函数(求最大值或最小值)确定一个目标函数;

(完整word版)《数据挖掘》试题与答案

一、解答题(满分30分,每小题5分) 1. 怎样理解数据挖掘和知识发现的关系?请详细阐述之 首先从数据源中抽取感兴趣的数据,并把它组织成适合挖掘的数据组织形式;然后,调用相应的算法生成所需的知识;最后对生成的知识模式进行评估,并把有价值的知识集成到企业的智能系统中。 知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程,其最终目标是掌握数据的模式。流程步骤:先理解要应用的领域、熟悉相关知识,接着建立目标数据集,并专注所选择的数据子集;再作数据预处理,剔除错误或不一致的数据;然后进行数据简化与转换工作;再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型;最后经过解释和评价成为有用的信息。 2. 时间序列数据挖掘的方法有哪些,请详细阐述之 时间序列数据挖掘的方法有: 1)、确定性时间序列预测方法:对于平稳变化特征的时间序列来说,假设未来行为与现在的行为有关,利用属性现在的值预测将来的值是可行的。例如,要预测下周某种商品的销售额,可以用最近一段时间的实际销售量来建立预测模型。 2)、随机时间序列预测方法:通过建立随机模型,对随机时间序列进行分析,可以预测未来值。若时间序列是平稳的,可以用自回归(Auto Regressive,简称AR)模型、移动回归模型(Moving Average,简称MA)或自回归移动平均(Auto Regressive Moving Average,简称ARMA)模型进行分析预测。 3)、其他方法:可用于时间序列预测的方法很多,其中比较成功的是神经网络。由于大量的时间序列是非平稳的,因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练,通过数学统计模型估计神经网络的各层权重参数初值,就可能建立神经网络预测模型,用于时间序列的预测。

数据模型与决策试卷2018

2018级硕士研究生课程考试试题 课程名称:数据、模型与决策 适用专业:2018级MBA 一、名词解释(每题5,共20分) 1.灵敏度分析 2.最大流问题 3.决策树 4.仿真 1.灵敏度分析 在根据一定数据求得最优解后,当这些数据中某一个或某几个发生变化 时,对最优解会产生什么影响。或者说,要使最优解保持不变,各个数据可以有多大的幅度的变动。这种研究线性规划模型的原始数据变化对最优解产生的影响就叫做线性规划的灵敏度分析。 2. 最大流问题 给一个有向图D=(V ,A),在V 中指定了一点,称为发点(记为v s ),和另一点,称为收点(记为v t ),其余的点叫中间点。对于每一个弧(v i ,v j )∈A,对应有一个c(v i ,v j )≥0(或简写为c ij ),称为弧的容量。通常把这样的D 叫作一个网络。记作D=(V ,A ,C)。对D 中的任一弧(v i ,v j )有流量f(v i ,v j ) (有时也简记作f ij ),称集合f={f ij }为网络D 上的一个流。满足1)容量限制条件:对每一弧(v i ,v j )∈A ,0≤f ij ≤c ij ;2)平衡条件:流出量=流入量,即对每个i(i ≠s, t)有 (,)(,)0i j j i ij ji v v A v v A f f ∈∈- =∑ ∑ 的流 f 称为可行流。最大流问题就是在网络中,寻 找流量最大的可行流,即求一个流{f ij },使其流量v(f)达到最大,且满足:0≤f ij ≤c ij (v i ,v j )∈A , ()()()()() ,ij ji v f i s f f i s t v f i t ?=?-=≠??-=? ∑∑ 。 3.决策树 决策树又称为判定树,是数据挖掘技术中的一种重要的分类方法,它是一种 以树结构(包括二叉树和多叉树)形式来表达的预测分析模型。具体方法是:通过把实例从根节点排列到某个叶子节点来分类实例;叶子节点即为实例所属的分类;树上每个节点说明了对实例的某个属性的测试,节点的每个后继分支对应于该属性的一个可能值。决策树起源于Marin 和Stone 为了研究人类概念模型而得来,于1966年提出。主要算法有:CART 算法,ID3算法,C4.5算法,SLIQ 分类方法,SPRINT 法,PUBLIC 法等等。 4.仿真 科学研究通常有三种途径;理认推导、科学实验和仿真模拟。人们在认识自然、利用自然过程中,为了更好地完成这一能动过程,需要对物质世界及非物质世界进行实验研究。然而试验分析对某些真实系统可能是不允许的。因此,在实践中出现了用模型来代替真实系统做试验的方法,以解决上述无法直接对真实系统进行试验分析的问题。仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。仿真是一门建立在相似理论,控制理论,系统科学和计算机基础上的综合性和试验性学科。 二、简答题(每题10分,共30分) 1.线性规划模型由哪些部分组成?线性规划模型有哪些性质? 答:线性规划模型由决策变量、目标函数、约束条件等组成构成。线性规划模型的具体性 质包括:1)目标函数是决策变量的线性函数;2)约束条件是决策变量的线性等式或不等式。 2.什么是概率决策的期望值方法?决策树方法与期望值法有何关系? 答:决策的前提条件存在确定、不确定及风险三种情况,在不确定及存在风险情况下进行 决策,可以依据不确定事件及风险发生的概率计算相应的期望值,通过期望收益最大化或期望损失最小化进行决策,即为概率决策的期望值方法。决策树法是指借助树状图,按照客观概率的大小,计算出各个方案的期望值,并对各个方案期望值进行比较,从中选择一个最为满意方案的方法。因此,决策树法属于概率决策期望值方法的一种。 3.有些什么类型的仿真?什么是仿真的Monte Carlo 进程? 答:仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。大致可分成:计算 机仿真、半物理仿真及全物理仿真。计算机仿真也被称为纯数学仿真,它是一种通过建立与

相关主题
文本预览
相关文档 最新文档