数据模型与决策作业答案
- 格式:pdf
- 大小:1.10 MB
- 文档页数:13
【最新整理,下载后即可编辑】数据模型与决策课程大作业以我国汽油消费量为因变量,乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归(数据为年度时间序列数据)。
试根据得到部分输出结果,回答下列问题:1)“模型汇总表”中的R方和标准估计的误差是多少?2)写出此回归分析所对应的方程;3)将三个自变量对汽油消费量的影响程度进行说明;4)对回归分析结果进行分析和评价,指出其中存在的问题。
1)“模型汇总表”中的R方和标准估计的误差是多少?答案:R方为0.993^2=0.986 ;标准估计的误差为120910.147^(0.5)=347.722)写出此回归分析所对应的方程;答案:假设汽油消费量为Y,乘用车销量为a,城镇化率为b,90#汽油吨价/城镇居民人均可支配收入为c,则回归方程为:Y=240.534+0.00s027a+8649.895b-198.692c3)将三个自变量对汽油消费量的影响程度进行说明;乘用车销量对汽油消费量相关系数只有0.00027,数值太小,几乎没有影响,但是城镇化率对汽油消费量相关系数是8649.895,具有明显正相关,当城镇化率每提高1,汽油消费量增加8649.895。
乘用90#汽油吨价/城镇居民人均可支配收入相关系数为-198.692,呈明显负相关,即乘用90#汽油吨价/城镇居民人均可支配收入每增加1个单位,汽油消费量降低198.692个单位。
a, b, c三个自变量的sig值为0.000、0.000、0.009,在显著性水平0.01情形下,乘用车消费量对汽油消费量的影响显著为正。
(4)对回归分析结果进行分析和评价,指出其中存在的问题。
在学习完本课程之后,我们可以统计方法为特征的不确定性决策、以运筹方法为特征的策略的基本原理和一般方法为基础,结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因素进行了模拟回归,并运用软件计算出回归结果,故根据回归结果,对具体回归方程,回归准确性,自变量影响展开分析。
1、某企业目前的损益状况如在下:销售收入(1000件×10元/件) 10 000销售成本:变动成本(1000件×6元/件) 6 000固定成本 2 000销售和管理费(全部固定) 1 000利润 1 000(1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。
为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。
请做出选择,哪一个方案更有利?(2)假设企业欲使利润增加50%,即达到1 500元,可以从哪几个方面着手,采取相应的措施。
2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费0.70元,单位变动管理费0.30元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少?如拟实现净利500元,应产销多少件产品?3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元):要求:(1)计算各产品的边际贡献;(2)计算加权平均边际贡献率;(3)根据加权平均边际贡献率计算预期税前利润。
4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。
则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少?5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:(1)说明两变量之间的相关方向;(2)建立直线回归方程;(3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。
6、某商店的成本费用本期发生额如表所示,采用账户分析法进行成本估计。
首先,对每个项目进行研究,根据固定成本和变动成本的定义及特点结合企业具体情况来判断,确定它们属于哪一类成本。
例如,商品成本和利息与商店业务量关系密切,基本上属于变动成本;福利费、租金、保险、修理费、水电费、折旧等基本上与业务量无关,视为固定成本。
数据模型与决策习题与参考答案《数据模型与决策》复习题及参考答案第⼀章绪⾔⼀、填空题1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。
2.运筹学的核⼼是运⽤数学⽅法研究各种系统的优化途径及⽅案,为决策者提供科学决策的依据。
3.模型是⼀件实际事物或现实情况的代表或抽象。
4、通常对问题中变量值的限制称为约束条件,它可以表⽰成⼀个等式或不等式的集合。
5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。
运筹学研究和解决问题的效果具有连续性。
6.运筹学⽤系统的观点研究功能之间的关系。
7.运筹学研究和解决问题的优势是应⽤各学科交叉的⽅法,具有典型综合应⽤特性。
8.运筹学的发展趋势是进⼀步依赖于_计算机的应⽤和发展。
9.运筹学解决问题时⾸先要观察待决策问题所处的环境。
10.⽤运筹学分析与解决问题,是⼀个科学决策的过程。
11.运筹学的主要⽬的在于求得⼀个合理运⽤⼈⼒、物⼒和财⼒的最佳⽅案。
12.运筹学中所使⽤的模型是数学模型。
⽤运筹学解决问题的核⼼是建⽴数学模型,并对模型求解。
13⽤运筹学解决问题时,要分析,定议待决策的问题。
14.运筹学的系统特征之⼀是⽤系统的观点研究功能关系。
15.数学模型中,“s·t”表⽰约束。
16.建⽴数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。
17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。
⼆、单选题1.建⽴数学模型时,考虑可以由决策者控制的因素是( A )A.销售数量 B.销售价格 C.顾客的需求 D.竞争价格2.我们可以通过( C )来验证模型最优解。
A.观察 B.应⽤ C.实验 D.调查3.建⽴运筹学模型的过程不包括( A )阶段。
A.观察环境 B.数据分析 C.模型设计 D.模型实施4.建⽴模型的⼀个基本理由是去揭晓那些重要的或有关的( B )A数量 B变量 C 约束条件 D ⽬标函数5.模型中要求变量取值( D )A可正 B可负 C⾮正 D⾮负6.运筹学研究和解决问题的效果具有( A )A 连续性B 整体性C 阶段性D 再⽣性7.运筹学运⽤数学⽅法分析与解决问题,以达到系统的最优⽬标。
第二章习题(P46)14.某天40只普通股票的收盘价(单位:元/股)如下:29.625 18.000 8.625 18.5009.250 79.375 1.250 14.00010.000 8.750 24.250 35.25032.250 53.375 11.500 9.37534.000 8.000 7.625 33.62516.500 11.375 48.375 9.00037.000 37.875 21.625 19.37529.625 16.625 52.000 9.25043.250 28.500 30.375 31.12538.000 38.875 18.000 33.500(1)构建频数分布*。
(2)分组,并绘制直方图,说明股价的规律。
(3)绘制茎叶图*、箱线图,说明其分布特征。
(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。
解:(1)将数据按照从小到大的顺序排列1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 32.25, 33.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。
(2)将数据分为6组,组距为10。
分组结果以及频数分布表。
为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。
根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。
频率分布直方图从频率直方图和累计频率直方图可以看出股价的规律。
股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。
数据模型与决策试题及参考答案本文为《数据模型与决策》复,共分为五个填空题。
1.已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是N(167.48,0.609)。
2.某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。
根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为[1040,1936]。
3.从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。
假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48.已知___第一胎是女孩,那么她的第三胎生男孩的概率是0.4653.4.调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是0.5.5.结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是0.6.1.孩子与父母的身高存在相关性,这个相关性可以用相关系数来衡量。
相关系数的取值范围为-1到1,绝对值越接近1表示相关性越强,绝对值越接近0表示相关性越弱。
在这个问题中,孩子与父母平均身高的相关性比较高,应该选0.9作为相关系数。
2.模拟仿真的关键步骤包括:确定仿真目标、建立仿真模型、选择仿真工具、设计实验方案、进行仿真实验、分析仿真结果、验证仿真模型。
模拟仿真是一种通过计算机模拟来研究和分析实际系统的方法,可以帮助人们更好地理解和预测系统的行为,从而提供决策支持和优化方案。
3.___某天上班路上捡到10元钱属于小概率事件。
小概率事件是指在一次试验中,出现的概率很小的事件。
通常认为,小概率事件的概率小于等于0.05.在这个问题中,其他选项中抛硬币的结果全是正面的概率都大于0.05,因此不属于小概率事件。
P45.1.21.2N ewtowne有一副珍贵的油画,并希望被拍卖。
有三个竞争者想得到该幅油画。
第一个竞拍者将于星期一出价,第二个竞拍者将于星期二出价,而第三个竞拍者将于星期三出价。
每个竞拍者必须在当天作出接受或拒绝的决定。
如果三个竞拍者都被拒绝,那个该油画将被标价90万美元出售。
Newtowne 拍卖行的主任对拍卖计算的概率结果列在表1.5中。
例如拍卖人的估计第二个拍卖人出价200万美元的概率p=0.9.(a)对接受拍卖者的决策问题构造决策树。
1、买家1:如果出价300万,就接受,如果出价200万,就拒绝;2、买家2:如果出价400万,就接受,如果出价200万,也接受。
接受买家1200 200200接受买家22002002000.50.9接受买家3买家1出价200万买家2出价200万0.7100 21买家3出价100万100100 0220020010100拒绝买家390拒绝买家290900190接受买家30.3400买家3出价400万400400拒绝买家1104000220拒绝买家3909090接受买家24004004000.1接受买家3买家2出价400万0.71001买家3出价100万100100040010100260拒绝买家390拒绝买家290900190接受买家30.3400买家3出价400万40040010400拒绝买家3909090接受买家1300 300300接受买家22002002000.50.9接受买家3买家1出价300万买家2出价200万0.7100 11买家3出价100万100100 0300020010100拒绝买家390拒绝买家290900190接受买家30.3400买家3出价400万400400拒绝买家1104000220拒绝买家3909090接受买家24004004000.1接受买家3买家2出价400万0.71001买家3出价100万100100040010100拒绝买家390拒绝买家290900190接受买家30.3400买家3出价400万40040010400拒绝买家39090902.9在美国有55万人感染HIV病毒。
MBA数据模型与决策考卷及答案一、选择题(每题1分,共5分)A. 线性模型B. 非线性模型C. 网络模型D. 层次分析法模型A. 期望收益B. 折现率C. 净现值D. 敏感性分析A. 敏感性分析B. 概率树C. 决策树D. 蒙特卡洛模拟A. 目标函数为线性函数B. 约束条件为非线性函数C. 变量之间存在相关性D. 变量取值范围为整数A. ExcelB. SPSSC. MATLABD. AutoCAD二、判断题(每题1分,共5分)1. 数据模型只能用于定量分析,不能用于定性分析。
()2. 在决策过程中,确定性决策的风险一定低于不确定性决策。
()3. 敏感性分析可以找出影响项目收益的关键因素。
()4. 多目标规划问题中,各个目标函数之间一定是相互矛盾的。
()5. 网络计划技术(PERT)是一种确定型网络图。
()三、填空题(每题1分,共5分)1. 数据模型的三个基本要素是变量、______和关系。
2. 决策树分析中,节点分为______节点和______节点。
3. 在线性规划问题中,目标函数和约束条件均为______函数。
4. 概率树分析是一种______分析工具,适用于评估项目风险。
5. 数据挖掘的五个基本步骤包括:数据准备、______、数据挖掘、结果评估和______。
四、简答题(每题2分,共10分)1. 简述蒙特卡洛模拟的基本原理。
2. 什么是网络计划技术(PERT)?它有哪些优点?3. 简述线性规划在企业管理中的应用。
4. 如何运用决策树分析解决实际问题?5. 数据挖掘技术在市场营销中的作用是什么?五、应用题(每题2分,共10分)1. 某企业生产两种产品,产品A的利润为50元/件,产品B的利润为80元/件。
生产一件产品A需要2小时,生产一件产品B需要3小时。
企业每月共有240小时的生产能力,请问如何安排生产计划,使得总利润最大化?2. 某项目有三种投资方案,方案一的投资额为100万元,收益率为10%;方案二的收益率为12%,投资额为150万元;方案三的投资额为200万元,收益率为15%。
数据模型与决策课程大作业以我国汽油消费量为因变量,乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归(数据为年度时间序列数据)。
试根据得到部分输出结果,回答下列问题:1)“模型汇总表”中的R方和标准估计的误差是多少?2)写出此回归分析所对应的方程;3)将三个自变量对汽油消费量的影响程度进行说明;4)对回归分析结果进行分析和评价,指出其中存在的问题。
1)“模型汇总表”中的R方和标准估计的误差是多少?答案:R方为0.993^2=0.986 ;标准估计的误差为120910.147^(0.5)=347.722)写出此回归分析所对应的方程;答案:假设汽油消费量为Y,乘用车销量为a,城镇化率为b,90#汽油吨价/城镇居民人均可支配收入为c,则回归方程为:Y=240.534+0.00s027a+8649.895b-198.692c3)将三个自变量对汽油消费量的影响程度进行说明;乘用车销量对汽油消费量相关系数只有0.00027,数值太小,几乎没有影响,但是城镇化率对汽油消费量相关系数是8649.895,具有明显正相关,当城镇化率每提高1,汽油消费量增加8649.895。
乘用90#汽油吨价/城镇居民人均可支配收入相关系数为-198.692,呈明显负相关,即乘用90#汽油吨价/城镇居民人均可支配收入每增加1个单位,汽油消费量降低198.692个单位。
a, b, c三个自变量的sig 值为0.000、0.000、0.009,在显著性水平0.01情形下,乘用车消费量对汽油消费量的影响显著为正。
(4)对回归分析结果进行分析和评价,指出其中存在的问题。
在学习完本课程之后,我们可以统计方法为特征的不确定性决策、以运筹方法为特征的策略的基本原理和一般方法为基础,结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因素进行了模拟回归,并运用软件计算出回归结果,故根据回归结果,对具体回归方程,回归准确性,自变量影响展开分析。
MBA数据模型与决策考卷及答案一、选择题(每题1分,共5分)A. 线性回归模型B. 决策树模型C. 主成分分析模型D. 聚类分析模型A. 信息增益B. 均方误差C. 相关系数D. F值A. 加权评分模型B. 层次分析法C. 数据包络分析法D. 逻辑回归分析法A. 目标函数线性B. 约束条件线性C. 变量非负D. 变量连续A. SPSSB. ExcelC. SASD. MATLAB二、判断题(每题1分,共5分)1. 数据模型可以用来描述现实世界中的数据关系和规律。
(√)2. 在决策分析中,只需要关注定量数据,无需考虑定性数据。
(×)3. 熵值法可以用于评估决策树的节点纯度。
(√)4. 线性规划问题中,目标函数和约束条件都必须是线性的。
(√)5. 数据挖掘就是从大量数据中提取有价值信息的过程。
(√)三、填空题(每题1分,共5分)1. 在决策树中,用于分割节点的属性称为______属性。
2. 多属性决策方法中,加权评分模型的核心是确定各属性的______。
3. 线性规划问题中,目标函数的取值称为______。
4. 在数据挖掘过程中,将原始数据转换为适合挖掘的格式的过程称为______。
5. ______是一种基于样本相似度的分类方法。
四、简答题(每题2分,共10分)1. 简述决策树的基本原理。
2. 什么是线性规划?它有哪些应用场景?3. 简述主成分分析的基本步骤。
4. 聚类分析的主要目的是什么?5. 请列举三种常用的多属性决策方法。
五、应用题(每题2分,共10分)1. 某企业拟投资两个项目,项目A的预期收益为100万元,风险系数为0.6;项目B的预期收益为150万元,风险系数为0.8。
请使用加权评分模型为企业选择投资项目。
2. 某公司生产两种产品,产品1的单件利润为10元,产品2的单件利润为15元。
生产一件产品1需要2小时,生产一件产品2需要3小时。
公司每月最多生产100件产品,且生产时间不超过240小时。
1、某企业目前的损益状况如在下:销售收入(1000件×10元/件) 10 000销售成本:变动成本(1000件×6元/件) 6 000固定成本 2 000销售和管理费(全部固定) 1 000利润 1 000(1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。
为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。
请做出选择,哪一个方案更有利?(2)假设企业欲使利润增加50%,即达到1 500元,可以从哪几个方面着手,采取相应的措施。
2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费0.70元,单位变动管理费0.30元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少?如拟实现净利500元,应产销多少件产品?3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元):要求:(1)计算各产品的边际贡献;(2)计算加权平均边际贡献率;(3)根据加权平均边际贡献率计算预期税前利润。
4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。
则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少?5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:(1)说明两变量之间的相关方向;(2)建立直线回归方程;(3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。
6、某商店的成本费用本期发生额如表所示,采用账户分析法进行成本估计。
首先,对每个项目进行研究,根据固定成本和变动成本的定义及特点结合企业具体情况来判断,确定它们属于哪一类成本。
例如,商品成本和利息与商店业务量关系密切,基本上属于变动成本;福利费、租金、保险、修理费、水电费、折旧等基本上与业务量无关,视为固定成本。
数据,模型与决策练习题含答案(总15页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--1、某企业目前的损益状况如在下:销售收入(1000件×10元/件) 10 000销售成本:变动成本(1000件×6元/件) 6 000固定成本 2 000销售和管理费(全部固定) 1 000利润 1 000(1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。
为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。
请做出选择,哪一个方案更有利(2)假设企业欲使利润增加50%,即达到1 500元,可以从哪几个方面着手,采取相应的措施。
2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费元,单位变动管理费元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少如拟实现净利500元,应产销多少件产品3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元):要求:(1)计算各产品的边际贡献;(2)计算加权平均边际贡献率;(3)根据加权平均边际贡献率计算预期税前利润。
4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。
则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如(2)建立直线回归方程;(3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。
6、某商店的成本费用本期发生额如表所示,采用账户分析法进行成本估计。
首先,对每个项目进行研究,根据固定成本和变动成本的定义及特点结合企业具体情况来判断,确定它们属于哪一类成本。
数据模型与决策习题答案数据模型与决策习题答案在当今信息时代,数据的价值越来越受到重视。
数据模型作为一种描述和组织数据的方式,对于决策过程起着重要的作用。
本文将通过解答一些与数据模型和决策相关的习题,来探讨数据模型在决策中的应用和意义。
1. 什么是数据模型?为什么在决策过程中需要使用数据模型?数据模型是对现实世界进行抽象和描述的一种方式。
它通过定义实体、属性和关系的方式,将现实世界中的事物转化为计算机可以处理的形式。
数据模型可以帮助我们更好地理解和组织数据,为决策提供支持。
在决策过程中,数据模型的使用具有以下几个重要的作用:1) 数据模型可以帮助我们对现实世界进行建模和描述,将复杂的现实问题转化为可计算的形式,从而更好地理解问题的本质。
2) 数据模型可以帮助我们组织和管理大量的数据,使得数据更易于存储、检索和分析,为决策提供必要的信息支持。
3) 数据模型可以帮助我们对不同的决策方案进行评估和比较,通过模拟和预测的方式,帮助我们选择最佳的决策方案。
2. 数据模型的种类有哪些?请简要介绍其中的几种。
常见的数据模型包括层次模型、网状模型、关系模型和面向对象模型等。
层次模型是最早的数据模型之一,它将数据组织成一种树状结构,其中每个节点代表一个实体,每个节点之间通过父子关系连接。
层次模型的优点是结构简单,易于理解和实现,但缺点是不适合处理复杂的关系和多对多的关联。
网状模型是层次模型的扩展,它允许多个父节点指向同一个子节点,从而解决了层次模型不适合处理多对多关联的问题。
但网状模型的缺点是结构复杂,不易理解和维护。
关系模型是目前应用最广泛的数据模型,它将数据组织成一张二维表格,其中每一行代表一个实体,每一列代表一个属性。
关系模型通过定义实体间的关系和约束,实现了数据的灵活查询和操作。
面向对象模型是一种基于对象的数据模型,它将数据组织成一组对象,每个对象包含了数据和对数据的操作。
面向对象模型适用于处理复杂的关系和行为,但在实际应用中较为复杂和庞大。
第二章习题(P46)14.某天40只普通股票的收盘价(单位:元/股)如下:29.625 18.000 8.625 18.5009.250 79.375 1.250 14.00010.000 8.750 24.250 35.25032.250 53.375 11.500 9.37534.000 8.000 7.625 33.62516.500 11.375 48.375 9.00037.000 37.875 21.625 19.37529.625 16.625 52.000 9.25043.250 28.500 30.375 31.12538.000 38.875 18.000 33.500(1)构建频数分布*。
(2)分组,并绘制直方图,说明股价的规律。
(3)绘制茎叶图*、箱线图,说明其分布特征。
(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。
解:(1)将数据按照从小到大的顺序排列1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 32.25, 33.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。
(2)将数据分为6组,组距为10。
分组结果以及频数分布表。
为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。
根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。
频率分布直方图从频率直方图和累计频率直方图可以看出股价的规律。
股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。
《数据模型与决策》复习(附参考答案)2018.9一、填空题(五题共15分)1.已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是①。
解:N(167.48,0.609)考查知识点:已知总体服从正态分布,求样本均值的分布。
2.某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。
根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为②。
解:[1040,1936]考查知识点:区间估计的求法。
正态总体均值的区间估计是[X-Z上,X + Z与] 1-a n'n1-a nn 其中X是样本平均数,s是样本的标准差,n是样本数。
详解:直接带公式得:区间估计是— s _ s2240 2240[X—Z -=, X + Z ,]= [1488 —2^^,1488 + 2^^] 山nn山.nn x100 * 100=[1040,1936]3.从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。
假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。
已知小李第一胎是女孩,那么她的第三胎生男孩的概率是③。
解p=0.4653考查知识点:离散概率计算方法。
详解:假设B1二第1胎生男孩,B2二第2胎生男孩,B3二第3胎生男孩G1二第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩P(B3)二P(B3B2)+P(B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P(B3))= P(B3|B2)P(B2)+P(B3|G2)P(G2)=0.48 义(1-0.55) + (1-0.55)义 0.55=0.46534.调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。
《数据模型与决策》复习试题和参考题答案一、选择题1. 下列哪种数据模型不是数据库系统常用的数据模型?()A. 关系模型B. 层次模型C. 网状模型D. 面向对象模型2. 以下哪项不是数据库系统的主要功能?()A. 数据存储B. 数据检索C. 数据更新D. 数据加密3. 在关系数据库中,下列哪个概念表示表之间的关系?()A. 外键B. 主键C. 候选键D. 索引4. 下列哪种决策方法属于定量决策方法?()A. 直觉决策法B. 经验决策法C. 线性规划法D. 逻辑推理法5. 以下哪个概念不属于数据挖掘的范畴?()A. 关联规则B. 聚类分析C. 决策树D. 文本挖掘二、填空题6. 数据模型通常包括________、________和________三个基本要素。
7. 数据库系统的核心是________。
8. 在关系数据库中,为了实现表之间的连接,通常使用________。
9. 数据挖掘的方法主要包括________、________和________。
10. 线性规划法在决策过程中主要用于解决________问题。
三、判断题11. 数据模型是数据库设计和实现的基础,它描述了数据如何存储、组织和访问。
()12. 数据库系统只能用于存储数据,不能进行数据检索和更新操作。
()13. 在关系数据库中,主键可以唯一标识表中的每一行数据。
()14. 数据挖掘是一种从大量数据中提取有价值信息的方法,它包括关联规则、聚类分析和决策树等技术。
()15. 定量决策方法主要依赖于数学模型和算法,通常比定性决策方法更加准确和有效。
()四、简答题16. 简述数据模型的作用。
17. 简述数据库系统的四个主要功能。
18. 简述数据挖掘的主要应用领域。
19. 简述线性规划法的基本原理。
五、综合题20. 设某公司销售三种产品A、B、C,每种产品的销售价格、成本和销售量如下表所示。
请根据这些数据,计算该公司每种产品的利润,并确定哪种产品的销售利润最高。
《管理统计学》习题解答(20XX 年秋MBA 周末二班,邢广杰,学号:)第3章 描述性统计量 (一) P53 第1题抽查某系30个教工,年龄如下所示:61,54,57,53,56,40,38,33,33,45,28,22,23,23,24,22,21,45,42,36,36,35,28,25,37,35,42,35,63,21(i )求样本均值、样本方差、样本中位数、极差、众数;(ii )把样本分为7组,且组距相同。
作出列表数据和直方图; (iii )根据分组数据求样本均值、样本方差、样本中位数和众数。
解:(i )样本均值∑==n1i ixn1x =37.1岁样本方差)X n X (1-n 1)X (X 1-n 1s 2n 1i 2i2n 1i i 2-=-=∑∑===189.33448 把样本按大小顺序排列:21,21,22,22,23,23,24,25,28,28,33,33,35,35,35,36,36,37,38,40,42,42,45,45,53,54,56,57,61,63样本中位数)X X (21m 1)2n ()2n (++==(35+36)/2=35.5岁极差=-=1)()n (X X R 63-21=42岁 众数=0m 35岁(ii )样本分为7组、且组距相同的列表数据、直方图如下所示样本均值i k1i f Xi n 1X ∑===36.3岁样本方差)X n f X (1-n 1f )X (X 1-n 1s 2k 1i i 2i i2k 1i i 2-=-=∑∑===174.3724 样本中位数810230730f F 2n i I m -+=-+==34.375岁 众数=--⨯-+=---+=+448248730f f 2f f f iI m 1m 1-m m 1-m m 033.5岁(二)P53 第2题某单位统计了不同级别的员工的月工资水平资料如下:解:样本均值i k1i f Xi n 1X ∑===1566.667元样本标准差)X n f X (1-n 1f )X (X 1-n 1s 2k 1i i2i i 2k 1i i -=-=∑∑===398.1751元 样本中位数在累计74人的那一组,m=1500元; 众数1500m 0=元。