2012研究生数学建模A题
- 格式:doc
- 大小:2.10 MB
- 文档页数:30
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
(一)葡萄酒观察方法1 酒液总体观察1.1 澄清度观察衡量葡萄酒澄清程度的指标有透明度、浑浊度等,与之相关的指标还有是否光亮、有无沉淀等。
优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。
a.澄清:是衡量葡萄酒外观质量的重要指标。
澄清表示的是葡萄酒明净清澈、不含悬浮物。
通常情况下,澄清的葡萄酒也具有光泽。
b.透明度:表示的是葡萄酒允许可见光透过的程度。
红葡萄酒如果颜色很深,则澄清的葡萄酒也不一定透明。
c.浑浊度:表示的是葡萄酒的浑浊程度,浑浊的葡萄酒含有悬浮物。
葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。
浑浊的葡萄酒其口感质量也差。
d.沉淀:指的是从葡萄酒中析出的固体物质。
沉淀是由于在陈酿过程中,葡萄酒构成成份的溶解度变小引起的,一般不会影响葡萄酒的质量。
1.2 颜色观察葡萄酒的颜色受酒龄影响,新红葡萄酒由于源于果皮花色素苷的作用,通常颜色鲜艳,为紫红色和宝石红色,带紫色色调;在葡萄酒的成熟过程中,丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。
瓦红或砖红色为成年红葡萄酒的常有的颜色,而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。
因此,可根据颜色,判断葡萄酒的成熟状况。
葡萄酒的颜色和口感的变化存在着平行性,颜色和口感之间必须相互协调平衡。
颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。
如在红葡萄酒中,颜色的深浅与丹宁的含量往往正相关。
如果红葡萄酒颜色深而浓,几乎处于半透明状态,多数情况下它必然醇厚、丰满、丹宁感强。
相反,色浅的葡萄酒,则味淡、味短。
当然,如果较柔和,具醇香,仍不失为好酒。
例如瓦红色的红葡萄酒,必须与浓郁的醇香和柔顺的口感同时存在,否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。
带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙;褐色过重的成年葡萄酒,氧化过重、老化。
1.3 浑浊度观察观察葡萄酒有无下列情况:略失光,失光,欠透明,微混浊,极浑浊,雾状混浊,乳状混浊;1.4 沉淀观察观察葡萄酒有无下列情况:有无沉淀,沉淀类型:纤维状沉淀,颗粒状沉淀,絮状沉淀,酒石结晶,片状沉淀,块状沉淀。
葡萄酒质量评定模型摘要葡萄酒质量的评定长久以来都是采用聘请品酒员,通过品酒员对葡萄酒各项指标打分求和来确定葡萄酒的质量。
葡萄酒的价格因品酒员评分高低的不同有显著的差别。
然而在这样的评定方式中人的主观因素对酒质量的评定占主导地位,葡萄酒质量的评定结果存在较大的不确定性。
随着人们对葡萄酒消费的增加及高质量化的追求,建立合理、规范、客观的葡萄酒质量评定模型显得尤为重要。
根据题中给出的相关数据,通过解决以下问题建立葡萄酒质量评定模型。
对于问题一:首先,将题目附录1中的数据经Excel处理,得到每组评酒员对每种酒样品的总分。
然后,对每一种酒样品运用两配对样本的非参数检验(符号秩和检验)对数据进行显著性差异分析,运用MATLAB软件比较各酒样品的两组数据发现两组结果差异显著。
其次,通过Excel求出每一种酒的品酒员所打总分的方差,得到两组品酒员分别对两类葡萄酒的方差走势图(见图1.1、1.2),根据总体方差最小,方差波动较小,确定第二组品酒员的评分更可信。
最后,采用SPSS软件作进一步检验,结果相同即模型合理。
对于问题二,选取一级理化指标作为酿酒葡萄分级参考,对理化指标运用主成分分析法降维,通过MATLAB计算得到红葡萄的主成分有8个,白葡萄的主成分有11个。
综合评分得到的葡萄酒质量影响,红葡萄的影响因素有9个,白葡萄的影响因素有12个。
然后,利用折衷型模糊决策模型,考虑到由主成分分析方法得到的酿酒葡萄的的主成分值在反应酿酒葡萄质量好坏问题上会有一定的偏差,利用三角模糊的表达方式对主成分指标值进行表示,分别将红、白两类酿酒葡萄按隶属度大小排序,在运用聚类分析的方法,利用SPSS软件将葡萄划分为五个等级(见表格2.1)。
对于问题三,数据的庞杂是解决该问题的难点。
我们运用问题二中的主成分分析方法将理化指标转化为几个主成分,并运用MATLAB编程求出具体的主成分数值,然后建立线性回归模型,求解出酿酒葡萄与葡萄酒理化指标主成分之间的相关关系,从而反映出酿酒葡萄与葡萄酒理化指标之间的联系。
2012年高教杯数学建模竞赛A题文章包括以下内容:一、引言1. 对数学建模竞赛的介绍2. 2012年高教杯数学建模竞赛的背景3. A题的重要性和难度二、问题描述1. A题的具体内容和要求2. 问题背景和实际应用三、问题分析1. 对A题中涉及的数学知识和模型进行分析a. 需要运用的数学工具和方法b. 相关参数和变量的定义和意义c. 问题中存在的约束条件和假设2. 对A题中涉及的实际问题进行分析a. 现实场景的相关情况和特点b. 问题的实际意义和应用价值c. 对问题的可行性和局限性进行分析四、问题求解1. 根据问题分析确定相应的数学模型a. 求解问题所需建立的数学模型b. 模型的简化和推导过程2. 运用已知的数学方法和工具解决问题a. 使用数学软件进行模拟和计算b. 运用数学定理和理论进行证明和推演五、结果分析1. 求解结果的展示和分析2. 结果的合理性和可靠性分析3. 结果对实际问题的指导意义和应用价值六、总结与展望1. 对A题求解过程的总结和反思2. 对实际问题的展望和未来研究方向3. 对数学建模竞赛的意义和作用进行总结稿件要求:1. 语言流畅、准确,表达清晰、精炼,逻辑性强2. 论据充分,论证严谨,具有说服力3. 不得抄袭,不得侵犯他人著作权4. 投递稿件时请注明真实尊称和通信方式,以便我们及时与您取得联系注:以上为文章大纲及要求,具体内容请根据实际情况进行撰写。
2012年高教杯数学建模竞赛A题是一个具有挑战性和复杂性的问题,需要参赛者结合数学理论和实际问题进行分析和求解。
在本文中,我们将对A题进行深入的探讨,从问题描述到问题分析再到问题求解,最终得出结果分析和总结展望,全面展示对A题的理解和解决方案。
让我们来看A题的具体内容和要求。
A题涉及一个复杂的实际问题,需要参赛者运用数学工具和方法对其进行建模和求解。
这个问题背景和实际应用是一个现实场景中的情况,问题的实际意义和应用价值是非常明显的。
A题的重要性和难度也就显而易见了。
2012全国数学建模竞赛A题详细分析1.问题重述在设计太阳能小屋时,需在建筑物外表面(屋顶及外墙)铺设光伏电池,光伏阵列件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用,并将剩余电量输入电网。
不同种类的光伏电池每峰瓦的价格差别很大,且每峰瓦的实际发电效率或发电量还受诸多因素的影响。
因此,在太阳能小屋的设计中,研究光伏电池在小屋外表面的优化铺设是很重要的问题。
对下列三个问题,分别给出小屋外表面光伏电池的铺设方案,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,并计算出小屋光伏电池35年寿命期内的发电总量、经济效益(当前民用电价按0.5元/kWh计算)及投资的回收年限。
在同一表面采用两种或两种以上类型的光伏阵列件时,同一型号的电池板可串联,而不同型号的电池板不可串联。
在不同表面上,即使是相同型号的电池也不能进行串、并联连接。
应注意分组连接方式及逆变器的选配。
问题1:请根据山西省大同市的气象数据,仅考虑贴附安装方式,选定光伏阵列件,对小屋(见附件2)的部分外表面进行铺设,并根据电池组件分组数量和容量,选配相应的逆变器的容量和数量。
问题2:电池板的朝向与倾角均会影响到光伏电池的工作效率,请选择架空方式安装光伏电池,重新考虑问题1。
问题3:根据附件7给出的小屋建筑要求,请为大同市重新设计一个小屋,要求画出小屋的外形图,并对所设计小屋的外表面优化铺设光伏电池,给出铺设及分组连接方式,选配逆变器,计算相应结果。
2.问题的分析2.1 问题一的分析问题一中要求根据山西省大同市的气象数据,选定光伏阵列件对小屋的部分外表面以贴附安装方式进行铺设,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,最后给出铺设方案,包括电池组件分组数量和容量,以及相应的逆变器的容量和数量。
首先,附表中提供的大同地区的光照数据并未直接告知每个面获得的光照总量,需要根据光散射和直射的关系,建立光照模型,确定每个面的总的光照强度。
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A(隐去论文作者相关信息)日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。
通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。
A基因识别问题及其算法实现一、背景介绍DNA 是生物遗传信息的载体,其化学名称为脱氧核糖核酸(Deoxyribonucleic acid ,缩写为DNA )。
DNA 分子是一种长链聚合物,DNA 序列由腺嘌呤(Adenine, A ),鸟嘌呤(Guanine, G ),胞嘧啶(Cytosine, C ),胸腺嘧啶(Thymine, T )这四种核苷酸(nucleotide )符号按一定的顺序连接而成。
其中带有遗传讯息的DNA 片段称为基因(Gene )(见图1第一行)。
其他的DNA 序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。
在真核生物的DNA 序列中,基因通常被划分为许多间隔的片段(见图1第二行),其中编码蛋白质的部分,即编码序列(Coding Sequence )片段,称为外显子(Exon ),不编码的部分称为内含子(Intron )。
外显子在DNA 序列剪接(Splicing )后仍然会被保存下来,并可在图1真核生物DNA 序列(基因序列)结构示意图蛋白质合成过程中被转录(transcription )、复制(replication )而合成为蛋白质(见图2)。
DNA 序列通过遗传编码来储存信息,指导蛋白质的合成,把遗传信息准确无误地传递到蛋白质(protein )上去并实现各种生命功能。
图2蛋白质结构示意图对大量、复杂的基因序列的分析,传统生物学解决问题的方式是基于分子实验的方法,其代价高昂。
诺贝尔奖获得者W.吉尔伯特(Walter Gilbert ,1932—;【美】,第一个制备出混合脱氧核糖核酸的科学家)1991年曾经指出:―现在,基于全部基因序列都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。
一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设。
‖ 随着世界人类基o DNA 序列外显子(Exon ) 内含子(Intron)DNA 序列蛋白质序列因组工程计划的顺利完成,通过物理或数学的方法从大量的DNA 序列中获取丰富的生物信息,对生物学、医学、药学等诸多方面都具有重要的理论意义和实际价值,也是目前生物信息学领域的一个研究热点。
摘要..................................................................................................................... - 1 -一、问题的重述....................................................................................................... - 2 -二、问题分析与建模思路....................................................................................... - 2 -三、基本假设与符号说明....................................................................................... - 3 -3.1 基本假设 ........................................................................................................ - 3 -3.2 符号说明 ........................................................................................................ - 4 -四、模型的建立与求解........................................................................................... - 4 -4.1功率谱和信噪比的计算方法 ............................................................................. - 4 -4.1.1 基于Voss映射求解功率谱和信噪比方法................................................ - 4 -4.1.2 基于Z-curve映射求解功率谱与信噪比方法 ........................................... - 7 -4.1.3 基于实数映射求解功率谱与信噪比方法 ............................................... - 10 -4.2 对不同物种类型基因的阈值确定 ................................................................... - 11 -4.2.1 人类基因序列阈值的确定 .................................................................... - 11 -4.2.2鼠类基因序列阈值的确定................................................................... - 13 -4.3 基因识别算法的实现..................................................................................... - 16 -4.4 延展性研究................................................................................................... - 20 -五、模型评价与改进............................................................................................. - 21 -六、参考文献......................................................................................................... - 22 -七、附录................................................................................................................. - 23 -参赛密码(由组委会填写)第九届“华为杯”全国研究生数学建模竞赛题目基因识别问题及其算法的研究摘要在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。
在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。
我们运用计算机MATLAB软件,分析结果如下:对于问题一,我们根据文献中给出的Voss映射,用快速傅里叶变换方法来实现功率谱和信噪比的求解。
本文利用附件中的genes6中的数据,运行第1条DNA片段的基因数据,通过编程分析,得到功率谱和信噪比r =3.4474。
在Z-curve 映射下我们得到功率谱和信噪比r = 4.5965,并发现二者呈现一定的常数比例关系。
在实数映射下,我们得到功率谱和信噪比为r =3.1186。
对于问题二,假定运行的数据拥有足够的长度。
首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。
我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。
对于问题三,我们假定3-周期性具有一定的普遍性。
采用相邻峰值频谱差异法确定外显子的起点和终点。
首先,画出genes6中的DNA序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。
对于问题四,我们运用的是频谱和信噪比方法探讨基因突变。
首先利用genes200数据,得到信噪比;其次做描述性统计分析,得到基因序列信噪比折线图和描述统计表;最后预测到当R值突然高于周围值时,基因失去DNA片段的对称性,这样的片段就会存在基因突变。
创新点:1. 利用快速傅里叶变换代替傅里叶变换,并用程序运行,大大提高了基因功率谱和信噪比的运算速度,对于今后研究具有现实性意义和参考价值。
2. 运用信噪比的取值探讨基因识别方法。
关键词:Voss映射Z-curve 映射MATLAB软件SPSS软件快速傅里叶变换一、问题的重述DNA是生物遗传信息的载体,DNA分子是一种长链聚合物,DNA序列由腺嘌呤(Adenine, A),鸟嘌呤(Guanine, G),胞嘧啶(Cytosine, C),胸腺嘧啶(Thymine,T)这四种核苷酸(nucl eotide)符号按一定的顺序连接而成。
其中带有遗传讯息的DNA片段称为基因(Genes)。
其他的DNA序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。
如何利用DNA这些重要的信息帮助人们在农业、工业等行业领域内实现新的突破是我们面临的一个新的实际课题。
我们就当前国内外的研究现状与成果的相关情况,建立数学模型分析研究下面的问题:问题一:(1)基于Voss映射,探求功率谱和信噪比的计算方法。
(2)基于Z-curve映射,求解频谱与信噪比并对Z-curve映射和Voss映射下的频谱和信噪比进行比较。
(3)基于实数映射,求解功率谱与信噪比的计算方法。
问题二:对8个人类和92个鼠类的基因序列进行分析,找到每类基因研究其阈值的确定方法和阈值结果,并对所得到的结果进行评价。
问题三:对设计好的基因识别算法的准确率做出适当评估,并对genes6的编码区域的预测。
问题四:利用频谱或信噪比方法去发现基因编码序列可能存在的突变。
二、问题分析与建模思路问题一:(1)根据Voss映射,采用傅里叶方法探求功率谱和信噪比的快速计算办法。
本文利用附件中的genes6中的数据,运行给定的任意一段基因数据,在给定的一段DNA序列片段为S = ATCGTACTG,则所生成的四个0-1序列分别为:{[]}A u n :{1,0,0,0,0,1,0,0,0}; {[]}G u n :{0,0,0,1,0,0,0,0,1};{[]}C u n :{0,0,1,0,0,0,1,0,0}; {[]}T u n :{0,1,0,0,1,0,0,1,0}。
这样产生的四个数字序列又称为DNA 序列的指示序列,并通过利用MATLAB 软件对Voss 映射进行编程分析(见附件1),得到功率谱和信噪比的快速计算方法。
(2)根据附件1中的Z-curve 映射来探求频谱与信噪比的快速计算方法。
通过运行程序得到Z-curve 映射下频谱和信噪比的值,然后采用100个组进行对比分析,发现在Voss 映射和Z-curve 映射下得到的信噪比之间呈现一定的倍数比例关系。
(3)根据已编好的程序在实数映射下,如:0,1,2,3A C G T →→→→,采取快速傅里叶方法得到功率谱与信噪比的快速计算方法。
问题二:假定运行的数据拥有足够的长度。
从带有编码外显因子信息的8个人和92个鼠类中找出具有代表性的基因序列,并对每类基因研究其阈值确定方法,适当地评论其有效性。
首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。
我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。
问题三:我们假定3-周期性具有一定的普遍性。
采用相邻峰值频谱差异法确定外显子的起点和终点。
首先,画出genes6中的DNA 序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。