数学建模竞赛(化验结果的处理)解题论文
- 格式:doc
- 大小:409.50 KB
- 文档页数:28
血样的分组化验摘要本问题所述的情况在医学统计、病毒检测等诸多问题中是首要解决的问题。
进行某种疾病的调查,需要大量的统计数据,而统计数据的取得主要靠实验的方法,这时候,我们就要考虑如何让分组使得我们处理问题的效率提高,花销最少,本文就是以找出最优分组为主要目的。
首先解决的是在阳性先验概率p固定情况下建立一个概率模型使化验次数最小的问题,我们设平均每人检验次数的函数为f(x),然后通过非线性方程数值解法对其求解,找到是化验次数最小的每组人数;接着要解决的是阳性先验概率p为多大时,就不应该再分组;再接下来,解决二次分组(即阳性组再分组检验)的问题,我们采用非线性规划模型利用LINGO软件求使化验次数最少的最优解;最后通过平均概率模型讨论其它类型的血样分组情况。
关键字:概率模型非线性方程数值解法非线性规划平均概率模型一、问题提出要在人群中(数量很大)找出某种病患者,为减少检验次数,通常采用筛选的办法。
即假设人群总数为 n, 将人群分成 m 组,每组的人数为 k,将每组的 k 份血样混在一起进行化验,若化验结果呈阳性,则需要对该组的每个人重新进行化验,以确定患者;若化验结果呈阴性,则表明该组全体成员均为阴性,不需要重新化验。
(1)已知先验阳性率为p,,当 p 固定时,如何分组可使得化验次数最小;(2)找出不必分组的先验阳性率p的取值范围;(3)讨论两次分组的情况,即检测为阳性的组再次分组检验的情况;(4)讨论其它分组方案,如半分法、三分法,这里我们采用平均概率模型进行分组。
二、基本假设①血样的检验结果只存在阴性和阳性两种结果, 即阴性与阳性的先验概率之和为1,即p+q=1;②假设先验概率p是对某个人检验一次,结果呈阳性的概率,并假设先验概率在检验中保持不变(即假设该概率p只与疾病有关,而对同一种疾病该值为常量);③用来抽样的随机人群相互独立(即不考虑是否有遗传性与病毒的传染);④为了简化模型,假设能够平均分配,进行再分组的时候,对呈阳性的组进行内分组。
化验结果处理的数学模型摘要医学化验是协助医生诊断疾病的重要手段。
在化验过程中,医院希望可以用简便的判别方法,通过尽量少的化验指标判别出就诊人员是否患病。
本篇论文针对于化验结果的处理提出了Ca含量判别法和费希尔判别等判别法,并采用逐个剔除的方法来排除无关紧要的元素,从而减少化验指标,找出关键元素。
针对问题1和2,我们提出了马氏距离判别法、fisher判别法、偏离程度判别法和Ca含量判别法共四种方法。
通过运用这四种方法分别计算1-60号病例的化验结果来检验其的正确率来进行筛选,算得四种方法的综合正确率分别为:88.33%,93.33%,90%和95%。
所以最终决定采用准确率较高的Ca含量判别法和费希尔判别法来作为诊断就诊人员是否患有肾炎的最终方法。
针对问题3和4,通过对数据特征分析,提出了多元线性回归法和主成分分析模型法两种方法。
前者利用偏离程度建立多元线性回归方程,通过F检验,最后求得的关键因素有:Cu Fe Mg K Na;后者通过建立主成分分析赋权模型,对数据进行标准化并确定相关系数矩阵,求出相关矩阵的特征值和特征向量,从而得到各种元素的权值,得出关键元素为:Cu Ca Mg K Na。
针对问题5,我们对前后作了进一步分析。
将问题二、四的结果进行比较我们得知:以我们确定的关键元素Cu Ca Mg K Na为指标,得到问题四的结果,我们从被诊断为健康人的数据中发现了1组患肾炎的,而原被诊为患肾炎的数据数目没有发生改变。
根据我们在诊断的过程中不会把患肾炎的诊断成健康人,从而进一步验证了我们选取的元素指标的正确性。
关键字:马氏距离判别法、fisher判别法、Ca含量判别法、偏离程度MATLAB,Excel,SPSS,主成分分析一.问题的提出(一)问题的背景人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
以诊断肾炎为例,一般情况下,医生是通过就诊人员的尿液的化验结果,即其中某些元素含量的高低判断就诊人员是否患有肾炎,这些元素一般包括Zn、Cu、Fe、Ca、Mg、K、Na等7种元素。
摘要以大学生数学建模竞赛为牵引,进行创新创业能力培养,把创新创业教育与课程建设、教学团队建设、科学研究相融合,把以竞赛为目的变为以竞赛为手段,解决创新创业教育的实践平台问题。
构建大学生创新创业教育的实践教学体系,完善大学生数学建模竞赛的运行模式和激励机制,进行大学生数学建模竞赛与创新创业教育的融合。
本课题的研究可以推广到其他的大学生科技竞赛,搭建更多的创新创业教育实践平台,实现工科院校大学生科技竞赛与创新创业教育的融合,更好地培养学生的创新实践能力。
关键词数学建模竞赛;创新创业;学科建设大学生数学建模竞赛1985 年出现于美国[1] ,教育部高等教育司和中国工业与应用数学学会从1994 年起共同主办全国大学生数学建模竞赛,每年一届,目前已成为全国高校规模最大的基础性学科竞赛,在高校中已变成最广泛的大学生科技创新活动之一。
这项竞赛2007 年被列入教育部质量工程首批资助的学科竞赛之一。
数学建模竞赛的题目由工程技术、经济管理、社会生活等领域中的实际问题简化加工而成,具有很强的实用性和挑战性[1] 。
学生面对一个实际问题,对解决方法没有任何限制,学生可以运用自己认为合适的任何数学方法和计算机技术加以分析、解决,他们必须充分发挥创造力和想象力,从而培养了学生的创新意识及主动学习、独立研究的能力。
竞赛没有事先设定标准答案,但留有充分余地供参赛者发挥其聪明才智和创造精神,并充分发扬 3 人一组的团结合作精神。
由于竞赛面向所有专业的在校大学生,因此每年吸引了大量工科类专业的大学生参赛。
竞赛实际上包括三个阶段,即赛前培训阶段、竞赛阶段和赛后研究阶段,彼此相互联系。
在赛前培训阶段,学生要通过课程学习或课外讲座掌握一些包括数学知识的学习和数学软件的使用等数学建模的基本知识,并通过实际建模得到训练;竞赛三天集中完成竞赛题目;赛后对赛题继续深入研究。
在十二五期间[2] ,国家决定通过实施大学生创新创业训练计划促进高等学校转变教育思想观念,改革人才培养模式,强化创新创业能力训练,增强高校学生的创新能力和在创新基础上的创业能力,培养适应创新型国家建设需要的高水平创新人才。
《2016年全国大学生数学建模竞赛B题解题分析与总结》篇一一、引言全国大学生数学建模竞赛(CUMCM)是衡量各高校数学类学科学生学习与实践能力的标志性竞赛之一。
其中,B题以真实问题的复杂性吸引了广大参赛选手的关注。
本文将对B题的具体题目内容、解题过程、常见方法和误区进行分析,并结合实例对竞赛结果进行总结,以期为其他参赛同学提供一定的参考。
二、题目分析B题通常关注某一实际领域的复杂问题,涉及多个因素的综合考量。
其要求参赛者通过建立数学模型,解决实际问题。
具体问题包括某个地区的旅游经济预测和资源合理配置。
针对此问题,首先需要对旅游业的各项数据进行详细分析,然后构建适当的数学模型,并使用合适的数学工具和软件进行计算和模拟。
三、解题过程1. 数据收集与分析:收集该地区的历史旅游数据,包括游客数量、消费水平、旅游景点分布等。
同时,分析该地区的经济、文化、交通等影响旅游业的因素。
2. 模型构建:根据收集的数据和实际情况,选择合适的数学模型进行建模。
常见的模型包括时间序列预测模型(如ARIMA 模型)、多元回归模型等。
3. 模型求解与验证:利用数学软件(如MATLAB、SPSS等)对模型进行求解,并对模型的预测结果进行验证。
验证方法包括与历史数据进行对比、进行敏感性分析等。
4. 资源合理配置:根据预测结果和实际情况,制定合理的资源分配方案,如旅游景点的开发策略、交通设施的优化配置等。
四、常见方法与误区1. 常见方法:在建模过程中,应选择合适的数学模型和方法。
对于时间序列预测问题,常用的有ARIMA模型、指数平滑法等;对于多元回归问题,则需要考虑各因素之间的相互关系。
同时,还应充分利用计算机技术进行数据分析和模拟。
2. 误区提示:在建模过程中,要避免陷入一些常见的误区。
例如,过分追求模型的复杂性和精确度而忽视模型的实用性和可解释性;忽视数据的预处理和清洗工作;忽略模型的验证和修正等。
五、实例分析以某次B题竞赛的优秀解决方案为例,详细分析其解题过程和关键点。
大学生数学建模是一项基础性得学科竞赛,可以交流更多得经验,学习更多得知识,所以大学生数学建模很受学者们得欢迎,本篇文章就向大家介绍一些大学生数学建模论文,供给大家作为一个参考。
大学生数学建模论文专业推荐范文10篇之第一篇:数学建模对大学生综合素质影响得调查研究---------------------------------------------------------------------------------------------------------------------感谢使用本套资料,希望本套资料能带给您一些思维上的灵感和帮助,个人建议您可根据实际情况对内容做适当修改和调整,以符合您自己的风格,不太建议完全照抄照搬哦。
---------------------------------------------------------------------------------------------------------------------摘要:文章通过问卷网以调查问卷得形式和线下访谈得方法 ,对笔者所在学校参加过数学建模竞赛得同学和未参加过数学建模竞赛得同学对数学建模对自身综合素质得影响进行了调查研究。
调查表明,大部分学生都能认识到数学建模学习和竞赛对其自身综合素质得提升是有帮助得,但是大多数学生对数学建模得意义认识还不到位。
文章对调查结果进行分析,结合笔者得切身体会对地方高校数学建模课程教学及学生参加竞赛提出某些建议。
关键词:数学建模; 大学生; 综合素质; 研究;一、前言随着社会得不断进步和发展,大学生想要在激烈得人才竞争中脱颖而出,就必须要不断提高自己得综合素质,而良好得综合素质不仅应具有坚实得理论基础,扎实得专业知识,还应该具有较强得创新能力、与他人合作得能力、较强得语言表达能力、以及稳定得心理状态。
许多科学家断言未来科学技术得竞争是数学技术得竞争,这无疑对数学能力提出了更高得要求,不可否认数学建模课程教学及建模竞赛是提升大学生数学能力得有效途径。
1、 血样的分组检验在一个很大的人群中通过血样检验普查某种疾病,假定血样为阳性的先验概率为p(通常p 很小).为减少检验次数,将人群分组,一组人的血样混合在一起化验.当某组的混合血样呈阴性时,即可不经检验就判定该组每个人的血样都为阴性;而当某组的混合血样呈阳性时,则可判定该组至少有一人血样为阳性,于是需要对这组的每个人再作检验.(1)、当p 固定时(如0.01%,…,0.1%,…,1%)如何分组,即多少人一组,可使平均总检验次数最少,与不分组的情况比较. (2)、当p 多大时不应分组检验.(3)、当p 固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序).模型假设与符号约定1 血样检查到为阳性的则患有某种疾病,血样呈阴性时的情况为正常2 血样检验时仅会出现阴性、阳性两种情况,除此之外无其它情况出现,检验血样的药剂灵敏度很高,不会因为血样组数的增大而受影响. 3 阳性血样与阳性血样混合也为阳性 4 阳性血样与阴性血样混合也为阳性 5 阴性血样与阴性血样混合为阴性 n 人群总数 p 先验概率血样阴性的概率q=1-p血样检验为阳性(患有某种疾病)的人数为:z=np 发生概率:x i P i ,,2,1, = 检查次数:x i R i ,,2,1, = 平均总检验次数:∑==xi i i R P N 1解1设分x 组,每组k 人(n 很大,x 能整除n,k=n/x ),混合血样检验x 次.阳性组的概率为k q p -=11,分组时是随机的,而且每个组的血样为阳性的机率是均等的,阳性组数的平均值为1xp ,这些组的成员需逐一检验,平均次数为1kxp ,所以平均检验次数1kxp x N +=,一个人的平均检验次数为N/n,记作:k k p kq k k E )1(1111)(--+=-+=(1) 问题是给定p 求k 使E(k)最小. p 很小时利用kp p k -≈-1)1(可得kp kk E +=1)( (2) 显然2/1-=p k 时E(k)最小.因为K 需为整数,所以应取][2/1-=p k 和1][2/1+=-p k ,2当E (k )>1时,不应分组,即:1)1(11>--+k p k,用数学软件求解得k k p /11-->检查k=2,3,可知当p>0.307不应分组.3将第1次检验的每个阳性组再分y 小组,每小组m 人(y 整除k,m=k/y ).因为第1次阳性组的平均值为1xp ,所以第2次需分小组平均检验1yxp 次,而阳性小组的概率为m q p -=12(为计算2p 简单起见,将第1次所有阳性组合在一起分小组),阳性小组总数的平均值为21yp xp ,这些小组需每人检验,平均检验次数为21yp mxp ,所以平均总检验次数211yp mxp yxp x N ++=,一个人的平均检验次数为N/n,记作(注意:n=kx=myx)p q q q mk p p m p k m k E m k -=-+-+=++=1),1()1(111),(211 (3) 问题是给定p 求k,m 使E (k,m )最小.P 很小时(3)式可简化为21),(kmp mkpk m k E ++≈ (4)对(4)分别对k,m 求导并令其等于零,得方程组:⎪⎪⎩⎪⎪⎨⎧=+-=++-0012222kp m kp mp mp k 舍去负数解可得:2/14/3,21--==p m p k (5)且要求k,m,k/m 均为整数.经在(5)的结果附近计算,比较E(k,m),得到k,m 的最与表1比较可知,二次分组的效果E(k,m)比一次分组的效果E(k)更好.2、铅球掷远问题铅球掷远比赛要求运动员在直径2.135m 的圆内将重7.257kg 的铅球投掷在 45的扇形区域内,建立模型讨论以下问题1.以出手速度、出手角度、出手高度 为参数,建立铅球掷远的数学模型;2.考虑运动员推铅球时用力展臂的动 作,改进以上模型.3.在此基础上,给定出手高度,对于 不同的出手速度,确定最佳出手角度 问题1模型的假设与符号约定1 忽略空气阻力对铅球运动的影响.2 出手速度与出手角度是相互独立的.3 不考虑铅球脱手前的整个阶段的运动状态. v 铅球的出手速度 θ 铅球的出手角度 h 铅球的出手高度 t 铅球的运动时间 L 铅球投掷的距离g 地球的重力加速度(2/8.9s m g=)铅球出手后,由于是在一个竖直平面上运动.我们,以铅球出手点的铅垂方向为y 轴,以y 轴与地面的交点到铅球落地点方向为x 轴构造平面直角坐标系.这样,铅球脱手后的运动路径可用平面直角坐标系表示,如图.因为,铅球出手后,只受重力作用(假设中忽略空气阻力的影响),所以,在x 轴上的加速度0=,在y 轴上的加速度g a y -=.如此,从解析几何角度上,以时间 t 为参数,易求得铅球的运动方程:⎪⎩⎪⎨⎧+-==h gt t v y t v x 221sin cos θθ 对方程组消去参数t ,得h x x v gy ++-=)(tan cos 2222θθ……………………………………………(1) 当铅球落地时,即是0=y ,代入方程(1)解出x 的值v ggh gh v g v x θθθθθ2222sin 22cos sin cos sin 2-++=对以上式子化简后得到铅球的掷远模型θθθ22222cos 22sin 222sin g v h g v g v L +⎪⎪⎭⎫ ⎝⎛+=………………………………(2) 问题2我们观察以上两个阶段,铅球从A 点运动到B 点,其运动状态是匀加速直线运动的,加速距离是2L 段.且出手高度与手臂长及出手角度是有一定的联系,进而合理地细化各个因素对掷远成绩的约束,改进模型Ⅰ.在投掷角度为上进行受力分析,如图(3)由牛顿第二定 律可得,ma mg F =-θsin 再由上式可得,θsin g mFa -=………………………………………(3) 又,22022aL v v =-,即22022aL v v += (4)将(3)代入(4)可得,θsin 2222202g L m FL v v -⎪⎭⎫⎝⎛+= ………………………(5) (5)式进一步说明了,出手速度v 与出手角度θ有关,随着θ的增加而减小.模型Ⅰ假设出手速度与出手角度相互独立是不合理的. 又根据图(2),有θsin 1'L h h += (6)由模型Ⅰ,同理可以得到铅球脱手后运动的距离θθθ22222cos 22sin 222sin g v h g v g v L +⎪⎪⎭⎫ ⎝⎛+= 将 (4)、(5)、(6)式代入上式整理,得到铅球运动的距离()⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎪⎭⎫⎝⎛++++-⎪⎭⎫ ⎝⎛+=θθθθθ22220'2220sin sin 22sin 2112sin 2sin 22g L m FL v h g g g L m FL v L 对上式进行化简:将m=7.257kg,2/8.9s m g = 代入上式,再令m h 60.1'= (我国铅球运动员的平均肩高),代入上式进一步化简得,()⎪⎪⎭⎫ ⎝⎛-++-++⨯θθθθθ2222232222sin sin 6.192756.06.19sin 6.19sin 2756.0sin 1L FL v L FL v ………………(7) 所以,运动员投掷的总成绩θcos 1L L S +=问题3给定出手高度,对于不同的出手速度,要确定最佳的出手角度.显然,是求极值的问题,根据微积分的知识,我们要先求出驻点,首先,模型一中L 对θ求导得,g hv g v g hv v g v d dL θθθθθθθθ22224242cos 82sin sin cos 42cos 2sin 2cos +-+=令0=θd dL,化简后为, 0sin cos 42cos 2sin cos 82sin 2cos 2422242=-++θθθθθθθhgv v hgv v v根据倍角与半角的三角关系,将以上方程转化成关于θ2cos 的方程,然后得,hv g g vgh gh222cos +=+=θ (3)()θθ2sin sin 6.192756.051.0222L FL v L -+=从(3)式可以看出,给定铅球的出手高度h ,出手速度v 变大,相应的最佳出手角度θ也随之变大.对(3)式进行分析,由于0,0>>θh ,所以02cos >θ,则40πθ≤<.所以,最佳出手角度为)arccos(212vgh gh +=θ θ是以π2为周期变化的,当且仅当N k k ∈⎪⎭⎫⎝⎛∈±,4,02ππθ时,πθk 2±为最佳出手角度.特别地,当h=0时(即出手点与落地点在同一高度),最佳出手角度︒=45α3、零件的参数设计粒子分离器某参数(记作y )由7个零件的参数(记作x x 12,,…x 7)决定,经验公式为:y x x x x x x x x x x x =⎛⎝ ⎫⎭⎪-⎛⎝ ⎫⎭⎪⨯--⎛⎝ ⎫⎭⎪⎡⎣⎢⎢⎤⎦⎥⎥⎛⎝ ⎫⎭⎪-17442126210361532108542056324211667......y 的目标值(记作y 0)为1.50。
数学建模论文范文怎么写数学建模论文写作一、写好数模答卷的重要性 1. 评定参赛队的成绩好坏、高低,获奖级别,数模答卷,是唯一依据。
2. 答卷是竞赛活动的成绩结晶的书面形式。
3. 写好答卷的训练,是科技写作的一种基本训练。
二、答卷的基本内容,需要重视的问题 1.评阅原则假设的合理性,建模的创造性,结果的合理性,表述的清晰程度。
2.答卷的文章结构题目(写出较确切的题目;同时要有新意、醒目)摘要(200-300字,包括模型的主要特点、建模方法和主要结论)关键词(求解问题、使用的方法中的重要术语) 1)问题重述。
2)问题分析。
3)模型假设。
4)符号说明。
5)模型的建立(问题分析,公式推导,基本模型,最终或简化模型等)。
6)模型求解(计算方法设计或选择;算法设计或选择,算法思想依据,步骤及实现,计算框图;所采用的软件名称;引用或建立必要的数学命题和定理;求解方案及流程。
) 7)进一步讨论(结果表示、分析与检验,误差分析,模型检验) 8)模型评价(特点,优缺点,改进方法,推广。
)9)参考文献。
10)附录(计算程序,框图;各种求解演算过程,计算中间结果;各种图形,表格。
)3. 要重视的问题 1)摘要。
包括: a. 模型的数学归类(在数学上属于什么类型); b. 建模的思想(思路); c. 算法思想(求解思路); d. 建模特点(模型优点,建模思想或方法,算法特点,结果检验,灵敏度分析,模型检验……); e. 主要结果(数值结果,结论;回答题目所问的全部“问题”)。
▲注意表述:准确、简明、条理清晰、合乎语法、要求符合文章格式。
务必认真校对。
2)问题重述。
3)问题分析。
因素之间的关系、因素与环境之间的关系、因素自身的变化规律、确定研究的方法或模型的类型。
5)模型假设。
根据全国组委会确定的评阅原则,基本假设的合理性很重要。
a. 根据题目中条件作出假设 b.根据题目中要求作出假设关键性假设不能缺;假设要切合题意。
高校数学建模竞赛获奖论文范文赏析(正文开始)在当今的教育体制中,数学建模竞赛作为一项重要的学术竞赛,已经逐渐受到了高校学生的重视。
这一竞赛不仅考察了学生的数学知识和思维能力,同时也鼓励学生动手实践、独立思考和合作交流的能力。
因此,高校数学建模竞赛获奖论文具有一定的学术研究价值和借鉴意义。
本文将选取一篇高校数学建模竞赛获奖论文进行赏析,以期探索优秀论文的写作技巧和论述思路,对广大数学建模竞赛参赛者提供借鉴和参考。
选取的论文题目为《基于XXX模型的高校教学质量评价研究》。
一、引言在引言部分,作者首先介绍了高校教学质量的重要性和当前存在的问题。
随后,论述了研究的目的和意义,明确了本文的研究要点和方法。
值得注意的是,作者通过对前人研究成果的概述,补充了相关理论和实证研究对于本文的支持。
二、理论基础与模型构建在理论基础与模型构建部分,作者详细介绍了相关理论的背景和意义,并为本研究构建了合适的数学模型。
作者在此部分运用了数学符号、公式等来清晰地表达模型的定义和假设,并给出了相应的解释和推导过程。
此外,作者还结合实际情况,灵活运用了图表等可视化工具,提高了论文的可读性和可理解性。
三、实证研究与数据分析在实证研究与数据分析部分,作者描述了研究方法和实证数据的来源与收集方式,并对数据进行了详细的分析和论证。
作者可以运用适当的表格、图表和统计学方法,对数据进行量化和可视化处理,以便读者更加直观地理解分析结果。
同时,作者在此部分还展示了对实证结果的科学解释和讨论,提出了相应的结论和建议。
四、结论与展望在结论与展望部分,作者总结了研究的主要发现和成果,并针对研究中存在的不足之处提出了进一步深入研究的设想和方向。
作者在此部分可以对研究的局限性进行说明,并提出可行的改进和发展方案,以期引起相关领域学者的关注和参与。
综上所述,这篇高校数学建模竞赛获奖论文范文在结构与内容上展现了较高的水平。
文章在介绍研究背景和问题的同时,恰当地引用了相关的理论和实证研究成果,论据充分且有力。
全国大学生数学建模竞赛论文范例摘要:本文通过对具体问题的研究,建立了相应的数学模型,并运用具体方法进行求解和分析。
通过对结果的讨论,得出了具有一定实际意义的结论和建议。
一、问题重述详细阐述所给定的问题,明确问题的背景、条件和要求。
二、问题分析(一)对问题的初步理解对问题进行初步的思考和分析,明确问题的关键所在和需要解决的核心问题。
(二)可能用到的方法和模型根据问题的特点,探讨可能适用的数学方法和模型,如线性规划、微分方程、概率统计等。
三、模型假设(一)假设的合理性说明所做假设的依据和合理性,确保假设不会对问题的解决产生过大的偏差。
(二)具体假设内容列举出主要的假设条件,如忽略某些次要因素、变量之间的关系等。
四、符号说明对文中使用的主要符号进行清晰的定义和说明,以便读者理解。
五、模型建立与求解(一)模型的建立详细阐述模型的构建过程,包括数学公式的推导和逻辑关系的建立。
(二)模型的求解运用适当的数学软件或方法对模型进行求解,给出求解的步骤和结果。
六、结果分析(一)结果的合理性对求解得到的结果进行合理性分析,判断其是否符合实际情况。
(二)结果的敏感性分析探讨模型中某些参数或条件的变化对结果的影响。
七、模型的评价与改进(一)模型的优点总结模型的优点,如准确性、简洁性、实用性等。
(二)模型的不足分析模型存在的不足之处,如局限性、假设的不合理性等。
(三)改进的方向针对模型的不足,提出可能的改进方向和方法。
八、结论与建议(一)结论总结问题的解决结果,明确回答问题的核心要点。
(二)建议根据结论,提出具有实际意义的建议和措施,为相关决策提供参考。
以下是一个具体的示例,假设我们要解决一个关于交通流量优化的问题。
问题重述在某城市的一个交通路口,每天早晚高峰时段都会出现严重的交通拥堵。
现需要建立数学模型,优化信号灯的设置时间,以提高交通流量,减少拥堵。
问题分析首先,我们需要收集该路口的交通流量数据,包括不同时间段各个方向的车辆数量。
2007年北京工业大学数学建模竞赛初赛试题B题:化验结果的处理题解摘要:本文运用了距离判别和Fisher判别两种方法对问题进行分析求解,得出了我们想要的结论,即通过体内元素含量较准确的判别个体是否患有肾炎。
1、问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。
表是就诊人员的化验结果。
我们的问题是:1)根据表中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2)按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
3)能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4)根据3的结果,重复2的工作。
5)对2和4的结果作进一步的分析。
(表见附录)2、问题分析1)题目中表.1中给出了已经确诊为肾炎病人和健康人的各30组数据;2)每一组数据都有七个数,分别代表了Zn,Cu,Fe,Ca,Mg,K,Na在每个人体内的量;3)第一问要求我们提出判别一个人属于患者还是健康人的方法,这就需要通过对60组数据的分析得出健康人和肾炎患者体中这些元素量之差异,这些差异的大小又同时是解决第三问的主要影响因素;4)在寻找数据的差异时,我们用到的传统方法就是求数据的方差和均值,用excel列表分析,用matlab作直方图分析。
5)第二问最可靠的方法就是用判别分析来做,这就需要在R软件中进行一些必要的编程和处理;6)第四问是建立在第三问的基础上的;当解决了第三问中到底是那些因素影响到了人们患肾炎的关键时,只需要在那些主要因素中进行判断就可以省去一些复杂繁琐的步骤;7)将以上问题都解决之后,我们使用和步骤5)相同的方法,使用R软件帮助我们高效地对精简后的数据进行再次分析,并且把第二问和第四问的结果之间进行比较,观察差异和详细的分析。
2007年北京工业大学数学建模竞赛初赛试题B题:化验结果的处理题解摘要:本文运用了距离判别和Fisher判别两种方法对问题进行分析求解,得出了我们想要的结论,即通过体内元素含量较准确的判别个体是否患有肾炎。
1、问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。
表B.2是就诊人员的化验结果。
我们的问题是:1根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她们是肾炎病人还是健康人。
3能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4根据3的结果,重复2的工作。
5对2和4的结果作进一步的分析。
(表见附录2、问题分析1题目中表.1中给出了已经确诊为肾炎病人和健康人的各30组数据;2每一组数据都有七个数,分别代表了Zn, Cu, Fe, Ca, Mg, K, Na在每个人体内的量;3第一问要求我们提出判别一个人属于患者还是健康人的方法,这就需要通过对60组数据的分析得出健康人和肾炎患者体中这些元素量之差异,这些差异的大小又同时是解决第三问的主要影响因素;4在寻找数据的差异时,我们用到的传统方法就是求数据的方差和均值,用excel 列表分析,用matlab作直方图分析。
5第二问最可靠的方法就是用判别分析来做,这就需要在R软件中进行一些必要的编程和处理;6第四问是建立在第三问的基础上的;当解决了第三问中到底是那些因素影响到了人们患肾炎的关键时,只需要在那些主要因素中进行判断就可以省去一些复杂繁琐的步骤;7将以上问题都解决之后,我们使用和步骤5相同的方法,使用R软件帮助我们高效地对精简后的数据进行再次分析,并且把第二问和第四问的结果之间进行比较,观察差异和详细的分析。
8为了进一步验证我们这种做法的合理性,我们又要用C语言编一个程序,把表B2中的数据与4中所求出各元素的均值进行比较,进行了一下直观的分析。
3.符号约定后缀为1:患者体内元素的含量(例如:Zn1代表患者体内Zn的含量;后缀为2:健康人体内元素的含量(例如:Zn2代表健康人体内Zn 的含量; 1:患者; 2:健康人;4.模型假设1 题中所给的内容和数据都是真实可信的;2 除了表中列出的元素外,其他元素对是否会患肾炎的影响很小;3 外界条件对肾炎患者的影响不计;4 没病的个体都是健康体。
5.模型建立该问题的关键是如何判断一个人是有病的还是健康的,即这是个判别问题,可以采用统计方法中的判别分析法进行分析处理。
题目中只有两类——病体和健康体,所以可采用二类群体的判别方法。
首先考虑用一种简单而直观的判别方法——Mahalanobis 距离判别。
根据两个母体样本计算出他们的均值向量和协方差阵,求取待测样本x 对两个样本的Mahalanobis 距离,二者取差值,判断离那个母体近似。
设x,y 是从均值为μ,协方差阵为Σ的总体A 中抽取的样本,则总体A 内两点x与y 的Mahalanobis 距离定义为(,d x y =.定义样本x 与A 的Mahalanobis 距离为(,d x A =值向量和协方差阵来代替:设(11x ,(12x , (11n x 是来自母体A 的1n 个样本,(21x ,(22x ,……(22n x是来自母体A 的2n 个样本,则样本的均值与协方差为( (11,1,2,in i i i jj ixxi n μ∧====∑,212111212in i j S S n n ∧==∑=++-∑∑,(( ((1((,1,2.in i i i i Ti jj j S xxx xi ==--=∑对于待测样本x ,如果两个母体样本的协方差相同,由22 (,(,d x B d x A -得到判别函数为1(1(2(((T x x x xxω∧-=-∑-,其中(1(22x x x +=,其判别准则是,(0,,(0.A x x B x ωω∧∧⎧≥⎪∈⎨⎪≥⎩。
如果两个母体样本协方差不同,即1212,μμ≠∑≠∑,对于样本x 判别函数定义为:11(2(2(1(121(((((TTx x xx xx xx xω--∧∧∧=-----∑∑,((((111((,1,21 1in i i i i T j j i ij i i x xx xS i n n ∧==--==--∑∑。
其次考虑用另外一种方法求取解决办法——Fisher 判别法,即按类内方差尽量小,类间方差尽量大的准则来求判断函数。
设两个总体A 、B 的均值和协方差阵分别是1μ、2μ和1∑、2∑,对任一测样本x ,设它的判别函数为(u u x =,并假设11((,((u E u x x A u E u x B =∈=,2212((,((Var u x x A Var u x B σσ=∈=,使(u x 满足类内偏差平方和22012W σσ=+最小,而类间偏差平方和22012((B u u u u =-+-最大,其中121(2u u u =+。
即(u x 要满足00B I W =最大,若12((u x u u x u -≤-,则x A ∈,否则x B ∈。
通过推导得出判别函数T 1u(x=d (S x x --,其中2(((11111,,1,2ii n n i ii jj i j j ix x xxi nn ======∑∑∑,((( (1 ((,1,2in i i i i T i jjj S xxi xx==--=∑,当(0u x ≤,x A ∈,否则x B ∈。
6.模型求解利用模型求解时通过R 软件将以上两种算法编写成程序代码,通过手动输入样本,利用计算机进行求解,程序清单如下: Mahalanobis 距离判别:A<-matrix(c(166,15.8,24.5,700,112,179,513,185,15.7,31.5,701,125,184,427,193,9.80,25.9,54 1,163,128,642,159,14.2,39.7,896,99.2,239,726,226,16.2,23.8,606,152,70.3,218,171,9.29, 9.29,307,187,45.5,257,201,13.3,26.6,551,101,49.4,141,147,14.5,30.0,659,102,154,680,17 2,8.85,7.86,551,75.7,98.4,318,156,11.5,32.5,639,107,103,552,132,15.9,17.7,578,92.4,131 4,1372,182,11.3,11.3,767,111,264,672,186,9.26,37.1,958,233,73.0,347,162,8.23,27.1,625 ,108,62.4,465,150,6.63,21.0,627,140,179,639,159,10.7,11.7,612,190,98.5,390,117,16.1,7. 04,988,95.5,136,572,181,10.1,4.04,1437,184,101,542,146,20.7,23.8,1232,128,150,1092,4 2.3,10.3,9.70,629,93.7,439,888,28.2,12.4,53.1,370,44.1,454,852,154,13.8,53.3,621,105,1 60,723,179,12.2,17.9,1139,150,45.2,218,13.5,3.36,16.8,135,32.6,51.6,182,175,5.84,24.9, 807,123,55.6,126,113,15.8,47.3,626,53.6,168,627,50.5,11.6,6.30,608,58.9,58.9,139,78.6, 14.6,9.70,421,70.8,133,464,90.0,3.27,8.17,622,52.3,770,852,178,28.8,32.4,992,112,70.2, 169,ncol=7, byrow=TB<-matrix(c(213,19.1,36.2,2220,249,40.0,168,170,13.9,29.8,1285,226,47.9,330,162,13.2,19. 8,1521,166,36.2,133,203,13.0,90.8,1544,162,98.90,394,167,13.1,14.1,2278,212,46.3,134, 164,12.9,18.6,2993,197,36.3,94.5,167,15.0,27.0,2056,260,64.6,237,158,14.4,37.0,1025,1 01,44.6,72.5,133,22.8,31.0,1633,401,180,899,156,135,322,6747,1090,228,810,169,8.00,3 08,1068,99.1,53.0,289,247,17.3,8.65,2554,241,77.9,373,166,8.10,62.8,1233,252,134,649, 209,6.43,86.9,2157,288,74.0,219,182,6.49,61.7,3870,432,143,367,235,15.6,23.4,1806,166,68.8,188,173,19.1,17.0,2497,295,65.8,287,151,19.7,64.2,2031,403,182,874,191,65.4,35 .0,5361,392,137,688,223,24.4,86.0,3603,353,97.7,479,221,20.1,155,3172,368,150,739,217,25.0,28.2,2343,373,110,494,16 4,22.2,35.5,2212,281,153,549,173,8.99,36.0,1624,216,103,257,202,18.6,17.7,3785,225,3 1.0,67.3,182,17.3,24.8,3073,246,50.7,109,211,24.0,17.0,3836,428,73.5,351,246,21.5,93.2 ,2112,354,71.7,195,164,16.1,38.0,2135,152,64.3,240,179,21.0,35.0,1560,226,47.9,330,nc ol=7,byrow=TX<-matrix(c(58.2,5.42,29.7,323,138,179,513,106,1.87,40.5,542,177,184,427,152,0.80,12.5,1 332,176,128,646,85.5,1.70,3.99,503,62.3,238,762.6,144,0.70,15.1,547,79.7,71.0,218.5,85 .7,1.09,4.2,790,170,45.8,257.9,144,0.30,9.11,417,552,49.5,141.5,170,4.16,9.32,943,260,1 55,680.8,176,0.57,27.3,318,133,99.4,318.8,192,7.06,32.9,1969,343,103,553,188,8.28,22. 6,1208,231,1314,1372,153,5.87,34.8,328,163,264,672.5,143,2.84,15.7,265,123,73.0,347. 5,213,19.1,36.2,2220,249,62.0,465.8,192,20.1,23.8,1606,156,40.0,168,171,10.5,30.5,672, 145,47.0,330.5,162,13.2,19.8,1521,166,36.2,133,203,13.0,90.8,1544,162,98.9,394.5,164, 20.1,28.9,1062,161,47.3,134.5,167,13.1,14.1,2278,212,36.5,96.5,164,12.9,18.6,2993,197, 65.5,237.8,167,15.0,27.0,2056,260,44.8,72.0,158,14.4,37.0,1025,101,180,899.5,133,22.8, 31.3,1633,401,228,289,169,8.0,30.8,1068,99.1,53.0,817,247,17.3,8.65,2554,241,77.5,373 .5,185,3.90,31.3,1211,190,134,649.8,209,6.43,86.9,2157,288,74.0,219.8,182,6.49,61.7,38 70,432,143,367.5,235,15.6,23.4,1806,166,68.9,188,ncol=7, byrow=Tdiscri1<-function(TrnA,TrnB,TstX=NULL,var.equal=FALSE{ //*TrnA,TrnB,TstX 分别为有病,健康和待测得样本,var.equal 缺省值为FALSE ,意思是以样本TrnA为参考if (is.null(TstX == TRUETstX<-rbind(TrnA,TrnB nx<-nrow(TstX; blong<-array(0, c(nx //*把待测样本数(30给nx ,建立一个向量值为0的1行30列的矩阵Ab<-apply(TrnA,2,mean; Bb<-apply(TrnB,2,mean //Ab 为1行7列的矩阵,列向量为TrnA 矩阵对应列的所有数的均值,Bb 同理if (var.equal == TRUE || var.equal == T{ //两个样本的协方差相等时 S<-var(rbind(TrnA,TrnB; Xb<-(Ab+Bb/2//计算212111212in i j S S n n ∧==∑=++-∑∑,((((1((,1,2.in i i i i Ti jj j S xxx xi ==--=∑for (i in 1:nx{w<-(TstX[i,]-Xb %*% solve(S, Ab-Bb; //得到判别函数值 if (w>0 blong[i]<-1 //待测体有病 elseblong[i]<-2 //待测体没病}}else{Sa<-var(TrnA; Sb<-var(TrnB; //两个样本的协方差不等时for (i in 1:nx{y<-TstX[i,]-Ab; z<-TstX[i,]-Bbw=z %*% solve(Sb, z - y %*% solve(Sa, y //得到判别函数值if (w>0blong[i]<-1elseblong[i]<-2}}blong}discri1(A,B,XFisher判别:A<-matrix(c(166,15.8,24.5,700,112,179,513,185,15.7,31.5,701,125,184,427,193,9.8 0,25.9,541,163,128,642,159,14.2,39.7,896,99.2,239,726,226,16.2,23.8,606,152,70.3,218,171,9.29,9.29,307,187,45.5,257,201,13.3,26.6,551,101,49.4,141,147,14.5,30.0,659,102,154,680,172,8.85,7.86,551,75.7,98.4,318,156,11.5,32.5,639,107,103,552,132,15.9,17.7,578,92.4,1314,1372,182,11.3,11.3,767,111,264,672,186,9.26,37.1,958,233,73.0,347,162,8.23,27.1,625,108,62.4,465,150,6.63,21.0,627,140 ,179,63 9,159,10.7,11.7,612,190,98.5,390,117,16.1,7.04,988,95.5,136,572,181,10 .1,4.04,1437,18 4,101,542,146,20.7,23.8,1232,128,150,1092,42.3,10.3,9.70,629,93.7,439,888,28.2,12.4,53.1,370,44.1,454,852,154,13.8,53.3,621,105,160,723,179 ,12.2,17 .9,1139,150,45.2,218,13.5,3.36,16.8,135,32.6,51.6,182,175,5.84,24.9,807,123,55.6,126,113,15.8,47.3,626,53.6,168,627,50.5,11.6,6.30,608,58.9,58.9,139,78.6,14.6,9.70,421,70.8,133,464,90.0,3.27,8.17,622,52.3,770,852,178,28.8,32.4,992,112,70.2,169,ncol=7, byrow=TB<-matrix(c(213,19.1,36.2,2220,249,40.0,168,170,13.9,29.8,1285,226,47.9,330,162 ,13.2,19. 8,1521,166,36.2,133,203,13.0,90.8,1544,162,98.90,394,167,13.1,14.1,2278,212,46.3,134,164,12.9,18.6,2993,197,36.3,94.5,167,15.0,27.0,2056,260,64.6 ,237,15 8,14.4,37.0,1025,101,44.6,72.5,133,22.8,31.0,1633,401,180,899,156,135,322,6747,1090,228,810,169,8.00,308,1068,99.1,53.0,289,247,17.3,8.65,2554,241,77.9,373,166,8.10,62.8,1233,252,134,649,209,6.43,86.9,2157,288,74.0,219,182,6 .49,61. 7,3870,432,143,367,235,15.6,23.4,1806,166,68.8,188,173,19.1,17.0,2497,295,65.8,287,151,19.7,64.2,2031,403,182,874,191,65.4,35.0,5361,392,137,688,223,24.4,86.0,3603,353,97.7,479,221,20.1,155,3172,368,150,739,217,25.0,28.2,2343,373,110,494,164,22.2,35.5,2212,281,153,549,173,8.99,36.0,1624,216,103,257,202,18.6,17.7,3785,225,31.0,67.3,182,17.3,24.8,3073,246,50.7,109,211,24.0,17.0 ,3836,42 8,73.5,351,246,21.5,93.2,2112,354,71.7,195,164,16.1,38.0,2135,152,64.3,240,179,21.0,35.0,1560,226,47.9,330,ncol=7,byrow=TX<-matrix(c(58.2,5.42,29.7,323,138,179,513,106,1.87,40.5,542,177,184,427,152,0. 80,12.5,1332,176,128,646,85.5,1.70,3.99,503,62.3,238,762.6,144,0.70,15.1,547,79.7,71.0,218.5,85.7,1.09,4.2,790,170,45.8,257.9,144,0.30,9.11,417,552,49.5,141.5,170,4.16,9.32,943,260,155,680.8,176,0.57,27.3,318,133,99.4,318.8,192,7.06,32.9,1969,343,103,553,188,8.28,22.6,1208,231,1314,1372,153,5.87,34.8,328,163,264,672.5,143,2.84,15.7,265,123,73.0,347.5,213,19.1,36.2,2220,249,62.0,465.8,192,20.1,23.8,1606,156,40.0,168,171,10.5,30.5,672,145,47.0,330.5,162,13.2,19.8,1521,166,36.2,133,203,13.0,90.8,1544,162,98.9,394.5,164,20.1,28.9,1062,161,47.3,134.5,167,13.1,14.1,2278,212,36.5,96.5,164,12.9,18.6,2993,197,65.5,237 .8,167,1 5.0,27.0,2056,260,44.8,72.0,158,14.4,37.0,1025,101,180,899.5,133,22.8 ,31.3,1633,401,2 28,289,169,8.0,30.8,1068,99.1,53.0,817,247,17.3,8.65,2554,241 ,77.5,373.5,185,3.90,31.3,1211,190,134,649.8,209,6.43,86.9,2157,288,74.0,219.8,182,6.49,61.7,3870,432,143,367.5,235,15.6,23.4,1806,166,68.9,188,ncol=7, byrow=T discri2<-function(TrnA,TrnB,TstX=NULL{if(is.null(TstX==TRUETstX<-rbind(TrnA,TrnBnx<-nrow(TstX;blong<-array(0,c(nxna<-nrow(TrnA;nb<-nrow(TrnBAb<-apply(TrnA,2,mean;Bb<-apply(TrnB,2,meanS<-(na-1*var(TrnA+(nb-1*var(TrnBxb<-na/(na+nb*Ab+nb/(na+nb*Bbfor(i in 1:nx{w<-(TstX[i,]-xb%*%solve(S,Bb-Ab;if(w<=0blong[i]<-1elseblong[i]<-2}blong}discri2(A,B,X7.模型结果及分析Mahalanobis距离判别法结果:1 12 1 2 1 2 2 2 2 1 1 2 2 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2Fisher判别:1 12 1 1 1 2 1 1 2 1 1 1 2 1 1 2 2 1 2 2 2 1 2 1 2 2 2 2 2通过结果可以看出这两种方法得到的结果基本一致,但存在一定的误差,对结果有出入的个体应进行进一步的检查,以达到确诊的目的。