肾炎诊断问题分析数学建模
- 格式:docx
- 大小:504.05 KB
- 文档页数:64
关于肾炎诊断问题的优化分析摘要:由题目我们知道,在诊断肾炎的时候可以通过化验体内的一些化学元素量的多少来得到准确的判别结果。
本论文由此对医院诊断肾炎病人的过程中,如何利用有效的判别准则对就诊人员进行诊断,建立了统计回归模型,最终得到了判别准则。
我们对1~60号病例进行统计处理:对七种化学元素随机分为1、2、3、4、5、6、7七个等级,利用MATLAB编程求解出各种情况下各个化学元素的权重值,然后权重与化学元素量相乘,计算出每个病例的化学元素总量的值。
在各种情况下,总和与前30号为患者,31~60为非患者比较,以此确定出最优的权重赋予值。
再由隶属度函数(大型柯西分布和对数函数)确定各元素的权重。
权重确定以后,用线性加权函数作为综合评价模型,对n个系统进行判别。
并通过随机代入已确诊的病例来检验模型的准确性。
问题一得到解决。
将表格2中的数据带入到上述的模型,判别出15名是健康者,15名是患者。
对于问题三,我们由第一问中,求出来的权重大小来判定哪些指标是影响人们患肾炎的主要因素。
找到系数显著性最小三种元素,分别为Na,Zn,K;我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比较从而确定主要影响元素。
保留了Ca,Cu,Fe,Mg 四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。
对比问题二、四的结果,我们发现两者的结果基本相同。
这说明,在所给的因素中,有一些是小作用因素,可以忽略不计。
如此,便可大大节约诊断的时间、人力、财力。
关键字:MATLAB、全样本对比取优法、线性加权法、样本检验法问题重述人体的病变和人体内各元素含量的变化密切相关,人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。
数学建模论文化验结果的处理Modified by JEEP on December 26th, 2020.A题化验结果的处理本组成员:10数本一数学与应用数学俞子骏10数本一数学与应用数学林文涛10化工本二化学工程与工艺过武厚指导老师:杨云苏化验结果的处理摘要本文要解决的问题是如何根据检测人员体内各种元素的含量,判别检测人员是否患有肾炎,并找出影响人们是否患有肾炎的主要元素,以便减少化验的指标。
我们建立了BP神经网络模型来判别检测人员是否患有肾炎,并建立了Fisher判别模型找出影响人们患有肾炎的主要元素。
我们将1-30号肾炎患者作为总体A,把患病者记为1;将31-60号健康人作为总体1A,把健康者记为0。
由题意我们建立了BP神经网络模型来验证1-60号检测人员的健康2状况,将其结果与实际情况对比,得出这种模型的准确度高达%,较好的实现了对是否患有肾炎病的判断。
在问题二中,我们利用了BP神经网络模型对61-90号就诊人员是否患病进行了判断,得出结果:病历号为61、62、63、64、65、66、67、68、69、71、72、73、76、79、82、83、84、85、87的就诊人员为肾炎患者;病历号为70、74、75、77、78、80、81、86、88、89、90的就诊人员为健康人。
我们利用Fisher判别模型求解问题三时,计算出()221xxC+⨯的结果,可以得出各项指标对结果影响进行排序为K,Zn,Fe,Na,Mg,Cu,Ca,按照这个顺序依次对K,Zn,Fe,Na,Mg,Cu,Ca进行剔除,由准确度可以判断Mg,Cu,Ca,Na是影响人们患肾炎的主要元素。
问题四中,我们把影响人们患肾炎的主要元素作为指标,重复了问题二的步骤,得到的结果与问题二的结果进行对比分析后,发现检验出来的结果变化很小,问题四中的确诊结果与问题二中的确诊结果基本相同,只是在问题二中被判断为肾炎患者的67、82、84号检验人员在问题四种被诊断为健康人。
题目:疾病确诊问题的实证研究【摘要】人们到医院就诊时,其是否患肾炎一般要通过化验人体内各种元素的含量来协助医生的诊断。
为了更好地解决实际问题,我们建立了logistic回归模型、决策树模型以及判别分析。
logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率等。
本文中通过题设给出的两组人体内各种元素的含量,一组是有肾炎组,一组是非肾炎组,这里的因变量就是是否有肾炎,即“是”或“否”,为两分类变量,自变量包括a,CZn,,通过logistic回归分析,就可以大致了解到Fe,K,u NMg,Ca,底哪些因素是判定肾炎的关键因子。
决策树是一种倒立的树结构,它由内部节点、叶子节点和边组成。
构造决策树的目的是找出属性和类别间的关系,一旦这种关系找出,就能用它来预测将来未知类别的记录的类别。
判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
【关键字】Logistic回归、决策树、多元统计分析、判别分析1、问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。
表2是就诊人员的化验结果。
需要解决的问题:(1)、根据表1中的数据,给出一种或多种简便的判别方法,判别是否属于肾炎患者的方法,并检验你的方法的正确性;(2)、按照(1) 中给出的方法,对表2中的30名就诊人员的化验结果进行判别,判定他们是否肾炎病人;(3)、能否根据表1的数据特征,确定哪些指标是关系到人们患肾炎的主要或关键因素,以便减少化验的指标;(4)、根据(3) 中的结果,重复(2) 的工作;(5)、对(2) 和(4) 的结果作进一步的分析。
肾炎诊断的数学模型摘要本题讨论的问题是关于肾炎监测指标的分析,我们首先对数据从整体上用求单项均值的方法进行了预处理,随后建立起以下三种模型。
针对问题一,我们共用了两种模型。
首先建立起Binary Logistic回归模型,得到回归方程(见5.1.2式子 (1.1)),并得出该表达式的相关系数R =0.82378902。
在假设检验中利用Excel经过F检测得出检验的临界值为-11,该值远小于显著水平0.05,从而验证了该方法的正确性,最7.3656910后用回代法得出正确率为93.33%。
我们的第二种模型是费希尔判别模型,该模型得出的正确率也为93.33%。
两种模型正确率相同,均可以作为判别属于患者或健康人的方法。
针对问题二,我们利用问题一中两种模型得出的公式将待测30组数据代入,得出结果均为:15个为肾炎患者,15个为健康人。
(详细结果见附录三)针对问题三,我们也建立了两种模型。
首先建立多元线性回归模型,利用Excel的6SQ软件,得出了各项元素的显著性水平。
根据显著性依次剔除了式子中的部分元素并用回代法进行了相关性检验。
最终得出结论为剔除Na、Zn、K时所得模型最优,得到回归方程(见7.1.2式子(1.2)),并求出回归系数R=0.809870029,标准误差为0.306346745,回代后准确率为93.33%,误判为第32,33,38,60号。
同时用主成分分析法结合费希尔判别模型得出误判结果相同。
针对问题四,我们利用问题三中两种方法得出的公式分别将待测30组数据代入,得出结果:线性回归法有14个肾炎患者,16个健康人。
成分分析法有13个肾炎患者,17个健康人。
(详细结果见附录四)针对问题五,我们将问题二和四的结果进行比较发现差别在于68,71,77号。
无论是何种模型和方法最终分析得出结论:由于诊断准确率基本不变,减少了三种元素Na、Zn、K的检测,则诊断效率大大提高而且为病人节约了成本和时间,所以问题二方法比问题四方法更优。
肾炎诊断的数学模型科院4组杨海鹏刘备刘栋摘要本文研究的是通过人体内各种元素含量来判断就诊人员是否患有肾炎的问题。
首先我们将收集的数据分为两组进行抽样调查,其中肾炎患者视为实验组,正常人视对照组,运用SPSS软件对数据进行处理,建立Fisher判别模型。
对于问题一、二:分析相关数据,运用Fisher判别法建立判别模型。
对数据运用软件SPSS进行Fisher判别处理,得到相应的判别函数和判别函数的监界值,通过马氏判别法对模型有效性检验,数据正则相关性达到0.811,判断正确度达90%。
然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人11名,肾炎患者19名。
对于问题三、四:通过实验组与对照组中各相同元素的对比及相关分析,剔除一些对诊断结果影响不大的元素,重新运用Fisher判别法及SPSS软件建立新的优化判别模型。
通过马氏判别法对模型有效性检验,数据正则相关性达到0.708,判断正确度达90%。
然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人10名,肾炎患者20名。
对于问题五:对二、四问结果作进一步分析,所判断的结果基本相同。
这说明所给的元素指标中有些对总体判断不大,属于小因素。
相比之下剔除后判别更有说服性,确定了Zn、Fe、Ca、Mg为判别肾炎的重要指标。
关键字:fisher判别法;多元统计分析;马氏距离检验;1. 问题重述1.1问题的简单提要:人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。
表B.2是就诊人员的化验结果。
1.2本文需要解决的问题:1)根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性;2)按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人;3)能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标;4)根据3的结果,重复2的工作;5)对2和4的结果作进一步的分析。
肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。
为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher 判别模型找出影响人们患肾炎的主要因素。
对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了93.33%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。
用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。
两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。
对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。
发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到93.3%,将Na 剔除以后准确度变为90.0%,所以我们认为Na,Mg,Cu,Ca的含量是影响人们患肾炎的关键因素。
对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。
对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。
关于肾炎诊断的数据分析方法摘要肾炎是一种比较常见的疾病,早期症状常不明显,容易被忽略,发展到晚期可引起肾功能衰竭,严重威胁病人的健康和生命,是引起肾功能衰竭最常见的原因,必须早发现早治疗。
本文就肾炎病人和健康人的化验结果进行处理,是否患有肾炎与就诊者体内微量元素的含量有关,科学的判定方法可以及时对就诊者的身体情况给予正确的判定.本文根据附件所给数据,就此分析就诊者体内Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素含量,说明影响肾炎的主要元素。
并由此建立模型确定元素的影响程度。
最后评价模型,分析如何更实际的判断是否患有肾炎。
对于问题1,我们采用Logistic 回归方程()011....1qk k q e p q x x eβββ==++++,求出7中元素在对人体中是否患有肾炎时健康概率。
分析模型计算出其健康概率,再与概率值0.5 比较,即可以判断就诊者是否患有肾炎.若p <0.5,则表明就诊者患有肾炎,否则,就表明就诊者健康.对于问题2,我们采用马氏距离判别法是将表B.1中的结果分为肾炎病人A 组和健康人B 组,化验结果j c 是一个p 维的样品,这里定义(,),(,)D c A D c B 为样品c 到A 组、B 组的距离,这样通过比较(,),(,)D c A D c B 两值的大小就可以判断样品c 是属于A 组还是B 组;样品c 到A 组和B 组的马氏距离分别为:11111222(,)()(),(,)()()D c A c c D c B c c μμμμ--'=--'=--∑∑;其中,1212μμ∑∑,,,分别为总体A 和B 的均值和协方差。
则判别函数y 为:11112212()(,)(,)()()()();y x D c A D c B c c c c μμμμ--=-''=-----∑∑当()0y x <时,样品c 靠近A ,c 属于A ;当()0y x >时,样品c 靠近B ,c 属于B 。
2007年北京工业大学数学建模竞赛初赛试题B题:化验结果的处理题解摘要:本文运用了距离判别和Fisher判别两种方法对问题进行分析求解,得出了我们想要的结论,即通过体内元素含量较准确的判别个体是否患有肾炎。
1、问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。
表是就诊人员的化验结果。
我们的问题是:1)根据表中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2)按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
3)能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4)根据3的结果,重复2的工作。
5)对2和4的结果作进一步的分析。
(表见附录)2、问题分析1)题目中表.1中给出了已经确诊为肾炎病人和健康人的各30组数据;2)每一组数据都有七个数,分别代表了Zn,Cu,Fe,Ca,Mg,K,Na在每个人体内的量;3)第一问要求我们提出判别一个人属于患者还是健康人的方法,这就需要通过对60组数据的分析得出健康人和肾炎患者体中这些元素量之差异,这些差异的大小又同时是解决第三问的主要影响因素;4)在寻找数据的差异时,我们用到的传统方法就是求数据的方差和均值,用excel列表分析,用matlab作直方图分析。
5)第二问最可靠的方法就是用判别分析来做,这就需要在R软件中进行一些必要的编程和处理;6)第四问是建立在第三问的基础上的;当解决了第三问中到底是那些因素影响到了人们患肾炎的关键时,只需要在那些主要因素中进行判断就可以省去一些复杂繁琐的步骤;7)将以上问题都解决之后,我们使用和步骤5)相同的方法,使用R软件帮助我们高效地对精简后的数据进行再次分析,并且把第二问和第四问的结果之间进行比较,观察差异和详细的分析。
肾炎的诊断摘要一、问题重述1.1 问题背景到医院就诊的时候,一般都要进行血检,尿检等化验,通过化验某些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常就要化验人体内各种元素的含量。
通过各种相关元素的含量,医生可以初步鉴别就诊人员是否患有肾炎。
现有某医院某些肾炎病例的化验结果,表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。
表B.2是就诊人员的化验结果。
1.2 需要解决的问题题目中的附录给出了确诊病例的化验结果和就诊人员的化验结果,根据这些信息,我们需要通过采用数学建模的方法来帮助解决一下问题:问题一:根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
问题二:按照问题一提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
问题三:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
问题四:根据问题三的结果,重复问题二的工作。
问题五:对问题二和问题四的结果作进一步的分析。
二、问题分析题目中给出了部分确诊病例的化验结果,其中包括了患者和健康人的化验结果。
通过分析这些数据,我们得到了一些相关的信息。
初步分析可知这是一个判别类型的问题,在医学上是一个诊断问题,它的结果有两种,即肾炎病人和健康人,其中影响是否得肾炎的因素有很多,我们要综合考虑这些影响因素,建立评估体系。
2.1问题一的分析根据诊断结果只有两种(是或否)和有多种影响因素,在了解logistic 回归分析的相关功能的基础之上,我们采用了Logistic 回归模型。
假设肾炎病人为 0,健康为1,变量为y,定义了一种概率函数π,其中()11221/,,......,n n p Y X x X x X x π=====在此问题中()()11log 11n y n y ππ≠-⎛⎫≈=⎪=⎝⎭,其中n 是事件发生的次数。
肾炎的诊断摘要本文研究的问题是通过检测人体内各种元素的含量,来诊断就诊人员是否患有肾炎。
我们首先将健康的和患病的人群的体内的相关元素的平均值用∑====B 301)0,1;7,...,2,1(301i ij iy y i x 计算出来,发现体内的元素含量的确和患病有必然的联系。
我们再利用Excel 软件中的logistic 模型对样本做了具体的分析。
( logistic 模型被广泛应用于病理学中,被作为病理学研究的常用模型) 发现各元素的含量与是否患有肾炎之间的确有一定关联,属于线性回归问题。
接着,计算出该线性方程的常量和系数从而完成模型的初步建立。
对于问题一,我们取1-60号为样本,建立线性回归模型,ii ii x b x b x b b x b x b x b b e e p +++++++++= (22110221101)以各元素的含量(1,2,3,4,5,6,7)i x i =为自变量,是否患有肾炎为因变量,用y 表示,当1y =时,表示患有肾炎;当0y =时,表示健康。
然后利用回归统计表、方差分析表、回归参数表中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好。
对60例受检者的数据进行判别,若p 大于0.5则判定为患病,若小于0.5则判定为健康。
结果正确率为93.33%。
对于问题二,我们利用问题一中建立的优化模型进行检验,将待诊断的30个病例中各元素的含量代入模型一中,计算出对应的p 值,然后和0.5进行比较,通过对数据分析处理:检验出61、62、64、65、66、68、69、71、72、73、75、76、79、83、85 号就诊人员患有肾炎;63、67、70、74、77、78、80、81、82、84、86、87、88、89、90 号就诊人员是健康的。
对于问题三,由问题一知,这七种元素的回归系数显著性由高到低顺序依次为Ca,Cu,Fe,Mg,Na,Zn,K 。
医学肾炎化验分析模型摘要此数学模型的建立主要是为了解决这样的问题,通过检测人体内相关微量元素的含量来判定一个人是否患肾炎。
因而在此数学模型中,自变量为体内若干种微量元素的含量,因变量作为判定一个人是否患病的主要数据,做如下设定,当被确诊为患病时,设为1,被确诊为健康时,设为0.我们通过对数据的基本分析和判别,试图通过线性回归模型解决这个问题,经过查阅相关资料,了解到logistic模型被广泛应用于病理学研究中作为研究模型,于是利用excel中的回归工具建立logistic回归模型,计算出该线性方程的常量和系数从而完成模型的初步建立。
然后利用回归统计表、方差分析表中、回归参数表等中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好,又通过将表1和表2中已确诊的数据代入,对60例受检者的数据进行判别,若大于0.5则判定为患病,若小于0.5则判定为健康。
对应的logit(p/(1-p))为正数时候患病,为负数时为健康。
发现该模型在本题判断中的正确率高达93.33%,预测能力显著。
诊断待测病人,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有15人健康,15人患病的结论。
回归参数表中回归系数的统计量的线性系数显著性t值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度。
因此以此为衡量的标准来筛选7项相关因素,找到系数显著性最小三种元素,分别为Na,Zn,K;我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比较从而确定主要影响元素。
保留了Ca,Cu,Fe,Mg四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。
利用排除非显著性元素后的Logistic模型,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有16人健康,14人患病的结论。
关于肾炎判别的研究2011数模培训练习一组员:曹绍军刘强刘小双关于肾炎判别的研究摘要本文利用0—1拟合和Fisher判别分析,根据人体内各种关键元素的含量,对就诊人员是否患有肾炎做出合理的判断。
针对问题一,为得到拟合优度较高的模型,本文把样本容量确定为25。
首先令1为健康,0为患病进行0—1拟合,得出判别表达式。
然后和1、0比较,若接近于1,则表示健康;接近于0,表示患有肾炎。
为保证结果的可靠性,本文又引入了Fisher判别分析借助于SPSS软件对检测人员进行诊断判别。
接着,利用剩余5个数据对两种方法所得结果进行检验,结果较为准确,但具体到所算出的因变量的值,与临界值很接近,故考虑对7个因素中偏离均值最大的值进行剔除。
进而利用有效数据对判别表达式参数进行修正。
最后,对待诊断的30个病例中各元素的含量代入,检验出61、62、63、64、65、68、69、70、71、72、73、76、83、85、87号为患者,66、67、74、75、77、78、79、80、81、82、84、86、88、89、90号为健康人(加粗表示Fisher判别得到了相反结果的人员)。
针对问题二,考虑到有些因素对其是否为患者的影响不大,通过多元向后筛选法选出了影响肾炎的关键因素,进一步通过Fisher判别分析对待检测人员进行诊断,同样用5个数据对所得结果进行检验,结果拟合度高,对待检测者进行诊断,检测出61、62、63、64、65、66、67、68、69、71、72、73、76、79、83、85、87号为患者,70、74、75、77、78、80、81、82、84、86、88、89、90为健康人(加粗表示与问题一结果相反)。
问题一与问题二中的结果非常接近,可以认为,人体内各种元素的含量对身体是否健康都会存在一定的影响,只是有些元素的含量对一些疾病的影响较小。
关键词:0—1拟合 Fisher判别分析数据剔除多元逐步分析一、问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
肾炎诊断的数学模型摘要本题讨论的问题是关于肾炎监测指标的分析,我们首先对数据从整体上用求单项均值的方法进行了预处理,随后建立起以下三种模型。
针对问题一,我们共用了两种模型。
首先建立起回归模型,得到回归方程(见5.1.2式子 ),并得出该表达式的相关系数0.82378902。
在假设检验中利用经过F检测得出检验的临界值为-11,该值远小于显著水平0.05,从而验证了该方法的正7.3656910确性,最后用回代法得出正确率为93.33%。
我们的第二种模型是费希尔判别模型,该模型得出的正确率也为93.33%。
两种模型正确率相同,均可以作为判别属于患者或健康人的方法。
针对问题二,我们利用问题一中两种模型得出的公式将待测30组数据代入,得出结果均为:15个为肾炎患者,15个为健康人。
(详细结果见附录三)针对问题三,我们也建立了两种模型。
首先建立多元线性回归模型,利用的6软件,得出了各项元素的显著性水平。
根据显著性依次剔除了式子中的部分元素并用回代法进行了相关性检验。
最终得出结论为剔除、、K时所得模型最优,得到回归方程(见7.1.2式子),并求出回归系数0.809870029,标准误差为0.306346745,回代后准确率为93.33%,误判为第32,33,38,60号。
同时用主成分分析法结合费希尔判别模型得出误判结果相同。
针对问题四,我们利用问题三中两种方法得出的公式分别将待测30组数据代入,得出结果:线性回归法有14个肾炎患者,16个健康人。
成分分析法有13个肾炎患者,17个健康人。
(详细结果见附录四)针对问题五,我们将问题二和四的结果进行比较发现差别在于68,71,77号。
无论是何种模型和方法最终分析得出结论:由于诊断准确率基本不变,减少了三种元素、、K的检测,则诊断效率大大提高而且为病人节约了成本和时间,所以问题二方法比问题四方法更优。
关键词:多元线性回归主成分分析法回归模型费希尔判别模型1问题重述1.1问题背景随着我国人口老龄化问题的日益显现,肾炎已经成为一种在中老年人群中比较流行的疾病。
肾炎诊断的数学模型摘要本文解决的是肾炎的诊断的问题。
人们到医院就诊时,其是否患肾炎通常要化验人体内各种元素的含量来协助医生的诊断。
为解决此问题,我们建立了距离判别的数学模型。
对于问题一:我们提出了欧式距离和马氏距离两种方法来判别就诊的是患者还是健康人。
我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A,31-60号已确诊为健康人的化验结果作为总体B。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,然后我们将样品C用欧式距离模型进行判别,得到的误判率为23.33%;用马氏距离模型判别,得到的误判率为13.3%。
为此,我们选用马氏距离法。
为了使误判率降低,我们对模型进行改进,引入误判因子,此时的误判率降为3.33%。
对于问题二:我们用改进了的马氏距离判别模型将判断表B.2的化验结果进行判别,得出如下结果:对于问题三:为了确定影响人们患肾炎的关键或主要因素,我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果按照元素种类划分总体,分别为A1(Zn),A2(Cu),A3(Fe),A4(Ca),A5(Mg),A6(K),A7(Na),同理,31-60号已确诊为健康人的化验结果划分总体为B1,B2,B3,B4,B5,B6,B7。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果划分为样本D1,D2,D3,D4,D5,D6,D7,然后根据我们建立的改进后的距离判别模型,用马氏距离法逐个算出由该元素带来的误判率。
然后将相似结果的元素组合用马氏距离法和原数据进行计算比较,我们得出影响人们患肾炎的关键或主要元素为Fe,Ca,Mg,K。
对于问题四:我们将自己确定的关键元素Fe,Ca,Mg,K作为检验指标,再次根据建立后改进的距离判别的数学模型,用马氏距离方法将判断表B.2的化验结果进行判别,得出如下结果:对于问题五:将问题二,四的结果进行比较我们得知发现,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们从被诊断为健康人的数据中发现了3组患肾炎的,而原被诊断为患肾炎的数据数目没变,根据我们在诊断的过程中不会把患肾炎的诊断成健康人,这进一步验证了我们选取的元素指标的正确性。
肾炎的诊断研究摘要本文研究的是肾炎的诊断问题。
我们通过对人体内七种元素的含量进行分析,运用Fisher判别法和马氏距离法分别建立了两个不同的模型来判别某就诊者的健康与否。
为了更准确便捷地判定就诊者健康与否,我们又采用了主成分综合评价分析方法将原数据的七个观测指标减少到四个。
针对问题一:我们选取了全部样本组成了一个大容量样本,分别运用了Fisher 判别法和马氏距离判别法建立了两个不同的模型,根据人体内Zn、Cu、Fe、Ca、Mg、K、Na七种元素的含量判别肾炎病人和健康人,并对模型的有效性进行了验证。
应用Matlab软件求解,最后得出Fisher判别法的正确率为:933.%;马氏距离判别法的准确率为:90%。
针对问题二:我们运用题一中Fisher模型对题中所给的61-90这30个样本进行分析,得出:患病者病例号为:61、62、64、65、66、68、69、71、72、73、75、76、79、83、85、87,共计16人;健康者病例号为:63、67、70、74、77、78、80、81、82、84、86、88、89、90,共计14人。
针对问题三:我们为了确定影响人们患病的关键因素,建立了主成分综合评价模型,通过对40组样本进行分析,得出影响人们患病的关键因素为:Zn、Ca、Mg、K,并用这四种关键因素重新判别肾炎病人和健康人,此时误判的病例号为:925,就四项检测指标而言,判别结果好。
41、43、48,得正确率为:.%针对问题四:我们运用问题三的模型,对题中30个待检样本进行分析,得出简化化验指标后的判别结果为:患病者病例号为:61、62、63、64、65、66、67、68、69、71、72、73、76、79、83、84、85、87,共计18人;健康者病例号为:70,74,75,77,78,80,81,82,86,88,89,90共计12人。
针对问题五:比较问题二、四的结果,我们发现简化化验指标前后得到的判867.别结果有4组不同。
水资源短缺风险综合评价摘要多年以来,水资源不足,水资源污染以及洪水灾害制约了中国很多地区的经济发展,以北京市水资源为例,北京属资源型重度缺水区,地处海间流域,是一座人口密集,水资源短缺的特大城市。
本文基于模糊概率理论建立了水资源短缺风险评价模型,可对水资源短缺风险发生的概率和缺水影响程度给予综合评价。
首先构造隶属函数以评价水资源系统的模糊性;其次利用Logistic回归模型模拟和预测水资源短缺风险发生的概率;而后建立了基于模糊概率的水资源短缺风险评价模型;最后利用判别分析识别出水资源短缺的主要风险因子。
作为实例对北京市1979 —2005年的水资源短缺风险研究表明,水资源总量、污水排放总量、农业用水量以及生活用水量是北京市水资源短缺的主要风险因子。
利用Quick Cluster对水资源短缺风险进行聚类分类,将风险等级划分为低风险、较低风险、中风险、较高风险、高风险五类。
通过灰色理论预测模型,得到2010年和2011年水资源短缺风险值。
通过再生水回用和南水北调工程等相关措施可使北京地区在未来两年各种情景下的水资源短缺均降至低风险水平。
关键词:模糊概率,Logistic回归模型,Mahalanobis 距离法,聚类分类,灰色预测模型Ⅰ问题重述近年来,我国、特别是北方地区水资源短缺问题日趋严重,北京是世界上水资源严重缺乏的大都市之一,以北京市为例,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,水资源短缺已经成为影响和制约首都社会和经济发展的主要因素。
如何对水资源风险的主要风险因子进行识别,对风险造成的危害等级进行划分,对不同风险因子和未来两年水资源的短缺风险,进行预测并采取相应的有效措施规避风险或减少其造成的危害,再对此提出建议,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。
Ⅱ问题的分析水资源系统风险泛指在特定的时空环境条件下,水资源系统中所发生的非期望事件及其发生的概率以及由此产生的经济与非经济损失。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):三峡大学参赛队员(打印并签名) :1.金培培2008105325 机械2.何卓丽2008142201 理学院3 肖汉骏指导教师或指导教师组负责人(打印并签名):日期: 2010 年 7 月26 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号)肾炎的诊断摘要本文研究的问题是通过检测人体内各种元素的含量,来诊断就诊人员是否患有肾炎。
我们利用Excel 软件对样本数据进行了统计分析,发现各元素的含量与是否患有肾炎之间有一定关联,属于线性回归问题。
对于问题一,我们取1-15号、31-45号病例为样本,建立线性回归模型,以各元素的含量(1,2,3,4,5,6,7)i x i =为自变量,是否患有肾炎为因变量,用y 表示,当1y =时,表示患有肾炎;当0y =时,表示健康。
通过对模型不断进行优化,我们最终求得了拟合优度较高的模型:722022331672253451ˆi i i yx r x r x m x x m x x m x x ββ==++++++∑ ,其中各项系数分别为: 0.97135,0.00287,-0.01047,-0.00846,-0.00065 ,-0.00132,0.00158,0.00042,0.00067,0.00002,-0.0000013,-0.0001,0.00000123。
肾炎诊断问题分析数学建模Document number:BGCG-0857-BTDO-0089-2022肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。
为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher判别模型找出影响人们患肾炎的主要因素。
对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。
用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。
两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。
对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。
发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到%,将Na剔除以后准确度变为%,所以我们认为Na,Mg,Cu,Ca 的含量是影响人们患肾炎的关键因素。
对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。
对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。
关键词:加权马氏距离判别模糊模式识别 fisher判别神经网络1.问题重述.人们到医院就诊时,通常要检测一些指标来协助医生诊断。
我们判断人员是否患肾炎是通过分析人体内各种元素含量来确定的。
对于就诊人员说而言不希望自己的病情被误判,所以我们应该确定精确的检测方法。
本文我们就如何判断前来就诊人员是否患有肾炎,建立数学模型。
有题目所给数据我们可以看出,60位已经诊断的病例号的体内元素含量,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。
另外还有61-90号为待检验的就诊患者。
需要解决的问题有:问题一:根据表中的数据,提出一种或多种简便的判别方法,判别就诊人员是属于患者或健康人,并检验你提出方法的正确性。
问题二:按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
问题三:能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主因素,以便减少化验的指标。
问题四:根据3的结果,重复2的工作。
问题五:对2和4的结果作进一步的分析。
2.问题假设(1)假设题目所给的数据合理正确(2)假设肾炎患者体内各种元素的含量受其他疾病的影响较小;(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;(4)假设用于判断肾炎患者的七种元素,不受人体内其他元素或化合物的影响。
3.符号说明BX4.问题分析此题研究的是如何判断就诊人员是否患有肾炎。
在医院就诊时,一般情况下医生是通过就诊人员的尿液的化验结果来判断该就诊人员是否患有肾炎。
本题中就是通过分析病人的尿液中各元素的含量来判断的,我们要对这些数据进行分析处理,寻求好的判别方法,判断前来就诊的人员是否患有肾炎。
针对问题一,题目中已经给出30个肾炎患者与30个健康者体内7种元素的含量,现在所要做的是,如何根据这些数据提出一种合理的诊断方案。
通过分析,我们确定两种比较好的方法来判别病例号是否患有肾炎。
方法一:采用改进后的加权马氏距离判别法,即在马氏距离判别法的基础上,对每种不同的指标确定合适的权重从而提高准确度的方法,对实际问题进行判别。
方法二:将数据划分为两类,分别用两个集合表示。
一类为肾炎患者,一类为健康人体,使用模糊论中的模糊模式识别的方法建立模型,达到判别效果。
针对问题二,表中给出了30名就诊人员体内各种元素的含量,我们分别应用问题一中建立的加权马氏判别模型和模糊模式识别模型进行判断,然后将两种判断结果进行比较。
得出61—90号就诊者的诊断结果。
针对问题三,根据表的数据,我们要得到哪些元素是该化验结果的关键指标,即哪些元素在诊断结果中起关键作用。
我们重新建立了一个Fisher线性判别模型,求出Fisher系数,按照Fisher模型的理念,依次剔除Fisher系数小的元素,用Fisher判别法对题中给出的1—60号就诊者进行检验,得出正确率。
根据正确率的改变,确定出起关键作用的元素。
针对问题四,在问题三中我们已经剔除了对肾炎诊断结果起次要作用的元素,选出在诊断中起关键作用的元素。
然后我们再运用问题一的加权马氏改进法和模糊模式识别,对61—90号的就诊人员进行判别是否患有肾炎。
针对问题五,通过把问题二和问题四中分别运用加权马氏改进法和模糊识别法进行判断的结果进行比较、分析,剔除了次要元素后,61-90号就诊者患肾炎的人员是否发生变化。
5.问题一的求解针对问题一,要求我们采用一种或多种方法对前来就诊的人员做初步的判断,我们运用加权马氏判别法(模型一)和模糊识别模型(模型二)寻求了两种判别方法。
判别方法一5.1.1模型一的分析对于本题,我们把病人体内含有的7种元素Na K Mg Ca Fe Cu Zn ,,,,,,作为化验结果的样本T x x x X )...,,(721=检测的指标,把总体分为肾炎病人1A 类和健康人2A 类。
60个人的化验结果是),...,(721i i i i x x x X =。
我们定义),(11A X L 为样本X 到1A 的距离,),(22A X L =为样本X 到样本2A 的距离,通过比较),(11A X L 与),(22A X L 的大小来判别样品应该归属于1A 类还是2A 类。
样品X 到1A 类和2A 类的马氏距离分别为:')()(),(111111∑---=u X u X A X L')()(),(122222∑---=u X u X A X L 其中,21,u u ,∑1,∑2分别为总体1A 和2A 的均值和协方差。
在实际问题中,这些指标往往在判断样本X 属于A 时,所起的作用不尽相同,其重要性存在差异。
因此,马氏距离夸大了一些微小指标的作用。
如果不对指标的重要性进行区别,在判定时,可能造成较大的误判,为了减小这种影响,在马氏距离的基础上,我们需要对重要指标加以区分,因此,我们增加了一个权重W ,构造了加权马氏距离判别法。
加权马氏距离判别法的原理:马氏距离判别法是用待判别样本T m x x x X ),...,,(21= 到各总体t A A A ...,,21的距离远近作为测量尺度来判别其归属的一种直观判别方法。
为了提高这种方法对实际问题进行判别时的准确程度,在马氏距离判别法的基础上,对不同的指标加入不同的权重,合理的分配各种指标对问题的影响,这就是加权马氏距离判别法。
5.1.2模型一的建立对原始指标数据的标准化我们采集7维随机向量T X X X X ),...,(721=)7,...,2,1)(,...,(721==i X X X X i i i i 是题中给出的60个人的化验结果,60>7,所以我们构造样本阵,对样本进行如下标准化变换:jij ij jX X Z S -=()1,2,...60;1,2,...7i j == 其中1n iji j X X n ==∑,1)(212--=--=∑n X X S j ij n i J ,从而可以计算出Z .求标准化阵Z 的相关系数矩阵加权马氏距离判别法对马氏距离判别法的改进主要取决于权重的选取,权重选取是否得当影响加权马氏距离判别法的准确度。
在该实际问题中我们确定权重1T t Z Z W n =-,其中0=-E W λ。
我们可以解这个样本相关矩阵W 的特征方程0=-E W λ,得到7个特征根。
确定加权的马氏距离根据我们所求得的权重W ,可以确定加权后的马氏距离为:')()(),(11111∑---=u X W u X A X L T')()(),(122212∑---=u X W u X B X L T 式中2112 ,,,u u ∑∑分别是A 和B 的均值和协方差。
5.1.3确定判别函数在马氏距离判别法中,我们一般通过比较),(11A X L =与),(22A X L =的大小来判别样品应该归属于1A 类还是2A 类。
为了便于对结果进行直观的观察和统计,我们将判别函数y 定义为),(11A X L =与),(22A X L =的差值。
那么我们确定的判别函数为:),(),(2211A X L A X L y -==)()()()(21221111u X W u X u X W u X T T -----∑∑--0>y 说明样本到1A 类的距离大于到2A 类的距离所以应该属于1A 类即肾炎患者;0<y 说明样本到1A 类的距离小于到2A 类的距离所以应该属于2A 类即健康人。
5.1.4运用模型一进行检验根据上述建立的加权马氏距离判别法,我们运用matlab 软件(代码见附录二)对题目中给出的病例号为1—60的就诊人员进行检验,检验结果整理如下表(1):表(1):运用加权马氏距离判别法对1—60号进行检验的结果5.1.5模型一的检验分析由表(1)中的检验结果可以看到在给出的60个病例号中,我们将18,19,38和41号判断错误,也就是说我们所建模型一对于该实际问题的检验准确度为:604100%93.33%.60-⨯=既然我们所建立的模型有这么高的准确度,为什么这四个病例号会误判呢我们对检验结果进行分析。
运用excel分别求出1—30号和31—60号七种元素的平均值,并与18,19,38和41号就诊人员体内元素含量进行比较,见图(1)和图(2)。
图(1):1—30号体内各元素含量与均值比较图(2):31—60号体内各元素含量与均值比较由图我们发现, 19号体内Cu元素的含量为接近健康人的体内Cu 含量,但远高于肾炎病人体内的Cu含量;41号体内Cu元素的含量为肾炎患者体内Cu 含量很接近,但远低于健康人体内的Cu 含量;18号体内Fe 元素含量太低,而41号体Fe 元素含量太高;这四个人体内Ca 元素和Mg 元素的含量都很异常,按照均值推断,正常情况应该是患者体内这两种元素的含量远远低于健康人体内的含量,但事实刚好相反。