肾炎诊断问题分析数学建模

合集下载

数学建模--肾炎问题优化

数学建模--肾炎问题优化

关于肾炎诊断问题的优化分析摘要:由题目我们知道,在诊断肾炎的时候可以通过化验体内的一些化学元素量的多少来得到准确的判别结果。

本论文由此对医院诊断肾炎病人的过程中,如何利用有效的判别准则对就诊人员进行诊断,建立了统计回归模型,最终得到了判别准则。

我们对1~60号病例进行统计处理:对七种化学元素随机分为1、2、3、4、5、6、7七个等级,利用MATLAB编程求解出各种情况下各个化学元素的权重值,然后权重与化学元素量相乘,计算出每个病例的化学元素总量的值。

在各种情况下,总和与前30号为患者,31~60为非患者比较,以此确定出最优的权重赋予值。

再由隶属度函数(大型柯西分布和对数函数)确定各元素的权重。

权重确定以后,用线性加权函数作为综合评价模型,对n个系统进行判别。

并通过随机代入已确诊的病例来检验模型的准确性。

问题一得到解决。

将表格2中的数据带入到上述的模型,判别出15名是健康者,15名是患者。

对于问题三,我们由第一问中,求出来的权重大小来判定哪些指标是影响人们患肾炎的主要因素。

找到系数显著性最小三种元素,分别为Na,Zn,K;我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比较从而确定主要影响元素。

保留了Ca,Cu,Fe,Mg 四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。

对比问题二、四的结果,我们发现两者的结果基本相同。

这说明,在所给的因素中,有一些是小作用因素,可以忽略不计。

如此,便可大大节约诊断的时间、人力、财力。

关键字:MATLAB、全样本对比取优法、线性加权法、样本检验法问题重述人体的病变和人体内各元素含量的变化密切相关,人们到医院就诊时,通常要化验一些指标来协助医生的诊断。

诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。

表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。

数学建模论文化验结果的处理

数学建模论文化验结果的处理

数学建模论文化验结果的处理Modified by JEEP on December 26th, 2020.A题化验结果的处理本组成员:10数本一数学与应用数学俞子骏10数本一数学与应用数学林文涛10化工本二化学工程与工艺过武厚指导老师:杨云苏化验结果的处理摘要本文要解决的问题是如何根据检测人员体内各种元素的含量,判别检测人员是否患有肾炎,并找出影响人们是否患有肾炎的主要元素,以便减少化验的指标。

我们建立了BP神经网络模型来判别检测人员是否患有肾炎,并建立了Fisher判别模型找出影响人们患有肾炎的主要元素。

我们将1-30号肾炎患者作为总体A,把患病者记为1;将31-60号健康人作为总体1A,把健康者记为0。

由题意我们建立了BP神经网络模型来验证1-60号检测人员的健康2状况,将其结果与实际情况对比,得出这种模型的准确度高达%,较好的实现了对是否患有肾炎病的判断。

在问题二中,我们利用了BP神经网络模型对61-90号就诊人员是否患病进行了判断,得出结果:病历号为61、62、63、64、65、66、67、68、69、71、72、73、76、79、82、83、84、85、87的就诊人员为肾炎患者;病历号为70、74、75、77、78、80、81、86、88、89、90的就诊人员为健康人。

我们利用Fisher判别模型求解问题三时,计算出()221xxC+⨯的结果,可以得出各项指标对结果影响进行排序为K,Zn,Fe,Na,Mg,Cu,Ca,按照这个顺序依次对K,Zn,Fe,Na,Mg,Cu,Ca进行剔除,由准确度可以判断Mg,Cu,Ca,Na是影响人们患肾炎的主要元素。

问题四中,我们把影响人们患肾炎的主要元素作为指标,重复了问题二的步骤,得到的结果与问题二的结果进行对比分析后,发现检验出来的结果变化很小,问题四中的确诊结果与问题二中的确诊结果基本相同,只是在问题二中被判断为肾炎患者的67、82、84号检验人员在问题四种被诊断为健康人。

数学建模疾病的确诊

数学建模疾病的确诊

题目:疾病确诊问题的实证研究【摘要】人们到医院就诊时,其是否患肾炎一般要通过化验人体内各种元素的含量来协助医生的诊断。

为了更好地解决实际问题,我们建立了logistic回归模型、决策树模型以及判别分析。

logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率等。

本文中通过题设给出的两组人体内各种元素的含量,一组是有肾炎组,一组是非肾炎组,这里的因变量就是是否有肾炎,即“是”或“否”,为两分类变量,自变量包括a,CZn,,通过logistic回归分析,就可以大致了解到Fe,K,u NMg,Ca,底哪些因素是判定肾炎的关键因子。

决策树是一种倒立的树结构,它由内部节点、叶子节点和边组成。

构造决策树的目的是找出属性和类别间的关系,一旦这种关系找出,就能用它来预测将来未知类别的记录的类别。

判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。

【关键字】Logistic回归、决策树、多元统计分析、判别分析1、问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。

诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。

表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。

表2是就诊人员的化验结果。

需要解决的问题:(1)、根据表1中的数据,给出一种或多种简便的判别方法,判别是否属于肾炎患者的方法,并检验你的方法的正确性;(2)、按照(1) 中给出的方法,对表2中的30名就诊人员的化验结果进行判别,判定他们是否肾炎病人;(3)、能否根据表1的数据特征,确定哪些指标是关系到人们患肾炎的主要或关键因素,以便减少化验的指标;(4)、根据(3) 中的结果,重复(2) 的工作;(5)、对(2) 和(4) 的结果作进一步的分析。

肾炎诊断的数学模型(含程序)

肾炎诊断的数学模型(含程序)

肾炎诊断的数学模型摘要本题讨论的问题是关于肾炎监测指标的分析,我们首先对数据从整体上用求单项均值的方法进行了预处理,随后建立起以下三种模型。

针对问题一,我们共用了两种模型。

首先建立起Binary Logistic回归模型,得到回归方程(见5.1.2式子 (1.1)),并得出该表达式的相关系数R =0.82378902。

在假设检验中利用Excel经过F检测得出检验的临界值为-11,该值远小于显著水平0.05,从而验证了该方法的正确性,最7.3656910后用回代法得出正确率为93.33%。

我们的第二种模型是费希尔判别模型,该模型得出的正确率也为93.33%。

两种模型正确率相同,均可以作为判别属于患者或健康人的方法。

针对问题二,我们利用问题一中两种模型得出的公式将待测30组数据代入,得出结果均为:15个为肾炎患者,15个为健康人。

(详细结果见附录三)针对问题三,我们也建立了两种模型。

首先建立多元线性回归模型,利用Excel的6SQ软件,得出了各项元素的显著性水平。

根据显著性依次剔除了式子中的部分元素并用回代法进行了相关性检验。

最终得出结论为剔除Na、Zn、K时所得模型最优,得到回归方程(见7.1.2式子(1.2)),并求出回归系数R=0.809870029,标准误差为0.306346745,回代后准确率为93.33%,误判为第32,33,38,60号。

同时用主成分分析法结合费希尔判别模型得出误判结果相同。

针对问题四,我们利用问题三中两种方法得出的公式分别将待测30组数据代入,得出结果:线性回归法有14个肾炎患者,16个健康人。

成分分析法有13个肾炎患者,17个健康人。

(详细结果见附录四)针对问题五,我们将问题二和四的结果进行比较发现差别在于68,71,77号。

无论是何种模型和方法最终分析得出结论:由于诊断准确率基本不变,减少了三种元素Na、Zn、K的检测,则诊断效率大大提高而且为病人节约了成本和时间,所以问题二方法比问题四方法更优。

肾病诊断的数学模型

肾病诊断的数学模型

肾炎诊断的数学模型科院4组杨海鹏刘备刘栋摘要本文研究的是通过人体内各种元素含量来判断就诊人员是否患有肾炎的问题。

首先我们将收集的数据分为两组进行抽样调查,其中肾炎患者视为实验组,正常人视对照组,运用SPSS软件对数据进行处理,建立Fisher判别模型。

对于问题一、二:分析相关数据,运用Fisher判别法建立判别模型。

对数据运用软件SPSS进行Fisher判别处理,得到相应的判别函数和判别函数的监界值,通过马氏判别法对模型有效性检验,数据正则相关性达到0.811,判断正确度达90%。

然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人11名,肾炎患者19名。

对于问题三、四:通过实验组与对照组中各相同元素的对比及相关分析,剔除一些对诊断结果影响不大的元素,重新运用Fisher判别法及SPSS软件建立新的优化判别模型。

通过马氏判别法对模型有效性检验,数据正则相关性达到0.708,判断正确度达90%。

然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人10名,肾炎患者20名。

对于问题五:对二、四问结果作进一步分析,所判断的结果基本相同。

这说明所给的元素指标中有些对总体判断不大,属于小因素。

相比之下剔除后判别更有说服性,确定了Zn、Fe、Ca、Mg为判别肾炎的重要指标。

关键字:fisher判别法;多元统计分析;马氏距离检验;1. 问题重述1.1问题的简单提要:人们到医院就诊时,通常要化验一些指标来协助医生的诊断。

诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。

表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。

表B.2是就诊人员的化验结果。

1.2本文需要解决的问题:1)根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性;2)按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人;3)能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标;4)根据3的结果,重复2的工作;5)对2和4的结果作进一步的分析。

肾炎诊断问题分析 数学建模

肾炎诊断问题分析 数学建模

肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。

为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher 判别模型找出影响人们患肾炎的主要因素。

对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了93.33%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。

用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。

两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。

对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。

发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到93.3%,将Na 剔除以后准确度变为90.0%,所以我们认为Na,Mg,Cu,Ca的含量是影响人们患肾炎的关键因素。

对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。

对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。

关于肾炎诊断的数据分析方法

关于肾炎诊断的数据分析方法

关于肾炎诊断的数据分析方法摘要肾炎是一种比较常见的疾病,早期症状常不明显,容易被忽略,发展到晚期可引起肾功能衰竭,严重威胁病人的健康和生命,是引起肾功能衰竭最常见的原因,必须早发现早治疗。

本文就肾炎病人和健康人的化验结果进行处理,是否患有肾炎与就诊者体内微量元素的含量有关,科学的判定方法可以及时对就诊者的身体情况给予正确的判定.本文根据附件所给数据,就此分析就诊者体内Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素含量,说明影响肾炎的主要元素。

并由此建立模型确定元素的影响程度。

最后评价模型,分析如何更实际的判断是否患有肾炎。

对于问题1,我们采用Logistic 回归方程()011....1qk k q e p q x x eβββ==++++,求出7中元素在对人体中是否患有肾炎时健康概率。

分析模型计算出其健康概率,再与概率值0.5 比较,即可以判断就诊者是否患有肾炎.若p <0.5,则表明就诊者患有肾炎,否则,就表明就诊者健康.对于问题2,我们采用马氏距离判别法是将表B.1中的结果分为肾炎病人A 组和健康人B 组,化验结果j c 是一个p 维的样品,这里定义(,),(,)D c A D c B 为样品c 到A 组、B 组的距离,这样通过比较(,),(,)D c A D c B 两值的大小就可以判断样品c 是属于A 组还是B 组;样品c 到A 组和B 组的马氏距离分别为:11111222(,)()(),(,)()()D c A c c D c B c c μμμμ--'=--'=--∑∑;其中,1212μμ∑∑,,,分别为总体A 和B 的均值和协方差。

则判别函数y 为:11112212()(,)(,)()()()();y x D c A D c B c c c c μμμμ--=-''=-----∑∑当()0y x <时,样品c 靠近A ,c 属于A ;当()0y x >时,样品c 靠近B ,c 属于B 。

数学建模竞赛化验结果的处理解题论文

数学建模竞赛化验结果的处理解题论文

2007年北京工业大学数学建模竞赛初赛试题B题:化验结果的处理题解摘要:本文运用了距离判别和Fisher判别两种方法对问题进行分析求解,得出了我们想要的结论,即通过体内元素含量较准确的判别个体是否患有肾炎。

1、问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断。

诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。

表是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。

表是就诊人员的化验结果。

我们的问题是:1)根据表中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。

2)按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。

3)能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。

4)根据3的结果,重复2的工作。

5)对2和4的结果作进一步的分析。

(表见附录)2、问题分析1)题目中表.1中给出了已经确诊为肾炎病人和健康人的各30组数据;2)每一组数据都有七个数,分别代表了Zn,Cu,Fe,Ca,Mg,K,Na在每个人体内的量;3)第一问要求我们提出判别一个人属于患者还是健康人的方法,这就需要通过对60组数据的分析得出健康人和肾炎患者体中这些元素量之差异,这些差异的大小又同时是解决第三问的主要影响因素;4)在寻找数据的差异时,我们用到的传统方法就是求数据的方差和均值,用excel列表分析,用matlab作直方图分析。

5)第二问最可靠的方法就是用判别分析来做,这就需要在R软件中进行一些必要的编程和处理;6)第四问是建立在第三问的基础上的;当解决了第三问中到底是那些因素影响到了人们患肾炎的关键时,只需要在那些主要因素中进行判断就可以省去一些复杂繁琐的步骤;7)将以上问题都解决之后,我们使用和步骤5)相同的方法,使用R软件帮助我们高效地对精简后的数据进行再次分析,并且把第二问和第四问的结果之间进行比较,观察差异和详细的分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

肾炎诊断问题分析数学建模Document number:BGCG-0857-BTDO-0089-2022肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。

为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher判别模型找出影响人们患肾炎的主要因素。

对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。

用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。

两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。

对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。

发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到%,将Na剔除以后准确度变为%,所以我们认为Na,Mg,Cu,Ca 的含量是影响人们患肾炎的关键因素。

对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。

对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。

关键词:加权马氏距离判别模糊模式识别 fisher判别神经网络1.问题重述.人们到医院就诊时,通常要检测一些指标来协助医生诊断。

我们判断人员是否患肾炎是通过分析人体内各种元素含量来确定的。

对于就诊人员说而言不希望自己的病情被误判,所以我们应该确定精确的检测方法。

本文我们就如何判断前来就诊人员是否患有肾炎,建立数学模型。

有题目所给数据我们可以看出,60位已经诊断的病例号的体内元素含量,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。

另外还有61-90号为待检验的就诊患者。

需要解决的问题有:问题一:根据表中的数据,提出一种或多种简便的判别方法,判别就诊人员是属于患者或健康人,并检验你提出方法的正确性。

问题二:按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。

问题三:能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主因素,以便减少化验的指标。

问题四:根据3的结果,重复2的工作。

问题五:对2和4的结果作进一步的分析。

2.问题假设(1)假设题目所给的数据合理正确(2)假设肾炎患者体内各种元素的含量受其他疾病的影响较小;(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;(4)假设用于判断肾炎患者的七种元素,不受人体内其他元素或化合物的影响。

3.符号说明BX4.问题分析此题研究的是如何判断就诊人员是否患有肾炎。

在医院就诊时,一般情况下医生是通过就诊人员的尿液的化验结果来判断该就诊人员是否患有肾炎。

本题中就是通过分析病人的尿液中各元素的含量来判断的,我们要对这些数据进行分析处理,寻求好的判别方法,判断前来就诊的人员是否患有肾炎。

针对问题一,题目中已经给出30个肾炎患者与30个健康者体内7种元素的含量,现在所要做的是,如何根据这些数据提出一种合理的诊断方案。

通过分析,我们确定两种比较好的方法来判别病例号是否患有肾炎。

方法一:采用改进后的加权马氏距离判别法,即在马氏距离判别法的基础上,对每种不同的指标确定合适的权重从而提高准确度的方法,对实际问题进行判别。

方法二:将数据划分为两类,分别用两个集合表示。

一类为肾炎患者,一类为健康人体,使用模糊论中的模糊模式识别的方法建立模型,达到判别效果。

针对问题二,表中给出了30名就诊人员体内各种元素的含量,我们分别应用问题一中建立的加权马氏判别模型和模糊模式识别模型进行判断,然后将两种判断结果进行比较。

得出61—90号就诊者的诊断结果。

针对问题三,根据表的数据,我们要得到哪些元素是该化验结果的关键指标,即哪些元素在诊断结果中起关键作用。

我们重新建立了一个Fisher线性判别模型,求出Fisher系数,按照Fisher模型的理念,依次剔除Fisher系数小的元素,用Fisher判别法对题中给出的1—60号就诊者进行检验,得出正确率。

根据正确率的改变,确定出起关键作用的元素。

针对问题四,在问题三中我们已经剔除了对肾炎诊断结果起次要作用的元素,选出在诊断中起关键作用的元素。

然后我们再运用问题一的加权马氏改进法和模糊模式识别,对61—90号的就诊人员进行判别是否患有肾炎。

针对问题五,通过把问题二和问题四中分别运用加权马氏改进法和模糊识别法进行判断的结果进行比较、分析,剔除了次要元素后,61-90号就诊者患肾炎的人员是否发生变化。

5.问题一的求解针对问题一,要求我们采用一种或多种方法对前来就诊的人员做初步的判断,我们运用加权马氏判别法(模型一)和模糊识别模型(模型二)寻求了两种判别方法。

判别方法一5.1.1模型一的分析对于本题,我们把病人体内含有的7种元素Na K Mg Ca Fe Cu Zn ,,,,,,作为化验结果的样本T x x x X )...,,(721=检测的指标,把总体分为肾炎病人1A 类和健康人2A 类。

60个人的化验结果是),...,(721i i i i x x x X =。

我们定义),(11A X L 为样本X 到1A 的距离,),(22A X L =为样本X 到样本2A 的距离,通过比较),(11A X L 与),(22A X L 的大小来判别样品应该归属于1A 类还是2A 类。

样品X 到1A 类和2A 类的马氏距离分别为:')()(),(111111∑---=u X u X A X L')()(),(122222∑---=u X u X A X L 其中,21,u u ,∑1,∑2分别为总体1A 和2A 的均值和协方差。

在实际问题中,这些指标往往在判断样本X 属于A 时,所起的作用不尽相同,其重要性存在差异。

因此,马氏距离夸大了一些微小指标的作用。

如果不对指标的重要性进行区别,在判定时,可能造成较大的误判,为了减小这种影响,在马氏距离的基础上,我们需要对重要指标加以区分,因此,我们增加了一个权重W ,构造了加权马氏距离判别法。

加权马氏距离判别法的原理:马氏距离判别法是用待判别样本T m x x x X ),...,,(21= 到各总体t A A A ...,,21的距离远近作为测量尺度来判别其归属的一种直观判别方法。

为了提高这种方法对实际问题进行判别时的准确程度,在马氏距离判别法的基础上,对不同的指标加入不同的权重,合理的分配各种指标对问题的影响,这就是加权马氏距离判别法。

5.1.2模型一的建立对原始指标数据的标准化我们采集7维随机向量T X X X X ),...,(721=)7,...,2,1)(,...,(721==i X X X X i i i i 是题中给出的60个人的化验结果,60>7,所以我们构造样本阵,对样本进行如下标准化变换:jij ij jX X Z S -=()1,2,...60;1,2,...7i j == 其中1n iji j X X n ==∑,1)(212--=--=∑n X X S j ij n i J ,从而可以计算出Z .求标准化阵Z 的相关系数矩阵加权马氏距离判别法对马氏距离判别法的改进主要取决于权重的选取,权重选取是否得当影响加权马氏距离判别法的准确度。

在该实际问题中我们确定权重1T t Z Z W n =-,其中0=-E W λ。

我们可以解这个样本相关矩阵W 的特征方程0=-E W λ,得到7个特征根。

确定加权的马氏距离根据我们所求得的权重W ,可以确定加权后的马氏距离为:')()(),(11111∑---=u X W u X A X L T')()(),(122212∑---=u X W u X B X L T 式中2112 ,,,u u ∑∑分别是A 和B 的均值和协方差。

5.1.3确定判别函数在马氏距离判别法中,我们一般通过比较),(11A X L =与),(22A X L =的大小来判别样品应该归属于1A 类还是2A 类。

为了便于对结果进行直观的观察和统计,我们将判别函数y 定义为),(11A X L =与),(22A X L =的差值。

那么我们确定的判别函数为:),(),(2211A X L A X L y -==)()()()(21221111u X W u X u X W u X T T -----∑∑--0>y 说明样本到1A 类的距离大于到2A 类的距离所以应该属于1A 类即肾炎患者;0<y 说明样本到1A 类的距离小于到2A 类的距离所以应该属于2A 类即健康人。

5.1.4运用模型一进行检验根据上述建立的加权马氏距离判别法,我们运用matlab 软件(代码见附录二)对题目中给出的病例号为1—60的就诊人员进行检验,检验结果整理如下表(1):表(1):运用加权马氏距离判别法对1—60号进行检验的结果5.1.5模型一的检验分析由表(1)中的检验结果可以看到在给出的60个病例号中,我们将18,19,38和41号判断错误,也就是说我们所建模型一对于该实际问题的检验准确度为:604100%93.33%.60-⨯=既然我们所建立的模型有这么高的准确度,为什么这四个病例号会误判呢我们对检验结果进行分析。

运用excel分别求出1—30号和31—60号七种元素的平均值,并与18,19,38和41号就诊人员体内元素含量进行比较,见图(1)和图(2)。

图(1):1—30号体内各元素含量与均值比较图(2):31—60号体内各元素含量与均值比较由图我们发现, 19号体内Cu元素的含量为接近健康人的体内Cu 含量,但远高于肾炎病人体内的Cu含量;41号体内Cu元素的含量为肾炎患者体内Cu 含量很接近,但远低于健康人体内的Cu 含量;18号体内Fe 元素含量太低,而41号体Fe 元素含量太高;这四个人体内Ca 元素和Mg 元素的含量都很异常,按照均值推断,正常情况应该是患者体内这两种元素的含量远远低于健康人体内的含量,但事实刚好相反。

相关文档
最新文档