肾炎的诊断数学建模
数学建模--肾炎问题优化

关于肾炎诊断问题的优化分析摘要:由题目我们知道,在诊断肾炎的时候可以通过化验体内的一些化学元素量的多少来得到准确的判别结果。
本论文由此对医院诊断肾炎病人的过程中,如何利用有效的判别准则对就诊人员进行诊断,建立了统计回归模型,最终得到了判别准则。
我们对1~60号病例进行统计处理:对七种化学元素随机分为1、2、3、4、5、6、7七个等级,利用MATLAB编程求解出各种情况下各个化学元素的权重值,然后权重与化学元素量相乘,计算出每个病例的化学元素总量的值。
在各种情况下,总和与前30号为患者,31~60为非患者比较,以此确定出最优的权重赋予值。
再由隶属度函数(大型柯西分布和对数函数)确定各元素的权重。
权重确定以后,用线性加权函数作为综合评价模型,对n个系统进行判别。
并通过随机代入已确诊的病例来检验模型的准确性。
问题一得到解决。
将表格2中的数据带入到上述的模型,判别出15名是健康者,15名是患者。
对于问题三,我们由第一问中,求出来的权重大小来判定哪些指标是影响人们患肾炎的主要因素。
找到系数显著性最小三种元素,分别为Na,Zn,K;我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比较从而确定主要影响元素。
保留了Ca,Cu,Fe,Mg 四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。
对比问题二、四的结果,我们发现两者的结果基本相同。
这说明,在所给的因素中,有一些是小作用因素,可以忽略不计。
如此,便可大大节约诊断的时间、人力、财力。
关键字:MATLAB、全样本对比取优法、线性加权法、样本检验法问题重述人体的病变和人体内各元素含量的变化密切相关,人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。
数学建模疾病的确诊

题目:疾病确诊问题的实证研究【摘要】人们到医院就诊时,其是否患肾炎一般要通过化验人体内各种元素的含量来协助医生的诊断。
为了更好地解决实际问题,我们建立了logistic回归模型、决策树模型以及判别分析。
logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率等。
本文中通过题设给出的两组人体内各种元素的含量,一组是有肾炎组,一组是非肾炎组,这里的因变量就是是否有肾炎,即“是”或“否”,为两分类变量,自变量包括a,CZn,,通过logistic回归分析,就可以大致了解到Fe,K,u NMg,Ca,底哪些因素是判定肾炎的关键因子。
决策树是一种倒立的树结构,它由内部节点、叶子节点和边组成。
构造决策树的目的是找出属性和类别间的关系,一旦这种关系找出,就能用它来预测将来未知类别的记录的类别。
判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
【关键字】Logistic回归、决策树、多元统计分析、判别分析1、问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为非肾炎病人的结果。
表2是就诊人员的化验结果。
需要解决的问题:(1)、根据表1中的数据,给出一种或多种简便的判别方法,判别是否属于肾炎患者的方法,并检验你的方法的正确性;(2)、按照(1) 中给出的方法,对表2中的30名就诊人员的化验结果进行判别,判定他们是否肾炎病人;(3)、能否根据表1的数据特征,确定哪些指标是关系到人们患肾炎的主要或关键因素,以便减少化验的指标;(4)、根据(3) 中的结果,重复(2) 的工作;(5)、对(2) 和(4) 的结果作进一步的分析。
肾病诊断的数学模型

肾炎诊断的数学模型科院4组杨海鹏刘备刘栋摘要本文研究的是通过人体内各种元素含量来判断就诊人员是否患有肾炎的问题。
首先我们将收集的数据分为两组进行抽样调查,其中肾炎患者视为实验组,正常人视对照组,运用SPSS软件对数据进行处理,建立Fisher判别模型。
对于问题一、二:分析相关数据,运用Fisher判别法建立判别模型。
对数据运用软件SPSS进行Fisher判别处理,得到相应的判别函数和判别函数的监界值,通过马氏判别法对模型有效性检验,数据正则相关性达到0.811,判断正确度达90%。
然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人11名,肾炎患者19名。
对于问题三、四:通过实验组与对照组中各相同元素的对比及相关分析,剔除一些对诊断结果影响不大的元素,重新运用Fisher判别法及SPSS软件建立新的优化判别模型。
通过马氏判别法对模型有效性检验,数据正则相关性达到0.708,判断正确度达90%。
然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人10名,肾炎患者20名。
对于问题五:对二、四问结果作进一步分析,所判断的结果基本相同。
这说明所给的元素指标中有些对总体判断不大,属于小因素。
相比之下剔除后判别更有说服性,确定了Zn、Fe、Ca、Mg为判别肾炎的重要指标。
关键字:fisher判别法;多元统计分析;马氏距离检验;1. 问题重述1.1问题的简单提要:人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。
表B.2是就诊人员的化验结果。
1.2本文需要解决的问题:1)根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性;2)按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人;3)能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标;4)根据3的结果,重复2的工作;5)对2和4的结果作进一步的分析。
肾炎诊断1

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆三峡学院参赛队员(打印并签名) :1. 姜婷2. 李显亮3. 叶世萍指导教师或指导教师组负责人(打印并签名):日期: 2011 年 9 月 1 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):关于肾炎诊断问题的优化分析摘要本文研究的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。
由题目我们知道,在诊断肾炎的时候可以通过化验体内的一些化学元素量的多少来得到准确的判别结果。
我们对1-60号病例进行统计分析处理,利用excelEXCEL回归的方法求解出各种情况下各个化学元素的权重值,然后将权重值与化学元素量进行相乘,计算出每个病例的化学元素总量的值。
在各种情况下,将总和与前30号为健康和31-60为患者进行比较,以此确定出最优的权重赋予值。
权重确定以后,用线性加权函数作为综合评价模型,对n个系统进行判别。
并通过随机代入已确诊的病例来检验模型的准确性。
由此问题一得到解决。
根据问题一所建立的模型来分析表 2 中没有确诊的人员的化验结果中的数据,将表2中的每个病例的元素含量代入所建立的模型中,依据以1000分界值来判断表2中这30个人员的健康情况(这里只有肾炎和健康的区别)。
数学建模 肾炎诊断···

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):吉林工业职业技术学院参赛队员(打印并签名) :1. 陈聚克2. 曹晶3. 刘美红指导教师或指导教师组负责人(打印并签名):魏振义日期: 2011 年 5月 12 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):水资源短缺风险综合评价摘要多年以来,水资源不足,水资源污染以及洪水灾害制约了中国很多地区的经济发展,以北京市水资源为例,北京属资源型重度缺水区,地处海间流域,是一座人口密集,水资源短缺的特大城市。
本文基于模糊概率理论建立了水资源短缺风险评价模型,可对水资源短缺风险发生的概率和缺水影响程度给予综合评价。
首先构造隶属函数以评价水资源系统的模糊性;其次利用Logistic回归模型模拟和预测水资源短缺风险发生的概率;而后建立了基于模糊概率的水资源短缺风险评价模型;最后利用判别分析识别出水资源短缺的主要风险因子。
作为实例对北京市1979 —2005年的水资源短缺风险研究表明,水资源总量、污水排放总量、农业用水量以及生活用水量是北京市水资源短缺的主要风险因子。
肾炎诊断问题分析 数学建模

肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。
为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher 判别模型找出影响人们患肾炎的主要因素。
对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了93.33%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。
用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。
两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。
对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。
发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到93.3%,将Na 剔除以后准确度变为90.0%,所以我们认为Na,Mg,Cu,Ca的含量是影响人们患肾炎的关键因素。
对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。
对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。
关于肾炎诊断的数据分析方法

关于肾炎诊断的数据分析方法摘要肾炎是一种比较常见的疾病,早期症状常不明显,容易被忽略,发展到晚期可引起肾功能衰竭,严重威胁病人的健康和生命,是引起肾功能衰竭最常见的原因,必须早发现早治疗。
本文就肾炎病人和健康人的化验结果进行处理,是否患有肾炎与就诊者体内微量元素的含量有关,科学的判定方法可以及时对就诊者的身体情况给予正确的判定.本文根据附件所给数据,就此分析就诊者体内Zn, Cu, Fe, Ca, Mg, K, Na 七种微量元素含量,说明影响肾炎的主要元素。
并由此建立模型确定元素的影响程度。
最后评价模型,分析如何更实际的判断是否患有肾炎。
对于问题1,我们采用Logistic 回归方程()011....1qk k q e p q x x eβββ==++++,求出7中元素在对人体中是否患有肾炎时健康概率。
分析模型计算出其健康概率,再与概率值0.5 比较,即可以判断就诊者是否患有肾炎.若p <0.5,则表明就诊者患有肾炎,否则,就表明就诊者健康.对于问题2,我们采用马氏距离判别法是将表B.1中的结果分为肾炎病人A 组和健康人B 组,化验结果j c 是一个p 维的样品,这里定义(,),(,)D c A D c B 为样品c 到A 组、B 组的距离,这样通过比较(,),(,)D c A D c B 两值的大小就可以判断样品c 是属于A 组还是B 组;样品c 到A 组和B 组的马氏距离分别为:11111222(,)()(),(,)()()D c A c c D c B c c μμμμ--'=--'=--∑∑;其中,1212μμ∑∑,,,分别为总体A 和B 的均值和协方差。
则判别函数y 为:11112212()(,)(,)()()()();y x D c A D c B c c c c μμμμ--=-''=-----∑∑当()0y x <时,样品c 靠近A ,c 属于A ;当()0y x >时,样品c 靠近B ,c 属于B 。
数学建模竞赛化验结果的处理解题论文

2007年北京工业大学数学建模竞赛初赛试题B题:化验结果的处理题解摘要:本文运用了距离判别和Fisher判别两种方法对问题进行分析求解,得出了我们想要的结论,即通过体内元素含量较准确的判别个体是否患有肾炎。
1、问题的提出人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。
表是就诊人员的化验结果。
我们的问题是:1)根据表中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2)按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
3)能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4)根据3的结果,重复2的工作。
5)对2和4的结果作进一步的分析。
(表见附录)2、问题分析1)题目中表.1中给出了已经确诊为肾炎病人和健康人的各30组数据;2)每一组数据都有七个数,分别代表了Zn,Cu,Fe,Ca,Mg,K,Na在每个人体内的量;3)第一问要求我们提出判别一个人属于患者还是健康人的方法,这就需要通过对60组数据的分析得出健康人和肾炎患者体中这些元素量之差异,这些差异的大小又同时是解决第三问的主要影响因素;4)在寻找数据的差异时,我们用到的传统方法就是求数据的方差和均值,用excel列表分析,用matlab作直方图分析。
5)第二问最可靠的方法就是用判别分析来做,这就需要在R软件中进行一些必要的编程和处理;6)第四问是建立在第三问的基础上的;当解决了第三问中到底是那些因素影响到了人们患肾炎的关键时,只需要在那些主要因素中进行判断就可以省去一些复杂繁琐的步骤;7)将以上问题都解决之后,我们使用和步骤5)相同的方法,使用R软件帮助我们高效地对精简后的数据进行再次分析,并且把第二问和第四问的结果之间进行比较,观察差异和详细的分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
肾炎的诊断摘要本文研究的问题是通过检测人体内各种元素的含量,来诊断就诊人员是否患有肾炎。
我们首先将健康的和患病的人群的体内的相关元素的平均值用∑====B 301)0,1;7,...,2,1(301i ij iy y i x 计算出来,发现体内的元素含量的确和患病有必然的联系。
我们再利用Excel 软件中的logistic 模型对样本做了具体的分析。
( logistic 模型被广泛应用于病理学中,被作为病理学研究的常用模型) 发现各元素的含量与是否患有肾炎之间的确有一定关联,属于线性回归问题。
接着,计算出该线性方程的常量和系数从而完成模型的初步建立。
对于问题一,我们取1-60号为样本,建立线性回归模型,ii ii x b x b x b b x b x b x b b e e p +++++++++= (22110221101)以各元素的含量(1,2,3,4,5,6,7)i x i =为自变量,是否患有肾炎为因变量,用y 表示,当1y =时,表示患有肾炎;当0y =时,表示健康。
然后利用回归统计表、方差分析表、回归参数表中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好。
对60例受检者的数据进行判别,若p 大于0.5则判定为患病,若小于0.5则判定为健康。
结果正确率为93.33%。
对于问题二,我们利用问题一中建立的优化模型进行检验,将待诊断的30个病例中各元素的含量代入模型一中,计算出对应的p 值,然后和0.5进行比较,通过对数据分析处理:检验出61、62、64、65、66、68、69、71、72、73、75、76、79、83、85 号就诊人员患有肾炎;63、67、70、74、77、78、80、81、82、84、86、87、88、89、90 号就诊人员是健康的。
对于问题三,由问题一知,这七种元素的回归系数显著性由高到低顺序依次为Ca,Cu,Fe,Mg,Na,Zn,K 。
所以,我们认为回归系数显著性较小的几种元素对是否患肾炎的影响有限,可以忽略不计,并加以检验,以期能够得到一个更为简化的判定方法。
Mg 、Na 、Zn 、K 这4种元素所对应的回归系数显著性是最低的四个,分别为:-1.60239、1.380585、-0.3334、-0.21503。
我们将这几种元素进行组合剔除,共有15种组合方式,比较去掉后该回归的各个参量的值,以标准误差和正确率作为评判假设是否合理的依据。
从中找出在尽量减少元素检验的前提下相对来说较优的模型。
而保留下来的那些自变量对应的指标,即是影响人们患肾炎的关键因素,通过剔除法,得出Fe 元素,Ca 元素,Cu 元素,Mg 元素为影响人体患病的主要因素。
结果正确率为93.33%,可见模型较优。
对于问题四,我们通过问题三得到的最优回归模型进行检验,将待诊断的30个病例中各元素的含量代入模型三中,计算出对应的p 的值,然后和0.5进行比较,通过对数据分析处理:检验出61、62、64、65、66、69、72、73、75、76、77、79、83、85号就诊人员患有肾炎;63、67、68、70、71、74、78、80、81、82、84、86、87、88、89、90号就诊人员是健康的。
对于问题五,我们通过对问题二中所判定的结果与问题四中所判定的结果,进一步对比分析,问题二中所判定的结果与问题四中的判定结果对病例号为 68、71、77的3名就诊人员所判定的结果有所不同。
之所以会出现这种结果,我们认为由于每个人的体重不同,或者是因为样本的选取的分布不均匀和样本的容量较小问题等。
关键词:多元线性回归 最优化 主要因子 显著性检验1 问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。
表 B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。
表B.2是就诊人员的化验结果。
我们的问题是:1. 根据表 B.1(见附录)中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
2. 按照1提出的方法,判断表B.2(见附录)中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
4. 根据3的结果,重复2的工作。
5. 对2和4的结果作进一步的分析。
2 问题分析2.1问题一的分析问题一要求我们提出简便的方法,判别就诊人员是患者还是健康人。
我们首先将健康的和患病的人群的体内的相关元素的平均值用∑====B 301)0,1;7,...,2,1(301i ij iy y i x 计算出来,见表一,发现患病和健康人群体内的元素含量的均值相差很大。
所以体内元素的确和患病有必然的联系。
又因logistic 回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等。
我们根据ii ii x b x b x b b x b x b x b b e e p +++++++++= (22110221101)建立的logistic 回归模型来判断得病与健康的情况,由已确诊的病例中分析得知,人体是否患病与人体内某些元素的含量呈相应的回归关系,由模型来判别病例。
对于这种方法的正确性,我们利用回归统计表、方差分析表,回归参数表中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好。
2.2 问题二的分析问题二要求我们利用问题一中提出的方法,对表B.2中的30个病例进行判别。
我们分别将各元素的含量输入到在问题一建立的模型中,求出对应的p 的值,然后和0.5进行比较,判别出那些是患者,哪些是健康人。
2.3问题三的分析问题三要求我们根据表B.1的数据特征,确定影响人们患病的主要因素,以便减少化验因素。
由问题一的结果得知,回归系数显著性由高到低顺序依次为Ca,Cu,Fe,Mg,Na,Zn,K 。
我们通过剔除模型中那些对因变量作用不显著的自变量,得到最优化模型,那些保留下来的自变量,即是影响人体患病的关键因素。
2.4 问题四的分析问题四要求我们利用问题三中得到的优化模型,即剔除掉那些非关键因素后的模型,再次,对表B.2中的30个病例进行判别。
我们分别将各元素的含量输入到问题一建立的模型中,求出对应的p 的值,然后和0.5进行比较,判别出那些是患者,哪些是健康人。
2.5 问题五的分析问题五要求对问题二、问题四得出的结果,进行比较分析。
我们通过问题二、问题四得出的结果对比后发现,只有3个样本有差异,之所以会出现这种结果,我们认为由于每个人的体重不同,或者是因为样本的选取的分布不均匀和样本的容量较小问题等。
因此,这3个样本的需要进一步的检验,才能确定是否患病。
3 模型假设1. 假设问题所提供的60组数据是从大量的数据中随机抽取的,相互间没有任何必要的联系.2. 假设是否患有肾炎只与题目中给出的那几种元素的含量有关,与其他因素无关.3. 假设题目中所给的数据是真实可信的,且化验过程中没有出现错误。
4. 假设题目中所给的样本只患肾炎或者是健康体,没有患其他的疾病。
5. 假设人体内的各个元素是相互独立的,没有相互间的影响.6. 假设人的体重是近似相等的,这样就不存在了元素的含量与体重的关系.4 符号说明x i: (i=1,2,…7)分别表示人体内各元素的含量;y : 1y =表示患肾炎;0y =表示健康;b i: (i=1,2,…7)表示线性方程中i x 的系数;Biy(i=1,2,…7,表示对应的元素;1y =表示患肾炎,0y =表示健康)表示患病与健康人群的体内对应的各种元素的均值.Logit(p): p 的Logistic 变换R: 方程的拟合优度。
SST :表示总离差的平方和; SSR :表示回归平方和: SSE :表示残差平方和; P : 表示误判率;n : 表示从总体中抽取的一个样本;F α: 显著性水平为α和分子自由度i 、分母自由度1n i --的临界值; j u : 为在12,,....,p x x x 中j x 的偏回归平方和5 模型的建立与求解5.1 问题一的建模与求解 5.1.1 建立模型logistic 模型被广泛应用于病理学中,被作为病理学研究的常用模型 ,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等由于模型只有两个变量,分别为患病和健康,由此可以考虑应用多元Logistic(Binary Logistic) 模型。
我们把y=1定义为该受检者患病,y=0定义为该受检者健康,为此,我们建立了如下模型:ii ii x b x b x b b x b x b x b b e e p +++++++++= (22110221101)注意, p=0或1时,此式失效 ,因为当p 接近于0或1时,自变量即使有很大变化,p 的值也不可能变化很大,且非线性程度较高。
于是, 我们引入p 的Logistic 变换,即)1log()(log ppp it -= ,所以,原模型可以表示为:7722110)(log x b x b x b b p it +⋅⋅⋅+++= ,拟合Logistic 回归模型采用最大似然估计法。
将数据导入EXCEL 软件中,利用回归函数,选取的置信度为95%。
得到了回归统计表、方差分析表、回归参数表 。
MultiPle R (复相关系数R ) :是R²的平方根,又称为相关系数,用来衡量x 和y 之间相关程度的大小。
本例中R 为0.823779,表示二者之间的关系是高度正相关。
说明七种元素的含量与人的患病成高度相关性。
Significance F 是在显著性水平下的F 的临界值,本题是7.37E-11远小于显著水平0.05。
说明,回归效果显著。
由回归参数表得知,ii ii x b x b x b b x b x b x b b e e p +++++++++=......22110221101的b 0——b 7的值分别为:0.89113、-0.00033、0.016659、-0.00162、-0.0003、-0.00096、-6.6E-05、0.000303。
5.1.2模型检验由方差分析表得知,检验统计量F =15.68543,而F (1,5)=6.61,所以F> F (1,5),所以该线性模型线性显著,可以用于实际问题的分析。
将60份样本数据带入该模型中,得出,32、38、39、60与实际的结果不符。