数学建模各种分析方法

数学建模各种分析方法
数学建模各种分析方法

现代统计学

1.因子分析(Factor Analysis)

因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。

运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。

2.主成分分析

主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,

直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

主成分分析和因子分析的区别

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子

分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间

也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。

总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

3.聚类分析(Cluster Analysis)

聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。

在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。

4.判别分析(Discriminatory Analysis)

判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。

根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。

费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。

贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。

距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。

5.对应分析(Correspondence Analysis)

对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。

运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。

这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。

6.典型相关分析

典型相关分析是分析两组随机变量间线性密切程度的统计方法,是两变量间线性相关分析的拓广。各组随机变量中既可有定量随机变量,也可有定性随机变

量(分析时须F6说明为定性变量)。本法还可以用于分析高维列联表各边际变量

的线性关系。

注意:

1.严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关形式。

2.典型相关模型的基本假设和数据要求

要求两组变量之间为线性关系,即每对典型变量之间为线性关系;

每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。即log经济水平,log收入水平。

3.典型相关模型的基本假设和数据要求

所有观测变量为定量数据。同时也可将定性数据按照一定形式设为虚拟变量后,再放入典型相关模型中进行分析。

7.多维尺度分析(Multi-dimension Analysis)

多维尺度分析(Multi-dimension Analysis) 是市场研究的一种有力手段,它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。

在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先所有评价对象进行两两组合,然后要求被访者所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。

多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。同时该方法实施方便,调查中被访者负担较小,很容易得到理解接受。当然,该方法的不足之处是牺牲了个体距离矩阵,由于每个被访者个体的距离矩阵只包含1与0两种取值,相

对较为粗糙,个体距离矩阵的分析显得比较勉强。但这一点是完全可以接受的,因为对大多数研究而言,我们并不需要知道每一个体的空间知觉图。

多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅对所研究的专业领域要有很好的训练,而且要掌握必要的统计分析工具。对实际领域中的研究者和高等院校的研究生来说,要学习掌握多元统计分析的各种模型和方法,手头有一本好的、有长久价值的参考书是非常必要的。这样一本书应该满足以下条件:首先,它应该是“浅入深出”的,也就是说,既可供初学者入门,又能使有较深基础的人受益。其次,它应该是既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做。

最后,它应该是内涵丰富、全面的,不仅要基本包括各种在实际中常用的多元统计分析方法,而且还要对现代统计学的最新思想和进展有所介绍、交代。

因子分析

主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多变量分析中,某些变量间往往存在相关性。是什么原因使变量间有关联呢?是否存在不能直接观测到的、但影响可观测变量变化的公共因子?因子分析(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。

例如,随着年龄的增长,儿童的身高、体重会随着变化,具有一定的相关性,身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与

体重的生长因子。那么,我们能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。

可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。

因子分析主要用于:1、减少分析变量个数;2、通过对变量间相关关系探测,

将原始变量进行分类。即将相关性高的变量分为一组,用共性因子代替该组变量。

1. 因子分析模型

因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析模型描述如下:

(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。

(2)F = (F1,F2,…,Fm)¢(m

(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:

x1 = a11F1+ a12F2 +…+a1mFm + e1

x2 = a21F1+a22F2 +…+a2mFm + e2

………

xp = ap1F1+ ap2F2 +…+apmFm + ep

称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为: x =AF + e .

其中:

x=,A=,F=,e=

这里,

(1)m £p;

(2)Cov(F,e)=0,即F和e是不相关的;

(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;

D(e)=,即e1,e2,…,ep不相关,且方差不同。

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X 的特殊因子。

A = (aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j 因子的相关系数,反映了第i变量在第j因子上的重要性。

2. 模型的统计意义

模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有

公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj

的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,

即变量共同度和公共因子的方差贡献。

因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。

将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公

共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量

xi(i=1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。

3. 因子旋转

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。

旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向

分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。

4.因子得分

因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。

设公共因子F由变量x表示的线性组合为:

Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m

该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。

但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。

(1)回归估计法

F = X b = X (X ¢X)-1A¢= XR-1A¢(这里R为相关阵,且R = X ¢X )。

(2)Bartlett估计法

Bartlett估计因子得分可由最小二乘法或极大似然法导出。

F = [(W-1/2A)¢W-1/2A]-1(W-1/2A)¢W-1/2X = (A¢W-1A)-1A¢W-1X

(3)Thomson估计法

在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作,此时R = X ¢X+W,于是有:

F = XR-1A¢= X (X ¢X+W)-1A¢

这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:

F = XR-1A¢= X (I+A¢W-1A)-1W-1A¢

5. 因子分析的步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:

(1)确认待分析的原变量是否适合作因子分析。

(2)构造因子变量。

(3)利用旋转方法使因子变量更具有可解释性。

(4)计算因子变量得分。

(ii)因子分析的计算过程:

(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;

(3)求相关矩阵的特征值和特征向量;

(4)计算方差贡献率与累积方差贡献率;

(5)确定因子:

设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;

(6)因子旋转:

若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

(7)用原指标的线性组合来求各因子得分:

采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。

(8)综合得分

以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )

此处wi为旋转前或旋转后因子的方差贡献率。

(9)得分排序:利用综合得分可以得到得分名次。

在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:

·简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。

·构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。

·进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。

如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。

数学建模之层次分析法

第四讲层次分析法 在现实世界中,往往会遇到决策的问题,比如如何选择旅游景点的问题,选择升学志愿的问题等等。在决策者作出最后的决定以前,他必须考虑很多方面的因素或者判断准则,最终通过这些准则作出选择。 比如选择一个旅游景点时,你可以从宁波、普陀山、浙西大峡谷、雁荡山和楠溪江中选择一个作为自己的旅游目的地,在进行选择时,你所考虑的因素有旅游的费用、旅游地的景色、景点的居住条件和饮食状况以及交通状况等等。这些因素是相互制约、相互影响的。我们将这样的复杂系统称为一个决策系统。这些决策系统中很多因素之间的比较往往无法用定量的方式描述,此时需要将半定性、半定量的问题转化为定量计算问题。层次分析法是解决这类问题的行之有效的方法。层次分析法将复杂的决策系统层次化,通过逐层比较各种关联因素的重要性来为分析、决策提供定量的依据。 一、建立系统的递阶层次结构 首先要把问题条理化、层次化,构造出一个有层次的结构模型。一个决策系统大体可以分成三个层次: (1) 最高层(目标层):这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果; (2) 中间层(准则层):这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则; (3) 最低层(方案层):这一层次包括了为实现目标可供选择的各种措施、决策方案等。 比如旅游景点问题,我们可以得到下面的决策系统: 目标层——选择一个旅游景点 准则层——旅游费用、景色、居住、饮食、交通 方案层——宁波、普陀山、浙西大峡谷、雁荡山、楠溪江 二、构造成对比较判断矩阵和正互反矩阵 在确定了比较准则以及备选的方案后,需要比较若干个因素对同一目标的影响,从额确定它们在目标中占的比重。如旅游问题中,五个准则对于不同决策者在进行决策是肯定会有不同的重要程度,而不同的方案在相同的准则上也有不同的适合程度表现。层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的

数学建模定性分析方法解析

定性研究数据采集 定量研究往往具有足够样本量支持,丰富的统计分析技术,可以得出具有一定代表性的结论,但对于某个问题消费者为何如此回答,其所给解释是否是其真实想法,这样的问题便显得有些束手无策了。相对而言,定性技术对数理性的要求低一些,但对消费者动机的深层挖掘要求却更高,更具针对性,因而 与定量研究形成互补。 常规定性研究的方法主要是个别深度访谈与座谈会访谈。其中深度访谈是深层次地挖掘个体的表现特征与背后的原因,而座谈会是利用几个人一起进行头脑风暴(brainstorming)的优势,相互激发、相互启迪, 从而挖掘出深层次的原因。 座谈会(FDG) 座谈会的成功依赖于两个系统,一个是主持人培训系统,一个是被访者约访系统。华通现代建立起专职主持人与研究员水平主持人两个体系。一方面保持几个专职主持人,以利于他们不断提高公司在座谈会主持方面的技术水平,适应一些难度非常大的主持项目;另一方面又更鼓励一部分研究人员掌握主持技巧, 完成常规项目中必须的座谈会需求。 专职主持人的特点是主持技巧水平较高,缺点是研究设计、分析能力弱。必须要研究人员与主持人的高度配合才能够拿出高水平的研究报告。研究员水平的主持人对于一些特别复杂的技巧没有专职主持人那么强,但由于自己完全参与项目设计、数据分析、报告撰写等过程,容易对消费者有特别深入的理解、对数据的理解也会有独到的方面,比较容易出好的研究报告。 深层访谈(In-depth Interview) 深访是一种无结构的、直接的、一对一的访问,在访问过程中,由掌握高级访谈技巧的调查员对调查对象进行深入的访谈,用以揭示对某一问题的潜在动机、态度和情感,此方法最适合于做探测性调查。深层访谈的优点是更能深入地了解被调查者的内心想法和态度;便于对一些保密性、敏感性问题进行调查;能够自由地交换信息,常常会取得一些意外的资料。缺点是调查的无结构性使得这种方法首调查员自身素

(完整版)数学建模之层次分析法

层次分析法 层次分析法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题。 缺点: (1)层次分析法的主观性太强,模型的搭建,判断矩阵的输入都是决策者的主观判断,往往会因为决策者的考虑不周、顾此失彼而造成失误。 (2)层次分析法模型的内部结构太过理想化,完全分离、彼此独立的层次结构在实践中很难做到。 (5)层次分析法只能从给定的决策方案中去选择,而不能给出新的、更优的策略。 1.模型的应用 用于解决多目标的复杂问题的定性与定量相结合的决策分析。 (1)公司选拔人员, (2)旅游地点的选取, (3)产品的购买等, (4)船舶投资决策问题(下载文档), (5)煤矿安全研究, (6)城市灾害应急能力, (7)油库安全性评价, (8)交通安全评价等。 2.步骤 ①建立层次结构模型 首先明确决策目标,再将各个因素按不同的属性从上至下搭建出一个有层次的结构模型,模型如下图所示。

目标层 准则层 方案层 目标层:表示解决问题的目的,即层次分析要达到的总目标。通常只有一个总目标。 准则层:表示采取某种措施、政策、方案等实现预定总目标所涉及的中间环节。 方案层:表示将选用的解决问题的各种措施、政策、方案等。通常有几个方案可选。 注意: (1)任一元素属于且仅属于一个层次;任一元素仅受相邻的上层元素的支配,并不是任一元素与下层元素都有联系; (2)虽然对准则层中每层元素数目没有明确限制,但通常情况下每层元素数最好不要超过 9 个。这是因为,心理学研究表明,只有一组事物在 9 个以内,普通人对其属性进行判别时才较为清楚。当同一层次元素数多于 9 个时,决策者对两两重要性判断可能会出现逻辑错误的概率加大,此时可以通过增加层数,来减少同一层的元素数。 ②构造判断(成对比较)矩阵 以任意一个上一层的元素为准则,对其支配的下层各因素之间进行两两比 a重要程度的衡量用Santy的1—9较。得到判断矩阵,再求出各元素的权重。 ij 标度方法给出。即

层次分析报告法在数学建模中的应用

层次分析法在数学建模中的应用 摘要:人们在生活中处理一些决策问题的时候,要考虑的因素有多有少,有大有小,但是 一个共同的特点是它们通常都涉及到经济 、社会、 人文等方面的因素。在作比较、 判断 、 评价、 决策时,这些因素的重要性 影响力或者优先程度往往难以量化,人的主观选择会起 着相当主要的作用,这就给用一般的数学方法解决问题带来本质上的困难。这是就有人提出 了一种能有效地处理这样一类问题的实用方法,称为层次分析法,这是一种定性和定量相结 合的、系统化、层次化的分析方法。以及在对层次分析法的引入基础之上,建立层次分析模 型,并给出了层次分析的求解过程,以及在现实生活中的应用。 关键词:层次分析法;成对比较矩阵;权向量;一致性指标;一致性比率 一. 问题的提出:人们在日常生活中常常碰到许多决策问题:请朋友吃饭要筹划是办家宴还是去饭店,是吃中餐、西餐还是自助餐;假期旅游和科研成果的评价。诸如此类问题面临抉择,就要慎重考虑,反复比较,尽可能满意的决策。 然而人们在处理上面这些决策问题的时候,要考虑的因素有多有少,有大有小,但是一个共同的特点是它们通常都涉及经济社会和人文等方面的因素。在做比较、判断、评价、决策时,这些因素的重要性、影响力或者优先程度难以量化,人的主观选择会起着相当重要的作用。T.L.Saaty 等人在20世纪70年代提出了一种能有效地处理这样一类问题的实用方法,称为层次分析法(简称AHP ),这是一种定性和定量相结合的、系统化、层次化的分析方法。 二. 层次分析法的基本步骤 1.将决策问题分解为三个层次。最上层为目标层,最下层为方案层,中间层为准则层。 2.通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重,这些权重在人的思想过程常是定性的,而在层次分析法中则要给出得到权重的定量方法。 3.将方案层对准则层的权重及准则层对目标层的权重进行综合,最终确定方案层对目标层的权重。在层次分析法中要给出进行综合的计算方法。 三. 构造成对比较阵、计算权向量并做一致性检验;计算组合权向量并做组合一致性检验。 1.成对比较矩阵和权向量 所有因素两两相互对比,对比时采用相对尺度,以尽可能减少性质不同的诸因素相互对比的困难,提高准确度。 假设要比较某一层n 个因素对12,n c c c 上层一个因素O 的影响,每次取两个

数学建模主成分分析方法

主 成分分析方法 地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 一、主成分分析的基本原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:

111212122212p p n n np x x x x x x X x x x ???=????L L L L L L L (1) 如何从这么多变量的数据中抓住地理事物的内在规律性呢要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为z 1,z 2,…,zm (m≤p)。则 11111221221122221122,,......................................... ,p p p p m m m mp p z l x l x l x z l x l x l x z l x l x l x =+++??=+++????=+++?L L L (2)

基于层次分析法的数学建模

基于层次分析法研究云南烟草品牌竞争力 摘要 与国外知名烟草品牌相比,国内的烟草品牌存在着品牌集中度不够,品牌多、杂、散、小;品牌定位模糊,市场占有率低;品牌形象乱,品牌美誉度低,消费者购买行为习惯化导致忠诚度差等问题,因此,本文采用层次分析法对在中国烟草行业中有着举足轻重地位的云南省烟草品牌竞争力进行了评价研究,分析云南烟草业品牌现状,提出品牌竞争力的影响因素,对提高云南烟草业的品牌竞争力、解决烟草业存在的问题提供一定的帮助。 关键词:烟草品牌云南烟草品牌竞争力层次分析法 一、问题重述 近年来,我国一直推进实施卷烟工业的整合重组、卷烟品牌的淘汰和优化。但是,由于之前的卷烟品牌众多;截止到 2009 年底我国的烟草企业有 30 家,卷烟品牌 138 个,所以目前我国烟草企业之间的竞争非常激烈,行业内有众多势均力敌的竞争对手。当今卷烟产品差异化日渐缩小,消费者购买时会更看重品牌价值和品牌文化,使烟草行业内部面临着激烈的竞争,以具有代表性的云烟为实证,分析云南烟草企业的品牌竞争力及影响品牌竞争力的主要因素,并提出提高云烟品牌竞争力的对策建议。

二、问题分析 (1)云南卷烟近年情况分析 图1为云产卷烟在全国各地区的销量情况,有颜色部分为云南卷烟销量均超过15.58万箱,在全国卷烟销售中占有很大份额。2008 年卷烟品牌为16个,比2003年的36个减少了 20个。作为全国卷烟产销量最大的省份,2009 年云南的产销量达到 3667.9 亿支。在卷烟产量增幅较小的情况下,2008 年云南烟草工业税利为 577 亿元,比2003 年的 330 亿元增加了 247 亿元。因此,分析云南卷烟品牌竞争力有助于对云南卷烟品牌做出适当的规划调整,很大程度上能够促进云南经济的发展。(数据为云南中烟系统中2015年 云产卷烟销量数据) 图1

数学建模期末作业谈层次分析法在就业中的应用讲课稿

数学建模期末作业谈层次分析法在就业中 的应用

谈层次分析法在就业中的应用 摘要 近年高校毕业生数量急剧膨胀就业的难题似乎变得更加严峻和突出——全国就业工作座谈会传来消息,2010年应届毕业生规模是本世纪初的6倍,2011年高校毕业生人数为660万人,“十二五”时期应届毕业生年平均规模将达到近700万人。许多大学生处于就业十字路口,茫然不知所措。这种心态下的种种决策难免造成失误,所以需要一种可靠的定量的容易操作的,并且具体的有说服力的方法来帮助做出决策。本文提出了定性和定量相结合的层次分析法步骤,构成了工作满意度的评价指标体系,通过各因素重要程度比较与计算,最终确定出了6个具体指标在该体系下的权重并排序,这样在分析某种工作的满意程度时就可以按此权重进行衡量。为此我们建立了层次结构模型,做成对比较矩阵: 正互反矩阵为?????????? ????? ? ??? ?=wn wn w wn w wn wn w w w w w w w wn w w w w w w w A /...... 2/1//2........3/22/21/2/1........3/12/11/1M M M M 通过Matlab 等数学工具,得到特征向量 T w )083.0,201.0,139.0,154.0,076.0,347.0(1=,且∑==508.6)(max i i nw Aw λ,通过一致 性指标得出1016.0) 1() (max =--= n n CI λ,1.0082.024 .11016 .0<=== RI CI CR , 如果有CI 偏差,那偏差是否在满意的一致性范围,引进平均随机一致性指标RI 。 平均随机一致性指标RI 数值

8第八章 层次分析法

-167- 第八章 层次分析法 层次分析法(Analytic Hierarchy Process ,简称AHP )是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。它是美国运筹学家T. L. Saaty 教授于上世纪70年代初期提出的一种简便、灵活而又实用的多准则决策方法。 §1 层次分析法的基本原理与步骤 人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。 运用层次分析法建模,大体上可按下面四个步骤进行: (i )建立递阶层次结构模型; (ii )构造出各层次中的所有判断矩阵; (iii )层次单排序及一致性检验; (iv )层次总排序及一致性检验。 下面分别说明这四个步骤的实现过程。 1.1 递阶层次结构的建立与特点 应用AHP 分析决策问题时,首先要把问题条理化、层次化,构造出一个有层次的结构模型。在这个模型下,复杂问题被分解为元素的组成部分。这些元素又按其属性及关系形成若干层次。上一层次的元素作为准则对下一层次有关元素起支配作用。这些层次可以分为三类: (i )最高层:这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果,因此也称为目标层。 (ii )中间层:这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则,因此也称为准则层。 (iii )最底层:这一层次包括了为实现目标可供选择的各种措施、决策方案等,因此也称为措施层或方案层。 递阶层次结构中的层次数与问题的复杂程度及需要分析的详尽程度有关,一般地层次数不受限制。每一层次中各元素所支配的元素一般不要超过9个。这是因为支配的元素过多会给两两比较判断带来困难。 下面结合一个实例来说明递阶层次结构的建立。 例1 假期旅游有1P 、2P 、3P 3个旅游胜地供你选择,试确定一个最佳地点。 在此问题中,你会根据诸如景色、费用、居住、饮食和旅途条件等一些准则去反复比较3个侯选地点。可以建立如图1的层次结构模型。 图1 层次结构模型

数学建模常用的十种解题方法

数学建模常用的十种解题方法 摘要 当需要从定量的角度分析和研究一个实际问题时,人们就要在深入调查研究、了解对象信息、作出简化假设、分析内在规律等工作的基础上,用数学的符号和语言,把它表述为数学式子,也就是数学模型,然后用通过计算得到的模型结果来解释实际问题,并接受实际的检验。这个建立数学模型的全过程就称为数学建模。数学建模的十种常用方法有蒙特卡罗算法;数据拟合、参数估计、插值等数据处理算法;解决线性规划、整数规划、多元规划、二次规划等规划类问题的数学规划算法;图论算法;动态规划、回溯搜索、分治算法、分支定界等计算机算法;最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法;网格算法和穷举法;一些连续离散化方法;数值分析算法;图象处理算法。 关键词:数学建模;蒙特卡罗算法;数据处理算法;数学规划算法;图论算法 一、蒙特卡罗算法 蒙特卡罗算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法。在工程、通讯、金融等技术问题中, 实验数据很难获取, 或实验数据的获取需耗费很多的人力、物力, 对此, 用计算机随机模拟就是最简单、经济、实用的方法; 此外, 对一些复杂的计算问题, 如非线性议程组求解、最优化、积分微分方程及一些偏微分方程的解⑿, 蒙特卡罗方法也是非常有效的。 一般情况下, 蒙特卜罗算法在二重积分中用均匀随机数计算积分比较简单, 但精度不太理想。通过方差分析, 论证了利用有利随机数, 可以使积分计算的精度达到最优。本文给出算例, 并用MA TA LA B 实现。 1蒙特卡罗计算重积分的最简算法-------均匀随机数法 二重积分的蒙特卡罗方法(均匀随机数) 实际计算中常常要遇到如()dxdy y x f D ??,的二重积分, 也常常发现许多时候被积函数的原函数很难求出, 或者原函数根本就不是初等函数, 对于这样的重积分, 可以设计一种蒙特卡罗的方法计算。 定理 1 )1( 设式()y x f ,区域 D 上的有界函数, 用均匀随机数计算()??D dxdy y x f ,的方法: (l) 取一个包含D 的矩形区域Ω,a ≦x ≦b, c ≦y ≦d , 其面积A =(b 一a) (d 一c) ; ()j i y x ,,i=1,…,n 在Ω上的均匀分布随机数列,不妨设()j i y x ,, j=1,…k 为落在D 中的k 个随机数, 则n 充分大时, 有

数学建模的基本步骤

数学建模的基本步骤 一、数学建模题目 1)以社会,经济,管理,环境,自然现象等现代科学中出现的新问题为背景,一般都有一个比较确切的现实问题。 2)给出若干假设条件: 1. 只有过程、规则等定性假设; 2. 给出若干实测或统计数据; 3. 给出若干参数或图形等。 根据问题要求给出问题的优化解决方案或预测结果等。根据问题要求题目一般可分为优化问题、统计问题或者二者结合的统计优化问题,优化问题一般需要对问题进行优化求解找出最优或近似最优方案,统计问题一般具有大量的数据需要处理,寻找一个好的处理方法非常重要。 二、建模思路方法 1、机理分析根据问题的要求、限制条件、规则假设建立规划模型,寻找合适的寻优算法进行求解或利用比例分析、代数方法、微分方程等分析方法从基本物理规律以及给出的资料数据来推导出变量之间函数关系。 2、数据分析法对大量的观测数据进行统计分析,寻求规律建立数学模型,采用的分析方法一般有: 1). 回归分析法(数理统计方法)-用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式。 2). 时序分析法--处理的是动态的时间序列相关数据,又称为过程统计方法。 3)、多元统计分析(聚类分析、判别分析、因子分析、主成分分析、生存数据分析)。 3、计算机仿真(又称统计估计方法):根据实际问题的要求由计算机产生随机变量对动态行为进行比较逼真的模仿,观察在某种规则限制下的仿真结果(如蒙特卡罗模拟)。 三、模型求解: 模型建好了,模型的求解也是一个重要的方面,一个好的求解算法与一个合

适的求解软件的选择至关重要,常用求解软件有matlab,mathematica,lingo,lindo,spss,sas等数学软件以及c/c++等编程工具。 Lingo、lindo一般用于优化问题的求解,spss,sas一般用于统计问题的求解,matlab,mathematica功能较为综合,分别擅长数值运算与符号运算。 常用算法有:数据拟合、参数估计、插值等数据处理算法,通常使用spss、sas、Matlab作为工具. 线性规划、整数规划、多元规划、二次规划、动态规划等通常使用Lindo、Lingo,Matlab软件。 图论算法,、回溯搜索、分治算法、分支定界等计算机算法, 模拟退火法、神经网络、遗传算法。 四、自学能力和查找资料文献的能力: 建模过程中资料的查找也具有相当重要的作用,在现行方案不令人满意或难以进展时,一个合适的资料往往会令人豁然开朗。常用文献资料查找中文网站:CNKI、VIP、万方。 五、论文结构: 0、摘要 1、问题的重述,背景分析 2、问题的分析 3、模型的假设,符号说明 4、模型的建立(局部问题分析,公式推导,基本模型,最终模型等) 5、模型的求解 6、模型检验:模型的结果分析与检验,误差分析 7、模型评价:优缺点,模型的推广与改进 8、参考文献 9、附录 六、需要重视的问题 数学建模的所有工作最终都要通过论文来体现,因此论文的写法至关重要:

层次分析法-数学建模

层次分析法 一、分析模型和一般步骤 二、建立层次结构模型 三、构造成对比较矩阵 四、作一致性检验 五、层次总排序及决策 一. 层次分析模型和一般步骤 层次分析法是一种定性与定量分析相结合的多因素决策分析方法。这种方法将决策者的经验判断给于数量化,在目标因素结构复杂且缺乏必要数据的情况下使用更为方便,因而在实践中得到广泛应用。 层次分析的四个基本步骤: (1)在确定决策的目标后,对影响目标决策的因素进行分类,建立一个多层次结构; (2)比较同一层次中各因素关于上一层次的同一个因素的相对重要性,构造成对比较矩阵; (3)通过计算,检验成对比较矩阵的一致性,必要时对成对比较矩阵进行修改,以达到可以接受的一致性; (4)在符合一致性检验的前提下,计算与成对比较矩阵最大特征值相对应的特征向量,确定每个因素对上一层次该因素的权重; 计算各因素对于系统目标的总排序权重并决策。 二. 建立层次结构模型 将问题包含的因素分层:最高层(解决问题的目的);中间层(实现总目标而采取的各种措施、必须考虑的准则等。也可称策略层、约束层、准则层等);最低层(用于解决问题的各种措施、方案等)。把各种所要考虑的因素放在适当的层次内。用层次结构图清晰地表达这些因素的关系。 〔例1〕购物模型 某一个顾客选购电视机时,对市场正在出售的四种电视机考虑了八项准则作为评估依据,建立层次分析模型如下:

例2〕选拔干部模型 对三个干部候选人、、,按选拔干部的五个标准:品德、才能、资历、年龄和群众关系,构成如下层次分析模型:假设有三个干部候选人、、,按选拔干部的五个标准:品德,才能,资历,年龄和群众关系,构成如下层次分析模型 例3〕评选优秀学校 某地区有三个学校,现在要全面考察评出一个优秀学校。主要考虑以下几个因素: (1)教师队伍(包括平均学历和年龄结构)

数学建模层次分析法题目及程序

假期旅游问题 现有三个目的地可供选择(方案):风光绮丽的杭州(),迷人的北戴河(),山水甲 天下的桂林()。有5个行动方案准则:景色、费用、居住、饮食、旅途情况。 目标层 准则层 方案层 选择旅游地的层次结构 1-9的标度方法 1-9的标度方法是将思维判断数量化的一种好方法。首先,在区分事物的差别时,人们 总是用相同、较强、强、很强、极端强的语言。再进一步细分,可以在相邻的两级中插入折衷的提法,因此对于大多数决策判断来说,1-9级的标度是适用的。其次,心理学的实验表 明,大多数人对不同事物在相同程度属性上差别的分辨能力在5-9级之间,采用1-9的 标度反映多数人的判断能力。再次,当被比较的元素其属性处于不同的数量级时,一般需要将较高数量级的元素进一步分解,这可保证被比较元素在所考虑的属性上有同一个数量级或比较接近,从而适用于1 -9的标度。 选择旅游地 J景费居饮旅 色用住食途 C2 C 3 C4 C5 C1 G 『1 1/2 4 3 3、 C2 2 1 7 5 5 A = C3 1/4 1/7 1 1/2 1/3 C4 1/3 1/5 2 1 1 C5 订/3 1/5 3 1 1」

相对于旅途 R P 2 F 3 P 「1 1 1/4、 B 5 =R 2 1 1 1/4 讥4 4 1」 程序: A=[1 1/2 4 3 3; 2 1 7 5 5; 1/4 1/7 1 1/2 1/3; 1/3 1/5 2 1 1; 1/3 1/5 3 1 1]; [x,y]=eig(A); eige nvalue=diag(y); m=max(eige nvalue); lamda=m n=fin d(m==eige nvalue); y_lamda=x(:,n); s=sum(y_lamda); W2=y_lamda./s B1=[ 1 2 5; 1/2 1 2; 相对于景色 P P 2 R P 1 f 1 2 5 B 1 =P 2 1/2 1 2 P 3 <1/5 1/2 '1 相对于费用 R P 2 P 3 R (1 1/3 1/8 B 2 =F2 3 1 1/3 叭 3 '1 ; B 3 R 『1 3 4 、 B 4 =P 2 1/3 11 F 3 '^1/4 1 '1』

数学建模期末作业-谈层次分析法在就业中的应用

谈层次分析法在就业中的应用 摘要 近年高校毕业生数量急剧膨胀就业的难题似乎变得更加严峻和突出——全国就业工作座谈会传来消息,2010年应届毕业生规模是本世纪初的6倍,2011年高校毕业生人数为660万人,“十二五”时期应届毕业生年平均规模将达到近700万人。许多大学生处于就业十字路口,茫然不知所措。这种心态下的种种决策难免造成失误,所以需要一种可靠的定量的容易操作的,并且具体的有说服力的方法来帮助做出决策。本文提出了定性和定量相结合的层次分析法步骤,构成了工作满意度的评价指标体系,通过各因素重要程度比较与计算,最终确定出了6个具体指标在该体系下的权重并排序,这样在分析某种工作的满意程度时就可以按此权重进行衡量。为此我们建立了层次结构模型,做成对比较矩阵: 正互反矩阵为?????????? ????? ?????=wn wn w wn w wn wn w w w w w w w wn w w w w w w w A /......2/1//2........3/22/21/2/1........3/12 /11/1 通 过 Matlab 等 数 学 工 具 , 得 到 特 征 向 量 T w )083.0,201.0,139.0,154.0,076.0,347.0(1=,且∑==508.6)(max i i nw Aw λ,通过一致 性指标得出1016.0) 1() (max =--=n n CI λ,1.0082.024 .11016 .0<=== RI CI CR , 如果有CI 偏差,那偏差是否在满意的一致性范围,引进平均随机一致性指标 RI 。 平均随机一致性指标RI 数值 通过比较,最后得出一致性检验通过。 关键词:大学生择业, 层次分析法,适用性。

数学建模方法详解--三十四种常用算法

数学建模方法详解--三十四种常用算法 目录 一、主成分分析法 (2) 二、因子分析法 (5) 三、聚类分析 (9) 四、最小二乘法与多项式拟合 (16) 五、回归分析(略) (22) 六、概率分布方法(略) (22) 七、插值与拟合(略) (22) 八、方差分析法 (23) 九、逼近理想点排序法 (28) 十、动态加权法 (29) 十一、灰色关联分析法 (31) 十二、灰色预测法 (33) 十三、模糊综合评价 (35) 十四、隶属函数的刻画(略) (37) 十五、时间序列分析法 (38) 十六、蒙特卡罗(MC)仿真模型 (42) 十七、BP神经网络方法 (44) 十八、数据包络分析法(DEA) (51) 十九、多因素方差分析法()基于SPSS) (54) 二十、拉格朗日插值 (70) 二十一、回归分析(略) (75) 二十二、概率分布方法(略) (75) 二十三、插值与拟合(略) (75) 二十四、隶属函数的刻画(参考《数学建模及其方法应用》) (75) 二十五、0-1整数规划模型(参看书籍) (75) 二十六、Board评价法(略) (75) 二十七、纳什均衡(参看书籍) (75) 二十八、微分方程方法与差分方程方法(参看书籍) (75) 二十九、莱斯利离散人口模型(参看数据) (75) 三十、一次指数平滑预测法(主要是软件的使用) (75) 三十一、二次曲线回归方程(主要是软件的使用) (75) 三十二、成本-效用分析(略) (75) 三十三、逐步回归法(主要是软件的使用) (75) 三十四、双因子方差分析(略) (75)

一、主成分分析法 一)、主成分分析法介绍: 主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法。旨在利用降维的思想,把多指标转化为少数几个综合指标。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 二)、主成分分析法的基本思想: 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 三)、主成分分析法的数学模型: 其中:

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

数学建模之层次分析法

层次分析法 层次分析法就是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题。 缺点: (1)层次分析法的主观性太强,模型的搭建,判断矩阵的输入都就是决策者的主观判断,往往会因为决策者的考虑不周、顾此失彼而造成失误。 (2)层次分析法模型的内部结构太过理想化,完全分离、彼此独立的层次结构在实践中很难做到。 (5)层次分析法只能从给定的决策方案中去选择,而不能给出新的、更优的策略。 1、模型的应用 用于解决多目标的复杂问题的定性与定量相结合的决策分析。 (1)公司选拔人员, (2)旅游地点的选取, (3)产品的购买等, (4)船舶投资决策问题(下载文档), (5)煤矿安全研究, (6)城市灾害应急能力, (7)油库安全性评价, (8)交通安全评价等。 2、步骤 ①建立层次结构模型 首先明确决策目标,再将各个因素按不同的属性从上至下搭建出一个有层次的结构模型,模型如下图所示。

准则层 目标层 方案层 目标层:表示解决问题的目的,即层次分析要达到的总目标。通常只有一个总目标。 准则层:表示采取某种措施、政策、方案等实现预定总目标所涉及的中间环节。 方案层:表示将选用的解决问题的各种措施、政策、方案等。通常有几个方案可选。 注意: (1)任一元素属于且仅属于一个层次;任一元素仅受相邻的上层元素的支配,并不就是任一元素与下层元素都有联系; (2)虽然对准则层中每层元素数目没有明确限制,但通常情况下每层元素数最好不要超过 9 个。这就是因为,心理学研究表明,只有一组事物在 9 个以内,普通人对其属性进行判别时才较为清楚。当同一层次元素数多于 9 个时,决策者对两两重要性判断可能会出现逻辑错误的概率加大,此时可以通过增加层数,来减少同一层的元素数。 ②构造判断(成对比较)矩阵 以任意一个上一层的元素为准则,对其支配的下层各因素之间进行两两比较。得到判断矩阵,再求出各元素的权重。ij a 重要程度的衡量用Santy 的1—9标度方法给出。即 设各元素C 1,C 2,… , C n 对目标O 两两比较后的重要性 ,(),ij i j ij n n a C A a ?==0,1ij ji ij a a a >=,则得到比较矩阵

用层次分析法评选优秀学生进行数学建模

用层次分析法评选优秀学生 一.实验目的 运用层次分析法,建立指标评价体系,得到学生的层次结构模型,然后构造判断矩阵,求得各项子指标的权重,最后给出大学生综合评价得分计算公式并进行实证分析,为优秀大学生的评选提出客观公正,科学合理的评价方法。 二.实验内容 4.用层次分析法解决一两个实际问题; (1)学校评选优秀学生或优秀班级,试给出若干准则,构造层次结构模型。可分为相对评价和绝对评价两种情况讨论。 解:层次分析发法基本步骤:建立一套客观公正、科学合理的素质评价体系,对于优秀大学生的评选是至关重要的。在此我们运用层次分析法(AHP),以德、智、体三个方面作为大学生综合评价的一级评价指标,每个指标给出相应的二级子指标以及三级指标,然后构造判断矩阵,得到各个子指标的权重,结合现行的大学生评分准则,算出各项子指标的得分,将这些得分进行加权求和得到大学生综合评价得分,根据分配名额按总分排序即可选出优秀大学生。大学生各项素质的指标体系。如下表所示:

符号说明 设评价指标共有n 个,为1x ,2x ..... n x 。它们对最高层的权系数分别为1w ,2w , ... n w , 于是建立综合评价模型为: = y ∑=n i i i x w 1 解决此类问题关键就是确定权系数,层次分析法给出了确定它们的量化过程,其步骤具体如下: 确定评价指标集 P=(1P ,2P ,3 P ) 1P =(11P ,12P ) 2P =(21P ,22P ) 2P =(31P ,32P )

11P =(1x ,2x ) 12P =(3x ,4x ) 21P =(5x ,6x ,7x ) 22P =(8x ,9x ,10x ) 31P =(11x ,12x ) 31P =(13x ,14x ) 建立两两比较的逆对称判断矩阵 从1x ,2x .....n x 中任取i x 与 j x ,令 =ij a i x /j x ,比较它们对上一层某个因素的重要性时。 若=ij a 1,认为 i x 与 j x 对上一层因素的重要性相同; 若=ij a =3,认为i x 比 j x 对上一层因素的重要性略大; 若=ij a 5,认为i x 比j x 对上一层因素的重要性大; 若=ij a 7,认为i x 比 j x 对上一层因素的重要性大很多; 若=ij a 9,认为 i x 对上一层因素的重要性远远大于 j x ; 若 = ij a 2n ,n=1,2,3,4,元素 i x 与 j x 的重要性介于 = ij a 2n ? 1与 = ij a 2n + 1之间; 用已知所有的 i x /j x ,i ,j =1,2 ... n ,建立n 阶方阵P=n m j i x x ?) /(,矩阵P 的第i 行与 第j 列元素为i x /j x ,而矩阵P 的第j 行与第i 列元素为j x /i x ,它们是互为倒数的,而对 角线元素是1。 判断矩阵 ???? ???????? =11/51/4P 51341/31P P P 321 321P P P 0858.3max =λ 0740.0CI = 0359.6max =λ 0758.0=CI max λ=6.2255 CI =0.0364 max λ=6.0359 CI =0.0758 max λ=15.1382 CI =0.0558 max λ=14.2080 CI =0.0102 max λ=14.3564 CI =0.0175 max λ=15.1972 CI =0.0758 max λ=14.1043 CI =0.0051 max λ=14.2017 CI =0.0099 利用加法迭代计算权重 即取判断矩阵ne 个列向量的归一化的算术平均值近似作为权重向量

常用数学建模方法

数学建模常用方法以及常见题型 核心提示: 数学建模方法一、机理分析法从基本物理定律以及系统的结构数据来推导出模型 1.比例分析法--建立变量之间函数关系的最基本最常用的方法。 2.代数方法--求解离散问题(离散的数据、符号、图形)的主要方法。3. 逻辑方法--是数学理论研的重要方法,对社会学和经济学等领域的实际问题,在决策,对策等学科中得到广泛应用。4.常微分方程--解决两个变量之间的变化规律,关键是建立"瞬时变化率"的表达式。 5.偏微分方程--解决因变量与两个以上自 数学建模方法 一、机理分析法从基本物理定律以及系统的结构数据来推导出模型 1.比例分析法--建立变量之间函数关系的最基本最常用的方法。 2.代数方法--求解离散问题(离散的数据、符号、图形)的主要方法。 3. 逻辑方法--是数学理论研的重要方法,对社会学和经济学等领域的实际问题,在决策,对策等学科中得到广泛应用。 4.常微分方程--解决两个变量之间的变化规律,关键是建立"瞬时变化率"的表达式。 5.偏微分方程--解决因变量与两个以上自变量之间的变化规律。 二、数据分析法从大量的观测数据利用统计方法建立数学模型 1.回归分析法--用于对函数f(x)的一组观测值(xi,fi)I=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法。

2.时序分析法--处理的是动态的相关数据,又称为过程统计方法。 3.回归分析法--用于对函数f(x)的一组观测值(xi,fi)I=1,2,…,n,确定函数的表达式,于处理的是静态的独立数据,故称为数理统计方法。 4.时序分析法--处理的是动态的相关数据,又称为过程统计方法。 三、仿真和其他方法 1.计算机仿真(模拟)--实质上是统计估计方法,等效于抽样试验。 ①离散系统仿真--有一组状态变量。 ②连续系统仿真--有解析达式或系统结构图。 2.因子试验法--在系统上作局部试验,再根据试验结果进行不断分析修改,求得所需的模型结构。 3.人工现实法--基于对系统过去行为的了解和对未来希望达到的目标,并考虑到系统有关因素的可能变化,人为地组成一个系统。 数学建模题型 赛题题型结构形式有三个基本组成部分: 一、实际问题背景 1.涉及面宽--有社会,经济,管理,生活,环境,自然现象,工程技术,现代科学中出现的新问题等。 2.一般都有一个比较确切的现实问题。

相关文档
最新文档