数据标准化和指标权重确定方法
stata数据标准化处理方法

stata数据标准化处理方法数据标准化是数据分析中非常重要的一步,它能够将不同尺度的数据转换成一个统一的尺度和范围,使得不同数据之间的比较更加容易。
在stata中,有多种方法可以进行数据标准化处理。
本文将介绍其中几种常用的方法,帮助您更好地理解和应用数据标准化。
一、描述性统计方法描述性统计方法是通过对数据的集中趋势和离散程度进行计算和分析,来对数据进行标准化处理。
具体来说,可以通过求取数据的平均值和标准差,将原始数据转换为一个标准化的数值。
这种方法简单易行,但是它忽略了数据的分布情况,可能会对一些异常值产生影响。
在stata中,可以使用“describe”命令来计算数据的描述性统计量,例如使用“mean”命令求取数据的平均值,“stdev”命令求取数据的标准差。
在完成描述性统计量的计算后,可以使用“scale”命令将原始数据转换为标准化的数值。
二、Z分数方法Z分数方法是一种常用的数据标准化方法,它能够将原始数据转换为一个标准正态分布下的数值。
具体来说,可以将原始数据减去平均值,再除以标准差,得到Z分数。
这种方法能够使得Z分数服从标准正态分布,从而方便地进行统计推断和比较。
在stata中,可以使用“score”命令来对数据进行Z分数转换。
该命令会自动计算数据的平均值和标准差,并将原始数据转换为Z分数。
用户还可以使用“predict”命令将Z分数导出到变量中,以便后续分析和使用。
三、主成分分析方法主成分分析是一种常用的数据降维方法,它能够将多个变量通过线性变换转化为较少的几个综合指标(主成分),这些综合指标能够反映原始变量的绝大部分信息,且彼此之间不相关。
在进行主成分分析时,可以将原始数据标准化,以确保每个变量具有相同的权重。
在stata中,可以使用“princomp”命令进行主成分分析。
在进行主成分分析之前,需要先将原始数据进行标准化处理。
在完成主成分分析后,可以将综合指标导出到变量中,以便后续分析和使用。
权重确定方法归纳

2.构造判断矩阵
构造所有相于不同准则的方案层判断矩阵 (1)相对于景色
(2)相对于费用 (3)相对于居住 (4)相对于饮食
(5)相对于旅途
3. 层次单排序及一致性检验 3.1用matlab求得判断矩阵的最大特征根与特征向量: ,对应于的正规化的特征向量为: 判断矩阵的最大特征值与特征向量 判断矩阵的最大特征值与特征向量 判断矩阵的最大特征值与特征向量 判断矩阵的最大特征值与特征向量 判断矩阵的最大特征值与特征向量
0.251 0.016 0.021 0.122 0.117 1
计算过程如下: (1)先根据各个国家的指标数据,分别计算这些国家每个指标的 平均数和标准差; (2)根据均值和标准差计算变异系数。 即:这些国家人均GNP的变异系数为:
农业占GDP比重的变异系数:
其他类推。 (3)将各项指标的变异系数加总:
人均 指 GNP 标
表1-1 现代化水平评价指标的权重
农业 第三
非农
大学生 每千
占 产业
人口自
成人
业劳 城市人
平均预
占适龄 人拥
GDP 占
然增长
识字
总
动力 口比重
期寿命
人口比 有医
的比 GDP
率
率
比重
重
生
重 比重
(美元) (%) (%) (%) (%) (%) (岁) (%) (%) (人) 和
平 均 11938.4 9.352 54.86 0.826 69.792 0.7214 72.632 93.34 36.556 2.446 —
层次分析法根据问题的性质和要达到的总目标,将问题分解为不同 的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同 层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结 为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权 值的确定或相对优劣次序的排定。
确定权重的7种方法

确定权重的7种⽅法确定权重的7种⽅法表7-1 地质环境质量评价定权⽅法⼀览表序号定权⽅法1 专家打分法2 调查统计法1.重要性打分法2.“栅栏”法3.“⽹格”法4.列表打勾ü集合统计法T1.频数截取法2.聚类求均值法3.中间截取求均值法.3 序列综合法1.单定权因⼦排序法2.多定权因⼦排序法4 公式法1.三元函数法2.概率法3.信息量法4.相关系数法5.⾪属函数法5 数理统计法1.判别分析法2.聚类分析法3.因⼦分析法6 层次分析法7 复杂度分析法⼀、专家打分法专家打分法即是由少数专家直接根据经验并考虑反映某评价观点后定出权重,具体做法和基本步骤如下:第⼀步选择评价定权值组的成员,并对他们详细说明权重的概念和顺序以及记权的⽅法。
第⼆步列表。
列出对应于每个评价因⼦的权值范围,可⽤评分法表⽰。
例如,若有五个值,那么就有五列。
⾏列对应于权重值,按重要性排列。
第三步发给每个参予评价者⼀份上述表格,按下述步骤四~九反复核对、填写,直⾄没有成员进⾏变动为⽌。
第四步要求每个成员对每列的每种权值填上记号,得到每种因⼦的权值分数。
第五步要求所有的成员对作了记号的列逐项⽐较,看看所评的分数是否能代表他们的意见,如果发现有不妥之处,应重新划记号评分,直⾄满意为⽌。
第六步要求每个成员把每个评价因⼦(或变量)的重要性的评分值相加,得出总数。
第七步每个成员⽤第六步求得的总数去除分数,即得到每个评价因⼦的权重。
第⼋步把每个成员的表格集中起来,求得各种评价因⼦的平均权重,即为“组平均权重”。
第九步列出每种的平均数,并要求评价者把每组的平均数与⾃⼰在第七步得到的权值进⾏⽐较。
第⼗步如有⼈还想改变评分,就须回到第四步重复整个评分过程。
如果没有异议,则到此为⽌,各评价因⼦(或变量)的权值就这样决定了。
⼆、调查统计法具体作法有下⾯四种。
1.重要性打分法:重要性打分法是指要求所有被征询者根据⾃⼰对各评价因⼦的重要性的认识分别打分,其步骤如下:a.对被征询者讲清统⼀的要求,给定打分范围,通常1~5分或1~100分都可。
权重确定方法归纳

权重确定方法归纳多指标综合评价是指人们根据不同的评价目的,选择相应的评价形式据此选择多个因素或指标,并通过一定的评价方法将多个评价因素或指标转化为能反映评价对象总体特征的信息,其中评价指标与权重系数确定将直接影响综合评价的结果;按照权数产生方法的不同多指标综合评价方法可分为主观赋权评价法和客观赋权评价法两大类,其中主观赋权评价法采取定性的方法由专家根据经验进行主观判断而得到权数,然后再对指标进行综合评价,如层次分析法、综合评分法、模糊评价法、指数加权法和功效系数法等;客观赋权评价法则根据指标之间的相关关系或各项指标的变异系数来确定权数进行综合评价,如熵值法、神经网络分析法、TOPSIS法、灰色关联分析法、主成分分析法、变异系数法等;两种赋权方法特点不同,其中主观赋权评价法依据专家经验衡量各指标的相对重要性,有一定的主观随意性,受人为因素的干扰较大,在评价指标较多时难以得到准确的评价;客观赋权评价法综合考虑各指标间的相互关系,根据各指标所提供的初始信息量来确定权数,能够达到评价结果的精确但是当指标较多时,计算量非常大;下面就对当前应用较多的评价方法进行阐述;一、变异系数法一变异系数法简介变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重;是一种客观赋权的方法;此方法的基本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更能反映被评价单位的差距;例如,在评价各个国家的经济发展状况时,选择人均国民生产总值人均GNP作为评价的标准指标之一,是因为人均GNP不仅能反映各个国家的经济发展水平,还能反映一个国家的现代化程度;如果各个国家的人均GNP没有多大的差别,则这个指标用来衡量现代化程度、经济发展水平就失去了意义;由于评价指标体系中的各项指标的量纲不同,不宜直接比较其差别程度;为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度;各项指标的变异系数公式如下:式中:是第项指标的变异系数、也称为标准差系数;是第项指标的标准差;是第项指标的平均数;各项指标的权重为:二案例说明例如,英国社会学家英克尔斯提出了在综合评价一个国家或地区的现代化程度时,其各项指标的权重的确定方法就是采用的变异系数法;案例:利用变异系数法综合评价一个国家现代化程度时的指标体系中的各项指标的权重;数据资料是选取某一年的数据,包括中国在内的中等收入水平以上的近40个国家的10项指标作为评价现代化程度的指标体系,计算这些国家的变异系数,反映出各个国家在这些指标上的差距,并作为确定各项指标权重的依据;其标准差、平均数数据及其计算出的变异系数等见表1-1;i ii x V σ=()n i ,,2,1 =iV i i σi i xi ∑==ni iii VV W 1计算过程如下:1先根据各个国家的指标数据,分别计算这些国家每个指标的平均数和标准差;2根据均值和标准差计算变异系数; 即:这些国家人均GNP 的变异系数为:农业占GDP 比重的变异系数:其他类推;3将各项指标的变异系数加总:4计算构成评价指标体系的这10个指标的权重: 人均GNP 的权重:农业占GDP 比重的权重:其他指标的权重都以此类推; 三变异系数法的优点和缺点当由于评价指标对于评价目标而言比较模糊时,采用变异系数法评价进行评定是比较合适的,适用各个构成要素内部指标权数的确定,在很多实证研究中也多数采用这一方法;缺点在于对指标的具体经济意义重视不够,也会存在一定的误7 966.270.66711 938.4ii iV x σ===782.0352.9316.7===iii x V σ0.6670.7820.2360.560.537 4.59+++++=145.059.4667.01===∑=ni iii VV W 1704.059.4782.01===∑=ni iii VV W差;二、层次分析法一层次分析法概述人们在对社会、经济以及管理领域的问题进行系统分析时,面临的经常是一个由相互关联、相互制约的众多因素构成的复杂系统;层次分析法则为研究这类复杂的系统,提供了一种新的、简洁的、实用的决策方法;层次分析法AHP法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法;该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题;二层次分析法原理层次分析法根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层供决策的方案、措施等相对于最高层总目标的相对重要权值的确定或相对优劣次序的排定;层次分析法的特点是在对复杂的决策问题的本质、影响因素及其内在关系等进行深入分析的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法;尤其适合于对决策结果难于直接准确计量的场合;三层次分析法的步骤和方法•建立层次结构模型•构造判断(成对比较)矩阵•层次单排序及一致性检验•层次组合排序及一致性检验1. 建立层次结构模型利用层次分析法研究问题时,首先要把与问题有关的各种因素层次化,然后构造出一个树状结构的层次结构模型,称为层次结构图;一般问题的层次结构图分为三层,如图所示;最高层为目标层O :问题决策的目标或理想结果,只有一个元素;中间层为准则层C :包括为实现目标所涉及的中间环节各因素,每一因素为一准则,当准则多于9个时可分为若干个子层;最低层为方案层P :方案层是为实现目标而供选择的各种措施,即为决策方案;一般说来,各层次之间的各因素,有的相关联,有的不一定相关联;各层次的因素个数也未必一定相同.实际中,主要是根据问题的性质和各相关因素的类别来确定;层次分析法所要解决的问题是关于最低层对最高层的相对权重问题,按此相对权重可以对最低层中的各种方案、措施进行排序,从而在不同的方案中作出选择或形成选择方案的原则;2. 构造判断成对比较矩阵构造比较矩阵主要是通过比较同一层次上的各因素对上一层相关因素的影响作用.而不是把所有因素放在一起比较,即将同一层的各因素进行两两对比;比较时采用相对尺度标准度量,尽可能地避免不同性质的因素之间相互比较的困难;同时,要尽量依据实际问题具体情况,减少由于决策人主观因素对结果造成的影响;决策目标o准则1C 1准则2C 2准则m 1C m1子准则1C 11子准则2C 21方案1P 1方案2P 2方案nP n子准则m 2 C m21设要比较n 个因素n C C C ,,,21 对上一层如目标层O 的影响程度,即要确定它在O 中所占的比重;对任意两个因素i C 和j C ,用ij a 表示i C 和j C 对O 的影响程度之比,按1~9的比例标度来度量),,2,1,(n j i a ij =.于是,可得到两两成对比较矩阵n n ij a A ⨯=)(,又称为判断矩阵,显然0>ij a ,),,2,1,(,1,1n j i a a a ii ijji ===因此,又称判断矩阵为正互反矩阵.比例标度的确定:ij a 取1-9的9个等级,ji a 取ij a 的倒数,1-9标度确定如下:ij a = 1,元素i 与元素j 对上一层次因素的重要性相同; ij a = 3,元素i 比元素j 略重要; ij a = 5,元素i 比元素j 重要; ij a = 7, 元素i 比元素j 重要得多; ij a = 9,元素i 比元素j 的极其重要; 2ij a n =,1,2,3,4n =元素i 与j 的重要性介于21ij a n =-与21ij a n =+之间;1ij a n=,1,2,9n =当且仅当ji a n =;由正互反矩阵的性质可知,只要确定A 的上或下三角的2)1(-n n 个元素即可;在特殊情况下,如果判断矩阵A 的元素具有传递性,即满足),,2,1,,(n k j i a a a ij kj ik ==则称A 为一致性矩阵,简称为一致阵. 3. 层次单排序及一致性检验3.1相对权重向量确定 1和积法取判断矩阵n 个列向量归一化后的算术平均值,近似作为权重,即),,2,1(111n i a a n w n j n k kjiji ==∑∑==类似地,也可以对按行求和所得向量作归一化,得到相应的权重向量; 2求根法几何平均法将A 的各列或行向量求几何平均后归一化,可以近似作为权重,即),,2,1(111111n i a a w nj nk nn j kj nij n j i =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=∑∑∏∏====3特征根法设想把一大石头Z 分成n 个小块n c c c ,,,21 ,其重量分别为n w w w ,,,21 ,则将n 块小石头作两两比较,记j i c c ,的相对重量为),,2,1,(n j i w w a jiij ==,于是可得到比较矩阵111122221212n n n n n n w w w w w w w w w w w w A w w w w w w ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦显然,A 为一致性正互反矩阵,记12(,,,)T n W w w w =,即为权重向量.且12111,,,n A W w w w ⎛⎫=⋅ ⎪⎝⎭则12111,,,n A W W W nW w w w ⎛⎫⋅=⋅= ⎪⎝⎭这表明W 为矩阵A 的特征向量,且n 为特征根.事实上:对于一般的判断矩阵A 有max A W W λ⋅=,这里)(max n =λ是A 的最大特征根,W 为m ax λ对应的特征向量.将W 作归一化后可近似地作为A 的权重向量,这种方法称为特征根法; 注:现有软件求得最大特征根与特征向量; 3.2一致性检验通常情况下,由实际得到的判断矩阵不一定是一致的,即不一定满足传递性和一致性.实际中,也不必要求一致性绝对成立,但要求大体上是一致的,即不一致的程度应在容许的范围内.主要考查以下指标: 1一致性指标:1max --=n n CI λ.2随机一致性指标:RI ,通常由实际经验给定的,如表2-1;表2-1 随机一致性指标3一致性比率指标:RICI CR =,当10.0<CR 时,认为判断矩阵的一致性是可以接受的,则m ax λ对应的特征向量可以作为排序的权重向量;此时()1max 111nij jnnj ii i iia wA W nw n w λ===⋅≈=∑∑∑其中(A )i W ⋅表示A W ⋅的第i 个分量; 4.计算组合权重和组合一致性检验 1组合权重向量设第1-k 层上1-k n 个元素对总目标最高层的排序权重向量为()1(1)(1)(1)(1)12,,,k Tk k k k n Wwww-----=第k 层上k n 个元素对上一层1-k 层上第j 个元素的权重向量为()(1)()()()121,,,,1,2,,k Tk k k k jj jn jk P p p pj n --==则矩阵1()()()()12,P ,,P k k k k k n P P -⎡⎤=⎣⎦是1-⨯k k n n 阶矩阵,表示第k 层上的元素对第1-k 层各元素的排序权向量.那么第k 层上的元素对目标层最高层总排序权重向量为()1()()(1)()()()(1)12()()()12,P ,,P ,,,k kk k k k k k k n Tk k k n W P W P W w w w---⎡⎤=⋅=⋅⎣⎦=或k k j n j k ij k in i w p wk ,,2,1,)1(1)()(1==-=∑- 对任意的2>k 有一般公式()()(1)(3)(2)(2)k k k W P P P W k -=⋅⋅⋅⋅>其中(2)W 是第二层上各元素对目标层的总排序向量. 2组合一致性指标设k 层的一致性指标为)()(2)(11,,,k nk k k CI CI CI - ,随机一致性指标为 )()(2)(11,,,k n k k k RI RI RI - 则第k 层对目标层的最高层的组合一致性指标为()1()()()()(1)12,,,k k k k k k n CI CI CI CI W --=⋅ 组合随机一致性指标为()1()()()()(1)12,,,k k k k k k n RI RI RI RI W --=⋅ 组合一致性比率指标为)3()()()1()(≥+=-k RICI CRCRk k k k 当10.0)(<k CR 时,则认为整个层次的比较判断矩阵通过一致性检验.四案例说明实例:人们在日常生活中经常会碰到多目标决策问题,例如假期某人想要出去旅游,现有三个目的地方案:风光绮丽的杭州1P 、迷人的北戴河2P 和山水甲天下的桂林3P ;假如选择的标准和依据行动方案准则有5个景色,费用,饮食,居住和旅途;1.建立层次结构模型目标层 准则层2.构造判断矩阵1234511/2433217551/41/711/21/31/31/52111/31/5311C C A C C C ⎛⎫ ⎪⎪ ⎪= ⎪⎪ ⎪⎝⎭构造所有相对于不同准则的方案层判断矩阵 1相对于景色O 择旅游地P1桂林C1景色C2费用C3居住C4饮食C5旅途P2黄山P3北戴河12345C C C C C 11231251/2121/51/2`1P B P P ⎛⎫ ⎪= ⎪⎪⎝⎭123P P P2相对于费用3相对于居住4相对于饮食5相对于旅途3. 层次单排序及一致性检验3.1用matlab 求得判断矩阵A 的最大特征根与特征向量:max 5.073λ=,对应于max 5.073λ=的正规化的特征向量为:(2)(0.263,0.475,0.055,0.099,0.110)T W =判断矩阵1B 的最大特征值与特征向量max 3.005λ=(3)10.5950.2770.129W ⎛⎫ ⎪= ⎪ ⎪⎝⎭122311/31/8311/383`1P B P P ⎛⎫ ⎪= ⎪⎪⎝⎭123P P P 132********/31/3`1P B P P ⎛⎫ ⎪= ⎪⎪⎝⎭123P P P 14231341/3111/41`1P B P P ⎛⎫ ⎪= ⎪⎪⎝⎭123P P P 1523111/4111/4441P B P P ⎛⎫ ⎪= ⎪⎪⎝⎭123P P P判断矩阵2B 的最大特征值与特征向量max 3.002λ=(3)20.2360.682W ⎪= ⎪ ⎪⎝⎭判断矩阵3B 的最大特征值与特征向量max 3λ=(3)30.4290.429,0.142W ⎛⎫ ⎪= ⎪ ⎪⎝⎭判断矩阵4B 的最大特征值与特征向量max 3.009λ=(3)40.6330.193,0.175W ⎛⎫⎪= ⎪ ⎪⎝⎭判断矩阵5B 的最大特征值与特征向量max 3λ=(3)50.1660.166.0.668W ⎛⎫ ⎪= ⎪ ⎪⎝⎭4.一致性检验对于判断矩阵A 进行一致性检验:max 5.07350.01825151nCI n λ--===--查表知平均随机一致性指标RI,从而可检验矩阵一致性:0.018250.0162950.11.12CI CR RI ===< 同理,对于第二层次的景色、费用、居住、饮食、旅途五个判断矩阵的一致性检验均通过;利用层次结构图绘出从目标层到方案层的计算结果:5.层次总排序各个方案优先程度的排序向量为:(3)(2)W W W =0.5950.0820.4290.6330.1660.3000.4750.2770.2360.4290.1930.1660.2460.0550.1290.6820.1420.1750.6680.4560.0990.110 ⎪⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭决策结果是首选旅游地为3P 其次为1P ,最后为2P ; 五优点与缺点人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统;层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法;在应用层次分析法研究问题时,遇到的主要困难有两个: i 如何根据实际情况抽象出较为贴切的层次结构;ii 如何将某些定性的量作比较接近实际定量化处理;层次分析法对人们的思维过程进行了加工整理,提出了一套系统分析问题的方法,为科学管理和决策提供了较有说服力的依据;但层次分析法也有其局限性,主要表现在:i 它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维过程中的严重非一致性,却无法排除决策者个人可能存在的严重片面性;ii 当指标量过多时,对于数据的统计量过大,此时的权重难以确定;AHP 至多只能算是一种半定量或定性与定量结合的方法;三、熵值法一熵值法的原理在信息论中,熵是对不确定性的一种度量;信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大;根据熵的特性,我们可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大; 二算法实现过程 1.数据矩阵m n nm n m X X X X A ⨯⎪⎪⎪⎭⎫ ⎝⎛=1111其中ij X 为第i 个方案第j 个指标的数值; 2. 数据的非负数化处理由于熵值法计算采用的是各个方案某一指标占同一指标值总和的比值,因此不存在量纲的影响,不需要进行标准化处理,若数据中有负数,就需要对数据进行非负化处理;此外,为了避免求熵值时对数的无意义,需要进行数据平移:对于越大越好的指标:mj n i X X X X X X X X X X X nj j j nj j j nj j j ij ij ,,2,1;,,2,1,1),,,min(),,,max(),,,min(212121' ==+--=对于越小越好的指标:mj n i X X X X X X X X X X X nj j j nj j j ijnj j j ij,,2,1;,,2,1,1),,,min(),,,max(),,,max(212121' ==+--=为了方便起见,仍记非负化处理后的数据为ij X 3.计算第j 项指标下第i 个方案占该指标的比重),2,1(1m j XX P ni ijijij ==∑=4.计算第j 项指标的熵值1e 0,ln 10ln ,0,)log(*1≤≤=≥>-=∑=则一般令有关,与样本数。
灰色关联法确定权重

灰色关联法确定权重1. 引言灰色关联法是一种基于数学模型的分析方法,通过对多个指标进行比较和关联,确定它们之间的相关程度和影响因素的重要性。
在决策分析、综合评价和预测预警等领域中广泛应用。
本文将详细介绍灰色关联法的原理、步骤以及如何利用该方法确定权重。
2. 灰色关联法原理灰色关联法是由中国科学家陈胜武于1981年提出的,其基本原理是通过建立灰色关联度模型,从而判断各个因素对目标因素的影响程度。
该方法主要包括以下几个步骤:2.1 数据标准化首先需要将各个指标的数据进行标准化处理,将其转化为无量纲纯数值。
常用的标准化方法有极差法、标准差法和正态化等。
2.2 确定参考数列参考数列是一个代表目标因素发展趋势的序列,可以是已知数据或者专家经验给出的预测值。
2.3 计算关联系数通过计算各个指标与参考数列之间的关联系数,来评价各个因素对目标因素的影响程度。
关联系数的计算可以采用相关系数、欧氏距离等方法。
2.4 确定权重根据关联系数的大小,确定各个因素的权重。
关联系数越大,说明该指标对目标因素的影响越大,其权重也就越高。
3. 灰色关联法确定权重步骤下面将详细介绍如何利用灰色关联法确定指标的权重:3.1 数据准备首先需要收集所需数据,并进行预处理。
确保数据的准确性和完整性,同时对数据进行标准化处理,使其具有可比性。
3.2 确定参考数列根据研究目的和实际情况,选择一个代表目标因素发展趋势的参考数列。
可以是已知数据或者专家经验给出的预测值。
3.3 计算关联系数通过计算各个指标与参考数列之间的关联系数,来评价各个因素对目标因素的影响程度。
常用的计算方法有相关系数法和欧氏距离法。
相关系数法相关系数是衡量两个变量之间相关程度的指标,常用的相关系数有皮尔逊相关系数和斯皮尔曼相关系数。
可以通过计算各个指标与参考数列的相关系数,得到关联系数。
欧氏距离法欧氏距离是衡量两个向量之间差异程度的指标,可以通过计算各个指标与参考数列之间的欧氏距离,来得到关联系数。
权重确定方法归纳

权重确定方法归纳多指标综合评价是指人们根据不同的评价目的,选择相应的评价形式据此选择多个因素或指标,并通过一定的评价方法将多个评价因素或指标转化为能反映评价对象总体特征的信息,其中评价指标与权重系数确定将直接影响综合评价的结果。
按照权数产生方法的不同多指标综合评价方法可分为主观赋权评价法和客观赋权评价法两大类,其中主观赋权评价法采取定性的方法由专家根据经验进行主观判断而得到权数,然后再对指标进行综合评价,如层次分析法、综合评分法、模糊评价法、指数加权法和成效系数法等。
客观赋权评价法那么根据指标之间的相关关系或各项指标的变异系数来确定权数进行综合评价,如熵值法、神经网络分析法、TOPSIS法、灰色关联分析法、主成分分析法、变异系数法等。
两种赋权方法特点不同,其中主观赋权评价法依据专家经验衡量各指标的相对重要性,有一定的主观随意性,受人为因素的干扰较大,在评价指标较多时难以得到准确的评价。
客观赋权评价法综合考虑各指标间的相互关系,根据各指标所提供的初始信息量来确定权数,能够到达评价结果的精确但是当指标较多时,计算量非常大。
下面就对当前应用较多的评价方法进行阐述。
一、变异系数法〔一〕变异系数法简介变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重。
是一种客观赋权的方法。
此方法的根本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更能反映被评价单位的差距。
例如,在评价各个国家的经济开展状况时,选择人均国民生产总值(人均GNP)作为评价的标准指标之一,是因为人均GNP不仅能反映各个国家的经济开展水平,还能反映一个国家的现代化程度。
如果各个国家的人均GNP没有多大的差异,那么这个指标用来衡量现代化程度、经济开展水平就失去了意义。
由于评价指标体系中的各项指标的量纲不同,不宜直接比拟其差异程度。
为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。
权重确定方法归纳解读

权重确定方法归纳多指标综合评价是指人们根据不同的评价目的,选择相应的评价形式据此选择多个因素或指标,并通过一定的评价方法将多个评价因素或指标转化为能反映评价对象总体特征的信息,其中评价指标与权重系数确定将直接影响综合评价的结果。
按照权数产生方法的不同多指标综合评价方法可分为主观赋权评价法和客观赋权评价法两大类,其中主观赋权评价法采取定性的方法由专家根据经验进行主观判断而得到权数,然后再对指标进行综合评价,如层次分析法、综合评分法、模糊评价法、指数加权法和功效系数法等。
客观赋权评价法则根据指标之间的相关关系或各项指标的变异系数来确定权数进行综合评价,如熵值法、神经网络分析法、TOPSIS法、灰色关联分析法、主成分分析法、变异系数法等。
两种赋权方法特点不同,其中主观赋权评价法依据专家经验衡量各指标的相对重要性,有一定的主观随意性,受人为因素的干扰较大,在评价指标较多时难以得到准确的评价。
客观赋权评价法综合考虑各指标间的相互关系,根据各指标所提供的初始信息量来确定权数,能够达到评价结果的精确但是当指标较多时,计算量非常大。
下面就对当前应用较多的评价方法进行阐述。
一、变异系数法(一)变异系数法简介变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重。
是一种客观赋权的方法。
此方法的基本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更能反映被评价单位的差距。
例如,在评价各个国家的经济发展状况时,选择人均国民生产总值(人均GNP)作为评价的标准指标之一,是因为人均GNP不仅能反映各个国家的经济发展水平,还能反映一个国家的现代化程度。
如果各个国家的人均GNP没有多大的差别,则这个指标用来衡量现代化程度、经济发展水平就失去了意义。
由于评价指标体系中的各项指标的量纲不同,不宜直接比较其差别程度。
为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。
熵值法标准化处理公式

熵值法标准化处理公式
熵值法是一种常用的多指标权重确定方法,通过计算各指标的熵值来确定权重,从而实现对指标进行标准化处理。
其标准化处理公式可描述为以下步骤:
1. 确定指标的数据集:首先,收集所需指标的数据集,该数据集应包含所有样
本的指标值。
2. 计算指标的归一化矩阵:将指标的数据集进行归一化处理,消除指标之间的
量纲差异。
常用的归一化方法有线性归一化、标准化等,根据实际情况选择适当的方法。
3. 计算指标的权重:对每个指标的归一化矩阵,计算其各个属性值的熵值。
熵
值的计算公式为:熵值 = - sum(pi * log(pi)),其中pi表示该属性值出现的概率。
4. 计算指标的权重向量:将熵值转化为权重向量,使得各指标的权重之和为1。
一种常用的方法是通过归一化处理,将熵值除以熵值之和。
5. 进行指标的加权求和:将每个指标的归一化矩阵乘以对应的权重,再将结果
相加,得到最终的标准化处理结果。
熵值法标准化处理公式是一种有效的多指标权重确定方法,可以帮助我们解决
目标多样性和权重确定的问题。
通过计算指标的熵值,能够准确刻画指标的重要程度,并将其应用于标准化处理中,提高数据的可比性和分析的准确性。
因此,在实际应用中,我们可以根据任务的需要,使用熵值法标准化处理公式来对指标进行权重确定和标准化处理。
这将帮助我们更好地进行决策和评价,从而推动工作或研究的进展和发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按环比计算的 换算为以E为
重要性比率
基数的比率
2.0
4.5
0.5
2.25
3.0
4.5
1.5
1.5
1.0
13.75
权数
0.327 0.164 0.327 0.109 0.073 对指标的重要性进行两两比较,重要的得1分, 不重要的得0分 。如下例:
指标
重要性得分
总 修正 分 总分
2 线性比例变换法
在决策矩阵X中,对于正向指标,取
yij
xij
max
1im
xij
, (1 i m,1
j
n)
对于逆向指标,取
yij
min
1im
xij
xij
, (1 i
m,1
j
n)
经过线性变换后,指标值均在0~1之间,正、逆向 指标均化为正向指标,最优值为1,最劣值为0。
3 极差变换法
1 L
均值
方差
G1 G2
Gn
w w w 11 21
n1
w w w 1L 2L
nL
w1w2wn
D1 D2
Dn
L
wi ( wij) / L, (i 1,2,, n) j 1 L
Di [ (wij wi)2 ] /(L 1), (i 1,2,, n) j1
若方差中最大的不超过允许误差e,说明各个老 手提供的权数没有显著差别,以均值作为各个指标 的权数,否则和方差大的老手协商调整权数,重复 上述过程。
权数
A 1 111
4
B0
111
3
C
0
0
10
1
D
0
0
0
00
E
0
0
11 2
合计
10
5 0.33 4 0.27 2 0.13 1 0.07 3 0.2
15 1.0
也可以用下表表示
指标
A B C D E
ABCDE
×1 1 11 0×1 11 0 0×10 0 0 0× 0 0 0 1 1×
合计
得分
5 4 2 1 3
指标的重要程度
1 老手法(专家咨询法) 选L个有经验的老手(专家) ,独立对n个指标给
出权数。
设第j 位老手提出的权数方案为
w1 j, w2 j,, wnj, ( j 1,2,, L)
n
wij 1, wij 0, (i 1,2,, n; j 1,2,, L)
i 1
权数方案表如下:其中
指标 老手
或更简单一些直接用wij与wi之差的绝对值代替方差。
2. 环比法
先把指标随意排序,按照顺序逐个 比较两个指标的重要性,得出环比比率, 再通过连乘把环比比率换算为以最后一 个指标为基数的定基比率,最后归一化 为权数。例如,有A、B、C、D、E五个 指标,按照此顺序求其权数。
指标
A B C D E 合计
在决策矩阵X中,对于正向指标,取
yij
xij
min
1im
xij
max
1im
xij
min 1im
xij
, (1 i m,1
j n)
对于逆向指标,取
yij
max
1im
xij
xij
max
1im
xij
min 1im
xij
, (1 i m,1
j
n)
经过极差变换后,指标值均在0~1之间,正、逆向
指标均化为正向指标,最优值为1,最劣值为0。
4 标准样本变换法
在决策矩阵X中,取
yij
xij
1 m
m i 1
xij
, (1 i m,1 j n)
1
m 1
m
( xij
i 1
1 m
m i 1
xij
)2
经过标准样本变换后,标准化矩阵每列的样本均 值为0,方差为1。
5 平均值法
一组数x1,x2 ,x3,......,xn ,其平均值为x, 则各数的平均值法得到的标准化值为x1/x,x2 /x,......
将不同量纲通过变换,变为无量纲的标准 化指标。
指标一般分为两类:效益型(正向)指标 (越大越好)和成本型(逆向)指标(越小越 好)。
1 向量归一化法
在决策矩阵中,令
yij
xij
m
, (1 i m,1 j n)
xij2
i 1
称矩阵 Y ( yij ) 为向量归一标准化矩阵,其列向量 模等于1,而且指标值均满足在0~1之间。并且正、逆 向方向没变。
最大速度 (马赫)
最大范围 最大负载 费用 (公里) (千克) (106 可靠性
灵敏度
美元)
A
2.0
1500
20000 5.5 一般 很高
B
2.5
2700
18000 6.5 低
一般
C
1.8
2000
21000 4.5 高
高
D
2.2
1800
20000 5.0 一般 一般
解:前三个指标是正向指标,第四个指标是逆向
1 1 0.86 0.69 0.43 0.56
0.72 0.74 1
1
1
0.78
0.88 0.67 0.95 0.9 0.71 0.56
用极差变换法Y为
( 0.28 0 11 0 0.42
0.67 0 1
0.5 0 1
) 0.51 1
0
0
1
0.5
0.57 0.52 0.67 0.75 0.5 0
当多个指标的重要程度不同时,以权数表示各个
15
4. 相对比较法
与三类似,区别是同样重要时各得0.5分。这两 种方法注意传递性,避免出现矛盾。
5. 判断矩阵法
6 定性指标量化处理方法
可以最优值为10分,最劣值为0分,其余相 应给分如下:
指标
正向 指标
逆向 指标
很低 1 9
低 一般 高 很高
3
57
9
7
53
1
例1:某航空公司在国际市场上购买飞机,按照6个 决策指标对不同型号的飞机进行综合评价。有4种型号 飞机可供选择。具体指标如下表:写出决策矩阵,进行 标准化处理。
指标,第五、六指标是定性指标。先将第五、六指标 量化,写出决策矩阵,再分别用前三种方法归一化。
(2.0 1500 20000 5.5 2.5 2700 18000 6.5 1.8 2000 21000 4.5
5 3 7
) 9
5 7
2.2 1800 20000 5.0 5 5
用线性比例变换法Y为
( ) 0.8 0.56 0.95 0.82 0.71 1