熵值法
1.算法简介
熵值法是一种客观赋权法,其根据各项指标观测值所提供的信息的大小来确定指标权
重。设有m个待评方案,n项评价指标,形成原始指标数据矩阵 nmijxX )( ,对于某项指
标 jx ,指标值 ijX 的差距越大,则该指标在综合评价中所起的作用越大;如果某项指标的指
标值全部相等,则该指标在综合评价中不起作用。
在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;
信息量越小,不确定性就越大,熵也越大.根据熵的特性,我们可以通过计算熵值来判断一
个方案的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越
大,该指标对综合评价的影响越大!因此,可根据各项指标的变异程度,利用信息熵这个工
具,计算出各个指标的权重,为多指标综合评价提供依据!
2.算法实现过程
数据矩阵
mnnmn
m
XX
XX
A
1
111
其中 ijX 为第 i个方案第 j个指标的数值
数据的非负数化处理
由于熵值法计算采用的是各个方案某一指标占同一指标值总和的比值,因此不存在量纲的
影响,不需要进行标准化处理,若数据中有负数,就需要对数据进行非负化处理!此外,为
了避免求熵值时对数的无意义,需要进行数据平移:
对于越大越好的指标:
mjni
XXXXXX
XXXX
X
njjjnjjj
njjjij
ij ,,2,1;,,2,1,1),,,min(),,,max(
),,,min(
2121
21'
对于越小越好的指标:
mjni
XXXXXX
XXXX
X
njjjnjjj
ijnjjj
ij ,,2,1;,,2,1,1),,,min(),,,max(
),,,max(
2121
21'
为了方便起见,仍记非负化处理后的数据为 ijX
计算第 j项指标下第 i个方案占该指标的比重
),2,1(
1
mj
X
X
P
n
i
ij
ij
ij
计算第 j项指标的熵值
1e0,ln
1
0ln,0,)log(*
1
则一般令
有关,与样本数。式中常数为自然对数,其中
mk
mkekPPke j
n
i
ijijj
计算第 j项指标的差异系数。
对于第 j项指标,指标值 ijX 的差异越大,对方案评价的作用越大,熵值就越小
jj eg 1 , 则: jg 越大指标越重要
求权数
mj
g
g
W
m
j
j
j
j 2,1,
1
计算各方案的综合得分
),2,1(*
1
niPWS ij
m
j
ji
3.熵值法的优缺点
熵值法是根据各项指标指标值的变异程度来确定指标权数的,这是一种客观赋权法,避
免了人为因素带来的偏差,但由于忽略了指标本身重要程度,有时确定的指标权数会与预期
的结果相差甚远,同时熵值法不能减少评价指标的维数!
理解熵值法
1. 1
学习熵值法,熵值法是一种理论的数学方法,从计算机科学角度上看,属于一
种算法。要运用熵值法当然要理解它,搞懂它。
2. 2
熵值法原理: 熵的概念源于热力学,是对系统状态不确定性的一种度量。在
信息论中,信息是系统有序程度的一种度量。而熵是系统无序程度的一种度量,
两者绝对值相等,但符号相反。根据此性质,可以利用评价中各方案的固有信
息,通过熵值法得到各个指标的信息熵,信息熵越小,信息的无序度越低,其
信息的效用值越大,指标的权重越大。
3. 3
具体的方法步骤见附图课件。
END
利用 Excel 进行熵值法计算求解
1. 给出算例,题干是购买教车的一个决策矩阵,给出了四个方案供我们进行
选择,每个方案中均有相同的六个属性,我们需要利用熵值法求出各属性的权
重,级在方案中的贡献度。
2. 一:求第 j 个属性下第 i 个方案 Ai 的贡献度,公式为附图一,在 excel
中,先求出各列的和,然后用每行的数值比上列和,形成新的矩阵,如附图 2
所示。
javascript:;
3. 求出所有方案对属性 Xj 的贡献总量,用附图一所示的算法。在 excel 操
作中,将刚才生成的矩阵每个元素变成每个元素与该 ln(元素)的积,如附
图 2 所示。
4. 求出常数 k,k 为 1/ln(方案数),本例中有 4 个方案,4 中车的类型,所
以求得 k 为
,再求 k 与新矩阵每一列和的乘积,这样获得的 6 个积为所有方案
对属性 xj 的贡献度。至此所有的 Ej 就求出来了。
5. dj 为第 j 属性下各方案贡献度的一致性程度。dj=1-Ej,利用上面求得的
Ej,可以得到 dj
6. 各属性权重为对应的 dj 与所有 dj 和的商。dj 的和为 ,求得各
属性的权重为
7. 所以在购买汽车时,据所提供信息,利用熵值法计算得出的权重为油耗占
14%,功率占 7%,费用占 49%,安全性占 16%,维护性占 4%,操作性占
10%。故我们在进行购买决策时,更多是考虑车型的价格和安全性等重要因
素。这是从权重角度考虑的。
8. 就本例而言,每个车型每个指标的得分与其权重的乘积之和为其综合评价
值,这样求得本田 分,奥迪 分,桑塔纳 分,别克
分。所以综合评价排序为奥迪、别克、桑塔纳、本田。
1.算法简介
2.算法实现过程
数据矩阵
数据的非负数化处理
计算第项指标下第
计算第项指标的熵值
求权数
计算各方案的综合得分
3.熵值法的优缺点
理解熵值法
利用Excel进行熵值法计算求解