指标权重确定方法之熵值法
日常工作中,经常需要确定各指标的权重,利用熵值法确定权重属于客观赋
权法,从数据出发,避免过强的主观性,那我们详细了解下其原理及其是如何运
作的吧。
什么是信息熵
熵是热力学的一个物理概念,是体系混乱度(或无序度)的量度。熵越大说明系
统越混乱,携带的信息越少,熵越小说明系统越有序,携带的信息越多。信息熵
则借鉴了热力学中熵的概念 (注意:信息熵的符号与热力学熵应该是相反的),
用于描述平均而言事件信息量大小。所以数学上,信息熵其实是事件所包含的信
息量的期望。在概率论和统计学中,数学期望(mean)(或均值,亦简称期望)
是试验中每次可能结果的概率乘以其结果的总和。根据上面期望的定义,我们可
以设想信息熵的公式大概是这样的一个格式:信息熵=∑每种可能事件的概率*
每种可能事件包含的信息量
如何理解信息熵
信息熵的基本思想是从指标的无序程度,即指标熵的角度来反映指标对评价对象
的区分程度,某指标的熵值越小,该指标的样本数据就越有序,样本数据间的差
异就越大,对评价对象的区分能力也就越大,相应的权重也就越大。相反,某个
指标的信息熵越大表明指标的变异程度越小,提供的信息量也就越少,在综合评
价中所起的作用也就越小,其权重也就越小。
熵值法如何实现
1、假设数据有 n 行记录,m 个变量,数据可以用一个 n*m 的矩阵 A 表示(n 行
m 列,即 n 行记录数,m 个特征列)
2、数据的归一化处理:xij 表示矩阵 A 的第 i 行 j 列元素
3、计算第 j 项指标下第 i 个记录所占比重
4、计算第 j 项指标的熵值
5、确定各指标的权重
熵值法赋权实例
案例:某医院为了提高自身的护理水平,对拥有的 11 个科室进行了考核,考核
标准包括 9 项整体护理,并对护理水平较好的科室进行奖励。下表是对各个科室
指标考核后的评分结果。
由于各项护理的难易程度不同,因此需要对 9 项护理进行赋权,以便能够更加合
理的对各个科室的护理水平进行评价。具体步骤如下:
1) 数据标准化
根据原始评分表,对数据进行标准化后可以得到下列数据标准化表:
02) 计算权重
03) 求各指标的信息熵
根据信息熵的计算公式 ,可以计算出 9 项护理指标各
自的信息熵如下:
04) 计算各指标的权重
根据指标权重的计算公式 ,可以得到各个指标的权重,
如下表所示:
05) 对各个科室进行评分
根据计算出来的指标权重,及对 11 个科室的 9 项护理水平的评分,则
,各个科室的最终得分如下表所示:
指标权重确定方法之熵值法