熵权法实现

2023-10-07 05:54:30

文章目录

- 熵权法
- 算法步骤
- - 指标标准化。
  - 计算第 $i$ 个研究对象下第 $j$ 项指标的比重 $p_{ij}$
  - 计算第j项指标的熵值
  - 计算第 $j$ 项指标的差异系数 $g_j$
  - 给指标赋权，定义权重 $w_j$
  - 通过权重计算样本评价值，第 $i$ 个研究对象下第 $j$ 项指标的评价值为：
  - 则第 $i$ 个研究对象的总体评价值为：
- 数据./data.csv：
- 程序：
- 熵权法的优缺点
- 参考：

熵权法

一般来说，若某个指标的概率越大，不确定程度越小，信息熵越小，指标离散程度越大，提供的信息量越多，在综合评价中所能起到的作用也越大，其权重也就越大。相反，某个指标的指标的概率越小，不确定程度越小，信息熵越大，表明指标值得离散程度越小，提供的信息量也越少，在综合评价中所起到的作用也越小，其权重也就越小。

而熵权法是统计学领域，与信息学领域对熵值的解释有所不同。简言之，在统计学领域中，当数据越分散时，熵值越小，可认为该数据包含信息越多，因此权重越大，这也是熵权法的解释；而在信息学领域中，数据越分散，计算熵值越小，数据中的信息越不可靠，可以说数据包含的信息越少。

算法步骤

假设有 $m$ 个研究对象, $n$ 个指标：
$i=1,2,\dots,m,j=1,2,\dots,n$
$X=\begin{bmatrix} {x_{11}}&{x_{12}}&{\cdots}&{x_{1n}}\\ {x_{21}}&{x_{22}}&{\cdots}&{x_{2n}}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {x_{m1}}&{x_{m2}}&{\cdots}&{x_{mn}}\\ \end{bmatrix}$

指标标准化。

对于正向指标: $x_{ij}=\frac{x_{ij}-\min(x_j)}{\max(x_j)-\min(x_j)}$ .
对于负向指标： $x_{ij}=\frac{\max(x_j)-x_{ij}}{\max(x_j)-\min(x_j)}$ .

计算第 $i$ 个研究对象下第 $j$ 项指标的比重 $p_{ij}$

$p_{ij}=\frac{x_{ij}}{\sum\limits_{i}^mx_{ij}}$

计算第j项指标的熵值

$e_j=-k\sum\limits_i^mp_{ij}\ln p_{ij}$ ， $k=\frac{1}{\ln m}$

计算第 $j$ 项指标的差异系数 $g_j$

差异系数越大越好，表示该指标对于研究对象所起的作用越大，该指标较好。
$g_j=1-e_j$

给指标赋权，定义权重 $w_j$

$w_j=\frac{g_j}{\sum\limits_j^ng_j}$

通过权重计算样本评价值，第 $i$ 个研究对象下第 $j$ 项指标的评价值为：

$F_{ij}=a_jx_{ij}$

则第 $i$ 个研究对象的总体评价值为：

$F_i=\sum\limits_j^nF_{ij}$

数据./data.csv：

车型,油耗,功率,费用,安全性,维护性,操作性
本田,5,1.4,6,3,5,7
奥迪,9,2,30,7,5,9
桑塔纳,8,1.8,11,5,7,5
别克,12,2.5,18,7,5,5

程序：

#!/usr/bin/env python
# coding: utf-8
import numpy as np
import pandas as pd#定义数据标准化函数。为了避免求熵值时对数无意义，对数据进行平移，对标准化后的数据统一加了常数0.001
def std_data(value,flag):for i in range(len(indicator)):#print(flag[i])if flag[i]=='+':value[:,i]=(value[:,i]-np.min(value[:,i],axis=0))/(np.max(value[:,i],axis=0)-np.min(value[:,i],axis=0))+0.001elif flag[i]=='-':value[:,i]=(np.max(value[:,i],axis=0)-value[:,i])/(np.max(value[:,i],axis=0)-np.min(value[:,i],axis=0))+0.001return value
#定义熵值法函数、熵值法计算变量的权重
def cal_weight(indicator,project,value):p= np.array([[0.0 for i in range(len(indicator))] for i in range(len(project))])                    print(p)for j in range(len(indicator)):p[:,j]=value[:,j]/np.sum(value[:,j],axis=0)#沿轴print(p)e=-1/np.log(len(project))*sum(p*np.log(p))      #计算熵值g=1-e     # 计算一致性程度w=g/sum(g)     #计算权重return w
if __name__ == '__main__':##读取数据data=pd.read_csv('./data.csv',encoding='utf-8',index_col=0)data.dropna()indicator=data.columns.tolist()   ##指标个数project=data.index.tolist()    ##方案数、评价主体value=data.valuesprint(indicator)print(project)print(value)print(data.head())##数据标准化flag=["-","+","-","+","+","+"]  ##表示指标为正向指标还是反向指标std_value=std_data(value,flag)std_value.round(3)##结果w=cal_weight(indicator,project,std_value)w=pd.DataFrame(w,index=data.columns,columns=['权重'])print("#######权重:#######")print(w)score=np.dot(std_value,w).round(2)score=pd.DataFrame(score,index=data.index,columns=['综合得分']).sort_values(by =['综合得分'],ascending = False)print(score)

熵权法的优缺点

１.优点
首先，熵权法是客观确定权重的方法，相较于层次分析法等主观法而言具有一定的精确性；
其次，该方法确定出的权重可以进行修正，从而决定了其适应性较高的特点。
２.缺点
该方法的应用范围有限，仅适于计算权重。

参考：

https://www.zhihu.com/question/274997106/answer/1222518795
https://blog.csdn.net/ziyin_2013/article/details/116496411

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 评价类算法之 Topsis优劣解距离法和熵权法权值确定
下一篇 > RecyclerView setHasStableIds

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

熵权法实现

文章目录

熵权法

算法步骤

指标标准化。

计算第 i i i个研究对象下第 j j j项指标的比重 p i j p_{ij} pij​

计算第j项指标的熵值

计算第 j j j项指标的差异系数 g j g_j gj​​

给指标赋权，定义权重 w j w_j wj​

通过权重计算样本评价值，第 i i i个研究对象下第 j j j项指标的评价值为：

则第 i i i个研究对象的总体评价值为：