基于粗糙集和突变级数法的生态经济区划
摘要:首次采用粗糙集和突变理论相结合的方法进行生态经济区划,建立了较为科学的
评价指标体系,确立了应采用的突变模型,采用粗糙集的属性约简算法对粗选的生态经济
评价指标进行筛选,运用由突变理论衍生出来的突变级数法对指标进行浓缩,获得生态经济
综合评价指标,据此指标进行生态经济区划。以山西省东南部某县的生态经济区划为实例
进行区划研究与方法验证,结果与当地实际情况基本相符,表明该区划方法可行。
关键词:粗糙集,突变级数法,生态经济区划
1 引言
随着经济快速发展,生态环境与经济建设之间的矛盾问题日益突显,要解决这一矛盾,
就必须调整生态与经济相分离的发展理念,对区域生态经济功能定位,进行生态经济区划及
研究[1]。目前,生态经济区划方法主要有地图叠中国论文联盟 合法、生
态适宜度法、生态因子指标法和数值分类法,并已出现复杂系统划分的熵方法及基于空间
数据挖掘的分区方式。数值分类法是应用数学方法和计算机辅助进行定量分类,包括层次
分析法(AHP)、主成分分析法(PCA)及聚类分析法,因研究生态系统结构和功能定量化的需
要,数值分类法应用较广。各种区划方法的应用均对生态经济区划理论与技术的发展起到
了积极的作用,但也存在一定的局限性,诸如,定量化分析方法往往忽视指标本身的重要性
差异,丢失了数据的一些有用信息;多数生态经济区划方法在指标选择、权重确定时需依
赖先验知识、专家意见,受主观因素影响;一些方法对数据的要求非常苛刻,导致区划不易
实施。粗糙集理论[2~6]是一个处理不确定性的数学工具,突变理论[7~9]是研究不连
续现象的新兴数学分支,由于其本身所具有的特性,二者自出现以来在医学、地质学等诸多
领域都得到了成功的应用,但在生态经济区划方面的应用鲜有报道。基于以上区划方法的
现状,本文尝试将粗糙集和突变级数法引入该领域,进行生态经济区划研究。
2 粗糙集及突变级数法
粗糙集理论
粗糙集理论(Rough sets theory)是由波兰学者 Pawlak Z于 20世纪 80年代初在集合
论基础上首先提出的一个分析数据的理论,其基本理论包括 5个方面。
知识
一个知识表达系统或信息系统可以表示为有序 4元组:
S=(U,R,V,f).(1)
式中U={x1,x2,…,xm}为论域,是全体样本的集合;R为属性集合;
V=∪[DD(]r∈R[DD)]Vr为属性值的集合;f为U×R→V的一个映射,称为信
息函数,它为U中每个对象的每个属性赋予一个信息值。知识表达系统通常简记为
(U,R)。
不可分辨关系(indiscernibility relation)
设S1=(U,A)为一个信息表,对象xi,xj∈U,属性集BAR,b(x)为x的
属性值,对b∈B,如果满足b(xi)=b(xj),则称对象xi,xj对于属性集B
不可分辨,B上的不可分辨关系记为ind(B)。
属性约简
若R为属性集,P∈AR,对于一族等价关系,如果公式:
ind(A)=ind(A{P}).(2)
则可将A约简为(A-{P})。属性约简就是在保持信息系统分类能力不变的条件下,
删除其中不相关或不重要的知识。属性集A的约简可能有多个,A的所有约简组成的集
合记为red(A)。
核
属性集A中所有约简的交集简记为∩red(A),称为为A的核,即:
core(A)=∩red(A).(3)
核是A的最重要的属性子集,它包含于A的每个约简中,在不改变分类能力的前提
下,其中的任何元素均不能被去掉。
区分矩阵法
区分矩阵是由波兰华沙大学著名数学家Skowron提出来的一个粗糙集约简方法,可方
便的计算核和约简。令S=(U,A,V,f)是一个知识表达系统,|U|=n,S的区分矩阵是
一个n×n矩阵,其任一个元素为:
a(x,y)={a∈A|f(x,a)≠f(y,a)}.(4)
核是区分矩阵中所有单个元素组成的集合,即:
core(A)={a∈A|a(x,y)={a},其中 x,y∈U}.(5)
对于每个属性a∈A,若 a(x,y)={a1,a2,…,ak}≠,则指定一个布尔函数
a1∨a2∨…∨ak,用∑a(x,y)表示;若a(x,y)=则指定布尔常量 1。区分函数
Δ:
Δ=∏∑[DD(](x,y)∈U×U[DD)]a(x,y).(6)
区分函数Δ的极小析取范式中的所有合取式是属性集 A的所有约简。
突变级数法
突变理论
突变理论通过势函数研究突变现象,分析分歧集的性质实现对突变现象的界定与控制,
其基本概念有以下 2点。
(1)势函数:
V=V(x,c).(7)
式中V为势函数;x为状态变量,x=(x1,x2,…,xn),c 为控制变量,x=
(c1,c2,…,cn)。
(2)分歧集。对方程 dV(x)=0 与势函数的 Hessen矩阵 detH(V)=0 联立求解,消去
全部状态变量(单变量时为x)而得的解集称之为分歧集,亦称分叉集,即由所有控制参数
所构成的方程,落在分叉集内的控制变量的取值会使状态变量发生突变。
突变级数法
突变级数法是由突变理论衍生出来的一个多准则评价方法,它首先要对评价目标进行
多层次矛盾分解,再用突变理论与模糊数学相结合产生的突变模糊隶属函数逐级进行综合
量化计算,最后归一为一个综合指数进行评价。对突变模型的分歧集方程进行变换、推导,
将模型中状态变量、控制变量的取值范围限制在 0到 1,即可得到归一模型,亦称突变级数,
在归一模型中,x为状态变量,u,v,w,t为控制变量,前面为主要控制变量,后面为次要控
制变量。在利用归一公式计算每个状态变量值时,若诸控制变量之间是非互补关系则对各
控制变量的计算结果“大中取小”,若为互补关系则取平均值,这样方能满足分歧集方程,
达到质变。
常用突变模型及其归一模型
常用的突变模型有尖点突变、燕尾突变与蝴蝶突变 3种,它们的状态变量维数均为 1。
尖点突变控制变量维数为 2,势函数为:
v(x)=x4+ux2+vx.
归一模型为:
xu=u,xv=3v.
燕尾突变控制变量维数为 3,势函数为:
v(x)=x5+ux3+vx2+wx.
归一模型为:
xu=u,xv= 3v,xw=4w.
蝴蝶突变控制变量维数为 4,势函数为:
v(x)=x6+ux4+vx3+wx2+tx.
归一模型为:
xu=u,xv=3v,xw=4w,xt=5t.
3 基于粗糙集和突变级数法的生态经济区划
粗选生态经济区划指标体系
通过对生态环境及社会经济各要素进行考察,结合该县特征,按照科学性、简明性、代
表性、完整性、动态性、获取性及主导因素原则建立该县生态经济区划的评价指标体系。
首先确定生态经济区划总目标,其次从总目标开始,进行多层次分解,建立的 3层(目标层、
系统层和变量层)指标体系见表 1。
目标层A反映该地区生态经济发展能力总体水平,即一定时期内该区域内生态环境系
统的结构、功能与社会经济活动方向、规模相互协调的程度,它的相近程度反映出地区间
发展的同步程度,因此可根据其进行生态经济分区。系统层B反映各子系统的状况,变量
层C为基础指标。
评价指标筛选
利用粗糙集的属性约简算法对粗选生态经济要素评价指标进行筛选。
数据准备
以该县 17个乡(镇)作为生态经济综合评价的研究单元收集原始数据。为了消除量纲
的影响、简化后续运算,将收集到的原始数据按式(8)~(9)极差变化法进行无量纲化处理,
将指标的实际值转化为[0,1]的值:
正向指标(指标越大越好)的无量纲化值:
yi=xi-xminxmax-xmin.(8)
逆向指标(指标越小越好)的无量纲化值:
yi=xmax-xixmax-xmin.(9)
式中yi为原始数据xi的无量纲化值,xmin、xmax分别为xi所在属
性最小值及最大值。
在变量层的 21个指标中,SO2 现状排放量、TSP现状排放量、化肥施用强度是逆向指
标,其余均为正向指标。
为了将无量纲化后的值变成粗糙集所能识别的数据,将该数据离散化,其本质是利用选
取的断点来对条件属性构成的空间进行划分,此处采用等距离划分算法将指标离散为 1~4
4个级别,分别代表值的范围在[0,),[,),[,)和[075,1]。该县
经济发展指标无量纲化、离散化的结果见表 2。
用同样的方法可将该县资源状况指标、社会发展指标及环境质量指标的原始数据无量
纲化后离散为 1、2、3、4 4个级别。
指标(属性)约简
为了去掉冗余指标,以降低计算的复杂性和决策的难度,同时为了迎合初等突变模型只
能处理不超过四维的数据的需求,对以上各类指标(属性)应用前述区分矩阵法进行约简。
据式(4)计算该县经济发展类信息表的区分矩阵,因其对称性只需计算下三角元素,结
果见表 3。
据式(5)知核是C1,C3据式(6)求出区分函数:
Δ=c1∧c3∨(c2∧c6)∨(c5∧c6)∧(c4∧c6)=c1c2c3c6∨c1c3c5c6∨c
1c3c4c6,
由区分函数可知最小约简是C1,C2,C3,C6 或者 C1,C3,C5,C6;或者是
C1,C3,C4,C6 综合考虑数据获取成本以及数据可得性,选取 C1,C2,C3,C6 做为筛选
后的指标。即经济发展类筛选后的指标集为{C1,C2,C3,C6}。
同上法可以求得,资源状态类约简后的指标为{C11,C9,C10};社会发展类约
简后的属性为{C15,C16};环境质量类约简后的属性为{C19,C20,C21}。
指标浓缩
属性重要性计算
属性重要性的计算基于信息熵的概念,引入信息熵:
H(Xi)=-∑[DD(]ni=1[DD)]piInpi.(10)
式中pi为Xi发生的概率,若用H表示原来的熵,H(I)表示已知信息I后的
熵,很明显H(I)≤H,信息I提供的信息量即为H-H(I),信息量越大,则该信息越重
要。对信息系统S=(U,R),属性r∈R的重要度S(r)=|H(R-{r})-H(R)|,S(r)值越
大,说明属性r在属性集R中的重要程度越高。
经计算,约简后经济发展类指标重要度为:
S(C1)=|H({C2,C3,C6})-H({C1,C2,C3,C6})|=,
S(C2)=|H({C1,C3,C6})-H({C1,C2,C3,C6})|=,
S(C3)=|H({C1,C2,C6})-H({C1,C2,C3,C6})|=,
S(C6)=|H({C1,C2,C3})-H({C1,C2,C3,C6})|=.
主要与次要控制变量确定
依据属性重要性计算结果,确定主要控制变量和次要控制变量。由以上计算知,经济发
展类指标的重要性为:C3>C1>C2>C6,因此 C3(农业产值占总收入比重)是主要控制变
量,C1(原煤产量),C2(工业产值占总收入比重),C6(第三产业收入占总收入比重)等是次
要控制变量。
同上法可求得约简后资源状态类指标中C11(四旁植树)是主要控制变
量,C9(矿产资源)、C10(人口密度)是次要控制变量;社会发展类指标中
C15(万人拥有医院数)是主要控制变量,C16(人均用电量)是次要控制变量;环
境质量类指标中C19(化肥施用强度)是主要控制变量,C20(SO2 允许排放
量)、C21(TSP 允许排放量)是次要控制变量。
指标浓缩
应用突变级数法进行指标浓缩。经济发展类指标{C3,C1,C2,C6}有 4个控制变
量,按照蝴蝶突变级数模型进行计算,四者之间属于互补关系,按互补原则取其均值做为上
一层指标值,即:
B1=(C1/23+C1/31+C1/42+C1/56)/4.
资源状态类指标{C11,C9,C10}有 3个控制变量,按照燕尾突变级数模型进行
计算,3者之间属于互补关系,取平均值则:
B2=(C1/211+C1/39+C1/410)/3.
社会发展类约简后的属性为{C15,C16},按照尖点突变级数模型进行计算,2
者之间属于互补关系,取平均值则:
B3=(C1/215+C1/316)/2.
环境质量类约简后的属性为{C19,C20,C21},按照燕尾突变级数模型
进行计算,3者之间属于互补关系,取平均值则:
B4=(C1/219+C1/320+C1/421)/3.
计算系统层指标B1,B2,B3,B4 重要度,可知其重要度关系为:
B1>B2>B3>B4,主要控制变量为B1,B2、B3、B4为次要控制变量,按照蝴蝶突变
归一公式进行计算,4者之间没有明显的关联关系,属于非互补关系按取小原则,即:
A=min{B1/21,B1/32,B1/43,B1/54}.
运用 EXCEL计算可得B1,B2,B3,B4 和 A的值,为了突出特点,对A值进行特征化
处理,四舍五入保留一位小数得到A′,结果见表 4。
生态经济区划
以生态经济综合指标A的特征化值A′作为条件属性,以该县 17个乡镇所组成的集
合作为论域,依据粗糙集的不可分辨原理对研究单元进行区划。U/A′={{町店镇,西河
乡},{凤城镇,白桑镇,北留镇,润城镇,演礼乡,固隆乡,次营镇,驾岭乡,蟒河镇,东冶镇,寺
头镇},{董封乡,河北镇},{芹池镇},{横河镇}}以上由不可分辨关系的对象所组成的集合将
该县划分成了 5个区。
4 结语
本文尝试将粗糙集与突变理论引入生态经济区划域领域,使区划方法建立在实际数据
基础上,在一定程度上克服了主观因素对区划结果的影响。该方法对数据的要求较为宽松,
具有很强的可操作性,弥补了现有分区方法的不足。首次采用粗糙集和突变理论相结合的
方法进行生态经济区划,建立了一套科学的评价指标体系,并确立了应采用的突变模型。
通过实际调查验证,本区划方案在分区内部类间具有较大的相似性,在各分区之间具有
较大的差异性。因此,基于粗糙集和突变级数法的分区方案是合理的。该方法的出现进一
步丰富了生态经济区划的技术方法,也扩大了粗糙集和突变级数法的应用范围。
参考文献:
[1] 杜文渊,杨 丽.我国生态经济功能区划研究进展[J].环境科学与技
术,2004,27(6):97~99.
[2] Pawlak journal of computer
[J].Information Science,1982(11):341~356.
[3] Pawlak classification[J].J Man-Machine
Studies,1984(20):469~483.
[4] 王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001.
[5]Polkowski L,Skowron A Rough sets in knowledge discovery 1:methodology
and applications[M].HEidelberg:Physica-Verlag,1998.
[6]Polkowski L,Skowron sets in knowledge discovery
2:applications,case studies and software systems[M].Heidelberg:Physica-
Verlag,1998.
[7]黄奕龙.突变级数法在水资源持续利用评价中应用[J].干旱环境监
测,2001(15):167~168.
[8]赵正跃,项成龙.突变理论在环境预测中的应用[J].中国环境监
测,2002,18(4):60~69.
[9]李 艳,陈晓宏.突变级数法在区域生态系统健康评价中的应用[J].中国人口资
源与环境,2007(17):50~53.
Study on Eco-economical Zoning Based on Rough Sets and Catastrophe
Propression Method
Xu Mingde,Ning Zhihong,Nan Yang
(College of Environmental Science and Engineering,Taiyuan University of
Technologe,Taiyuan,Shanxi,030024,China)
Abstract:The method that combining Rough sets and Catastrophe theory
together is firstly used in the eco-economical this paper,a
scientific appraisal target system is established and a appropriate
catastrophic model is ,attribute reduction algorithm of rough
sets is used to filter the primary eco-economical appraisal target and
catastrophe progression method derived from catastrophe theory is used to
condense the target,and then the comprehensive appraisal target of eco-economy
is acquired and used to eco-economical ,this paper applies the
method to studying and validating the eco-economical zoning of a country in
the southeast of Shanxi Province,and the results accord generally with local
realities,therefore,it is proved that the zoning method is feasible.
Key words:rough sets;catastrophe progression method;eco-economical zoning