- 1 -
中国科技论文在线
基于本体的案例推理系统模型的研究
张涛,刘厚泉**
作者简介:张涛,(1987-),男(汉族),江西九江人,硕士研究生,研究方向为语义与本体、地理信息
通信联系人:刘厚泉,(1963-),男(汉族),教授,研究方向为语义与本体、地理信息、虚拟现实
(中国矿业大学计算机学院,江苏 徐州 221116)
摘要:基于案例推理包括案例检索、案例修正、案例重用、案例存储四个部分。案例的表示5
方式在案例的存储,案例库索引的建立中起到很重要的作用。恰当的表示方式能够清楚地表
示案例内部的知识结构,而且能够提高案例检索的效率。本文研究如何用本体来表示案例。
以笔记本维修为例,分析笔记本维修过程中可能出现的故障部件、故障模式、故障原因,分
别建立本体,完成该领域内的知识体系结构,接着讨论了用本体表示的案例之间如何进行语
义相似性的比较。 10
关键词:基于案例推理;本体;语义相似性
中图分类号:TP391
The Research on Case-Based Reasoning Model Based on
Ontology 15
ZHANG Tao, LIU Houquan
(School of Computer Science and Technology, China University of Mining and Technology,
JiangSu XuZhou 221116)
Abstract: There are four basic procedures in case-based reasoning (CBR), case retrieving, case
revising, case reusing and case retaining. The representation of a case plays an important role in 20
case retaining and the index of the case base. The proper representation of a case could describe
the knowledge of the case clearly and improve the efficiency of case retrieving. The paper
researches on how to represent a case by ontology. Take the example of notebook maintain,
analyze the probable fault parts, fault models and fault reasons in it. Then use ontology to model
them so as to build the full case-based reasoning system. Then discuss the semantic similarity 25
between cases modeled by ontology.
Keywords: case-based reasoning; ontology; semantic similarity
0 引言
20 世纪 90 年代,基于案例推理(Case-Based Reasoning, CBR)技术开始兴起。此后的时30
间里,许多学者和专家都对 CBR 进行了详细的研究,并取得了许多成果。对 CBR 的研究大
致分为以下几个方面:对案例检索方法的研究;对案例修正方法的研究;对案例的表示方法、
存储方式的研究;将 CBR 与基于规则的推理(RBR)结合的研究;对 CBR 的分子如文本
CBR(TCBR)的研究[1]。本文主要研究案例表示方法中的一种:如何用本体来表示案例,如何
在基于本体的推理系统中进行案例相似度的比较。 35
用本体来建模也是近期兴起的新技术,应用广泛[2]。用本体来表示案例的好处就在于,
案例中很多属性之间往往是有层次关系的,不是简单的并列关系,本体可以很好地表示出案
例中各个属性间的层次关系。简单的案例计算相似度时只需要考量一组特征属性即可,用本
体表示的案例则需要考虑属性所处的层次等因素。
一些维修案例中往往故障部件、故障原因、故障模式存在层次关系[3][4],本文以笔记本40
电脑维修系统为例,讨论基于本体的案例推理系统模型的建立和案例相似度的计算方法。
- 2 -
中国科技论文在线
1 案例推理的基本知识
案例推理的基本步骤
案例推理主要分为四个步骤[5]:
(1)检索(retrieve):采取适当的检索算法计算案例间的相似度,从案例库中找出与当45
前问题最相似的案例。
(2)重用(reuse):重用分为直接重用案例的解决方案和重用得出最终解决方案的方法。
有时候也可以只重用部分解决方案或部分得出最终解决方案的方法。
(3)修正(revise):在实际应用中,得出的案例解决方案往往不符合目标案例的要求。
这时,需要通过一定的修正方法,根据具体的环境,对案例解决方案进行调整,才能重用到50
目标案例上。
(4)存储(retain):处理完一个案例之后,把它存放到案例库中,以便以后碰到类似问
题可以重用。通过这种方法,案例库覆盖度逐渐提高,从而检索到相似案例的几率也随之提
高。在存储案例时,要考虑案例的表示方式、存储方式和索引的建立。
55
图 1-1 基于案例推理的基本步骤
Figure 1 -1 The basic processes in CBR
案例的表示方法
在介绍用本体表示案例之前,先介绍目前常用的其它几种案例表示的方法。从图 1-1 中60
可以看到,在案例库中,案例的表示方法非常重要,案例的表示方法要求能够完整、清晰地
描述案例内部的结构;要求能够高效、便捷的读取与存储;要求能够随时对案例进行更新、
修改;并且要求能够便捷地进行案例间相似度的比较。目前常用的案例表示方法有[6] [7]:
(1)数据表表示 这种表示方法适用于能用一组关键字描述的案例。通常根据案例的特征
建立几张数据表,每张数据表中都有一组关键字来描述案例。 65
(2)框架表示 通常一个框架由框架名、槽、侧面和值 4部分组成。框架表示法的主要优
点是可以表现出知识间的联系。如果把一个框架槽值设置成另一个框架的框架名,可以实现
框架间的相互联系。
(3) Petri-Net 网表示 Wu Chih-Hung 根据语义构建 Petri-Net 网,进而解决基于案例
- 3 -
中国科技论文在线
的文档编写问题。 70
(4)案例基本信息-元事件-状态-属性这种表示方法适用于一些比较复杂的案例,这些案
例往往包括多个子案例。图 1-2 描述了这种案例的表示方法。
图 1-2 案例表示的元事件模型
Figure 1-2 Meta-event model for representing cases 75
这些方法各有优缺点,下面会结合笔记本维修介绍用本体表示案例的方法。
2 基于本体的案例表示
在笔记本维修系统中,根据实际情况,我们将相关的本体划分成五类。
1)产品本体 80
产品本体描述的是笔记本维修中各种配件之间的层次关系。可以按照笔记本品牌先将笔
记本分成几个大类。每一种笔记本又分为硬件部分和软件部分。硬件部分可以分为外设、主
板设备、电源、存储设备。外设分为键盘、鼠标、显示器、音箱等;主板设备分为主板、
CPU、内存、显卡、散热器、网卡等;电源分为电池和变压器;存储设备主要包括硬盘。软
件部分分为操作系统和其它软件。这样划分之后,笔记本各种配件所处的层次、相互之间的85
关系一目了然,便于进行案例之间的比较。
2)故障模式本体
故障模式本体主要描述各种故障的外在现象。例如可以将笔记本电脑故障分成三种模
式。一是系统类故障,它可以分为电脑无法正常开机关机、无法进入操作系统、运行过程中
突然出现蓝屏死机关机等现象、电脑没有声音等细类。二是应用类故障,是指用户不能正常90
- 4 -
中国科技论文在线
地使用电脑,例如无法上网、无法使用某种软件、机器不受自己控制等。三是硬件类故障,
例如电脑散热不好,电源不稳定、外设无法正常使用等。
3)故障原因本体
故障原因本体描述的是笔记本出现各种故障的原因。可以将各种故障原因分成五类。一
是配件损耗,这是很常见的一种原因。电脑中各种配件时间用久了就会由于各种因素而出现95
损耗的现象。根据配件的不同,又可以分成多个细类。二是配件版本,电脑软硬件版本更新
的频率非常快,很多故障往往是由于软件或硬件的版本太低所造成。三是用户误操作,例如
用户误删除了一些系统文件,上网时中了病毒,修改了注册表等。四是兼容问题,包括硬件
与硬件的兼容,软件和硬件的兼容,软件和软件的兼容。五是其它问题,例如用户外接电源
不稳定、使用时周围温度过高等等。 100
4)数据字典本体
数据字典本体主要用来描述维修时的环境信息和维护时机。使用数据字典能够很好地对
内容进行规范。
5)维修案例本体
建立好上面的本体后,可以开始建立维修案例本体。维修案例本体应该包括信息记录、105
故障影响分析、组织实施和总结归零四部分。信息记录包括故障件、故障现象、发生时机和
故障环境;故障影响分析包括故障模式、故障原因和分析记录;组织实施包括处理结论、实
施方案和人员组织;总结归零包括参考案例、个人经验和归零报告。其中故障件、故障模式、
故障原因、发生时机、故障环境就可以参考前面建立的四种案例本体。
图 2-2 描述的是基于本体的笔记本维修系统知识体系结构 110
图 2-2 描述的是基于本体的笔记本维修系统知识体系结构
Figure2-2 The notebook maintain knowledge system based on ontology
115
3 基于本体的案例推理系统中案例相似度的计算
下面讨论如何在基于本体的案例推理系统中计算案例间的相似度。
在本体概念树中,概念从根节点分成开始细化。子节点包含它的所有祖先节点的信息。
两个概念之间的相似度主要由结构特征和概念的层次深度来决定。假设两个概念 A 和 B 最
近的共同祖先节点是 P,那么 A 和 B 从 P 点开始存在差异。计算相似度只需要考虑 P 点的120
- 5 -
中国科技论文在线
深度和密度因素[8] [9][10]。
(1)深度因素
在本体概念树中,两个概念所处的层次越深,相似度越大。深度函数为
D(x)=1/2+arctan(x-α)/π x∈1,…,N (3-1)
其中α为中间层数,由 max(D)/2 取上限获得。 125
(2)密度因素
在本体概念树中,某个节点出度越大,表示它的细化程度越大。它细化出来的各个节点
相似度就越大。
某个节点 A 的密度计算方法为:R (A)=1-1/T(A) T(A)>1 (3-2)
R (A)=1 (3-3) 130
其中 T (A)表示节点 A 的出度。
假设从根节点 R 到 P 的节点序列为{c0,c1,c2,…,cn},其中 R=c0,P=cn。最大层次深度为
m 层。则概念 A 和 B 的相似度为
S (A,B)=
-1
0
( )
m
i
D x
=
⎧ ⎫⎨ ⎬⎩ ⎭∑ * -11 (R(c ) * (C ))
n
i i
i
D
=
∑ (3-4)
两个案例 CASE1,CASE2 的相似度为 S(CASE1,CASE2)=
1
n
i
i
ρ
=
∑ *S(CASE1i,CASE2i) 135
其中 iρ 表示第 i 个特征的权重,S(CASE1i,CASE2i) 表示案例 CASE1,CASE2 在第 i
个属性上的相似度。
这里求出的是本体概念树中语义的相似度。在数据字典中,则是根据一组关键字和权重
计算相似度;在案例特征为无规则的文本时,例如图 2-2 中的组织机构可能就是用文本形式
来描述的,则要对文本进行分词处理再进行词汇间相似度的计算。 140
4 结论
本文主要讨论了利用本体来表示案例,建立一个基于本体的案例推理系统。论文以笔记
本维修为例,分析了笔记本维修中经常出现的故障件、故障模式、故障原因,并尝试将其进
行系统的分类,构建相关的本体。进行案例推理时,可以很清晰地看到维修案例的内部结构,
便于存储。接着介绍了本体概念树中概念之间相似度的计算方法,进而可以求出两个用本体145
表示的案例之间的相似度。本文的不足之处在于对笔记本维修故障部位、故障模式、故障原
因种类总结的不够,只有分类越准确,案例推理的效率才会越高。另外文本案例之间相似度
的计算是今后的一个研究方向。
[参考文献] (References)150
[1] 王晓亮,刘西拉,李楚舒.基于事例推理的技术及其前沿[C].第十二届全国工程建设计算机应用学术论文
集.北京:中国土 木工程学会,2005:105-110
[2] 刘健.基于案例推理的知识系统的设计与实现[D].南京:南京航空航天大学,2005:31-35
[3] Naresh R, Shama V, Vashisth M. An integrated neural fuzzy approach for fault diagnosis of transformers
[J].Power Delivery,2008,23(4);2017-2024 155
[4] Zhao Feng,Koutsoukos X, Haussecker H, et and fault diagnosis of hybrid
systems[J].Systems,Man and Cybernetics,2005,35(6):1225-1240
[5] Gavin Finnie,Zhao model for case-based reasoning[J].Knowledge-based Systems,2007,16(8):59-65
[6] 罗燕琪,陈雷霆.专家系统中知识表示法研究[J].电子计算机,2001(4):28-32
[7] 吴显义,崔洪涛,谢颖.专家系统开发工具的知识表示及结构[J].信息技术,2005,27(5):37-41 160
- 6 -
中国科技论文在线
[8] 李峰,魏莹.分布式环境下基于语义相似的案例检索[J].计算机工程,2007,33(9):28-30
[9] Rodriguez M. Egenhofer semantic similarity among entity classes from different ontologies
[J].Knowledge and Data Engineering,2003,15(2):442-456
[10] 黄果,周竹荣.基于领域本体的概念语义相似度计算研究[J].计算机工程与设计,2007,28(10):2460-2463
165