摘 要: 知识本体作为共享概念模型的形式化的规范说明,在信息技术领域的各个方面有着广泛的应用。本体的表示有多种方法,本文给出了OWA(ontology-based Web annotation) 、Maedche A形式化定义、Guarino和KAON(Karlsruhe Ontology)4种典型形式化定义,并对其进行了对比分析。
关键词: 本体; 形式化; OWL
知识是推理的基础,是人类文明的成果和发展的基石,不能想象人类失去了知识将会怎样。知识表示是一种数据结构与控制结构的统一体,既考虑知识的存储又考虑知识的使用。知识表示是一组描述事物的约定,把人类知识表示成机器能处理的数据结构。本体是将世界上所有的东西用层次类别组织起来,它是知识表示的中心内容[1]。近年来,本体论被人们引入知识工程领域,其最终目的是为了解决知识的重用和共享。本体不仅是一个可共享的概念模型,更重要的是:首先,本体所描述的概念不能有二义性,即必须是“明确(explicit)”的;第二,本体不仅能被人理解,还要能被计算机所理解,所以本体应该是被“形式化(formal)”的[2]。本文介绍了典型的本体的形式化定义,包括:OWA(Ontology-based Web Annotation)形式化定义、Maedche A形式化定义、Guarino形式化定义、KAON(Karlsruhe Ontology)形式化定义等;并对这四种形式化定义作了简单的对比分析。
1 本体及本体表示
本体是“共享概念模型明确的形式化规范说明”。通过本体(Ontology)可以获取某一领域的知识、本体描述该领域的概念以及这些概念之间的关系[3]。典型的本体一般由概念、概念的属性、概念间的关系、概念和属性之间的约束来表示领域知识,这在本质上决定了本体可以借助成熟的关系数据库技术来完成本体存储、查询等工作。OWL(Web Ontology Language)是W3C推荐的语义互联网中本体描述语言的标准[4]。本体可以采用OWL进行形式化编码,即用OWL中定义好的元ontology对概念和关系进行形式化描述。
本体的表示有多种:有仅表示概念的,有表示概念和属性的框架和语义网络的,还有能表达丰富语义的基于逻辑的表示。ER模型和UML类图也可认为是本体的表达。当前有逻辑和非逻辑两种主要的本体表达。非逻辑表达直观方便但语义不丰富、不精确,没有强大的推理能力;逻辑表达源于对谓词演算,可以清晰表达所描述的领域的认识。描述逻辑是一阶谓词逻辑的子集,它只有概念和角色两个基本成分,较好地与本体的定义相对应。用描述逻辑形式表达的本体语言的两个基本描述是:原子概念集(其成员用A表示)和原子角色集(其成员用R表示)。原子概念表示领域中的对象,原子角色表示对象之间的关系。复杂的描述可以通过以上2个概念构造符逐步创建[5]。本体的形式化描述主要有基于五元组、六元组、七元组和八元组的描述[6]。参考文献[6]采用函数式描述语言精确定义了本体建模基元,提出一种具有封闭性的本体代数定义;参考文献[7]提出了基于属性文法的本体形式化描述方法;参考文献[8]将本体抽象为外部声明和内部表示两部分,在外部声明中说明本体中的概念与关系,在内部表示中说明概念与关系的语义关系,建立了本体内的简单推理模型。
2 本体的形式化定义
目前本体论的很多定义都具有普遍性,但却很少有准确的数学定义,即很少从形式化角度对本体进行精确的描述。其主要原因是数学定义应该包括所有不同类型的本体论,并且不应与特殊的知识表示方法有关。本体的形式化定义典型的有:OWA形式化定义、Maedche A形式化定义、Guarino形式化定义、KAON(Karlsruhe Ontology)形式化定义等[9]。
本体是对共享的概念化进行形式的规范说明,是知识工程领域中的一个重要分支。本体的表示有多种,主要包括逻辑和非逻辑两种主要的本体表达。本文从逻辑表达的角度,给出了OWA(Ontology-based Web Annotation)、Maedche A、Guarino和KAON(Karlsruhe Ontology)4种典型形式化定义,并对其进行了对比分析。目前,本体的形式化表示及应用仍是知识工程的一个热点研究领域,如何用数学的方式更规范地表达本体,将是下一步研究的重点。
参考文献
[1] 吴强,刘宗田,强宇.基于本体的知识库推理研究[J].计算机应用研究,2005,21(13):50-52.
[2] 张其文,臧凤奎,李明.本体语言的联系及其逻辑基础分析[J].科学技术与工程,2009,9(4):950-953.
[3] 王乐,张建军.OWL本体存储的分析与应用[J].科学技术与工程,2008,8(7):1831-1834.
[4] OWL Web ontology language guide recommendation[EB/OL](2004-02-10).[2011-12-10]http://www.w3.org/TR/2004/RRC-owlguide-20040210.
[5] 王真星,吕滕.基于描述逻辑的本体导航[J].计算机工程, 2005,31(11):28-29.
[6] 王俊华,左万利,赫枫龄,等.本体定义及本体代数[J].吉林大学学报(理学版),2010,48(6):1001-1007.
[7] 宫慧颖,汪美玲,刘磊.基于属性文法的本体形式化描述方法及其应用[J].吉林大学学报(信息科学版),2005,23(2):199-204.
[8] 张大志,刘磊.一种本体的形式化描述方法及其应用[J].吉林大学学报(信息科学版),2004,22(1):74-78.
[9] 程显毅,刘一松. 面向智能体的知识工程[M].北京:科学出版社,2008.
[10] MAEDCHE A. Ontology learning for the semantic Web[M].[S.l.]:Kluwer Academic Publishers,2002.
[11] GUARINO N. Semantic matching: formal ontological distinctions for information organization extraction and integration[C]. In :Pazienza M T,eds. Information Extraction: A Multidisciplinary Approach to an Emerging Information Technology, Springer Verlag,1997:139-170.
[12] GUARINO N,WELTY C. A formal ontology of properties[C]. In:Dieg R,Corby O ,eds. the Proceedings of the 12th International Conference on Knowledge Engineering and Knowledge Management (EKAW’2000), Springer Verlag, 2000:97-112.