网格环境中基于代理的语义资源发现模型研究
2009-07-28
作者:董艳芳1,许鹏文2,孙 建2
摘 要: 本文提出了一种网格环境中基于代理的语义资源发现模型,结合代理技术和P2P网络技术,实现语义上的资源发现。
关键词: 网格 资源发现 本体 代理 P2P
网格技术用于实现广泛的分布资源共享和协同工作。网格中潜在着巨大数量的资源和用户以及具有资源的异构性、动态性和自治性等特点,这使得资源发现颇具挑战性。如何高效准确地发现网格资源已成为网格研究中的一个重要问题。目前已有的网格资源发现方式大都是基于句法、集中式的匹配。这种方式没有对其语义进行解析,不能根据资源的能力发现资源。而且网格系统中的资源规模巨大,如果采用集中式信息管理方式,在某一个或某几个结点维护整个系统的信息是不现实的,资源的动态更新、系统的扩展等也成为问题。
目前,基于本体的资源发现机制研究刚刚迈出第一步,如OMM[1]仍然是一种集中式的资源组织模式,适用于本地的资源匹配。本文提出了一种网格环境下基于代理的语义资源发现模型(ASRDM),它使用本体来实现请求者和资源的语义描述。为维护各组织内的资源管理自治性,在组织内部采取集中式资源发现模式;在系统各组织之间采取基于P2P的分布式资源发现模式。
1 典型的网格资源发现方式
Condor的MatchMaking不依赖全局资源命名,它是一种集中式的依靠资源属性进行匹配的资源共享系统。它将资源和用户请求间的匹配过程和建立联系过程分开。请求者和提供者按照分类广告(ClassAds)公开其各自的特点和请求。匹配服务将满足条件的请求和用户进行匹配,并通知双方。匹配双方既可直接建立联系,也可以进行进一步的协商。这种资源发现方式缺乏灵活性,并且集中式的资源组织模式会成为系统扩展的瓶颈。
Globus MDS是Globus Toolkit提供的信息服务组件,它提供网格资源的信息和状态。MDS包含网格资源信息服务GRIS(Grid Resource Information Service)和网格索引信息服务GIIS(Grid Index Information Service)。MDS实现了基于LDAP的树状元数据目录服务,实体描述为属性/值对。每个组织内通常都有一个集中的索引服务,组织规模比较大时,需要形成树状层次结构。这种发现机制的缺点为:(1)被动更新。如果查询近期没有执行,则GIIS服务器必须更新它的LDAP registry。因为GIIS不能主动得知机器以及服务的当前状态。(2)非分布式管理。GIIS服务器要联系所有注册的主机检查当前状态。显然,这种操作是不可伸缩的。
OMM的主要思想是利用语义网技术RDF(资源描述框架,本体,规则)进行网格资源匹配。本体是用于描述或表达某一领域知识的一组概念或术语,可用于组织知识库中较高层次的知识抽象,也可用于描述特定领域的知识;本体通过知识表示元语捕获某个领域的语义,使得机器能够(部分)理解该领域中概念间的关系,通过公理或规则还可以捕获其他知识,如领域背景知识等。OMM包括三部分:(1)本体。记录域模型及词汇,以表达资源公布和任务请求。(2)域背景知识。记载本体中没有捕获的域的其他知识。(3)匹配规则。定义资源和请求相匹配的规则。它仍然是一种集中式的资源组织模式,适用于本地的资源匹配。
2 基于代理的语义资源发现模型
2.1 组织内集中式资源发现模式
2.1.1 基于代理的集中式资源发现模式
网格中各组织内部有着不同的资源管理策略。例如在哪个时间段,内部资源对于组织外的用户是可共享的,哪些用户可以访问内部资源等。每个组织需要拥有对其资源管理的自治性。在ASRDM中,组织内部的资源采取集中式的管理模式,便于组织对其资源实施统一的管理策略,也利于提高本地资源发现的效率。资源发现模式如图1所示。
2.1.2 集中式资源发现模式中的各代理
代理是一种复杂的计算机程序,采取自治的行为,协同应用与环境交互,完成给定的目标。代理技术是适应网络平台的一种新型软件技术,为网格计算思想的实现提供了一种有力的手段。
组织内用户、资源以及匹配服务等都有专门的代理,代理间协作处理用户的请求,使得系统功能可以方便地进行动态重组。例如,添加一个新的资源仅仅只需要添加一个新的代理并公布其服务能力。各代理功能如下:
(1)用户代理:用户进入系统的智能接口。它使用系统的通用域模型(本体)来帮助用户规范查询和输出结果。
(2)本体代理:提供有关本体的信息并回答有关本体的查询。
(3)资源代理:提供本体和本地数据方案与语言间的映射,执行对于资源的具体请求,对外公布资源的服务能力。
(4)匹配代理:接受并存储组织内所有代理的公告信息,对资源请求做出回答。匹配代理使用一个公开的地址监听查询或者公布信息。每个代理都要基于组织内的域模型(本体)向匹配代理公布其地址和服务能力。
2.1.3 组织内资源发现过程
在ASRDM组织内用户通过浏览器和它的用户代理进行交互。用户提交一个查询,用户代理向匹配代理查询本体代理的地址,然后向本体代理查询适合于该请求的本体。基于返回的请求域模型,用户代理向匹配代理查询当前合适的资源代理。如果匹配代理在组织内发现了资源,则直接将结果返回给用户代理;如果组织内没有合适的资源,则向其他组织的匹配代理发出请求,在更广泛的范围进行资源查找。
由于网络资源具有动态性,所以不同时间返回的结果不同。用户代理根据返回结果,直接和资源代理建立连接。每个资源代理将基于本体的请求转换为本地模式,并将结果返给用户代理,用户代理通过浏览器将结果返给用户。
考虑到单点失效的问题,可以有一个冗余匹配结点作为备份。
2.2 组织间基于移动代理的分布式资源发现模式
与组织内部资源相比,网格这个大环境中的资源数量巨大,资源的变化更加不可预测。集中式的资源发现模式已经不适用,需要一种扁平的、分布式的、自组织的体系结构。P2P系统和网格具有很多共同特性,如动态性、广域环境以及异构性等。P2P系统具有自适应、自组织性和容错等特性,使用P2P协议能够提高网格系统的效率以及可扩展性。在ASRDM中,各组织间的资源管理采用P2P的模式,如图2所示。
2.2.1 结点本体
每个组织作为这个P2P网络上的一个结点,都有自己的对外索引结点(即匹配结点)。结点本体(peer ontology,即上述的Local ontology)包括两部分:(1)结点能力描述:结点自身及其所提供资源的元信息、邻居结点信息等,如结点ID、资源ID 及类型、邻居结点的IP地址等;(2)结点的域模型。
2.2.2 语义覆盖网SON的建立
传统的P2P资源发现定位方法,或者需要大的目录服务器的支持,系统的健壮性不好;或者向所有信息结点广播,消耗大量带宽,不利于系统的扩展。在ASRDM中,基于上述P2P网络各结点间的语义联系,构建一个语义覆盖网络SON。根据各结点的能力描述,SON将提供类似主题的结点进行聚集,以缩小请求转发空间。
ASRDM借鉴内容可寻址网络CAN的思想构建SON,模拟一个虚拟的d维笛卡尔空间,动态地将这个d维笛卡尔空间分成多个区(zone),给每个结点分配一个区。结点知识的索引由一个哈希函数生成,表示为二元组
2.2.3 基于移动代理的资源请求的转发
每个索引结点有自己的代理管理模块,负责移动代理的生成和派发。基于移动代理的资源管理策略不但可以优化资源管理,而且可以科学地解决资源冲突、拥塞、网络时延、降低网络负载等。
当组织内部的某资源请求需要在更广泛的领域进行转发时,由该结点向邻居结点派发一组移动代理, SON决定了其邻居结点。SON中的邻居定义为具有相似主题的两个结点,结点之间的距离越近,语义相似度越高。每个资源请求也被映射到语义空间的某个点,将请求的转发锁定在该点周围一个小范围内。每个代理将资源请求和其他结点本体进行比较,实现资源的语义匹配。完成匹配任务后,移动代理将结果返回给发出请求的结点。
3 ASRDM的特点
ASRDM与传统资源发现方式相比具有以下特点:(1)改变了以往基于关键词搜索的方式,实现了基于语义的资源发现;(2)采取集中式和分布式P2P相结合的资源发现模式,有利于系统的扩展,提高了资源发现的效率;(3)结合代理技术,实现了资源发现的自治性和智能性;(4)在组织间基于SON进行资源请求的转发,缩小了搜索空间,同时各结点间可以动态地进行语义聚合。
4 结束语
网格资源的复杂性使得以往传统式的资源发现机制已不能满足要求。本文针对以往资源发现机制的问题,利用代理技术以及语义本体论的理论和技术实现网格资源的语义发现,提出了网格环境中一种基于代理的语义资源发现模型ASRDM。ASRDM目前尚属于探索性研究阶段,还存在许多不够成熟和需要进一步解决、完善的问题,如建立完善的包含多种物理资源和抽象服务的本体库,扩展匹配能力以支持更复杂的语义匹配等。
参考文献
1 Tangmunarunkit H,Decker S,Kesselman C.Ontologybased ResourceMatching in the Grid-The Grid meets the Semantic Web.In:Proc.of the 2nd International Seman- tic Web Conference.Sanibel Island,Florida,USA,2003
2 Alliance G.GT Information Services:Monitoring & Discovery System(MDS).http://www.globus.org/mds,2005
3 William S,Austin T.Ontologies.IEEE Intelligent Systems,1999;(1)
4 Foster I,Kesselman C.brain-meets-brawn-why Grid and Agents Need Each Other.AAMAS,2004;(7)
5 Ratnasamy S,Francis P,Handley M et al.A scalable content addressable network.In:Proc of ACM SIGCOMM 2001,San Diego,California,USA,2001
6 韩光法,王汝传,徐小龙.网格计算环境下基于移动代理资源管理模型的研究.光电技术应用,2003;(5)