《电子技术应用》
您所在的位置:首页 > 其他 > 业界动态 > 基于案例与规则集成推理的公共卫生疫情预警系统的应用研究

基于案例与规则集成推理的公共卫生疫情预警系统的应用研究

2008-07-09
作者:刘双印, 徐龙琴, 谢仕义, 涂

    摘  要: 分析了基于规则推理" title="规则推理">规则推理和案例推理" title="案例推理">案例推理的人工智能推理技术存在的一些问题及推理过程,提出了技术优势互补的集成推理方案,设计了集成推理的系统结构和工作流程,并引入到疫情预警" title="疫情预警">疫情预警信息系统中,对疫情案例的表示、案例库组织结构、案例检索、案例适配与系统学习等部分关键技术进行了探讨,最后在湛江市城市公共卫生" title="公共卫生">公共卫生疫情预警系统" title="预警系统">预警系统中得以验证。
    关键词: 疫情预警  规则推理  案例推理  公共卫生

 

    现实世界中存在的大量不确定因素(如自然灾害、恐怖事件、交通事故、疫情爆发等)引起的突发事件对人们正常的生活构成了严重的威胁,如2003年的SARS疫情危机和2004的高致病性禽流感H5N1疫情给我国的经济建设、社会稳定造成了极大的损害。所以,预警系统的建设得到各国政府组织的高度重视,如日本常设了部一级的危机管理中心;印度专门设有危机管理小组。我国针对地震、台风、公共卫生等已建立了应急系统。这些系统大多数是基于规则推理RBR(Rule-Based Reasoning)的系统。这种模式存在知识获取的“瓶颈”问题,系统建立和维护困难,不具有自动的学习能力,而且不能利用另一重要的知识资源——以往的成功经验或典型案例数据。而基于案例推理CBR(Case-Based Reasoning)是一种类比推理方法,它可以方便地利用过去的成功经验或案例数据来求解与之相似的新的问题。对于很少或不能形成通用规则的问题领域,采用CBR最为有效。然而,CBR虽然克服了RBR知识获取的“瓶颈”问题,但CBR不适用于当前存在的领域知识,并且决策过程有时显得过于牵强(intuitively)[1-2]
  本文将基于规则与基于案例集成推理技术、专家系统和数据挖掘等技术结合起来,构造一套RBR与CBR集成的决策推理方案,并应用于公共卫生疫情预警系统中。利用两种推理各自的推理优势,形成优势互补系统,消除了RBR和CBR结果之间的冲突,提高了系统求解问题的效率,增强了系统对不良结构问题的适应性,实现了经验丰富领域的推理。针对疫情爆发,建立一套科学高效的公共卫生疫情预警系统,增强突发事件中实施疫情控制和医疗救治工作的快速反应能力,减轻突发公共卫生事件对居民健康、生命安全造成的威胁和财产损失,具有重要的经济价值和社会意义。
1 基于案例与规则集成推理的技术概述
1.1 基于规则推理技术
     RBR适合应用于对领域有充分认识,能以完备和健全的形式表示领域理论的场合,它是一种链式推理,其简单的推理可能触发多条规则[3]。许多成功的专家系统都采用产生式系统的典型结构,用产生式规则表达知识。通常,产生式系统由下面几个基本部分组成:
    (1)事实库(也称综合数据库):存储有关问题的状态、性质等事实的叙述性知识。
    (2)规则集(或称“规则库”):存储有关问题的状态转移、性质变化等规则的过程性知识,可描述成:IF条件THEN结论。条件可以是任意子句的逻辑组合,结论可以是多个子结论或操作的组合。
    (3)控制器:根据有关问题的控制性知识,选择控制策略,将规则与事实进行匹配,控制利用知识推理求解问题的过程。
     产生式规则的优点是知识表示自然、通用灵活,易于模块化和结构化,但这种模式存在知识获取的“瓶颈”问题。
1.2 基于案例推理技术
     CBR是一种类比推理方法,它可以方便地利用过去的成功经验或案例数据来求解与之相似的新问题。基于案例推理的系统设计技术可以被归纳为五个部分:案例检索、案例匹配、案例修改、案例学习和案例维护。基本解题步骤如下:
    (1)案例检索:根据当前的问题通过一系列的搜索和相似度的计算,将案例库中的案例过滤,取出与目标案例相似的若干案例组成相关案例集。
  (2)案例匹配:从检索出的案例集中提取最佳案例,即从已检索出的相关案例集中抽取特征最为相似的案例或案例片断,用相似度表征待解问题和相关案例集中案例的相似程度。根据相似度,判断已经存在的解决方案是否符合当前问题的求解需要,以便调整案例集的解决方案,从而获得待解问题的建议方案。
  (3)案例修改:根据案例库中已存案例与待解问题之间的差异,若用户对系统给出的方案不满意,推理系统将就此方案进行修改或重新设计后再提交给用户。如果用户认为差异太大,则求解过程终止。
  (4)案例学习:对当前问题的解进行评价分析,若认为求解结果有价值,则将新解保存到案例库中,扩充案例库的案例种类与数量,并进一步地从新问题的解中提取浅层规则知识或修改深层模型知识;否则,重新匹配和修正。
  (5)案例维护:求解方案经过实际应用后,根据实际应用效果和一定的策略,分析新案例的经验和知识是否有保留的价值,若有则按一定的存储策略将其纳入案例库中,实现案例库的不断更新、完善。
  案例推理技术借鉴以往的经验,更符合领域专家和设计人员的设计思维过程。它也存在前面所讲的优缺点。

1.3 以CBR和RBR集成推理的系统结构 
   由于CBR与RBR各有缺陷,它们无论是作为两种推理方式还是作为知识表示方式都不能相互替代。这是因为案例集合无法充分表达编码归纳后的规则,案例中包含的分布广泛的粗知识也极难或不可能提取归纳为规则。如果将CBR和RBR集成在一起,就能够克服两种推理体系各自的缺点,增强系统的灵活性和综合推理能力[4]。CBR和RBR集成的最通用方式有二种:第一种是以RBR为主导,CBR后置补充的(RC)混合模型;第二种是以CBR为前导,RBR后置补充的(CR)混合模型。其他的组合方式都是以这两种方式为基础组成的。
  对于已经在相关领域建立了较完善的RBR系统,由于对该领域知识的理解仍是很不充足的弱理论领域,使用第一种方式有较好的效果。而对于领域知识模型、案例和RBR系统己充分建立但还要求系统有很高实时性和效率的情况,则宜采用第二种方式[2]。在实际应用中,应该根据领域的不同特点和实际情况,灵活地选择不同的集成方式。根据公共卫生疫情的特征,本文选择以CBR为前导,RBR后置补充的(CR)推理模式,实现在丰富而精确的知识库基础上的高效推理。其集成推理的系统结构如图1所示。图中,规则库和案例库共同构成了专家系统的知识库。

                            
  (1)人机交互界面:完成人机交互、问题表示、结果显示和和系统的总体控制,即分析用户提交的问题并加以分解综合后转化成系统可以理解的知识表示形式送至学习机。
  (2)案例库:是CBR的核心。提供支持问题求解的一组案例,它是问题求解经验的集合。案例源的丰富程度是问题求解的关键。因此,必须利用丰富领域知识建立较为完善的案例库。在组织案例库时本文采用两层结构,第一层为典型案例库,第二层为被分类的子案例库,且第二层中的每一个子案例库对应着典型案例库中的一个典型案例。这样可有效提高案例检索效率。
  (3)规则库:用于存储领域专家认可的各应用领域的主要规则知识和技术指标,是以规则的形式表示的、正确的、能够完全表达领域的知识,相当于传统产生式系统中的知识库,是系统综合数据库的基础。对问题定义和案例适配提供背景知识,同时也提供查询和咨询服务。
  (4)学习机:主要负责创建和维护案例库,包括启用解释模块调用RBR来完成由规则到案例的实际的推理过程。
  (5)推理机:根据问题,利用知识库中的知识,用集成的CBR和RBR推理规则进行推理,求得问题的解。推理机是本系统的核心模块之一。
1.4 以CBR和RBR集成推理的系统模块协同工作过程
  采用集成推理的系统各模块协同工作过程如下:在推理时,通常把人们以往的经验储存成一个个案例形成的案例库。当新问题出现时,通过搜索算法可直接在案例库中搜索,找到合适案例作为新问题处理的参考,即实案例重用;如果找到的案例不满意或没有结果,此时就启动学习机内部的解释模块到规则库中检索相关知识,得到基于规则推理的结果以备进行间接匹配。若经过修改后的案例间接匹配成功,得到问题的解,经过案例评价机构评价后,认为问题的解有价值,便可保存在案例库中以备下次使用,即实现了案例自学习。若在推理过程中有不止一个旧案例与新的输入案例相匹配,此时还要启用评价机构,以便于对匹配情况做出裁决,从中选出最佳匹配。案例集成推理的控制流程图如图2所示。

                         
2 基于CBR和RBR集成推理的公共卫生疫情预警系统主要实现技术
2.1案例的表示
  案例的表示过程即是将权威领域专家的知识转化为计算机系统可以识别的信息过程。案例是知识表示的一种模式,它将专家的知识与经验用描述案例的数据结构和众多的案例表示出来,实际上它就是专家求解问题的一个具体例子[2]。适当的知识表示方法有助于提高在案例库中检索到与当前欲求解问题相似案例的精度和速度。本文采用面向对象的基于框架法的知识表示方法来表示疫情预警案例,因为框架法的知识表示方法适合于将某特定时期的疫情预警指标、行为知识和专家经验等有机地结合起来。而且采用框架法的知识结构描述方法,将所搜集到的疫情案例存放到一系列相互关联的数据库中,利用关系数据库的索引技术,可以方便地建立案例索引。借鉴相关参考文献所建立的疫情预警案例结构框架如表1所示。

                               
2.2 案例库的组织
  对案例库进行组织索引是为了方便案例库的检索,因此如何组织案例库取决于系统所采取的检索策略。如果在设计时不采取有效的检索策略,将直接影响案例检索效率和系统响应时间。本系统对案例库组织时采用两层结构,第一层为典型案例库,第二层为被分类的子案例库,且第二层中的每一个子案例库对应着典型案例库中的一个典型案例。具体地说,首先对案例进行分类,每一类组成一个较小的子案例库并在其中选出一个典型案例,作为对该类案例的索引,所有类的典型案例构成一个典型案例库。检索时,先在典型案例库中找到最相近的典型案例(此步骤相当于对新问题进行分类,看它属于哪一类案例),然后在最相似的典型案例所对应的那类案例中进行进一步的检索,案例库的两层结构可以更方便地检索案例。
2.3 案例的检索和匹配
  案例检索是指从案例库中寻找与新问题相似的案例的过程,案例的匹配检索是实现案例推理的关键步骤。查找以案例类别为第一检索条件,以案例特征为第二检索条件,在案例库中查找出可能与新问题有关的旧案例,形成候选案例集合,使以后匹配过程仅在候选案例集中进行。可提高案例检索效率的常用检索方法有:最近相邻策略、归纳推理策略、知识引导策略和模板检索策略[2],这些方法可以单独或联合地运用。本文检索采用的策略为目前常用的最近相邻策略[5]对案例进行匹配。
2.4 案例适配
  从检索出的案例集中提取最佳案例,即从已检索出的相关案例集中抽取特征最为相似的案例或案例片断,用相似度表征待解问题和相关案例集中案例的相似程度。根据相似度,判断已经存在的解决方案是否符合当前问题的求解需要,以便调整案例集的解决方案,从而获得待解问题的建议方案。然而,大多数情况因为系统知识不够丰富,检索到的案例并不能满足问题的求解,这就需要学习机进行学习。本系统采用转换型的适配策略(transformational adaptation)和参数调整(parameter adjustment)适配技术。其基本思想是:比较检索到的案例与新问题所关心属性的差异,从而将解决方案适当地调整。
2.5 集成推理系统自学习
  集成推理系统的优点在于其自学习的能力,即系统在运行过程中能够不断地将新问题及解决方案作为新的案例加入到案例库中丰富系统。但如果这种行为不加以控制,案例库中的案例质量就会下降;同时案例库的规模就会膨胀,降低系统的推理效率[6]。故本系统采用相似度δ进行评价控制:δ=(δ1t,δ2t,δ3t,…,δnt)式中,n为旧案例数,δit为新案例与旧案例的相似度。如果所有δit均小于某一设定阀门时,则认为有价值,送入案例库;否则,被认为是无价值案例,将该案例丢弃。
3 基于CBR和RBR集成推理的公共卫生疫情预警系统应用
  下面以湛江市城市公共卫生预警系统为例阐述该系统的应用,案例和规则放在SQL数据库中。现在取其中疫情预测分析模块为例,工作过程描述如下:
  把在湛江市石头村2005年7~11月各月份的鼠疫调查数据,如疫情地区、疫情名称、疫情症状、起始时间、发病人数等,经过特征抽取转换成机器可以识别的案例输入系统,点击预测按钮,可在2005年份7~11月各个月份的发病数基础上进行预测计算,便可得到鼠疫在2005年12月份的发病数预测值。疫情预测分析界面图如图3所示。

                    
    此外,系统还可根据疫情的属性与空间数据库相关联,实现疫情预警信息分布地图呈现给用户,并及时通报疫情信息,做好应对方案,可有效防止疫情的蔓延。
  目前国内已建立起为数不多的公共卫生疫情预警系统,多数是基于规则推理的系统,系统建立和维护困难,并且不具有自学习能力。本文将基于案例推理与基于规则推理的两种技术相结合,研究出智能高效的公共卫生疫情预警系统,这不仅使系统的建立和维护变得容易,且提高了系统的运行效率,呈现出更强的智能化特征。提高对公共卫生疫情的预防能力、增强在疫情爆发中的组织抢险和快速反应能力以及推进公共卫生疫情预警系统的科学化和智能化具有重要意义。该系统已投入使用,有一定的应用推广价值。
参考文献
[1] YANG Hao, WEN Flu, ALAN Clin. Procase: A casedbased process planning system for machining of rotational
 parts[J]. Journal of Intelligent Manufacturing.1994,(5):441-430.
[2] CSER L. Three kinds of case-based learning sheet rnanufacturin[J]. Computer in Industry,1991,(17):195-206.
[3] 蔡自兴,徐光祐.人工智能及其应用[M]. 北京:清华大学出版社,2003.
[4] 张建华,刘仲英.案例推理和规则推理结合的紧急预案信息系统[J]. 同济大学学报,2002,30(7):890-894.
[5] SCHAAF J W. Fish and shrink: A next step towards efficient case retrieval in large scaled case bases[A].
 Advances in Case-based Reasoning[C].Lausanne: Third European Workshop, 1996:362-376.

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。