随着包括微型机械纤维技术(Technology)在内的传感器(Sensor),受动器以及处理器技术的快速发展,价格低廉同时具有足够的处理功能和有限的感知能力的自动可移动设备的研制开发成为了可能。我们提出的目标是,利用大量的(100个以上)这些简单机器人来实现陆地,空中和水下环境中真实的军事任务,利用基于传感器的机器人来实现所需的共有的群体操作。为实现这一目标,关键的前提之一是具备以面向任务的系统级参数的方式来对这些机器人进行指挥和控制。指挥员需要了解系统的功能,操作规范以及在部署后系统有效性的度量方法。因此有必要通过单独的自动组件将系统(总体)功能和性能与所实现的行为联系起来。
本文描述了分析、建模、算法开发以及仿真的一系列项目,这些项目的目的是开发、和改进这个基本方法,并使其成为实际的解决方案。最初的目标是开发通用的行为,例如覆盖,障碍,以及扫描覆盖区域,各种部署和恢复模式,这些行为能够在很多通用的应用(Application)中得到应用,例如布雷,扫雷,侦查,放哨执勤,维护检查,船舱清理以及通信接力。文中最后给出了初步的仿真结果。
1.0引言
开发研制21世纪的军用移动机器人所必需的传感器,受动器,和处理器这些关键技术正在飞速发展。而且军用移动机器人的研制主要集中在无人地面车辆(UGV),无人飞机(UAV)和无人水下舰艇(UUV)上,在固态传感器和受动器技术上的进步说明在机器人车辆功能和性能范围的“低端”还有没有利用的机会。实际上,新出现的微型机械(也称为“微动力”,“机电一体化”或者“微型电子机械系统”)领域已经被1991年纽约时报的今日科学版选为90年代“10大关键技术”之一。
本文的目标是通过大量相对简单、廉价而且可相互替换的自动组件的共同操作实现一系列的军事任务,而不是通过目的明确,复杂,基于某个单独、十分复杂(而且目前在技术和经济上并不可行)的基于感知行为的机器人单元方式来实现。本文所提出的方法是设计并实现可以达到如下两个目标的机器人车辆:
a):支持真实世界的任务
b):用目前的传感器和处理技术可以实现
即使在对象和障碍很多的地面应用环境中,有用的任务一般所需的高带宽的基于视觉感知的车辆导航和控制功能也超出了目前传感器和处理器工具的功能。
大量的小型廉价车辆可以用于很多军事应用当中:雷区扫描,布雷,侦查,值班放哨以及通信接力,另外还有不同类型的搜寻,维护检查,载货仓异物(FOD)处理以及船舱清理等。
注意到,我们将这些不同应用中需要实现的导航行为定义为“在静态部署以及动态群组中维持各个组成单元之间的空间关系”是恰当的。这种协调位置和移动的一致性的概念是本文所关注的重心。
当采取利用中心位置控制器计算一个群组中各个组成单元的某个所需的位置或者移动轨迹,并随后下载并执行这些数据的方法解决这个问题时,在最好的情况下是效率低下,最坏的情况下是无法实现的。这个计划的执行可能会被无法预知的事件(例如,电流过载,位置障碍,敌军的行动)所阻碍。中央控制器需要从受控组件获得一些特殊的信息来修改计划,才能将偶然事件纳入考虑范围,并且这种信息有可能是受控组件自己也无法获知的。时间、处理、通信资源(Resource)可能无法对以下三种情况进行支持:
a):所需数据与中央控制器之间的通信;
b):制定修改计划所需要的处理;
c):将计划回传给执行单元的通信。
我们提出的解决方案是让机器人在应用中实现与人一样的方式:“你们排成一行,间隔一臂的距离,然后全部一起行走,在行走过程中拾起任何能找到的物体”。每个成员的行动都是在其它成员行动的基础之上的,与最临近的成员的行动最为相似,但是与距离相对较远的成员之间也有一些类似。因此利用传感器输入(每个成员感知相对于自身而言临近成员的位置)和明确的通信信道就可以实现导航定位。动态传感器可能要经过调制来完成控制过程(例如,发出与峰值发射功率成反比的鸣叫声)。这些机器人各自的世界模型将是严格 “以自我为中心”的。
当然,动物在成群移动时也使用类似的模型来实现控制。在动物的成群活动方面的文献中,大部分文献都是描述性的或粗略分析性质的,但是Craig Reynolds在文献中对这种成群活动进行了综合分析,并提出了一种鸟群的动物序列的概念。他发现他无法通过一次画一只鸟的方式来制造出一群实际的鸟群,但是通过维持鸟与周围临近的鸟之间的特定距离关系却可以实现一群鸟的仿真。
动物行为学(对动物行为的研究)提供了讨论体现群体行为系统的自然语言,对自然的群体行为的研究进入了新近出现的“人工生命”研究领域的范围之内,在这里需要指出的是,这种研究工作已经是智能控制领域的主流。
2.0系统概念
在本文中所考虑的系统的定义特征是移动机器人系统的数量是足够大的,系统的指挥控制接口必须将各自成员“隐藏”在系统的指挥员的视线之外。各成员不一定要是小型的或者廉价的,但是经济和技术因素让它们很可能具有这种特正。
系统由大量同样的成员(参见2.3和4.0节)所组成,每个成员处理如下数据:
(a):移动性的某种度量,这个度量可能是十分有限的,例如在水下应用中,成员可能只能在调整在水中的深度,并随着水流飘动;
(b):某种感知功能,让每个成员能进行测量,最少要知道相对于最近的其它成员的位置;
(c):某种能完成任务的传感器或者受动器,具有上述同样的传感器功能;
(d):此项是可选的,某种通信功能,这种能力可以利用传感器的功能;
(e):某种处理功能,执行利用受动器的移动性来维持传感器所测量的与临近成员之间的位置关系的算法。以这样方式与任务功能传感器或受动器一起完成所期望的任务目标。
2.1总体运动行为
完成任务目标的关键是要确保单个成员个体的简单运动行为的总和的结果是所期望的总体上的群体行为。我们对问题进行了如下级别的抽象:即不处理成员之间的碰撞或者有不相关联的障碍的单个成员,成员可以被认为是足够小的,以至于相互之间碰撞的可能性很小,并且成员足够健壮碰撞不会对其造成损害,或者说,成员的损害或者损失在系统/任务级别是忽略不计的。
覆盖行为:在许多情况下,我们所期望的群体行为是维持一种群体成员之间空间关系,并利用特定的本地条件来优化这种功能的性能,这种行为被称为“覆盖”。在这些情况下,有必要对有效性进行精确的度量,这对在特定任务目标的环境下对全部系统性能的描述是十分有意义的。例如,当任务的目标是让每个单元在广阔区域中单位时间内发现的敌人数量最大,侦查小组应当是具有很大的规模,并且成员间隔远,但是规模小且成员间排列紧密的侦查小组却可以在较小的扫描区域内让漏报的概率最小。下面列出了三种类型的覆盖行为:
地毯覆盖:目标是通过静态的成员布置在覆盖区域内达到最大的目标检测率。
障碍覆盖:目标是通过静态的成员布置在让突破障碍的敌军的漏检测概率最小。
扫描覆盖:目标是在覆盖区域内通过一组成员的移动进行覆盖,移动的方式是在单位时间内达到最大检测率和单位区域内的最小漏检率之间的一种折中。
下表中是这三种类型的覆盖行为可能的应用场合,有时可以认为不同系统可以完成同样的需求:
应用 覆盖类型
布雷 障碍覆盖
扫雷 扫描覆盖
侦查 扫描覆盖
放哨执勤 障碍覆盖
通信接力 地毯覆盖
维修检查 扫描覆盖
载货仓FOD处理 扫描覆盖
船体清洁 地毯覆盖或扫描覆盖
编队行为:这些行为是覆盖行为的一种替代方式的代表,期望的行为是在成员之间维持一种特定的空间关系。例如,如果一群USV(无人水面船只)或者低空飞行的UAV作为佯攻战斗群,这个群体之中各成员之间的距离应该保持得很好使这个群体看起来就像在执行进攻任务一样。这类行为的一个典型例子是行军分队或者演习连队,在这些群组中各成员之间在空间商是痛不得,并且伴随着音乐在时间上也是同步的。听起来可能简单,但实际上却不是这么简单!或许最简单的编队行为的例子是在一维空间条件下的沿着道路的护航车队;在文献中描述了一种基于传感器的保持护航车队中车辆间距离的方法。
覆盖和列队行为是系统的“稳定状态”和“主体”行为,在这之外,还有比必要考虑并提供各种空域和时域“边界条件”下的行为。
部署:各成员必须可以让自己从可以在部署方案中简单实现的初始状态进入一种可以接受的启动模式中。可能出现的情况有以下几种:
(a):单点(例如空降),
(b):密度适中的线性模式(例如,从移动平台上进行顺序部署);
(c):随机分布的初始状态,或者紧密,或者稀疏(例如,在空中突然实施散布)。
恢复:当任务完成时,系统必须可以(最少在一些情况下)完全(或者大体上)恢复到原来状态,或者(在一些情况下)即使在单个成员失灵的情况下。这个理想的恢复模式需要各成员自动移动到“召集”它们的集合站点。在同一时间具有多个相距很近的集合站点应当也是可行的。这种结合模式显然要保证不会向敌军留下可乘之机。
群体的整体导航:需要有一中机制来以整体的形式来控制群体的移动,以使群体可以到达执行任务所需的地点。实现这种控制方式的一些可行的方案有如下几种:
(a):使群体中每个成员的运动方向倾向于某个方向(一个可以实时“定向”的方向),这需要所有的成员公用一个通用的方向参考系);
(b):利用一小部分成员的方向控制来实现,群体中的大部分成员依靠基本的相对位置控制算法来实现运动控制(像牧羊犬引导一群羊一样)。
在许多应用中需要其它通用的行为,例如:
(a):当某个成员失灵时,在不干扰其它成员完成任务的情况下向其它成员求助;
(b):在不干扰全局任务的情况下,让成员自己进行例行维护(例如电池充电)。
2.2需要分析的问题
在定义了一系列类型的所期望的移动行为之后,系统未来的开发人员还必须对有大量移动成员所组成的系统的复杂行为有足够的理解。下面列出了一些需要考虑的领域:
行为的随机性:将随机性引入导航算法被证明是合理的。在实际的系统中,这有助于解决潜在的死锁情况,加强任务传感器的有效性并增强对敌军欺骗威胁的抵抗力。另外,在仿真系统中,算法随机性可以用在一些实际传感器和受动器行为限制的建模中。
障碍和可遍历性:可遍历性的概念在二维(地面)环境中是很重要的:有必要对点障碍和延伸障碍的存在进行区分,或者相反的说,导航实际上可以限制在一小部分可能的路由上。这些信息具有全局(任务级)的重要性,必须要弄清楚并向指挥员报告。在导航/机动界别,系统的行为必须要在存在各种不同类型的障碍的情况下保持健壮性:群体不应该一个接一个的从高处翻滚,也不应该在低处重叠在各自身上。
内部的动态状态:一个群体的整体运动可以被认为是实现整体行为的群体独立的内部动态。在算法和传感器功能的基础上,同样的群体运动可以通过利用一系列会产生十分不同的内部行为的其它不同的策略来实现。以物理状态进行分离,这些内部模式可以简单的分为如下几类:
如果群体在运动时,各成员间保持严格的相对地理位置关系,我们可以讲这种群体认为是固态的;而如果相对地理关系是重复的,则是晶体状态的;除此之外是非结晶的。如果成员间自由移动,但是成员的密度保持不变,这种群体可以认为是液态的。最后,如果密度是变化的,并且成员个体可以漂移出去,我们可以将这个群体看作是气态的。试验证明,类似于温度或压力的统计学度量方法在群体行为的分类中也是有效地。
2.3可能的生物系统类推
在我们所讨论的人工系统与动物的行为之间,已经进行了很多的类推和比较,因此我们可以在自然生物系统中寻找可以用于我们需求的方法。例如:
变形虫的爬行运动具有一种特殊的模式,即当群体通过“流动”的环形模式运动时,群组最外层的成员在任意给定的时刻都是静止的。在很多情况下,这会使传感器的性能比所有的成员都处于运动状态时要强。
信息素是一种动物用来通信的化学物质。例如,蚂蚁会在它们巢穴和水源之间的路途中留下信息素。在一些应用中,可以用例如撒微小的发射玻璃头的简单人工信息素方法。人工信息素的关键部分是衰退率以及隐蔽性。欺骗性也是一个问题,理想的信息素应该使用加密技术。
人体的免疫系统和蚂蚁的聚居都提供了自然系统该如何使用不同特点和功能的元素来实现期望目标的模型。一些细胞检测人体内的入侵者并对其进行“标记”,其它细胞如果发现了这个标记就摧毁这个入侵者。蚂蚁的分工系统与此类似。将能力进行何种混合擦你能最有效和高效的完成某项任务呢?从安全相关的任务来看,入侵检测任务中定位,鉴别以及中和需要不同的能力。利用很多廉价的传感器来进行最初的检测任务,然后利用数量相对较少的一组功能更强的传感器来执行最初的威胁接触并在入侵者被确认的情况下做相应的处理。Deneuboura在文献中通过仿真演示了蚂蚁的分类行为可以通过环境信号最简单的概率偏置来实现。
工蜂可以执行很多不同的任务,它们花费很大部分的时间在蜂巢周围“巡逻”,并可以根据很多简单信号来启动不同的生成活动。因此蜜蜂可以提供一个获得“有目的”的相互协调,对环境变化敏感的群体行为的模型,这个模型并不是全局模型,实际上,明确的全局判断并不能成为任何类型的模型。这种基于单反应计划的交互的准智能“突发行为”已经用于简单的车辆系统中,这个工作被认为是较复杂系统最基本的研制方法。目前的方法就属于此类。
3.0项目仿真和初步结果
在1992财年,我们启动了一个分析,建模和算法研制和仿真项目,目的是对所有的系统方法进行验证。仿真开始是在二维世界中进行的,每个成员知道相邻成员具体的相对位置,相邻模型和传感器功能以及限制(起初是对称的)将在仿真项目的第二次迭代中实现。最终,模型将用在三维世界中,并且系统将具有更加详细的传感器模型和预处理传感器。
仿真程序已经在Macintosh操作系统和Symantec的Think C编译器及相关开发环境中进行了编程,在编程中尽量不使用Macintosh操作系统相关的指令,以使程序具有最大的平台可移植性和计算性能。仿真程序可以支持10个不同控制行为群组的成员(机器人)的创建,成员总数可以达到200个。仿真程序用户在创建成员簇时可以指定一簇中有多少成员、簇的模式(圆形随机分布或者指定大小和位置的矩形分步)、初始速度(在某种速度区间内随机分布)、何种行为(零加速、特定速度,指定时间和位置的集合或者传感器基础上的集群算法中的一种)。仿真对每个单独的成员的航向和速度进行导航,利用安装在没有被仿真的较低几倍的控制器上的控制阀门和转向装置实现所需的速度和航向,仿真还可围绕点障碍(例如其它成员)实现导航。不同群体的成员的行为可以在仿真过程中通过用户命令进行更改。一次仿真运行可以以包含关键帧文件的形式进行保存。
图2中所示是一次仿真中的一些帧序列,一个包含40个成员的群体正在执行一种“凝聚”行为,即从分散的初始配置位置集中到一起。实际的算法非常简单:如果某一个成员所有相邻成员的最小方位角都小于 180度(即,如果能通过某个成员画一条线,并且这个成员所有的相邻成员都在这条线的同一侧),那么这个成员就被认为是在群的“边缘”。处于“边缘”的成员以固定的速度沿着方位角的角平分线移动,而不在“边缘”的成员保持静止。因而,随着“外部”元素“扫描”剩余的节点,凝聚过程得以继续。这个算法的分角部分是由Sugihara和Suzuki最先发现的,他们的论文讨论了一些其它有趣的运动协调算法。在实际应用中,利用一种补偿(或者在一些实现中,“竞争”)行为可以在达到期望的元素密度时中止凝聚过程。
关于凝聚算法及其仿真,还有一些有趣的特征可以讨论。首先,算法是相当健壮的,即使在传感器的感应距离比配置时的初始值要小得多的时候,只要传感器的探测能创建一个连接的图,算法也可以创建一个单独的排列紧凑的群体。(如果图是由不相连接的片组成,每片将凝聚形成一个单独的组)。之所以能够这样是因为任意一个移动的成员都在向靠近其它成员的方向运动。第二点是凝聚过程不需要任何类型的全局位置信息;群的指挥员并不是“向LATLONG位置凝聚”,而只是“凝聚”。第三点是算法只利用了来自传感器的方位角信息,而不需要其它数据。然而,算法在效果上与只用范围数据的方法或者范围数据和方位角数据混合方法是相似的。第四点,在初始安装中,因为“在边缘”和“不在边缘”两种情况下,成员的运动具有不连续性,时间分布仿真在配置的“边角”位置引入了一种人造簇,不同成员在“边角簇”交替前进,轮流处于 “边缘”状态。但是,这种“人为”的集中力量可能在某些战斗情况中被认为是可以值得拥有的特征,算法在生成真实(仿真)机器人时可以在时间上进行量化。
4.0指挥控制以及系统问题
为了有效地利用资源,指挥必须要理解他所使用的工具:他必须要知道他能让下级单元做什么,他们能够做什么,以及在各种条件下最应该做什么。指挥员在“游戏”中的参数是在训练和演习中建立的。这些考虑同样适用于自主无人单元的应用中。我们要向未来的指挥员提供以下的模型:
单元功能模型:了解能向单元分配的任务范围,单元能做出回应的基本的命令;
单元执行能力模型:了解单元能以多快的速度移动,移动范围能有多远,武器以及传感器的作用范围以及效能,在各种威胁下自我防卫的能力,通信资源的连接性和有效性,以及后勤保障支持需求。
单元行为模型:了解下属单元指挥员在训练和接收到特殊指令的基础上如何对一系列范围很广的情况做出回应:如何使用机动性,武器,传感器和通信能力。
本文所做工作的目的是提出“覆盖行为”的概念并让其作为多机器人系统通用的范例,换句话说,作为一个与多种不同应用相关的单元功能模型。最后,我们还会开发一些列对单元执行能力进行分类的分析工具。这些工作还包括用模型受动器(武器或者传感器)有效性(检测概率或者攻击成功率)对即时的战场情形进行分析,当成员接近潜在目标及随后撤退时为器提供合理的建议。关键问题是如何恰当的标示成功概率与相对时间和空间间隔的统计独立性。我们的计划是从群体行为的定义开始,然后提出这些群体行为使用的传感器和受动器的有效性度量(MOEs),并以MOE是的形式对群体行为进行验证。
在真实系统部署此之前,还要提出一个单元行为模型,这在某种意义上说是和对“虚拟下级指挥员”进行建模是一致的。如果单元行为确实是可适应的,并且不是令人失望的“不友好”,那么就有必要用明确的策略来处理许多人会用“常识”来处理得情况。对所有可能的相关情形进行遍历首先就不是简单工作,这包括大量不需要行动而只是向指挥员发送“这里有些奇怪的事情发生…”的信息的情况。
还有其它一些问题需要考虑。例如,考虑一群 10000个成员的群体在以目标为中心,1km半径的圆形区域内的部署。假如两个5000个成员部署器中有一个失灵,剩余的5000个成员怎么办?一个最明显的可能是保持成员的空间,将半径减少至700米。另一个明显的可能是保持1km半径的覆盖范围,但是增加成员间的间距(从大概平均8-9m增大至大约 12米)。或者我们可以区分不同情况。方法是,当这种命令是一种可能随着任务不同发生改变的“高级”政策决定时,暗示着有必要设计一个“低级别”的凝聚算法。如果间距保持不变,算法就可能是“如果局部密度太低,则向信号源移动,如果密度过高,则向密度降低的方向移动”。
如何处理与指挥员的通信也是一个问题。正如希望加入可以通过向所有参与的成员广播一个单独信息引起的整体行为一样,我们对有很清楚的强烈需求希望能够让各个单元向指挥员发送回馈信息,作为很多单独成员只是的融合,而不需要各个成员单独汇报。这种方式有一个潜在的需求,即需要各成员某种分层次组织,不是为了指挥,而是为了汇报。这种组织可能是参数化的,基于不同成员的不同固有差别的,或者是可变的,反应不同成员当前状态(例如在凝聚行为例子中的“边缘”状态)。
5.0未来演示和实现
这种方法的可信度最终取决于使用真正物理机器人的真实的物理行为。当资金允许是,我们计划使用廉价的“玩具”车辆,“智能”传感器,和一个简便实现的控制器来演示一个有可用于一类军事应用中的有目的的群体行为。
我们可以采用的一种方案是,使用现有的车辆群,例如麻省理工学院机器人实验室的20个IS Robotics R-1 室内机器人(每个机器人重量4磅)的“Nerd Herd”,来实现初步的演示。R-1使用Brooks的包含体系,提供一个非常合理的基于Macintosh的软件开发环境,并且使用声音信号让每个 R-1知道其它所有成员的位置,所以利用他们进行基于“伪传感器”的行为仿真是十分方便的。
第二套方案是开发和实现一种非常廉价的机器人车辆(目标是每个机器人车辆小于1k美元,而R-1的单元花费是5k美元),具有恰当的传感器和处理功能,能够让几十个成员在几百米的区域进行室外演示。这项任务的一个备选技术是Echelon公司的“局部操作网络”(“LON”)范例。LON利用控制技术为非常廉价的机器人成员提供高效的实现,项目处理器组件的花费大约在2美元到5美元之间,而RF调制解调器的花费小于10美元。另外,Echelon的硬件在提供传感器和受动器的控制功能之外还提供全套通信协议。
但是,最后这种原型系统的开发还是超出了 6.1预算,项目必须集中于单个实际世界应用(或者小部分相关应用)。仿真和建模共作的一个关键目标是确定能用于实际军事应用的备选系统,对所需群体行为进行量化分类(以成员数量,成员间距和运动参数),并开发一个可以满足(包括成员传感器,受动器和处理器需求)应用的智能机器人概念设计。