一个多智能体机器人协作装配系统
多智能体强化学习在多机器人协作中的应用

多智能体强化学习在多机器人协作中的应用随着人工智能的快速发展,多机器人系统在各个领域中的应用越来越广泛。
多机器人协作是指多个机器人在一个共享环境中相互合作,以完成特定任务。
然而,要实现高效的多机器人协作仍然是一个具有挑战性的问题。
传统的控制方法往往需要手工设计复杂的规划和控制策略,而且对于复杂任务来说效果有限。
因此,近年来研究者们开始关注使用强化学习方法来实现多机器人协作。
强化学习是一种通过智能体与环境之间相互作用来学习最优策略的方法。
在传统强化学习中,通常只有一个智能体与环境进行交互。
然而,在现实世界中存在许多需要多个智能体共同协作才能完成的任务,如救援任务、物流配送等。
因此,在这些场景下使用传统强化学习方法往往会面临一些挑战。
首先,在多机器人系统中存在着状态空间和动作空间巨大、动态复杂的问题。
每个机器人的状态和动作都会受到其他机器人的影响,这导致了状态空间和动作空间的指数级增长。
传统的强化学习方法往往无法处理这种复杂性,因为其需要对整个状态空间进行显式建模,这在实际问题中是不可行的。
其次,多机器人协作中存在着合作与竞争之间的平衡问题。
在某些情况下,多个机器人需要合作来完成任务,而在其他情况下它们可能会竞争相同的资源。
传统方法往往无法处理这种平衡问题,在任务中可能会出现冲突和不稳定性。
为了解决以上问题,近年来研究者们提出了多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)方法来实现多机器人协作。
多智能体强化学习是对传统强化学习方法进行扩展和改进,在其中每个智能体都是一个独立的强化学习智能体,并与其他智能体进行交互。
在多智能体强化学习中存在着许多不同的算法和框架。
其中一种常用的算法是基于价值分解(Value Decomposition)思想的方法。
这种方法将整个多智能体系统的价值函数分解为每个智能体的局部价值函数,并通过协作和合作来优化整个系统的性能。
多智能体系统的设计与实现

多智能体系统的设计与实现第一章:前言多智能体系统是指由多个相互协作的智能体组成的系统。
这些智能体可以是物理上的实体,也可以是软件上的实体,可以是独立的,也可以互相合作。
多智能体系统应用广泛,包括人工智能、机器人、自动控制等领域。
在这篇文章中,我们将探讨多智能体系统的设计与实现。
第二章:多智能体系统的基本原理多智能体系统的基本原理包括智能体的定义、智能体的分类、智能体的属性等方面。
通常智能体包括感知器、决策器、执行器三部分。
感知器用于感知外部世界的信息,决策器用于从感知器收集的信息中做出决策,执行器用于执行决策。
智能体还有其它属性,如智能体的目标,智能体之间的通讯方式等。
第三章:多智能体系统的设计多智能体系统的设计包括智能体的设计、智能体之间的协作方式的设计、智能体之间的通讯机制的设计等方面。
智能体设计要考虑到其目标、所需属性、感知器、决策器、执行器等方面。
智能体之间的协作方式包括合作、竞争、互补等方式。
多智能体系统的通讯机制有多样性,包括广播、单播、多播等。
设计多智能体系统需要考虑其应用场景,选择合适的设计方案。
第四章:多智能体系统的实现多智能体系统的实现包括智能体的程序代码实现、智能体之间的通讯实现等方面。
智能体的程序代码实现可以采用面向对象或面向过程等编程语言。
智能体之间的通讯实现可以采用TCP/IP、HTTP、WebSocket等通信协议。
第五章:多智能体系统的案例分析多智能体系统的案例分析可以帮助人们更深入地了解多智能体系统的设计与实现。
以下是两个多智能体系统的案例分析。
案例一:智能车队系统智能车队系统是一种由多个智能车辆组成的系统。
每个智能车辆都具有感知器、决策器、执行器三部分。
智能车辆之间通过WiFi等通信方式实现信息交换。
智能车辆在行驶时可以自动避让,自动超车,自动并线等。
这种系统可以使车辆在高速公路上行驶更加安全、高效。
案例二:智能物流系统智能物流系统是一种由多个智能物品组成的物流系统。
多智能体协同控制在复杂系统中的应用研究

多智能体协同控制在复杂系统中的应用研究多智能体协同控制是指通过多个智能体之间的合作与协调,共同完成一个复杂系统的控制任务。
该方法适用于各种复杂系统,如智能交通系统、智能机器人系统、智能电力系统等。
本文将重点介绍多智能体协同控制在智能交通系统和智能机器人系统中的应用研究,以探究其在复杂系统中的优势和应用前景。
1.智能交通系统中的多智能体协同控制智能交通系统是一个典型的复杂系统,包括交通信号灯、车辆、行人和环境等多个智能体。
通过多智能体协同控制可以提高交通系统的效率、减少交通拥堵和事故发生率。
(1)交通信号优化:多智能体协同控制可以使交通信号根据实时交通状况进行优化调整,实现交通流的最优化分配。
(2)路网流量控制:通过智能代理车辆之间的通信和协调,可以实现路网流量的智能分配和控制,减少路网拥堵和交通事故发生率。
(3)空中交通管理:多智能体协同控制在空中交通管理中的应用可以帮助控制器实现对飞机运行的灵活调度和路径规划,提高空中交通的安全性和效率。
2.智能机器人系统中的多智能体协同控制智能机器人系统是另一个典型的复杂系统,包括多个机器人和环境等智能体。
通过多智能体协同控制可以提高机器人系统的工作效率和任务完成能力。
(1)集体协作任务:多智能体协同控制可以实现机器人之间的分工合作,完成集体协作任务,如搬运物体、清洁等。
(2)任务分配:通过多智能体协同控制可以实现机器人系统的自适应任务分配,根据工作负载和机器人的能力动态调整任务分配,提高任务执行的效率和质量。
(3)群体控制:多智能体协同控制还可以实现机器人的群体控制,如集群、协同探测等,提高机器人系统的整体工作效能和任务完成能力。
综上所述,多智能体协同控制在复杂系统中的应用研究涵盖了智能交通系统和智能机器人系统两个典型应用领域。
通过多智能体协同控制,可以提高系统的工作效率、减少拥堵和事故发生率,实现任务的高效完成。
然而,多智能体协同控制仍面临着一些挑战,如智能体之间的通信和协调、决策算法的设计和优化等。
多智能体系统中的协同控制算法研究

多智能体系统中的协同控制算法研究一、多智能体系统简介随着现代科技的不断发展,我们越来越能感受到人工智能和机器人技术所带来的便利与改变。
多智能体系统作为机器人技术中的一种代表,其可实现协同工作,相比于单一机器人更具优势。
因此,多智能体系统也成为当前机器人技术重要研究方向之一。
多智能体系统是指由多个智能体组成的系统,每个智能体具有一定的感知、决策、控制等能力,在协作条件下,实现共同的任务。
在多智能体系统中,其协同控制算法对于系统的性能具有重要意义。
接下来本文将介绍当前多智能体系统中常用的协同控制算法。
二、常用的协同控制算法1、分布式控制算法分布式控制算法是指将多个智能体所执行的任务分解为多个子任务,每个智能体只负责部分任务的执行。
该算法在实现分工协作的同时,也能降低多智能体系统的通信开销,从而提高算法的效率。
常用的分布式控制算法有PRoPHET协议、Max-Min协议、CGRL算法等。
其中,PRoPHET协议是一种基于组播的控制算法,可以用于多智能体系统中的离线路由选择。
Max-Min协议是一种分布式控制算法,可用于解决多智能体系统中的最小化任务分配问题。
CGRL算法是一种分布式强化学习算法,常用于多机器人协作控制问题中。
2、集中式控制算法集中式控制算法是指将多个智能体的动作控制交由中央控制器来实现。
这种算法通常涉及到大量的通信,需要保证通信的高可靠性和低时延。
该算法对系统的控制具有高度的可控性,但扩展性和鲁棒性相对较差。
常用的集中式控制算法有、LQ-GSM算法、单一智能体遥测控制等。
其中,LQ-GSM算法是一种矩阵博弈理论,利用马尔可夫链状态表示多智能体系统运行情况,并通过求解线性四倍反馈控制器来实现多智能体系统的协同控制。
单一智能体遥测控制是一种典型的集中式控制策略,即单一智能体通过遥测接收所有智能体的信息,并根据任务要求来分配任务的执行。
3、分步控制算法分步控制算法是基于分布式和集中式控制算法的结合,采用一种分步式的控制过程,通过每个步骤的协同完成最终的任务。
多智能体系统协同控制策略研究

多智能体系统协同控制策略研究摘要:多智能体系统是由多个智能体组成的网络系统,通过协同合作来完成各种任务。
本文对多智能体系统的协同控制策略进行研究,探讨了分布式控制、层次控制以及混合控制等策略,并对其在不同应用领域中的应用进行了介绍和分析。
1. 引言多智能体系统是指由多个智能体(可以是机器人、传感器等)通过相互通信和协作来完成任务的集成系统。
与单一智能体相比,多智能体系统能够通过协同工作,实现分布式感知、决策和控制,从而提高整个系统的性能和鲁棒性。
2. 分布式控制策略分布式控制是一种常见的多智能体系统协同控制策略,其基本思想是将控制任务分配给各个智能体,使其根据自身的信息和局部的控制策略进行决策和控制。
分布式控制策略的优点是系统结构简单、运算效率高,并且对节点故障有较好的鲁棒性。
3. 层次控制策略层次控制是多智能体系统中一种重要的协同控制策略,它将系统控制任务分为不同的层次,每个智能体负责执行特定的任务,并将结果传递给上一层次的智能体。
层次控制策略能够实现分布式决策和控制,并能够应对系统中的不确定性和动态变化。
4. 混合控制策略混合控制是将分布式控制和集中式控制相结合的一种协同控制策略。
在混合控制策略中,智能体之间通过分布式控制进行协同合作,同时由一个集中的控制器进行全局决策和控制。
混合控制策略既能够在系统中实现分布式决策和控制,又能够通过集中式控制器对系统进行整体调度。
5. 多智能体系统应用案例多智能体系统协同控制策略在各个领域有着广泛的应用。
例如,在智能交通系统中,多个车辆之间通过协同控制策略实现交通流的优化;在无人机群体中,多智能体系统通过协同控制策略实现任务协同和信息收集等。
此外,多智能体系统协同控制策略还可以应用于智能电网、智能制造等领域。
6. 挑战与展望尽管多智能体系统协同控制策略在各个领域有着广泛的应用前景,但也面临着一些挑战。
例如,智能体之间的信息交流和协同合作需要高效的通信和协议机制;智能体的动态行为和不确定性需考虑在控制策略中;协同控制策略的设计和优化需要考虑系统的性能和效率。
基于神经网络的多智能体协作研究

基于神经网络的多智能体协作研究随着技术的快速发展,机器智能的领域也迅速扩展。
多智能体系统是当前非常热门的研究方向,其提供的多方互动和协作功能可以解决许多实际问题。
而神经网络则是实现多智能体协作的关键技术,在多智能体协作领域具有广泛应用。
一、神经网络与多智能体系统神经网络是机器智能领域中重要的技术方式之一,其具有进行数据模式识别、对关键信息进行分类和处理的能力。
而多智能体系统则是由多个个体组成的智能协作系统。
这两个领域的交集点,意味着神经网络可以应用到多智能体系统中去。
科学家们对这两种技术的探究,使得多智能体系统的能力得到显著的提升。
多智能体系统依赖于成员之间的协作,神经网络能够识别每个个体的行为,进而优化系统中的大量成员之间的协作。
总体而言,不同的机器学习算法可以用于调控神经网络中的每个智能体。
这种技术的发展,使得人们可以想象出更加快速而高效的智能合作系统。
二、机器人智能协作在机器人智能协作领域,神经网络的应用发挥着重要作用。
在具备诸如认知、学习和推理的机器人环境中,神经网络可以通过合法性反馈等机制优化行动策略,实现多智能体协作和智能决策。
在机器人学中,常见的多智能体协作问题包括目标搜索、路径规划、配对和任务分配等。
神经网络能够处理这些问题,并为机器人的决策提供支持。
三、多智能体系统中的应用神经网络的多智能体应用是多样化的,它涵盖了从智能家居到交通运输的各个方面。
智能家居方面:例如WiFi-可穿戴设备和家庭温度系统,需要多智能体之间保持通讯并共同操作。
交通系统方面:现在的交通系统涉及多种智能体之间的协作,例如实时的公共交通和汽车计划。
此时,神经网络可以对每个智能体进行排序,并优化车流和交通流。
机器人协作方面:在协作机器人领域中,神经网络是非常重要的一部分。
此领域包括环境监测、安全检查和建筑物维护等,神经网络可以指导自主智能机器人完成各种任务。
四、多智能体系统的优势多智能体系统的优势体现在以下几个方面:1.协作能力强:多智能体系统的设计目的是实现智能协作,使其能够解决复杂的问题。
多智能体系统协同控制的方法与应用研究
多智能体系统协同控制的方法与应用研究随着科技的发展和技术的不断升级,多智能体系统越来越多地在各个领域得到应用,并且成为研究人员广泛关注的重要领域。
在实际应用中,多智能体系统需要协同工作,以达到预期的目标。
因此,多智能体系统协同控制成为多智能体系统研究的一个重要方向。
一、多智能体系统的基础知识多智能体系统是由多个智能体组成的系统,每个智能体具有自主性和智能性,能够感知周围环境并作出相应的行为。
多智能体系统可以应用于许多领域,如智能交通、机器人、无人机等。
在多智能体系统中,智能体之间需要相互合作,以实现特定的目标。
因此,多智能体系统的协同控制就变得至关重要。
协同控制是指利用控制算法,协调多个智能体之间的行为,从而实现整个系统的最优性能。
二、多智能体系统协同控制的方法在多智能体系统中,控制方法的选择对系统的效果和性能有着重要的影响。
下面将介绍一些多智能体系统协同控制的方法。
1.分布式控制方法分布式控制方法是多智能体系统中常用的一种方法。
它将整个系统分为多个子系统,并给出每个子系统的控制算法。
每个智能体通过与相邻的智能体交换信息,协同工作,共同实现整个系统的目标。
这种方法的优点是实现简单,不需要中心控制器,具有较高的鲁棒性。
2.集中式控制方法集中式控制方法是指将整个多智能体系统看作一个整体进行控制。
该方法的优点是能够实现全局最优控制,但是由于需要集中控制器,使得系统的复杂度和成本都较高。
3.混合控制方法混合控制方法将分布式控制方法和集中式控制方法结合起来。
即在系统的某些部分使用集中控制,而在其余部分使用分布式控制。
这种方法能够发挥两种方法各自的优点,并且能够降低系统的复杂度和成本。
三、多智能体系统协同控制的应用多智能体系统协同控制在实际应用中有非常广泛的领域,以下列举几个典型的应用领域。
1.智能交通系统智能交通系统是指利用智能感应、通讯、控制等技术,对交通流进行优化管理,以提高交通效率和减少交通事故。
多智能体系统协同控制在智能交通系统中有着非常重要的应用。
多智能体协同控制技术的研究与应用
多智能体协同控制技术的研究与应用随着科技的不断发展,智能技术也得到了快速发展,而多智能体协同控制技术则是其中一个应用最为广泛的领域之一。
多智能体系统指的是由多个智能体组成的系统,在这个系统中,每个智能体都有自己的控制策略和目标,并且通过协同控制来达到整个系统的目标。
因此,多智能体协同控制技术已经被广泛地应用到自动化控制、机器人控制、交通管制、游戏协作和集群协作等领域中,尤其在工业自动化生产、交通运输和军事领域有着广泛的应用和前景。
首先,多智能体协同控制技术应用领域之一是自动化控制。
在自动化控制系统中,多智能体技术可以用于协同控制多个机器人或机械手臂协同完成某些任务。
例如,在生产线上,多个机械手臂需要一起协同完成分拣、装配、搬运等任务,此时多智能体协同控制技术可以实现这个目标。
另外,多智能体协同控制技术还可以应用于智能家居,如多个智能家电的协同控制,提高家庭生活的自动化程度。
其次,多智能体协同控制技术应用于机器人控制。
机器人系统中普遍采用多智能体协同控制,可以实现机器人小组的自主控制。
机器人可以协同完成任务,同时保持与其他机器人的适当距离,既可以分工协作,又可以防止相互干扰。
另外,在医疗领域,多个智能型机器人也可以协同完成机器人手术,提高手术效率和安全性。
再次,多智能体协同控制技术应用于交通运输。
在城市交通管理中,采用多智能体协同控制可以使交通信号灯、车辆导航和交通路况等进行协同管理,避免交通堵塞,节约时间,降低车辆排放。
特别是在无人驾驶汽车慢慢兴起的趋势下,多智能体协同控制技术将成为未来交通自主驾驶系统的重要组成部分。
最后,多智能体协同控制技术还可以应用于游戏协作与集群协作。
在多人在线游戏中,多个角色可以协同完成特定任务,而这些角色是由多个智能体控制的。
集群协作中,多个机器人或无人机协同完成特定任务,如集体搜救人员、测绘地图等。
因此,多智能体协同控制技术已经成为游戏开发和集群管理领域必不可少的技术。
基于多智能体的协作控制技术研究
基于多智能体的协作控制技术研究随着科技的发展,人们对智能化、自动化的需求越来越高。
传统的控制方法,在面对复杂的系统,特别是大型系统时已经无法应对。
因此,基于多智能体的协作控制技术逐渐走入人们的视野。
本文将介绍多智能体的协作控制技术的基本概念、应用场景和研究方向。
一、多智能体系统多智能体系统是指由多个智能体组成的系统。
智能体是指可以感知环境、做出决策、实现行动的自主实体。
在多智能体系统中,每个智能体需要能够与其他智能体进行通信和协作,以实现整个系统的全局目标。
多智能体系统应用广泛,包括机器人领域、智能交通系统、物流管理等。
二、协作控制协作控制是指多个智能体通过互相协作,实现全局目标的控制方法。
协作控制需要解决以下问题:1.各智能体间的信息交换方式;2.各智能体在通信过程中的信号传输和控制方式;3.各智能体做出决策的方式。
协作控制技术的应用,如在机器人领域,可以实现多个机器人协同工作、快速高效地完成生产任务。
在智能交通系统中,将多个智能的交通工具集成在一起,实现智能化的路况调度和优化,可以有效降低交通拥堵和事故率。
三、多智能体协作控制研究方向1.智能体间的协同学习各智能体的知识和能力不同,通过互相交流和学习,可以提高整个系统的性能。
因此,如何通过协同学习实现智能体间的知识共享和能力提升,是多智能体协作控制中的一个研究方向。
2.分布式决策在多智能体系统中,各智能体需要根据当前情况做出决策,并与其他智能体协同完成任务。
这往往需要通过协调来保证整个系统的性能。
因此,如何通过分布式决策实现各智能体间的协作,是多智能体协作控制中的另一个研究方向。
3.高效沟通多智能体系统中,各智能体之间需要通过通信来传递信息和协调工作。
因此,如何通过高效的通信方式,以最小的成本实现信息的传递和处理,是多智能体协作控制中的另一个研究方向。
4.系统的稳定性多智能体系统往往面临比较复杂的环境和系统动力学机制,因此系统的稳定性往往是一个非常重要的问题。
多智能体协同控制技术的研究与应用
多智能体协同控制技术的研究与应用概述:多智能体系统是由多个具有自主决策和相互交互的智能体组成的集合体。
多智能体系统越来越广泛地应用于各种领域,如无人机群控、机器人协作、交通系统等。
在多智能体系统中,协同控制技术的研究和应用具有重要意义。
本文将介绍多智能体协同控制技术的主要研究方向和应用领域,并探讨其未来的发展趋势。
一、多智能体协同控制技术的研究方向1. 集中式控制与分布式控制多智能体系统的控制方式可以分为集中式控制和分布式控制两种。
集中式控制指的是通过一个中央控制器来协调和调度所有智能体的行为,而分布式控制则是每个智能体通过与周围智能体的通信与协调来实现全局的目标。
在研究方向上,需要对集中式控制与分布式控制进行深入研究,包括控制算法的设计与分析、通信协议的选择与优化等。
2. 知识表示与共享在多智能体系统中,智能体需要共享知识和信息来实现协同控制。
因此,知识表示与共享是多智能体协同控制技术的关键问题之一。
研究方向包括知识表示模型的构建与优化、分布式知识共享机制的设计与实现等。
3. 协同决策与规划协同决策与规划是多智能体协同控制技术的核心内容之一。
智能体需要通过协商、协调和合作来实现共同的目标。
在研究方向上,需要研究有效的协同决策与规划算法,包括分布式决策与规划算法的设计与优化、协同博弈与协商机制的研究等。
二、多智能体协同控制技术的应用领域1. 无人机群控无人机群控是多智能体协同控制技术的典型应用之一。
通过多智能体协同控制技术,可以实现无人机之间的协同飞行、任务分配和信息共享,提高无人机的任务执行效率和安全性。
无人机群控技术在军事、物流和灾难救援等领域具有广阔的应用前景。
2. 机器人协作机器人协作是多智能体协同控制技术的另一个重要应用领域。
通过多智能体协同控制技术,可以实现多个机器人之间的协同任务执行、路径规划和物体搬运等。
机器人协作技术可以应用于制造业、医疗服务和家庭助理等领域,极大地提高了工作效率和生活质量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一个多智能体机器人协作装配系统①(1997年11月3日收到,1998年1月9日修回)王越超② 谈大龙 黄 闪 栾 天 赵忆文(中国科学院沈阳自动化研究所机器人学开放实验室 沈阳110015)
摘 要介绍了一个基于多智能体概念实现的多机器人协作装配系统——MRCAS(
Multi2
RobotCooperativeAssmblySystem)。该系统由组织级计算机、三台工业机器人和一台
全方位移动小车(ODV)组成,采用分层递阶体系结构。利用MRCAS系统进行了多机
器人协作装配的实验:在ODV装配平台上,四台机器人合作装配一个大型桁架式工件。该工件具有多种装配构型,但任何一台机器人不能独立完成装配。关键词:智能体、多机器人系统、装配
一、引 言 近年来,人们对机器人学领域中多机器人系统的研究极为关注,对这种系统所具有的适应性、柔性、可扩展性、可靠性等产生了浓厚的兴趣。多机器人系统在自动装配作业、危险环境下材料处理以及外层空间作业等有着广泛应用前景。多机器人系统研究主要有两个问题:多机器人协调和多机器人合作。协调是研究如何控制多个机器人的运动和谐一致;而合作是研究如何组织多个机器人共同完成一个任务,即给定处于某一环境中的一组机器人一个任务时,合作行为将如何产生。目前,基于分布式人工智能(DAI)中多智能体系统概念研究机器人协作问题十分活跃。DAI
主要包括两个研究领域:分布式问题求解(DPS)和多智能体系统(MAS)。DAI理论与协作机器
人学密切相关,许多研究者将MAS概念应用于多机器人系统,对多智能体机器人系统进行了研究[1-3]。多智能体机器人系统(MARS)中的每个机器人具有自治和协作能力,自治是指每个智能
体机器人具有自我控制与决策的能力,协作则是指能与其它机器人一起完成某个任务。为促进多机器人系统和机器人智能的研究,国际机器人界还组织了微机器人足球比赛[4],这对协作机器人学
及相关技术的研究提出了新的挑战。基于多智能体思想,我们在多年从事多机器人协调研究的基础上[5,6]实现了一个多机器人协作装配系统——MRCAS。这项研究的主要目的是实现一个能适应使命变化、可重构的多智能体机器人实验系统。本文介绍了MRCAS系统的体系结构,以及利用MRCAS系统的四台机器人合作装配大型桁架工件的实验。
二、MRCAS系统的体系结构 为实现多机器人协作系统,必须建立合适的体系结构。群体结构不仅提供了合作行为的基础,
—6—
高技术通讯 1998171 ①②男,1960年生,研究生,研究员;研究方向:机器人控制;联系人。
863计划资助项目(8632512222203)。而且对系统的能力有重要影响。多机器人系统基本上有两种体系结构,一种是集中式的,另一种是分散式的。集中式体系结构的特征是系统中存在一个单一的控制智能体。与此相对的分散式体系结构,则没有这样的智能体。一般认为,分散式结构较之集中式结构有很多优点。但目前的技术条件常常限制了全分散式多机器人系统的实现,特别是使用商品化机器人系统时更是如此。因此,在建立MRCAS系统时,我们将两种结构进行了结合,以分层递阶体系结构进行组织。图1是MRCAS系统的结构图,它具有两层结构,顶层是合作组织级,下层是协调运动级。
图1 MRCAS系统体系结构11硬件结构MRCAS的合作组织级由一个组织智能体——HOST构成,其硬件是一台AcerPowerPT100PC机。该机CPU采用100兆奔腾芯片。协调作业级由四台机器人组成:一台PUMA562机器人、一台PUMA760机器人、一台AdeptI机器人和一台全方位移动车(ODV)
。底层的体系结构是一个分散式
结构,每个机器人由其自己的控制器控制。AdeptI由V+系统控制,PUMA562由VAL2系统控制,PUMA760和ODV分别由SVAL系统控制。SVAL系统是中国科学院机器人学实验室开发的[6]。五个智能体之间的相互通信采用串行通信方式,其中ODV控制器与HOST和Adept通信是通过无线串口进行的。21软件系统对于具有两层的MRCAS系统来说,HOST是一个中心智能体。它负责整个系统的任务组织、确定机器人间的合作关系以及进行任务的规划与调度等。基于Windows平台和C++语言,开发了MRCAS系统合作组织级的软件系统。该系统包括图形用户接口(GUI)
、系统模型、装配序列
规划器、作业规划器和任务监控器等模块。组织级软件系统结构如图2所示。
图2 合作组织级软件系统结构框图其中,图形用户接口GUI在Windows环境下运行,提供了以图形方式代替文字方式对装配任务进行建模的手段。在屏幕上,操作者通过图形的拖放操作可指定工件的最终装配构型。系统模型包括机器人能力及状态模型、环境模型和装配规则等。装配序列规划器用于自动产生装配顺序。值得指出的是,装配序列规划是面向被装配工件,而不是面向机器人的。因此,规划是独立于机器人的。作业规划器根据机器人能力及状态模型将装配序列分解为一系列的命令代码,并将它们送往各个机器人。命令代码不是文本程序,而是一系列内部代码。这样,实现了任务级形式描述的装配作业。通过任务监控器,HOST实施对装配过程的实时监控,并以图形和文本两种方式显示每个装配步骤的状态。如果发生异常,HOST能迅速停止装配,并检查装配能否继续进行。如果能进行,HOST将重新规划后续的装配序列,并再次启动装配过程。反之,
HOST将在屏幕上显示故障原因。协调运动级采用分散型的体系结构,每个机器人受自身控制器的控制。协调级的作业编程是面向内部命令代码的。系统工作时,各机器人接收来自顶层HOST的装配操作命令代码,然后将命令代码变换为自身语言形式的运动程序。装配操作是并行进行的。当某个机器人不能独立完成一个操作时,它将与其它机器人进行通信联系,请求帮助。如果有机器人响应请求,它们将协调运动。由于底层采用分散式体系结构,当系统中机器人数量发生变化时,系统的结构不受影响。此—7—
王越超等:一个多智能体机器人协作装配系统外,由于控制算法是并行运行的,当系统机器人数量增加时整个计算时间不会显著增加。因此,
MRCAS系统具有较大的灵活性。
三、装配实验 构造和实现能实际运行的多智能体机器人系统十分重要,特别是使用商品化的工业机器人系统时更是如此。MRCAS系统是基于三台商品化工业机器人系统建立的。为研究实际的多机器人系统的协调与合作,我们设计了用MRCAS系统装配大型桁架式工件的实验,这些工件的装配必须通过机器人合作与协调才能完成。11装配任务描述装配任务是在ODV的装配平台上由PUMA562、PUMA760、Adept和ODV合作装配一个大型桁架式工件。其中PUMA562机器人安装在ODV上。桁架式工件由五个杆件组成:上横梁、下横梁和三个支柱。横梁和支柱如图3所示。每个横梁上有三个孔,装配时支柱将插入孔中。用这五个杆件工件最终可被装配成多种构型。图4是其中的四种构型。四种构型中,最简单的是构型①,最复杂的是构型④。
图3 横梁和支柱 图4 几种最终装配构型三台机器人都可进行工件装配,但是各机器人的能力不同,加上杆件较大,所以任何一种构型的装配仅由一个机器人都不能完成。例如,图4中构型①是最简单的,但仅由PUMA562并不能完成其装配。因为要将支柱插入到下横梁上,PUMA562必须在支柱的一端沿轴线方向抓住它。作业开始时,支柱横卧于平台上,以致PUMA562不能沿轴向抓起它。因此需要其它机器人的帮助。另外,由于上横梁很大,一个机器人难于抓稳,在将其插入到支柱上时必须依靠PUMA760
和PUMA562的协调运动。支柱和横梁孔之间的配合精度很高,在进行图4构型④的装配时,同时对准所有孔的操作是很难的。每个PUMA机器人都安装有RCC柔性装置。某些装配步骤可由不同的机器人完成。例如,在下横梁上插支柱的操作,即可由PUMA562
完成,也可由PUMA760完成。正是由于具有这种冗余能力,使得协作机器人系统一般具有可重构的特性。上述作业的描述表明,要完成装配任务既需要MRCAS系统中机器人的合作,也需要它们的协调运动。21装配过程以图4中构型④的装配为例说明装配过程。首先进行装配任务的建模。在HOST的屏幕上,操作者通过GUI指定最终装配构型。如图5所示,在屏幕的右侧是组成工件的杆件图形。操作者用鼠标从右侧区域拖动杆件图形,然后放到左侧区域。在确定了最终装配构型之后,操作者通过菜单操作分别进行装配序列规划和作业规划。接着,通过菜单操作将装配命令代码送往各机器人。这一步同时也启动了装配过程。装配开始时,ODV如同FMS系统中的自动托盘系统,先移动到装载位置。在这里,操作者将五个杆件不必精确定位地摆放到装配平面上。然后ODV移动到装配位置附近,请求Adept机
—8—
高技术通讯 1998171 器人对其定位。接着Adept先识别横梁,如图6所示,然后抓取它们并放到装配位置。然后分别识别三个支柱,抓起后传递给PUMA562或PUMA760机器人,使它们可以沿轴向抓住支柱。PUMA机器人再将支柱插入到下横梁上,如图7所示。最后PUMA562和PUMA760将协调动作,抓起上横梁后移动到支柱上方,接着将上横梁插在三个支柱上。如图8所示。
图5 任务建模时的GUI 图6 Adept机器人在识别杆件图7 PUMA562机器人进行插入作业 图8 PUMA562和PUMA760插装横梁 在机器人进行装配的同时,HOST实时监控装配过程,并以图形和文字两种方式显示每个装配步骤的状态。我们还对MRCAS系统的容错及重构性能进行了实验。在装配图4中构型②时,HOST首先规划由PUMA562插装三个支柱。当它插装完左侧的支柱后,我们强制PUMA562进入故障状态。HOST检测到故障后,它重新规划了后续的装配序列,并将命令送往PUMA760机器人。PUMA760从断点处继续进行插装作业。
四、结 论 本文介绍了一个基于多智能体系统概念实现的多机器人协作装配系统——MRCAS。系统由组织级计算机、PUMA562、PUMA760和Adept三台工业机器人和一台全方位移动车ODV组成。通过MRCAS系统进行需要系统中机器人合作与协调才能完成的装配实验表明:MRCAS系统具有可重构和能适应使命变化的能力,其控制方案可应用于车间级的FMS。今后的工作将以分布式计算系统取代MRCAS系统中合作组织级的HOST计算机,实现全分—9—
王越超等:一个多智能体机器人协作装配系统