RoboCup 机器人足球仿真比赛开发设计

合集下载

RoboCupdx型组足球机器人系统及相关技术研究

RoboCupdx型组足球机器人系统及相关技术研究

论 文 《 n e i g o o s 中 提 出 ] 0 S e n R b t  ̄ 。这 一 提 议 干 导
广 泛 赞 同 和 积 极 响 应 。 l 9 年 , 经 一 些 学 者 积 极 93 划 , 由S N 出 资 在 瑞 士 注 册 成 立 了R b C p 盟 ( OY o ou联 T R b C p e e a i n , 其 宗 旨是 国 际 社 会 共 同 o o u F d r t o )
决 策 等 多 学 科 领 域 。 对 此 标 准 问题 的研 究 成 果 不 仅 能
够 反 映 一 个 国家 信 息 与 自动 化 领 域 的综 合 实 力 , 至实际应 用的 中介 和桥
梁 ,促 进 产 、 学 、研 相 结 合 , 有 效 推 动 相 关 学 科 领 域
1序 言
R b C p 器 人 足 球 世 界 杯 比赛 是 为 人 工 智 能 和 o o u机 智 能 机 器 人 技 术 研 究提 供 测 试 和 研 究 平 台 而 提 出 的 标
准 基 础 研 究 课 题 … 。在 人 工 智 能 研 究 早 期 , 计 算 机 象 棋 作 为 标 准 研 究 平 台 发 挥 了 巨 大 作 用 。 但 随 着 “深
制 、 实 时 数 字 信 号 处 理 、 图像 处 理 与 图像 识 别 、无 线
通 讯 、知 识 工 程 与 专 家 系 统 、路 径 规 划 、 智 能 控 制 与
2 R b C pJ型组 足 球机 器 人 体 系结 构 oo u/  ̄
R b C p  ̄ 组 机 器 人 足 球 比赛 在 各 有 5 小 oo ud型 个
控 制 方 法 的 良好 测 试 平 台 。
知识处 理发展到 实时决策 与知识处理 …,从而将人 工

机器人足球Robocup仿真系统研究与程序设计

机器人足球Robocup仿真系统研究与程序设计

R b cp teR b t r u o ra n ) o ou ( oo Wo dC pT unmet 即机 h l
形 。荷 兰阿姆 斯特丹 大 学 U A Ti a v rer 队采 用 l n球
器人世界杯 足球锦 标 赛 。它 通过 提供 一 个标 准 任务 来促 进分布式 人工 智 能 、 能机 器人 技术 、 其 相关 智 及 领域 的研究与发 展 。Rbcp包 括 多种 比赛 方 式 , oou 主
B a s r es 队把 R b c p问题 看 成 部 分 可 观 察 ri t m r 球 no oo u
个 比 中, 赛 通过比赛平台自 带的自动裁判或者通过人
为 裁判来做一 些规 则 限制 , 以确 保 比赛 的顺 利进 行 。
R b cp仿真 机器人 系统 的结构 图如 图 1 示 。 oou 所
进行 比赛 。Sce Sr r ocr e e 提供 了一个虚拟场地 , v 并 对比赛双方 的全部 队员 和足球 的状态 进行 仿真。
Ci t 当于球 员 的 大脑 , ln 相 e 指挥 球 员 的运 动 。Sre e r v 和 Cin 之 间的通信 是通 过 U P I l t e D /P协议 进行 的 , 竞 赛 者可 以使 用 支持 U P I D /P的任 何程 序 系 统 。在 一
第1 0卷
第2 7期
21 00年 9月







Vo. 0 N . 7 S p 01 1 1 o 2 e .2 0
17 一 1 1 ( 00 2 —7 30 6 l 8 5 2 1 )7 6 8 —4
S i n e Te h o o y a gne rn c e c c n lg nd En i ei g

机器人足球比赛系统设计与实现

机器人足球比赛系统设计与实现

机器人足球比赛系统设计与实现机器人足球比赛是一项由各国高校生产的项目,旨在通过设计和制造参与比赛的小型机器人,提高学生们的机械设计和编程技能,同时也有利于促进国际交流。

本文将从机器人设计、调试、通信、算法等方面,介绍机器人足球比赛系统的构建过程。

一、机器人设计机器人设计是机器人足球比赛的“起点”。

设计师需要有全面的机械设计和电子技术知识,包括机身结构、传感器使用和控制算法等。

机身结构的设计用来保证机器人能够在预定的场地内正常使用。

机器人需要有肢体和轮子,以便在场地上移动,并携带所需的传感器、电池和通信设备。

传感器是机器人足球比赛中非常重要的组成部分,可以让机器人感知场地、球和对手的位置。

常用的传感器有红外线、超声波、相机等。

通过处理传感器收集的数据,机器人就可以做出响应和决策。

除此之外,机器人还需要一定的通信设备,方便和其它机器人进行通讯和协作。

常用的通信设备有蓝牙、Wi-Fi等无线设备,也有信号传输较为稳定的有线设备。

二、调试当机器人设计完成后,需要进行调试才能够运作。

调试是机器人足球比赛的要点,可以确保机器人在比赛时顺利运行。

首先,需要检查机器人的电路、电机是否连接正常,各个传感器计算数据是否准确。

这一步是重点和基础,如果出现问题,机器人将无法正常运行。

其次,需要测试机器人与其它机器人的通讯机制,同时在不同环境下测试机器人对于灯光、声音、障碍等方面的反应。

最后,需要利用场地模拟比赛,并对机器人的运动进行优化,确保机器人有足够的速度和敏锐的反应速度。

三、通信机器人足球比赛的灵魂之一就是通信。

在比赛中,机器人之间的通信可以让他们共同制定策略,并参加足球比赛。

一般来说,机器人与基站没有直接的连接,其通过无线网络和其它机器人进行通讯。

通信的方式有许多种,包括 ZigBee、无线局域网、蓝牙等。

不同的通信方式具有不同的优点和缺点。

比如,ZigBee通信路径较远,并且具有低耗能,但不适合实时应用;而无线局域网的优点是通讯速度快,但需要相对的大量电力。

机器人足球设计

机器人足球设计
以下函数有方向性,基于以上的基本动作 void NormalGame_Right( Environment *env ); 右队总策略。入口参数:环境参量。
void Defender_Right(Environment *env); void Defend1_Right(Environment *env); void Defend2_Right(Environment *env); void Defend_Right_py(Environment *env); 右队防守策略。入口参数:球员指针,环境参量。
机器人足球仿真比赛 课程设计
组 别:A 组 自动化 0409 班 组 员:程钊 012004014613
郝洵 012004014603 潘越 012004014604 王立 012004014626 指导老师:彭刚 提交时间:2005 年 11 月 13 日
机器人足球仿真课程设计


1. 需求分析
第9页
4.4 程序流程
机器人足球仿真课程设计
第 10 页
机器人足球仿真课程设计
4.5 函数说明 基本动作 void PredictBall ( Environment *env ); 预测球的位置,单步预测,运用微量调节。入口参数:环境参量。
void Velocity ( Robot *robot, double vl, double vr ); 将响应产生的机器人速度写入系统参量中,即引发机器人运动。入口参数:机器人 指针,左轮速度,右轮速度。
新加入的策略 void Kick( Environment *env, Robot *robot, double aim_angle ); 基本动作,绕到球后方,带球运动到对方球场。入口参数:环境参量,球员指针, 目标角度。

RoboCup小型组足球机器人主控系统的设计

RoboCup小型组足球机器人主控系统的设计

中图 分 类 号 : P 4 T 22
文献标识码 : A
文 章 编 号 :0 9 3 4 (0 83 - 9 7 0 1 0 - 0 42 0 )1 0 4 — 2
T e S s e sg fRo o o c r f r F1 0 Le g e h y tm De in o b t c e o 8 a u S
ZU O i ,PAN u ~hu ,LI G i g Y ng X e a N M n
( ASC, uh at i rt, Mig2 09 , ia CN I S tE sUnv sy Na n 10 6 Chn) o ei Abtat Ro o u T ia t ao aji r etOpo t AIrb d sadr a dfl.h ae i rd csh y e ds n src: b C p M ni e t nlon po c t rmoe ,o o c,n e t e T ippr n o ue tess m eg s nr i t j n le i d s t t i
个 集中控制 系统 , 唯~ 的信 息源是足球 场地 , 置于上 空 的摄 像机
会 把 球 场 图像 实 时地 传 送 至视 觉 处 理 子 系统 . 过 一 系 列 运 算 将 经 图像 数 据 化 ,智 能策 略子 系统 根 据 球 场 实 时数 据 作 出 实 时 判 断 , 输 出命 令 信 息 , 些 信 息 将 由无 线 传 输 子 系 统 传 送 到 每 一 台 终 端 这
执 行 子 系 统 本 文研 究 是 主 控 系 统 。 括 视 觉 处 理 子 系 统 、 能 策 略 子 系 包 智
J SSN 1 D — 0 4 0 9 3 4
E ma l e u @c c .e.n — i d f e cn t : c h t : w w.n s e.l t / w d z. t l p/ n e T l 8 ~ 5 — 6 0 6 59 9 4 e: 6 5 5 9 9 3 + 1 6 0 6

仿真机器人足球的体系结构

仿真机器人足球的体系结构

仿真机器人足球队的体系结构球员的高层决策体系报告人:黄展翔Summary☐Goal : passing you useful information to help you build your own simulation soccer team☐Some essential concepts and ideas should bear in mind , which will be helpful while you design your own team☐Fast start-up steps and samples☐The running environmentRoboCup团队合作挑战☐多智能体对抗比赛中的预防性规划☐规划分解和合并☐团队规划的执行评价各种体系结构和球队的评价模式☐基本性能☐健壮性☐一般性能☐实时运作☐通用性☐学习能力Refer RoboCup合成智能体挑战97我们要做些什么?server 更新程序更新场地模型球员控制程序场地模型场地模型信息server 更新程序快速起步构建自己的球队☐了解球队构成☐利用已有底层☐添加自己的高层决策☐注意运行环境仿真球队构成:☐整个球队共11名队员和一个教练☐教练、普通球员、守门员的区别信息感知行为能力☐我们要设计一个全能的队员,它能胜任各种不同的角色(守门员、后卫、中场、前锋等)利用已有的底层代码☐记忆模型世界模型Memory预测模型Prediction☐基本动作踢球kick_ball(direction, speed)传球pass_ball(teammate)射门shoot()带球dribble(position)拦截球intercept()跑位go_to_position(position)铲球tackle()扑球(守门员)catch_ball()添加自己的高层决策球员与server之间的同步问题☐周期(cycle)的概念☐server更新☐决策与server同步Agent的可分为两类:☐反应式agent (stimulus-response agent)☐慎思式agent (deliberative agent)反应式agent决策树式的决策系统高层决策树示例WrightEagle框架介绍:☐内部记忆体Memory包含了世界模型AbsoluteBallPosition(time)和预测模型FastestTeammatToBall(time)☐行为产生器Command产生带参数的动作kick(power,angle)dash(power)☐决策模块则包含在behave()函数中重要的决策函数behave()☐Agent类class agent{Memory mem;//内部记忆体Command cmd ;//行为产生器int behave();//决策模块};☐每个周期执行一次server →client.behave() →server information actionBehave()示例流程:Switch (play_type){case goalie:switch (play_mode){case play_on ://goalie decisioncase set_play://goalie decision}case normal_player:switch (play_mode){case play_on ://player decisioncase set_play://player decision}}普通球员决策树示例简单的agent程序示例my_home_position=vector(ballX*x_factor+basic_x ,ballY*y_factor+basic_y); behave(){If(i_am_goalie){if(ball_catchable)catch_ball();elsego_to_position(my_home_position);}else{//normal_playerif(ball_kickable)shoot();else if(i_am_the_closest_teammate_to_ball) intercept();elsego_to_position(my_home_position);}}竞争式的决策系统Tsinghuaeolus框架介绍:Behave(){//行为生成和评价motion.Defense();motion.SmartInterception();motion.Position();motion.Dribble();motion.Shoot();motion.Pass();motion. Communication();//行为仲裁mediator.mediation();}慎思式agent☐较强的推理能力☐学习适应能力☐显式长期规划能力守门员的设计问题:☐站位于跑位的特殊性☐扑球动作模型☐发任意球时候的move考虑教练的设计:☐通信限制☐更换球员类型☐给球员提出建议运行环境:☐编译器g++ version 2.94☐Linuxvi file_namemake dependmake☐连接serverrcssserverstart host_name team_name联系方式:☐邮件列表(mailing list)/联系交往☐个人信箱huangzx@。

机器人足球(Robocup)仿真比赛中进攻策略的研究与应用

机器人足球(Robocup)仿真比赛中进攻策略的研究与应用

3R b C p o o u 仿真比赛中进攻策略的改进 3 1 结合 变换 阵型 的进攻 策 略 . 我们 从整 个球 队 的整 体稳 定性 考 虑, 究 出适 合 自己 的阵型 。通 过大 量 研 测试 来验 证 阵型 是否合 适, 终确 定符 合风格 和 有着 良好 的效果 的 33阵型 。 最 4
科 学论 坛
- ■I
机器 人足球 ( o ou ) R b c p 仿真 比赛 中进攻策略 的研 究与应 用①
于 美 娟
( 天津 师范 大学 天津 30 8 ) 037
[ 要] 摘 本文 以机 器人 足球 仿真 比赛 作为 平 台, 从整 体和局 部 两方 面对球 员 A e t gn 的进攻 策 略进行 研 究, 点研 究通过 使用 启发 式搜 索 斛 算法对 球 员代 重 的带 球路 径进 行 评 估选 择, 实现 更 高效 率及 准 确 的进 攻,以增 强整 个 球 队的 实力 。 [ 关键 词 ] 攻 策略 启 发式搜 索 A 进 {算法 中图 分类号 :S5 .2 T 9 8 2 文献标 识码 : A 文章 编号 :0 99 4 2 1) 3 0 1 1 10 —1X(0 03 —4 卜O

员 广播 自身 状况 的信 息, 包括 位置 和速 度等, 以达 到 与 队友 在进 攻上 的战 略配 合。 在最 终实 现上采 取 边路进 攻 战术 为主, 中路渗透 战 术为辅 , 代理 球员 ( 能 智 体) 边路 带球进 攻 , 过底 线传 中, 通 禁区 附近 的球 员完成 射 门 : 发现对 方 中路 若 空 虚, 员 中路 带球 渗 透, 禁 区附近 完 成 射 门。 球 在
1研 究背 景 1 o o u 仿 真 比赛简 介 1 R b c p R b C p T e R b t S c e o l u ) 即机 器人 足球 世界 杯, o o u (h o o o c r W r d C p , 是一 个 通过提 供足 球 比赛这 样一 个标 准 问题来 促进 人工 智能 、智 能机器 人 以及相 关 领域 的研究 而建 立 的国际 性研 究和 教育 组织 。 最终 目标 是 : 2 世 纪 中叶, 其 到 l 支完全 自治 的人形机 器人足 球 队应 该 能在遵循 国 际足联 正式规 则的 比赛中,

足球机器人控制系统设计

足球机器人控制系统设计

摘要机器人足球和足球机器人是近几年在国际上迅速开展起来得高技术对抗活动。

本文以机器人世界杯为背景,采用数字信号处理器(DSP)作为核心芯片,研究足球机器人的控制系统设计以及相应的控制算法应用。

通过研究足球机器人的运动特性及控制,能为将来进一步探讨例如机器人路径规划、人工智能及多机器人合作等研究打下基础。

本文首先介绍了足球机器人的兴起,足球机器人的现状及其意义。

接着讨论了足球机器人的体系结构,机器人比赛的系统的组成,工作模式及系统结构,然后简要介绍了足球机器人的比赛的要求,并在最后讨论了控制的对象即我们设计的足球机器人的机电系统结构,包括所选用的电机及其各种运动结构的设计。

第三、四、五章是本文的核心部分,第三章讲述了关于机器人控制系统的硬件电路设计。

首先根据控制要求分析系统所需的硬件结构,然后针对每一部分进行电路设计分析。

第四章是关于控制系统的软件策略。

首先根据系统的控制求介绍了软件控制的总体思想与机构,然后分析机器人的动力学和运动学模型,在建立模型的基础上阐述算法的应用。

第五章是关于足球机器人的决策子系统的体系结构及其模型的建立。

关键词:足球机器人、TMS320LF2407、运动控制、建模、决策子系统ABSTRACTSoccer robots and RoboCup are the high technology activities in recent years that have attracted wide concerns among many countries. Based on RoboCup,this paper deal with the design and research of control system of robot by using a new core CPU (DSP). The main concerns of this paper are soccer robots and I hope with the design of soccer robots, some research on their locomotive properties and control systems, this could build up solid foundation for further research in such areas as Mobile Robot Path Planning, Artificial Intelligence and Multi-Agent Collaborative Behavior.Having introduced the rise of the soccer robot at first, current situation and meaning of the soccer robot. the impact of medium-sized group of robot competition system, the working model and system architecture, and then briefly introduced robot soccer competition requirements, and discussed in the final control of the object that we design the mechanical and electrical soccer robot system architecture, including the selection of the motor and the design of the structure of a wide variety of sports.Chapter three , four and five is mainly concerned. Chapter three is concenred with the hard ware design of control system. It firstly analyzes the hard ware structures and then there are detailed design and analysis on each structure. Chapter four deal with software strategies. Firstly it discusses he software structures according to the system requirements, and then it analyzes Dynamic Model and Movement Model,It analyzes use of some control arithmetic.The fifth chapter is on the soccer robot decision-making subsystem architecture modelKey words: Soccer robot、TMS320LF2407、Motion control、Modeling、Decision subsystem摘要 (1)ABSTRACT (2)第一章绪论 (5)1.1 足球机器人的简介 (5)1.2.1 RoboCup中型组足球机器人研究现状 (8)1.2.2 RoboCup中型组足球机器人研究意义 (8)1.4本章小结 (9)第二章足球机器人的体系结构 (9)2.1机器人足球的系统原理组成 (10)2.2足球机器人的系统工作模式 (12)2.3足球机器人的系统结构组成 (13)2.4足球机器人的技术要求 (14)2.5足球机器人机电结构系统[]6 (16)第三章足球机器人控制系统硬件设计 (20)3.1控制系统的硬件电路的组成结构[]7 (20)3.2.1 TMS320LF2407的简介 (21)3.2.2基于TMS320LF2407的主控系统设计[]10 (22)3.3电机驱动电路设计[][]1211 (24)3.3.1直流电机调速控制原理 (24)3.3.2直流电机驱动设计[]13 (25)3.4传感器电路设计[]7 (27)3.4.1加速度传感器电路设计[]14 (27)3.4.2近红外探测传感器的电路设计[]8 (30)第四章足球机器人的控制对象建模 (33)4.1控制系统的具体要求[][][]1715 (33)164.2足球机器人的动力学建模[]18 (35)4.3足球机器人的运动学建模[]19 (38)第五章中型足球机器人决策子系统分析与设计 (42)5.1 决策子系统分析 (42)5.1.1 决策子系统的任务 (42)5.1.2 决策子系统的特点 (44)5.2 决策子系统的体系结构 (44)5.2.1 决策子系统模型 (45)5.2.2 自上而下的分层递阶决策推理模型 (46)第六章总结与展望 (50)6.1 总结 (50)6.2 对今后工作的展望 (51)参考文献 (52)致谢 (54)附录一英文科技文献翻译 (55)附录二毕业设计任务书 (65)第一章绪论1.1 足球机器人的简介一、起源机器人足球的最初想法由University of British Columbia, Canada 的Alan Mackworth 教授于1992年正式提出。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

RoboCup机器人足球仿真比赛开发设计* 郭叶军熊蓉吴铁军(浙江大学控制科学与工程学系工业控制技术国家重点实验室杭州 310027)E-mail: yjguo@摘要:机器人世界杯足球锦标赛(The Robot World Cup),简称RoboCup,通过提供一个标准任务来促进分布式人工智能、智能机器人技术及其相关领域的研究与发展。

本文在介绍RoboCup仿真环境的基础上,系统完整地介绍了客户端程序的开发设计流程,阐述了其中涉及到的一些主要问题和算法,最后简要综述目前国际上的典型高层算法结构。

关键词: RoboCup 机器人足球比赛多智能体系统随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。

RoboCup1则是人工智能和机器人技术的一个集中体现,被认为是继深蓝战胜人类国际象棋冠军卡斯帕洛夫后的又一里程碑式挑战,目标是到2050年完全类人的机器人足球队能够战胜当时的人类足球冠军队伍。

RoboCup包括多种比赛方式,主要分为软件仿真比赛和实物系列的机器人足球比赛。

由于软件仿真比赛无需考虑实际的硬件复杂性,避免硬件实现的不足,可以集中于研究多智能体合作与对抗问题,因此,目前参加仿真组比赛的队伍数目最多。

本文的内容涉及RoboCup仿真比赛,系统地介绍了client程序开发设计完整流程,可以作为是开发完整的RoboCup仿真程序的入门指南。

1.RoboCup仿真比赛介绍2 RoboCup仿真比赛提供了一个完全分布式控制、实时异步多智能体的环境,通过这个平台,测试各种理论、算法和Agent体系结构,在实时异步、有噪声的对抗环境下,研究多智能体间的合作和对抗问题。

仿真比赛在一个标准的计算机环境内进行,采用Client/Server 方式,由RoboCup联合会提供Server系统rcsoccersim(版本8之前名为soccerserver),参赛队编写各自的客户端程序,模拟实际足球队员进行比赛。

Rcsoccersim通过提供一个虚拟场地,对比赛全部球员和足球的移动进行仿真,以离散的方式控制比赛的进程。

仿真模型引入了真实世界的很多复杂特性,诸如物体移动的随机性、感知信息和执行机构的不确定性、个人能力的物理有限性以及通讯量的受限性。

Client程序则表现为多个Agent(球员)为了共同的赢球目标进行多智能体间的合作规划,因此,我们需要进行以下设计:多线程的程序结构,client和server间的同步策略,根据有限信息重构足球场上所有对象图景,Agent的底层动作设计,Agent的高层决策智能算法。

2.程序框架和同步策略 Rcsoccersim通过UDP/IP协议和client进行通信,并没有对client的开发和运行环境提出任何其他限制,只要支持UDP/IP协议即可,因此在开发环境和使用语言上可以有多种选* 2002年11月收到《计算机工程与应用》录用通知择。

由于rcsoccersim运行在Linux/Unix系统下,而Linux遵循之GPL3许可和RoboCup开放源码、共享资源的思路有极大的相通之处,因此国际上一般都是选择Linux系统作为开发平台。

同时因为windows系列平台的易用性,也有极少数参赛队选择,如清华大学TsinghuAeolus4。

考虑到有大量基于Linux系统的文档资料,而且Linux系统具有高性能的网络特性和实时处理能力,在 Linux下同样拥有强大功能的编辑、编译、调试、源码控制程序,如vim, gcc, gdb, cvs以及程序开发集成环境KDevelop,丝毫不比Win平台逊色,所以本文选择了Linux操作系统作为仿真开发平台。

仿真开发环境一般需要有三台计算机组成局域网,其中一台运行rcsoccersim,另外两台分别运行两个参赛队的程序,三台机器连到同一个Hub。

目前主流配置是Redhat7.3,PIV1.70GHz,256MRAM,100M网卡。

2.1程序框架5RoboCup仿真是11VS11的比赛,每支参赛队启动11个Agent(球员)进程,每一个进程则由两个线程组成。

一个是IO处理线程,一旦网络上有rcsoccersim发送的数据包,就被触发运行;另外一个则是决策线程,选择一个适当的时机,利用rcsoccersim给出的有限信息进行处理决策,最后选择一个合适的基本动作发送至rcsoccersim。

由于两个线程都会利用/更新足球场上对象的信息,所以还需要增加一个互斥量,对该信息库进行加锁操作。

决策线程是关键,每个Agent内部都维护着一个世界模型,作为对真实世界的知识表述,由感知信息的处理结果和外部行为模块所选择动作的预测结果来共同更新。

外部行为根据高层决策发送基本动作指令。

基本动作作用于真实世界,从而改变Agent将来的感知。

从图(1)可以看出,还需要解决client和server间的同步问题,维护和更新世界模型,Agent 高层决策算法以及为实现高层决策的底层动作(图示为外部行为)。

2.2同步策略Rcsoccersim执行Agent球员发送的基本动作指令,并据此相应的更新比赛环境,同时根据一定的时间间隔规律向每个Agent发送感知信息(visual, auditory , sense_body)。

Agent 则根据这些信息来确定下一步要做的基本动作(dash,kick,turn,etc)6。

在这样的异步、离散控制的仿真环境中,c/s间的同步机制显得格外重要。

在每一个离散周期(目前一个仿真周期为100ms),Agent不能发送过多的动作指令,否则只会被随机选择其中某个指令;另一方面,在每一个离散周期,Agent也应该发送起码一个指令,否则就会浪费该仿真周期。

发送指令的时间要足够的早,要在本周期rcsoccersim停止接收Agent指令之前发送到,否则就会浪费本周期机会;发送指令的时间又要足够的晚,这样才能在得到尽可能多信息的情况下,做出一个更准确的决策。

那么,什么时候发送指令就成为问题的关键。

阿姆斯特丹大学的UvA Trilearn7综合研究了四种同步策略:外部基本策略(ExternalBasic)、内部基本策略(Internal Basic)、固定外部窗策略(Fixed External Windowing)、柔性外部窗策略(Flexible External Windowing)。

经过研究表明8,柔性外部窗策略是最佳选择,该策略如图2所示。

图中点虚线代表自身感知信息,rcsoccersim在每个周期的开始时段发送,短划虚线代表视觉信息,实线则是Agent发送给rcsoccersim的动作指令,阴影部分是Agent 的决策模块。

从图2可看出,Agent最大限度的利用了最新信息,同时也保证每一周期都不被浪费,确实是一个不错的同步机制。

3.世界模型和底层动作 在开始研究多智能体合作与对抗算法之前,我们还需要解决世界模型的维护以及底层动作的设计。

3.1世界模型的维护Agent仅能得到视野角度范围内的有限感知信息,而且有限的信息也带有噪声,而在Agent内部维护一个较为准确的全局世界模型,是接下去所有决策的前提条件,具有重要意义。

卡内基梅隆大学的RoboCup仿真研究小组9提出世界模型更新算法10,结合Agent获取的感知信息以及对执行动作的预测结果进行更新世界模型。

当更新Agent的世界模型时,首先更新Agent本身的位置、速度等值,然后更新球和其他球员。

n Agent本身由于视觉信息是以相对坐标表示的,那么首先要确定对应视觉信息时刻的Agent本身的绝对坐标。

以视觉信息为主,再考虑自身感知信息以及动作预测结果来补充更新Agent 本身信息。

n足球在决策过程中,足球的位置和速度对动作的选择是一个相当关键的因素。

因此,要尽可能及时获得关于足球的精确信息。

主要利用视觉信息中的相对值来更新足球对象的位置和速度。

当决定是否要截球、是否要踢球时,球的速度是非常重要的,而在视觉信息中通常不给出球的速度,因此当需要得到足球速度值时,可以通过原来的位置和当前的位置来计算球的速度。

n其他球员由于经常会因为距离原因不能看到所有球员的号码及所属队名,甚至有些球员将不在视野范围内,因此很难跟踪每个球员的位置。

我们需要建立尽可能准确的世界模型,包括场上所有对象信息。

通常情况下,球员位置和速度的确定和球所采用的方法一样。

所额外增加的是视觉信息中所提供的球员的面向。

在不能获知球员的全部信息时,可用该球员的原先位置来消除这种不确定性。

由于已知一个球员在一个周期内所能够移动的最大距离,因此当所得到的一个球员信息没有标识时,可以通过原来球员的位置来确定它的标识。

3.2底层动作介绍当一个良好的算法被设计后,同样需要完善的底层动作分解实现之,底层动作主要包括跑位、传球、截球、带球、断球、射门等个人技术。

这些技术动作是最基本的,是实现高层的复杂策略所必不可少的,每个都是复合动作,实现都需要多个周期,由多个基本命令(dash, kick,turn)组成。

l跑位:在决策出跑位点后,在跑位过程我们需要考虑世界模型的准确与完备,即视线不能老是对着跑位点,适当时候还应该转身扫描获取场上对象情况。

l传球:扫描传球路线,确定传球力量。

保证足球不会被对方球员所截获。

l截球:已知足球速度方向,分析各球员的得球能力。

l带球:不需要保证足球每个周期都在可踢范围内,只要保证自己能最早截球即可,可调用截球模块来重新获得足球控制权。

l断球:当双方近距离争抢足球时,如何断球,夺取足球的控制权。

l射门:可以参考传球模块,需要增加对对方守门员的额外考虑。

底层动作的实现可采用几何的方法对运动模型进行解析计算,也可采用神经网络的方法进行场景训练,使用监督学习的方式,通过对多层前馈神经元网络的训练,实现如带球,传球,射门等基本技术。

基于神经网络的学习在机器人足球领域已经有所研究11,该文提出的方法也适用于仿真领域。

4.高层算法简介 高层决策研究——多智能体的合作与对抗——是RoboCup仿真项目的最终研究目标。

在机器人足球系统的开发中,近年来迅速发展的先进智能算法被充分利用,并取得了很好的效果。

Peter Stone12使用层学习技术来设计机器人的基本动作和顶层决策。

Kostas Kostiadis13利用再励学习方法实现多机器人系统中的合作行为。

Endo Kazuaki et al.14运用遗传算法来优化系统的参数。

层学习技术综合了慎思结构和反应式结构,有很成功的应用。

RoboCup仿真比赛的2001世界冠军清华大学队15设计了层结构作为机器人的系统结构,使用神经元网络实现全队的基本队形,然后按照智能水平从低到高的顺序,建立整个机器人足球比赛系统,并应用于实践中。

相关文档
最新文档