RoboCup清华大学毕业设计论文
性能势算法研究及在RoboCup中的应用

t h e a v e r a g e p a y o f f r e c e i v e d p e r t i me s t e p i n ma n y p r o b l e ms ,f o r e x a mp l e t h a t t h e o p t i ma l b e h a v i o r i s a l i mi t c y c l e . Ho we v e r ,i t h a s ma n y p r o b l e ms s u c h a s o v e r s e n s i t i v e wi t h p a r a me t e r a n d c o n v e r g i n g s l o wl y .I n a d d i t i o n ,t r a d i t i o n a l l e a r n i n g a l wa y s e mp h a s i — z e s t h e i n d e p e n d e n t l e a r n i n g o f a s i n g l e a g e n t .Co n s i d e r i n g t h e r e l a t i o n s h i p b e t we e n i n d e p e n d e n t l e a r n i n g a n d g r o u p l e a r n i n g,a n i mp r o v e d G- l e a r n i n g b a s e d o n p e r f o r ma n c e p o t e n t i a l i s p r o os p e d wh i c h i s a p p l i e d t O t h e mu l t i - a g e n t s y s t e ms .By u s i n g t h e i m— p r o v e d a l g o r i t h m o n Ke e p a wa y p l a t f o r m ,t h e r e s u l t o f t h e s i mu l a t i o n s a n d e x p e r i me n t s s h o w t h a t t h e n e w r e wa r d f u n c t i o n b a s e d o n s o me b e t t e r r e f e r e n c e s t a t e i S b e t t e r . Ke y wo r d s :Ro b o Cu p S o c c e r ;r e i n f o r c e me n t l e a r n i n g ;p e r f o r ma n c e p o t e n t i a l s ;G- l e a r n i n g ;mu l t i - a g e n t s y s t e m
RoboCup比赛环境下足球机器人路径规划研究

RoboCup比赛环境下足球机器人路径规划研究黄彦文;曹其新【期刊名称】《智能系统学报》【年(卷),期】2007(2)4【摘要】RoboCup中型组足球机器人比赛具有高度的对抗性和实时性.比赛中机器人需要针对不同的比赛态势进行角色切换和任务选择.在这种环境下,应用传统人工势场或一般改进型人工势场的路径规划方法都无法得到令人满意的结果.将障碍物与机器人之间的相对速度矢量以及目标与机器人之间的相对速度矢量分别引入人工势场法中,对传统的势场函数进行了改进;并根据机器人的不同角色和任务,采用模糊逻辑方法对势场函数进行修正,提出一种处理多角色多任务环境的改进型人工势场法机器人路径规划方法.仿真试验和实际应用验证了此算法在足球机器人比赛系统中的可行性.【总页数】6页(P52-57)【作者】黄彦文;曹其新【作者单位】上海交通大学,机器人研究所,上海,200240;上海交通大学,机器人研究所,上海,200240【正文语种】中文【中图分类】TP242.6【相关文献】1.基于模糊神经网络的RoboCup足球机器人局部路径规划方法研究 [J], 曹宇杰;邓本再;詹一佳2.Robocup小型足球机器人AI决策系统设计--Robocup系列研究之六 [J], 陈盛;李永新;朱璐;皮骄阳;李尚荣;孙刚3.Robocup小型足球机器人的控制系统研究--Robocup系列研究之一 [J], 孙刚;李永新;李尚荣;陈盛;朱璐;陈浩耀4.Robocup小型足球机器人红外测距系统设计--Robocup系列研究之二 [J], 陈盛;李永新;李尚荣;孙刚;朱璐;杨杰5.Robocup小型足球机器人的运动分析与控制--Robocup系列研究之三 [J], 孙刚;李永新;皮骄阳;李尚荣;陈盛;朱璐因版权原因,仅展示原文概要,查看原文内容请购买。
Robocup3D仿真比赛关键技术的研究_个体技术的设计

第四章RoboCup3D仿真比赛中个体技术的设计在RoboCup3D仿真比赛中,11个球员为了完成赢得比赛的共同目标而互相合作。
两个球队之间的对抗实际上就是两个球队策略程序之间优劣的较量。
比赛的结果很大程度上是由球员所具备的技能来决定的。
仿真比赛客户端程序中,球员的技能实际上就是它所具备的能完成某个动作的能力,一个球员的行为特点也与它具备的技能有关,在多智能体系统中,单个智能体的技能对整个多智能体系统的性能有很大影响,体现在RoboCup3D中就是单个球员所具备的能力。
球员所具备的技能可以分解成许多基本的动作,一些高级的动作正是由一系列基本的动作所组成的,整个球队的策略都可以理解为单个球员技能的协调与合作。
球员的动作分为高层动作和中层动作以及底层动作[29]。
如图4.1所示,较高的动作都是通过调用一系列较低一层的动作来实现,最底层的动作实际上也就是最基本的指令(dash, kick, beam, say等),这些指令是能被服务器直接理解和接受的,每个球员根据当前的世界模型的状态来决定执行相应的技能动作。
而中层动作包括射门、守门、拦截、带球等。
高层动作一般是指由两个或两个以上的机器人通过相互配合完成的动作,如一射一传、二过一以及下底传中等[30-31]。
其中要注意的是,选择某个技能动作只是产生了一系列基本命令的集合而已,而服务器并不能保证一定可以执行这些指令集合。
比如有个球员要执行跑位的战术动作,但是它的体力值已经耗尽,而执行这个复合动作包含着dash这样的基本指令,根据Server的说明,执行dash动作需要消耗一定的体力值,所以只有当体力值大于dash所要求的才可以响应。
本章主要针对踢球、拦截、射门、守门、带球这几个动作进行分析讨论。
图4.1个体动作的层次关系4.1 踢球动作的设计踢球动作有一定的复杂性,首先需要弄清它的基本模型。
我们知道,球员的半径为0.22m,球的半径为0.111m,而踢球半径是0.04 m,直接加和就是0.371m,因此踢球时球员和球心平面距离的取值范围是0.32m到0.38m。
RoboCup清华大学毕业设计论文

清华大学毕业设计论文目录第一章背景介绍 (1)第二章设计理念和决策框架 (3)2.1设计理念 (3)2.2决策框架 (4)第三章截球技术的实现 (6)3.1 问题介绍 (6)3.2 RoboCup仿真环境的运动模型 (6)3.3二分法求解 (7)3.4 训练作截球判断的BP神经网络 (8)3.5 比较和总结 (9)第四章脚法的实现 (10)4.1 问题介绍 (10)4.2 再励学习(Reinfocement Learning) (10)4.2.1再励学习简介 (10)4.2.2 Bellmen最优方程 (12)4.2.3 动态规划算法简介 (12)4.2.4 Q学习算法简介 (13)4.3 用再励学习训练脚法 (13)4.3.1 Kalsruhe Brainstormers 的方法 (13)4.3.2 我们的实验结果 (14)4.3.3 我们的方法 (15)第五章仲裁算法 (19)5.1 问题介绍 (19)5.2 RoboCup仿真环境中队员的观察模型 (19)5.3 仲裁算法 (20)5.4视野宽度的决策 (23)第六章传球线路的搜索算法 (24)6.1 问题介绍 (24)6.2 传球线路搜索算法 (25)6.2.1 简单的搜索算法 (25)清华大学毕业设计论文6.2.2 优化搜索算法 (25)6.2.3 穿越速度的计算 (28)第七章防守体系 (29)7.1 问题介绍 (29)7.2 角色的定义 (29)7.3 阵形的定义 (30)7.4 一个简单的防守系统 (30)7.5 考虑全局利益的防守系统 (31)7.5.1 考虑全局利益防守体系介绍 (31)7.5.2 求解全局利益最优的防守方案 (32)7.5.3 实战效果 (32)7.5.4 缺点 (33)第八章 TSINGHUAEOLUS的程序结构 (34)参考文献 (36)致谢 (37)清华大学毕业设计论文第一章背景介绍机器人足球世界杯(RoboCup)是国际上一项为促进分布式人工智能、智能机器人技术及其相关领域的研究与发展而举行的大型比赛和学术活动。
RoboCup人形组的技术与挑战

RoboCup比赛的内容
RoboCupSoccer Simulation League Small-Size League Middle-Size League Standard Platform Humanoid League RoboCupRescue
Rescue Simulation League Rescue Robot League
——Technical Challenge: Artifical Grass
RoboCup人形组规则概述
——Technical Challenge: High-Kick
RoboCup人形组的技术
目前:
双足行走技术——PDW+ZMP 计算机视觉——颜色分割、物体识别 环境建模/定位——粒子滤波定位 单/多自主体的行为决策——有限状态机
为什么举办RoboCup?
继“计算机国际象棋”之后设立的又一个挑 战性计划。
1997年五月,Deeper Blue战胜人类世界冠军卡斯 帕罗夫; 1992年,Alan Mackworth在其论文《On Seeing Robots》中提出训练机器人进行足球比赛的设想; 1996年,IROS上举行Pre-RoboCup; 1997年, IJCAI上举行首届RoboCup。
InfoQ 策划·组织·实施
关注我们:/infoqchina
2vs2,9mX6m 6~10队,循环赛,淘汰赛 Technical Challenge
AdultSize(1.3~1.8米)
1vs1,9mX6m 6~10队,循环赛,淘汰赛 Technical Challenge
Best Humanoid(RoboCup的最高奖)
RoboCup 机器人足球仿真比赛开发设计

RoboCup机器人足球仿真比赛开发设计* 郭叶军熊蓉吴铁军(浙江大学控制科学与工程学系工业控制技术国家重点实验室杭州 310027)E-mail: yjguo@摘要:机器人世界杯足球锦标赛(The Robot World Cup),简称RoboCup,通过提供一个标准任务来促进分布式人工智能、智能机器人技术及其相关领域的研究与发展。
本文在介绍RoboCup仿真环境的基础上,系统完整地介绍了客户端程序的开发设计流程,阐述了其中涉及到的一些主要问题和算法,最后简要综述目前国际上的典型高层算法结构。
关键词: RoboCup 机器人足球比赛多智能体系统随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。
RoboCup1则是人工智能和机器人技术的一个集中体现,被认为是继深蓝战胜人类国际象棋冠军卡斯帕洛夫后的又一里程碑式挑战,目标是到2050年完全类人的机器人足球队能够战胜当时的人类足球冠军队伍。
RoboCup包括多种比赛方式,主要分为软件仿真比赛和实物系列的机器人足球比赛。
由于软件仿真比赛无需考虑实际的硬件复杂性,避免硬件实现的不足,可以集中于研究多智能体合作与对抗问题,因此,目前参加仿真组比赛的队伍数目最多。
本文的内容涉及RoboCup仿真比赛,系统地介绍了client程序开发设计完整流程,可以作为是开发完整的RoboCup仿真程序的入门指南。
1.RoboCup仿真比赛介绍2 RoboCup仿真比赛提供了一个完全分布式控制、实时异步多智能体的环境,通过这个平台,测试各种理论、算法和Agent体系结构,在实时异步、有噪声的对抗环境下,研究多智能体间的合作和对抗问题。
仿真比赛在一个标准的计算机环境内进行,采用Client/Server 方式,由RoboCup联合会提供Server系统rcsoccersim(版本8之前名为soccerserver),参赛队编写各自的客户端程序,模拟实际足球队员进行比赛。
赵明国-RoboCup人形组的技术与挑战

为什么举办RoboCup?
继“计算机国际象棋”之后设立的又一个挑 战性计划。
1997年五月,Deeper Blue战胜人类世界冠军卡斯 帕罗夫; 1992年,Alan Mackworth在其论文《On Seeing Robots》中提出训练机器人进行足球比赛的设想; 1996年,IROS上举行Pre-RoboCup; 1997年, IJCAI上举行首届RoboCup。
——Technical Challenge: Artifical Grass
RoboCup人形组规则概述
——Technical Challenge: High-Kick
RoboCup人形组的技术
目前:
双足行走技术——PDW+ZMP 计算机视觉——颜色分割、物体识别 环境建模/定位——粒子滤波定位 单/多自主体的行为决策——有限状态机
InfoQ 策划·组织·实施
关注我们:/infoqchina
RoboCup比赛的内容
RoboCupSoccer Simulation League Small-Size League Middle-Size Lenoid League RoboCupRescue
Rescue Simulation League Rescue Robot LeagInfoQ中文站定期组织的线下技术交流活动。目 的是让中高端技术人员有一个相对自由的思想交流和交友沟通的的平台。主要分讲师分享和OpenSpace两个关键环节,每期 只关注一个焦点话题。交流的平台。针对当期主题,参与者人人都可以发起话题,展开讨论。
环境 国际象棋 RoboCup 静态 动态 状态改变 回合制 实时 获取信息 完全 不完全 传感器信息 符号式 非符号式 控制方式 集中 分布
清华大学本科毕设论文

清华大学综合论文训练题目:基于四旋翼无人机的PM2.5测量系别:电子工程系专业:电子信息科学与技术中文摘要近年来,随着无人航空技术发展的日趋完善与成熟,无人机逐渐受到重视并且得到广泛应用。
无人机凭借其机动强、经济上较为实惠、方便起飞、降落等方面的优势,越来越受到人们的青睐。
同时,无线遥感技术的飞速发展与日趋完善,也在很大程度推动了无人机的应用,无人搭载平台在空气检测、环境监测、恶劣条件侦探、航拍等方面都得到广泛应用。
本课题以无人机作为搭载平台,搭载空气传感器与GPS模块,实现对PM2.5与PM10数据的采集,在PC端通过单片机编程,实现SD卡存储所采集的数据,达到空气质量检测的目的。
本文依次介绍系统的硬件部分、软件部分。
之后,对传感器的可信度进行评估,介绍如何通过单片机编程实现用SD卡存储PM2.5(PM10)值。
最后对采集的数据进行处理,绘制PM2.5(PM10)随着不同的经纬度、高度、风速的变化趋势曲线图,得出结论。
关键词:四旋翼无人机;SDS011激光传感器;STM32单片机;数据储存与显示ABSTRACTWith the rapid development of UAV technology, its application has become more and more widespread together. With its advantage in mobility, fastness, economy, convenience and so on, the UAV has been used more widespread. With the development of wireless remote sensing technology, the UAV has been used in meteorological monitoring, resource surveys, aerial survey and respond to emergencies widely.This topic uses the UAV as carrying platform, and equips UAV with air sensor and GPS module, implementation of PM2.5 and PM10 data collection, through the microcontroller programming to achieve the data stored on the SD card, and finally achieve the purpose of air quality testing.This paper firstly introduces the hardware part and software part of the system. And the evaluates the reliability of the sensor, describes how to use the microcontroller to store the value of PM2.5(PM10) in the SD card. Finally deal with the data collected, and then draw the trends and graph of the values of PM2.5(PM10) change with the latitude and longitude, altitude, wind speed.Keywords: Four-rotor UAV;SDS011 laser sensor;STM32 microcontroller;Data storage and display目录第1章引言 (1)1.1 课题背景 (1)1.1.1 无人机概述 (1)1.1.2 PM2.5(PM10)国内外检测现状概述 (1)1.2 课题的研究的目的和意义 (2)1.3 项目需求 (3)1.4 整体工作介绍 (6)第2章系统硬件概述与设计 (7)2.1 四旋翼无人机搭载平台介绍 (7)2.2 SDS011高精度激光传感器 (8)2.3 ATK-NEO-6M-V23定位模块 (10)2.4 开发板 (13)2.4.1 开发板简介 (13)2.4.2 单片机给电模块 (14)2.4.3 数据存储模块 (15)第3章系统软件概述与设计 (17)3.1 系统环境与软件开发工具 (17)3.1.1 Realview MDK介绍 (17)3.1.2 J—Link仿真调试 (19)3.2 串口对数据的输入与查看 (20)3.2.1 数据输入串口 (20)3.2.2 数据查看串口 (22)3.3 系统环境与软件开发工具 (23)3.3.1 软件设计程序设计整体构架 (23)3.3.2 系统模块初始化 (24)3.3.3 对空气传感器数据处理 (24)3.3.4 对GPS定位信息进行处理 (25)3.3.5 存储部分代码实现 (27)第4章系统实现过程 (29)4.1 空气传感器数据实现 (30)4.2 GPS定位模块数据实现 (31)4.2.1 海拔精确度测量 (32)4.2.2 地面风速测量 (33)4.2.3 经纬度测量 (34)4.3 PM2.5(PM10)值变化情况研究 (35)4.3.1 PM2.5(PM10)值随海拔变化情况研究 (35)4.3.2 PM2.5(PM10)值随风速变化情况研究 (37)4.3.3 PM值在不同的天气条件下随风速变化情况研究 (38)第5章结论与展望 (40)插图索引 (41)表格索引 (43)参考文献 (44)致谢 (45)声明 (46)附录A 外文资料的调研阅读报告 (47)第1章引言1.1 课题背景1.1.1 无人机概述“无人机(unmanned aerial vehicle,UA V)是一种带有动力装置,具有自主导航能力,无人驾驶的不载人航空器。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
清华大学毕业设计论文目录第一章背景介绍 (1)第二章设计理念和决策框架 (3)2.1设计理念 (3)2.2决策框架 (4)第三章截球技术的实现 (6)3.1 问题介绍 (6)3.2 RoboCup仿真环境的运动模型 (6)3.3二分法求解 (7)3.4 训练作截球判断的BP神经网络 (8)3.5 比较和总结 (9)第四章脚法的实现 (10)4.1 问题介绍 (10)4.2 再励学习(Reinfocement Learning) (10)4.2.1再励学习简介 (10)4.2.2 Bellmen最优方程 (12)4.2.3 动态规划算法简介 (12)4.2.4 Q学习算法简介 (13)4.3 用再励学习训练脚法 (13)4.3.1 Kalsruhe Brainstormers 的方法 (13)4.3.2 我们的实验结果 (14)4.3.3 我们的方法 (15)第五章仲裁算法 (19)5.1 问题介绍 (19)5.2 RoboCup仿真环境中队员的观察模型 (19)5.3 仲裁算法 (20)5.4视野宽度的决策 (23)第六章传球线路的搜索算法 (24)6.1 问题介绍 (24)6.2 传球线路搜索算法 (25)6.2.1 简单的搜索算法 (25)清华大学毕业设计论文6.2.2 优化搜索算法 (25)6.2.3 穿越速度的计算 (28)第七章防守体系 (29)7.1 问题介绍 (29)7.2 角色的定义 (29)7.3 阵形的定义 (30)7.4 一个简单的防守系统 (30)7.5 考虑全局利益的防守系统 (31)7.5.1 考虑全局利益防守体系介绍 (31)7.5.2 求解全局利益最优的防守方案 (32)7.5.3 实战效果 (32)7.5.4 缺点 (33)第八章 TSINGHUAEOLUS的程序结构 (34)参考文献 (36)致谢 (37)清华大学毕业设计论文第一章背景介绍机器人足球世界杯(RoboCup)是国际上一项为促进分布式人工智能、智能机器人技术及其相关领域的研究与发展而举行的大型比赛和学术活动。
它通过提供一个标准的比赛平台来检验各种智能机器人技术。
它的最终梦想是能在2050年发展出能打败人类足球运动员的机器人足球队。
RoboCup仿真组重点研究多个智能体(MultiAgent)的竞争与合作的关系。
设计RoboCup仿真比赛程序面临的主要难点在于:在连续空间作连续的决策;多个智能体的存在给状态空间带来维数灾难;环境的反馈延迟太长。
环境具有强实时性和动态性;环境通讯带宽很窄;环境有噪声;环境具有部分可观性;环境不具有马尔可夫性;前三点使得直接利用从环境中的得到的信息和反馈进行决策几乎不可能实现。
曾经有球队直接利用遗传算法(Genetic Algorithm)训练球队,效果并不好。
巨大的状态空间和长延时的反馈特性使得RoboCup的研究者纷纷转向分层的决策结构。
Peter Stone在他的博士论文中把层学习的方法运用于RoboCup 的研究当中。
他把决策分成底层技术层和顶层决策层,在不同的层次采用不同的方法决策,上层决策构筑在下层决策基础之上。
其实,层学习的概念非常的简单,当整个复杂的决策任务被分层,分到每个层次的决策任务都变成简单可行了。
第1页清华大学毕业设计论文汉堡大学采用Case-base的思想研究RoboCup。
其主要想法是利用定义各种典型的场景,根据当前场景和典型场景的匹配度来进行决策。
可以设想,这种方法无法克服状态空间巨大的问题,而且很难跟得上环境对动态性的要求。
卡尔斯鲁厄大学以再励学习(reinforcement learning)为他们的主要研究方向。
他们的梦想是能够做到仅仅告诉智能体去完成进球的任务,而智能体能够自主的通过和环境的交互,学习各种技能甚至是策略。
再励学习在RoboCup中遇到的最大的两个挑战是:一、再励学习最初是以离散空间为求解空间设计的,而RoboCup环境是连续的;二、RoboCup中的再励信号延迟太长,因为只有进球是最本质的再励信号。
从思维的层次上说,再励学习模仿的更多是人较为低级的智能行为,它很难表现如推理这类人类思维中较高级、较抽象的行为。
关于再励学习的问题,本文第四章“脚法的实现”有所涉及。
葡萄牙的里兹本大学队是2000年RoboCup仿真组的冠军,他们的主要特点是充分利用人类足球的知识和建立准确的世界模型。
由于环境具有噪声而且是部分可观的,如何充分利用得到的信息去推测当前的世界模型成了比赛的一个关键所在。
RoboCup的仿真比赛的场景如下图:图1 RoboCup仿真比赛场景第2页清华大学毕业设计论文第二章设计理念和决策框架2.1设计理念由于状态空间的过于庞大以及反馈延迟过大,不融入任何先验知识来设计决策几乎不可能实现。
许多非常简单的概念如:带球、截球、射门、传球等要让智能体从与环境的交互当中总结出来,而且组织成知识都是十分困难的。
从人类自身获取知识的途径来说,通过教学活动的占了很大的比例。
基于以上考虑,我们认为一个融入人类的先验知识,并且能在一定程度上自主学习的决策系统是一个有价值而且可行的设计目标。
人类的知识主要作为框架和建议的形式存在。
比如人类可以不加思索的把决策分成控球和无球,进攻和防守,如果还有点足球知识的话,带球、截球、传球、射门几类。
在我们的决策体系中,这些概念都是事先假定的,也就是我们所谓的以框架的形式存在。
作为建议的人类知识通常以限定求解的方向的形式存在。
这就类似于启发式搜索的思想,利用外来的信息来加速搜索,当然形式不限于此。
还有一部分人类知识以教练的形式存在,如角色、角色行为的定义、阵形、定位球配合等等。
环境的复杂性使得我们不可能全部通过先验的知识来确定智能体每一时刻的行为,而且人类的知识不能完全适合模拟环境。
智能体本身具有学习和适应能力,能够自己从环境中获取知识,也成为决策系统是否成功的关键所在。
目前流行的自适应学习的算法有BP、动态规划、Q-learning、遗传算法等。
当运用于决策时,这些学习算法普遍面临的问题是能处理的问题形式单一,能力有限。
如何能合理的把这些学习算法获取的知识运用在决策体系中,使之能够处理形式复杂的各种决策场景,也是我们研究的一个重点。
第3页清华大学毕业设计论文2.2决策框架在纵向,我们采用了分层的结构,分成基本动作层和策略层两层;在横向,我们按足球的各个基本的战术动作来划分模块,分成截球、传球、带球、射门、跑位、视觉、通讯几个模块。
每个模块由底层的基本动作和上层的决策策略构成。
底层评价在不考虑战术利益情况下动作的合理性(feasibility)。
而上层策略层结合战术利益,对候选动作进行进一步的评价和仲裁。
模块内部的候选动作先进行局部竞争,然后再提交给更上层的仲裁器进行模块之间的仲裁。
概括的说,总体的结构是一个分层、分模块的多级评价仲裁器。
结构示意图如下:图2 决策系统结构之所以采用多级仲裁和局部竞争是由于模块的评价器往往对同一模块内的候选动作评价有合理性,而在模块之间就失去可比性了。
尽管如此,模块的评价结果至少表明了该候选动作在目前环境中的适应程度,也即在目前状况下执行该动作的好坏,只不过不同模块之间用来评价好坏的标准不同。
模块之间的仲裁器可以等价于一个平衡标准的动态加权器,对不同模块之间的评价结果进行动态加权,使它们具有可比性。
这个全局的动态仲裁器,可以根据实际的比赛效果来学习调整,也可以由人类足球专家进行建议。
比如设计者可以有意的第4页清华大学毕业设计论文加重传球动作的权值来向智能体灌输多传球的战略意图。
接下来的几章将依照模块为序介绍几个重点的技术的设计与实现,第三章介绍截球技术,第四章是踢球技术,第五章是仲裁算法和视觉决策,第六章搜索传球线路的优化算法,第七章防守跑位体系,第八章简要介绍一下程序的结构。
第5页清华大学毕业设计论文第三章 截球技术的实现3.1 问题介绍对球运动的判断是足球运动员需要具备最基本的素质。
仿真环境物理模型与实际比赛球的运动的物理模型有很大差异,即使是在人类足球比赛当中由于存在不同的场地条件和不同的天气条件,球运动的物理模型也会不同。
所以对于一个人类足球队员来说,最基本应该具备适应比赛场地的能力,对于我们的仿真队员也是一样。
截球技术需要解决的就是对球运动的判断,从而作出正确的截球决策,它是其他决策的基础。
我们把截球问题归纳成如图3的一个简单的场景:白点代表球,红色的圆圈代表球员,dist 为球员到球的距离,a 为球到球员之间的连线和球运动方向的夹角,speed 为球的即时的运动速度。
球的速度随运动衰减。
截球问题归结为给定dist 、a 和speed ,决策出队员正确的截球角度b ,或者是当截到球时,球运动的距离,并给出对截球所可能花的时间的估计。
在介绍截球的算法之前,下一节将先对RoboCup 仿真环境中的运动模型做简单的介绍。
图3 截球场景3.2 RoboCup 仿真环境的运动模型在RoboCup 仿真环境中,时间被离散为周期,所以运动也是离散的。
物理模型由下面的公式决定:(u )=(v )+():accelerate11,++ty t x u ty t x v ,ty t x a a ,()=()+(u ):move 11,++ty t xp p ty t x p p ,11,++ty t x u 第6页清华大学毕业设计论文(v )=:decayspeed11,++ty t x v ),(11++×ty t x u u decay ()=(0):resetacceleration 11,++ty t xa a 0,其中t 表示周期,()和()分别表示t 周期物体的位置和即时速度,(u )为t-1到t 周期物体的平均速度。
Decay 是一个运动的衰减因子,球的衰减因子为0.94,球员为0.4。
()表示对象的加速度,球的加速度由踢球动作(kick )获得,球员的加速度由冲刺(dash )获得。
ty t x p p ,ty t x v v ,ty t x a a ,ty t xu , 仿真环境中的截球问题,等价于解一个由上面公式确定的球的运动轨迹和球员运动轨迹的交点。
只不过在这里我们假设球在运动过程中不会获得加速度,也就是不考虑球在过程中被踢的情况。
因为球员可以不断冲刺使自己保持匀速,所以我们假定球员的运动为匀速,这有助于简化问题。
下面将介绍我们采用的两种求解算法,然后进行比较,并且提出可能的改进方案。
第一种二分法假设了物理模型,第二种BP 网络求解的方法没有假设物理模型。
3.3二分法求解这个算法的原理比较简单,见图4.1。
这里我们求解的目标是当截到球时球运动的距离。
假设球员沿着绿线的方向尝试截球,当球员跑到球的运动轨迹上时,根据球的运动模型,可以估计球这时所在位置,假设如红点所示。