AlphaGo技术原理分析及人工智能军事应用展望_陶九阳

第2卷第2期指挥与控制学报V ol.2,No.2 2016年6月JOURNAL OF COMMAND AND CONTROL June,2016

AlphaGo技术原理分析及人工智能军事应用展望

陶九阳1,2吴琳1胡晓峰1

摘要以“深蓝”的技术原理为比对,研究了AlphaGo有监督学习策略网络、快速走子模型、增强学习策略网络和价值网络等核心模块,较为详细地分析了策略网络、价值网络引导的蒙特卡洛树搜索算法的实现；以AlphaGo的技术突破为起点,展望了人工智能在物理域、信息域、认知域和社会域上的可能应用,分析了美国国防部高级研究计划局资助的人工智能军事应用项目；以OODA循环理论为基础,研究了人工智能应用于军事领域可能会带来的颠覆性效果.

关键词AlphaGo,深度学习,增强学习,态势感知,OODA循环

引用格式陶九阳,吴琳,胡晓峰.AlphaGo技术原理分析及人工智能军事应用展望[J].指挥与控制学报,2016,2(2):114?120 DOI10.3969/j.issn.2096-0204.2016.02.0114

Principle Analysis on AlphaGo and Perspective in Milltary Application of Arti?cial Intelligence

TAO Jiu-Yang1,2WU Lin1HU Xiao-Feng1

Abstract Compared with chess-playing program”Deep Blue”,supervised learning of policy networks，rollout policy，reinforcement learning of policy networks and reinforcement learning of policy networks of AlphaGo are studied.A Monte Carlo tree search(MCTS) algorithm guiding by the policy and value networks is analyzed.Based on AlphaGo’s technological breakthroughs,potential applications of arti?cial intelligence(AI)in physics domain,information domain,cognition domain and social domain of war space are forecasted, and AI programs funded by Defense Advanced Research Projects Agency(DARPA)are analyzed.Finally，the revolutionary impacts of AI on military domain are studied based on the Observation,Orientation,Decision,Action(OODA)loop theory.

Key words AlphaGo;deep learning;reinforcement learning;situation awareness;OODA

Citation TAO Jiu-Yang,WU Lin,HU Xiao-Feng.Principle analysis on AlphaGo and perspective in milltary application of arti?cial intelligence[J].Journal of Command and Control,2016,2(2):114?120

围棋被誉为人类最后的智慧高地,一直是检验人工智能发展水平的重要标志之一.围棋复杂的盘面局势评估和巨大的状态搜索空间,成为学者们面临的巨大障碍.仅仅依赖常规的知识推理和启发式搜索[1]策略,会有极高的计算复杂度.2016年AlphaGo[2]围棋人工智能的突破,反映出最近兴起的深度学习等人工智能技术解决围棋这类完美信息博弈问题的优异性能.以深度学习为代表的人工智能技术的快速发展,使得人工智能逐渐具备了分层抽象及知识表达的自动化,极大降低了搜索的复杂度,为人工智能解决围棋问题提供了关键技术基础.

AlphaGo是谷歌公司旗下DeepMind公司研发的围棋人工智能程序.其分布式版本构建于1920个CPU和280个GPU之上,它综合运用了深度学习和

收稿日期2016-05-25

Manuscript received May25,2016

军民共用重大研究计划联合基金(U1435218),国家自然科学基金(61174156,61273189,61174035,61374179,61403400,61403401)资助Supported by Shared Army Major Research Plan Joint Fund(U1435218),Na-tional Natural Science Foundation of China(61174156,61273189,61174035, 61374179,61403400,61403401)

1.国防大学信息作战与指挥训练教研部北京100091

2.解放军理工大学指挥信息系统学院江苏南京210007

1.Department of Information Operation&Command Training,National Defense University,Beijing100091,China

2.College of Command Infor-mation Systems,PLA University of Science&Technology,Nanjing Jiangsu 210007,China 蒙特卡洛树搜索算法,2015年以5:0完胜欧洲围棋冠军、职业二段选手樊麾[2],2016年又以4:1战胜世界围棋冠军李世石.从技术上看,AlphaGo与1997年轰动一时的国际象棋“深蓝”具有本质的不同.“深蓝”依赖计算能力对所有状态空间进行穷尽式暴力搜索,是用确定性算法求解复杂问题,体现的是一种“机器思维”.而AlphaGo依靠深度学习的方法,建模了人类的“直觉”棋感和大局观,通过增强学习的方法,拥有了自主学习、自我进化的能力.它运用蒙特卡洛树搜索随机算法将深度神经网络进行融合,最终具备了在“直觉”基础上的“深思熟虑”,而这正是一种典型的“人类思维”处理复杂问题的方式.这为解决复杂决策智能的问题提供了一种工程技术框架[3].

以AlphaGo为代表和标志的技术突破,预示着一种具有直觉、认知和自我进化能力的新的人工智能时代的到来,也预示着智能化战争时代可能即将到来.这不仅给工业界带来巨大的震动,也为人工智能的军事应用打开了进入快车道的大门.对AlphaGo 技术原理进行深入剖析,研究其智能化方法框架,预见人工智能技术的军事应用,可以为解决复杂战争问题,储备必要的理论与技术基础并指明方向.

2期陶九阳等:AlphaGo技术原理分析及人工智能军事应用展望115

1AlphaGo技术原理分析

1.1“深蓝”工作原理

1997年战胜国际象棋大师卡斯帕罗夫的“深蓝”,主要技术原理是运用局势评估函数和α?β剪枝搜索算法对象棋的状态空间进行穷举搜索[4].“深蓝”根据棋盘上的状态来评估当前的局势,其盘面状态s(t)由每个棋子的重要程度、所处位置、可以影响的范围、王的安全系数、先手/后手等变量组成,对当前盘面状态s(t)进行评估的函数的定义为局势评估函数v:s(t)→R,局势评估函数值表示对当前状态形势好坏的一个判断.利用局势评估函数和当前所处的状态,“深蓝”可以建立一棵博弈树,如图1所示,博弈树[5]的节点表示博弈一方所处的状态1,博弈树的边表示可采取的策略,节点的特征值取值为博弈一方的局势评估函数值.博弈树自根节点向叶节点移动推进的过程,描述了博弈双方交替选择策略(行动)并获得相应收益的过程.“深蓝”运用α?β剪枝算法,通过对博弈树上策略(行动)的搜索来寻找最优策略.

α剪枝和β剪枝互为对偶问题,这里以α剪枝为例说明其基本原理：假设“深蓝”当前处于博弈树的A点,那么深蓝希望得到的是A点的最大局势值.象棋是一个零和博弈,一方赢另一方必然输.图1中,下一步卡斯帕罗夫将会进入B点或者C点.深蓝为了获得保底的收益,由此,需要采用“极小化极大策略”,即在最小的B和C里面找一个最大的.于是可以得到选择判断用的公式(1)：

v(A)=max(min(B,C))=max(21,min(max(D,E,F)))

(1)

由于在C节点作极小化极大运算有min(max(D,E,F)≤15,而对B节点作极小化极大运算所得结果等于21,所以在A节点处有v(A)= max(min(B,C))=v(B)=21.此时不需要计算C的局势值也可知道A的局势值,相当于可以将博弈树的C枝剪掉.

通过上面的步骤可以看到,“深蓝”所使用的α?β剪枝搜索算法是一种最大化最小搜索算法,是一种非常保守的搜索策略.这种策略的优势是非常稳健,这可能是“深蓝”和卡斯帕罗夫的对弈中出现平局较多的主要原因.α?β剪枝搜索算法是对最大化最小基本搜索的一种改进,它的算法效率高低与节点的排列顺序高度相关.

1.2AlphaGo建模原理和基本组成

“深蓝”在国际象棋中所采用的技术并不能直接复制到围棋领域,原因在于围棋的状态空间比象棋大得多.无论是围棋还是象棋,人工智能落子的选择主要依赖于对状态空间的搜索,象棋每一步搜索的宽度大概是30,搜索的深度大概是80,整个搜索空间大约为1050.而围棋搜索的宽度大概是250,深度大概150,搜索空间在10170以上.由于搜索空间太大,计算机难以处理,只依赖评估函数和α?β剪枝搜索算法无法在有限的时间穷尽所有状态,因此,难以使用.

观察可知,人类棋手并不像“深蓝”那样对全部策略空间进行暴力搜索,而是先通过宏观的“势”,或者是所谓的“棋感”选出几个感觉上比较好的落子方案,再对每个方案进行“深思熟虑”的多步推演,然后比较得出最好的落子位置.人类棋手凭经验和“直觉”确定候选方案,是在降低搜索的“宽度”,一些明显不好的落子方案不再进行深入的搜索.人类棋手的“深思熟虑”也不是推演到棋局的最后一步,往往是推演几步最多十几步后就对盘面进行综合评估判断局势好坏.这种综合评估,降低了搜索的“深度”.对于人类棋手而言,无论是落子“直觉”还是盘面综合评估,主要依赖棋手的经验来选点,推演只是辅助手段.AlphaGo充分借鉴了人类棋手的下棋模式,用策略网络(Policy network)来模拟人类的“棋感”,用价值网络(Value network)来模拟人类对盘面的综

合

图1α?β剪枝算法示意图

1部分参考书中将博弈树的结点定义为结(node),表示的是采取行动的时点.

116指挥与控制学报2

卷

图2AlphaGo 神经网络的训练

评估,同时,运用蒙特卡洛树搜索将策略网络和价值网络融合起来,来模拟人类棋手“深思熟虑”的搜索过程.

AlphaGo 由策略网络(Policy network)和价值网络(Value network)组成[2],如图２所示.策略网络又分为有监督学习策略网络(SL policy network)、快速走子策略(Rollout policy)和增强学习策略网络(RL policy network).1.3

AlphaGo 策略网络和价值网络

有监督学习策略网络ρσ是一个13层的卷积神经网络[6?8],其主要功能是：输入当前的盘面特征参数,输出下一步的落子行动的概率分布p (a |s ),判断预测下一步落子位置,如图2策略网络所示.ρσ首先将围棋盘面状态s 抽象为19×19的网格图像,再人工抽取出48个盘面特征作为图像的通道.ρσ的输入就是19×19×48的图像.ρσ训练样本采用3千万个人类围棋棋手产生的盘面数据(s ,a ),用随机梯度下降算法[9]进行训练调优.其中,ρσ的每个卷积层有192个卷积核,共包含约40万个神经元.网络最后加了一个softmax 层,能够将标签映射为每个位置走子

概率的概率分布p (a |s ),

p (a |s )=1,其中s 为当

前盘面,a 表示下一步的行动,p (a |s )表示在当前盘面s 下,下一步采用行动a (或者叫在a 处落子)的概率值.ρσ在使用中选择概率值最大的a 作为下一步采取的策略(行动).如果单纯用ρσ,可以实现在测试集上以57%的准确率预测围棋大师下一步的落子位置.AlphaGo 平均走子速度为3ms.

快速走子ρπ是一个线性模型,其主要功能与ρσ完全相同.模型的输入是人工抽取的当前盘面的十几万个特征模式(Feature of patterns),输出是下一步的落子行动的概率分布p (a |s ).快速走子可以看成是一个两层的神经网络,输入层是十几万的特征模

式,输出层是通过softmax 函数将输入映射为一个概率分布：softmax:parterns →p (a |s ).如果单纯用快速走子,能够在测试集上以24.2%的准确率预测围棋大师下一步的着法.平均走子速度为2μs.这比ρσ快1000多倍.

增强学习策略网络ρρ是通过增强学习(Rein-forcement learning)[10?11]的方法对ρσ加强.ρρ的网络结构和功能与有监督学习策略网络ρσ完全相同,性能上强化了学习.其增强学习的主要过程是：首先取ρσ为第一代版本ρσ1,让ρσ1与ρσ1自对弈N 局,产生出N 个新的棋谱,再用新的棋谱训练ρσ1产生第二代版本ρσ2,再让ρσ2与ρσ1自对弈N 局,训练产生第三代版本ρσ3,第i 代版本随机选取前面的版本进行自对弈,如此迭代训练n 次后得到第n 代版本ρσn =ρρ,这就产生了增强学习的策略网络ρρ.AlphaGo 增强学习自对弈共进行了3000万局.用训练过的ρρ与Pachi 围棋软件对战能取得85%的胜率,而若用训练过的ρσ与Pachi 围棋软件弈棋仅仅能取得11%的胜率.Pachi 使用了蒙特卡洛树搜索算法,是一个开源的围棋弈棋程序.

价值网络νθ是一个13层的卷积神经网络,与策略网络具有相同的结构.主要功能是：输入当前的盘面参数,输出下一步在棋盘某处落子时的估值,以此评价走子的优劣.νθ利用人类棋手的16万局对弈所拆分出的3000万盘局面来训练,用测试集测试有0.37的均方误差,而在训练集上只有0.19的均方误差,显然发生了过拟合.究其原因主要是3000万盘面之间具有相关性.为了克服相关性带来的过拟合,νθ从增强学习策略网络ρρ产生的3000万局对弈中抽取样本,每一局中抽取一个盘面从而组成3000万不相关的盘面作为训练样本.最终在训练集上获得0.226的均方误差而在测试集上获得0.234的均方误差.

2期陶九阳等:AlphaGo技术原理分析及人工智能军事应用展望

117

图3AlphaGo蒙特卡洛树搜索算法

1.4AlphaGo蒙特卡洛树搜索算法

AlphaGo策略网络和价值网络的主要作用是降低博弈树的搜索宽度和搜索深度,通过剪枝来控制搜索空间的规模.但是要作出合适的决策,不仅需要依赖于搜索空间的降低,还需要采用合适的搜索算法.AlphaGo运用蒙特卡洛树搜索(Monte Carlo tree search,MCTS[12?13])算法来实现对博弈树的搜索.MCTS算法的原理是：先随机走子,然后再通过最终的输赢来更新原先那些走子的价值.设定随机走子的概率,与先前计算出的走子价值成正比.如此进行大量的随机模拟,让好的方案自动涌现出来. AlphaGo中MCTS算法的工作原理如图3所示[2]：图3(a)中,当处于“选择”阶段时,在当前的盘面下,下一步要选择Q+U(P)最大的分支走子.Q 表示走子价值,价值越大越应该往该分支走.仿真开始时,设置每个分支上的价值都相同,初始假设为0,蒙特卡洛树搜索算法通过不断地模拟来更新搜索树每一个分支上的Q值,让Q值大的分支涌现出来,而U(P)表示每条分支上的先验知识, U(P)∝P(s,a)/(1+N(s,a)),其中P(s,a)=ρσ(s,a),是在当前盘面下,通过策略网络产生的每个分支上的先验知识,N(s,a)表示蒙特卡洛仿真搜索分支(s,a)的次数,它与U(P)成反比,以此来鼓励探索新的分支,避免随着搜索次数的增加算法过快停止搜索而产生过大误差.在图3(b)的“扩展”阶段,MCTS 树搜索算法首先用策略网络ρσ走L步(实际L取值为20),走到搜索树盘面S L的节点.因为搜索树有很多分支,所以S L是一个节点集合.用估值网络νθ为每个S L进行估值得到νθ(s L).此时整个模拟并有结束,为了加快搜索速度,用快速走子模型ρπ以每个S L节点为起点走到底,在进入图3(c)所示的“估值”阶段,根据最终的输赢情况给出评价值z L=r.最后对整个搜索进行回退更新Q值,进入图3(d)所示的“回退”阶段.这一阶段,首先是根据ρπ评价值r和估值网络νθ评价值νθ(s L)来计算s L的综合值ν(s L)：

ν(s L)=(1?λ)νθ(s L)+λz L(2)

式(2)中,λ为常数,实验检验发现取值0.5时效果最好.ν(s L)是νθ(s L)与z L的加权平均.

然后,用ν(s L)值更新Q值：

Q(s,a)=

N(s,a)

i=1

1(s,a,i)ν(s i L)(3)

式(3)中,1(s,a,i)为布尔函数用来将遍历到的分支选择出来,如果第i次模拟遍历到(s,a)分支则函数值为1,否则函数值为0.式(3)表示蒙特卡洛模拟了n次后的分支(s,a)的Q值.最终,第t步选择的策略a t由式(4)来计算：

a t=arg max

(U(s t,a)+Q(s t,a))(4)式(4)表明,a t由两部分组成,一部分来自策略网络的值U(s t,a),另一部分来自蒙特卡洛树搜索的Q(s t,a).前者建模了人类的“棋感”,后者建模了人类在“棋感”基础上的“深思熟虑”.因此,可以说Al-phaGo通过蒙特卡洛树搜索综合了策略网络的“棋感”和价值网络的“深思熟虑”,具有典型的人类思维的特征.

2人工智能军事应用展望

一般来说,按照作战活动的不同,可以将战争空间划分为物理域、信息域、认知域和社会域4个交叠构成的具有跨域特性的作战域[14?15].随着机器学习和人工智能的快速发展,以谷歌AlphaGo、微软智能图像识别、IBM沃森等为代表的人工智能技术必然会应用于战争空间的各作战域.美国国防部高级研究计划局(Defense Advanced Research Projects Agency,DARPA)作为美国先进科技的引领者,在人

118指挥与控制学报2卷

表1人工智能技术在4个作战域的应用展望

战争空间作战活动人工智能军事应用场景外军开展的项目和计划

物理域打击、防护、机动、

保障(后勤、通信等).

无人平台和系统在作战行动中的

应用：如无人驾驶汽车、无人船

(艇)、无人机、智能机器人等.

X战车技术项目(GXV-T)、反潜无人机械船、无人

空天飞机计划、机器人卫星服务、机器人挑战赛、

波士顿“大狗”机器人、蛇形侦察机器人项目等.

信息域产生、处理和共享信

息(包括信息对抗等).

智能信息系统：如智能通信、智

能语音识别和翻译处理、智能

化自主网络作战等.

语音识别、语言自动翻译项目、机器阅读和推理技

术项目、“自适应雷达对抗”(ARC)项目、挖掘和理

解软件飞地项目、“高可信赛博军用系统”(HACMS)

项目、“认知电子战”计划等.

认知域个体观念、意识、信条和价

值形成,感知、决策产生.

智能态势感知与认知、智

能辅助决策等.

“心灵之眼”(Mind’s Eye)项目、“深绿”计划、神经

工程系统设计(NESD)、DEFT(Deep Exploration and

Filtering of Text)项目.

社会域军事实体间及其内部

的交互,群体相互作用.

共享感知、协同决策等

认知计算信息共享与高级情报项目、“人机协作”

(“半人马模式”)计划等、“脑机结合”神经植入技术

(“阿凡达计划”).

工智能领域正在和计划开展大量研究项目.表1列出了人工智能技术在各个作战域中的可能应用情况以及DARPA开展项目的情况2.

物理域是各种军事力量进行交战、打击、防护和机动的作战域.人工智能技术在该域的应用,必然导致大量智能化无人作战平台的出现,如智能作战机器人、无人驾驶汽车、无人船、无人机等.这些智能化的无人作战平台与当前的无人系统将具有本质性的区别,是一类具有思考决策能力的系统,而不是简单地应对大致有限的既定环境.这必然导致打击、机动和防护能力的全面提升.如DARPA正在研发的X战车(GXV-T),依赖先进的人工智能技术具备更快行驶速度,超强侦察外部环境躲避敌方侦察的能力.

信息域是信息化战争对抗发生的主战场,是信息产生、处理、共享与对抗发生的领域.长期以来,由于信息的处理共享等环节需要大量的人工操作,例如战场侦察卫星传回的图像、无人机侦察图像、各类人员语音信息等非结构化数据需要人工判读,这直接导致信息的处理速度和利用效率极低,甚至可能使指挥员淹没在“信息洪流”中.微软的ImageNet 图像识别理解、科大讯飞的语音识别等人工智能技术的发展,使智能化处理非结构化战场数据越来越接近实战要求,由此正在催生各类传感器、数据处理器以及信息网络的全面智能化,使得信息收集的范围更为广泛,信息处理的速度更快质量更好.另外,信息域中的网电对抗,借助于人工智能技术将能够实现自主敏捷反应,如DARPA资助的“认知电子战”计划使用最新的人工智能和机器学习方法,能够自主识别对手的信号频谱并作出反应.

认知域和社会域是感知、认知和决策产生的作战域,智能态势感知理解和自主决策是目前人工智能亟待解决的领域,是通向真正意义的智能化战争的关键一环.由于战场环境具有高度的复杂性和不确定性,长期以来,态势理解及预测等认知活动机器智能还无法胜任,主要依赖人工完成.现代化战争复杂程度越来越高,陆、海、空、天、电、网各维度态势相互铰链,单纯依赖人工对态势图判读来理解和预测态势将会变得越来越困难.另外,由于战争内在的复杂性,对手行为的高度不确定性,长期以来,辅助决策功能一直饱受诟病.为了解决这一问题,DARPA 从2008年开始支持“深绿”计划,试图研究一种能够嵌入美军C4ISR系统的先进辅助决策模块.“水晶球”和“闪电战”是两大核心模块.水晶球负责生成和更新未来作战可能的各个分支,即绘制和更新战争的博弈树,而闪电战模块用来对每个分支进行模拟并给出交战结果,即完成对博弈树的剪枝和搜索,这与AlphaGo采用的方法极为类似.因此,AlphaGo 的成功极有可能带来这类智能军事决策的突破,这也是AlphaGo技术最有借鉴意义之所在.在社会域上,共享感知和协同决策是实现联合作战行动的基础,是整合其他各作战域智能作战力量形成作战体系的关键所在.DARPA正在大力发展的“人机协作”(“半人马模式”)等计划,其目标就是实现将人与机深度融合为共生的有机整体,让机器的精准和人类的可塑性完美结合,利用机器的速度让人类做出最佳判断,以协助人类提升认知速度和精度,快速作出决

2本文列出的相关项目和计划主要是从DARPA官方网站公布的近年项目资助预算书等资料中获得,网址为：https://www.360docs.net/doc/721573600.html,/.其他军方研究机构也有大量人工智能领域相关研究正在进行,本文未一一列出.

2期陶九阳等:AlphaGo 技术原理分析及人工智能军事应用展望119

策并指挥无人系统协同行动.

人工智能对OODA 循环的颠覆性影响分析

人工智能应用于战争领域,必将带来一次新的军事革命.美军2014年提出的“第三次抵消战略”,就是以人工智能技术为核心,综合生物、信息、空间、网电等技术领域发展能够“改变未来战局”的颠覆性技术群,来形成相较于对手的绝对军事优势.分析人工智能对作战活动的影响可以发现,其最主要的优势:一是增强作战行动的敏捷性,二是提高作战行动的力量.

通常,作战过程可以由OODA 循环来描述,人工智能在物理域、信息域、认知域和社会域的运用,能够显著影响交战各方的OODA 循环来改变战争的进程.OODA 循环理论认为作战过程是“观察、判断、决策、行动”的不断循环、往复过程[16].战争的作战双方是一种对抗行为,其各自的OODA 循环过程都受对手的作战行动的影响.战争双方的OODA 环就像两个耦合在一起的“齿轮”,如图4所示

图4红蓝双方相互耦合的OODA 环示意图

战争规律告诉我们,掌握战争主动权往往能够赢得战争胜利,被动就会处于不利地位.所以战争可以看成是冲突双方较量谁能更快更好地完成OODA 循环的过程,是争夺“主动轮”位置的过程.在这个耦合的OODA“齿轮”系统中,“主动轮”的位置通常由两个因素决定,一个是“齿轮”的转速,即OODA 循环完成的速度,另一个是“齿轮”的转动力量,即OODA 完成的质量,如打击效果等.通过前面分析可以看出,一方面,认知人工智能的进步和应用会大大提高感知和决策的质量和速度(如美军大力发展的“深绿”计划),使得OODA 循环的每一个环节都会加速,从而使“齿轮”转速提高而产生敏捷性优势[17]；另一方面,无人作战力量(如机器人、无人机等)自身所具有的速度和力量,会提高打击行动的精度、力量和强度(如超高速智能无人机能够更快更精准地实施打击),无人和有人系统的有机融合也会大大提

升作战效能,使得OODA 的行动(A)环节更有力,能够克服更大的战争阻力.一旦一方OODA 循环的速度大大快于对手,就会使对方无法跟上战争节奏而导致系统崩溃.例如在交战过程中OODA 循环显著慢的一方可能陷入反复的“观察(O)”、“判断(O)”或机械的跟随“行动(A)”过程中,而不能完成完整的OODA 循环,被对方牵着走,从而失去战争主动权.另外,一方打击力量远远弱于对手,即使OODA 循环的速度再快,也难以调动对手跟随,只有OODA 环的力量足够强大才能带动整个战争系统按照自己的节奏运行,掌握战争主动权.

4结论

本文分析了AlphaGo 的技术原理,并展望了人工智能在军事领域的应用.虽然AlphaGo 在围棋人工智能方面取得了突破性进展,但围棋毕竟是一种完美信息博弈,而战争是不完美信息博弈,其状态空间规模和复杂性都远远超过围棋.因此,应该看到人工智能在复杂军事领域中的应用尚处于起步阶段,前路依然充满挑战.我们认为,战场态势感知智能化是首先需要解决的一个挑战,是解决其他复杂军事问题的起点.因此,借鉴AlphaGo 的技术原理和实现框架,研究面向战场态势感知理解和自主决策的战场态势特征提取方法和深度神经网络的构建方式,获取、组织和运用态势数据来训练智能感知深度神经网络,是目前亟需开展的工作.

References

1ALLIS L V .Searching for solutions in games and artifcial intelligence[D].Maastricht Netherlands:University Limburg,1994.

2SILVER D,HUANG A.Mastering the game of go with deep neural net-works and tree search [J].Nature,2016(529):484-489.3WANG F Y ,ZHANG J J,ZHENG X H.Where does AlphaGo go:from Church-Turing Thesis to AlphaGo Thesis and beyond[J].IEEE /CAA Journal of Automatica Sinica,2016,3(2):113-1204CAMPBELL M,HOANE A,HSU F.Deep Blue[J].Artif Intell,2002(134):57–83.5埃里克·拉斯缪森.博弈与信息:第四版[M].韩松,译.北京：中国人民大学出版社,2009.6SERMANET P,EIGEN D,ZHANG X,et al.Overfeat:integrated recogni-tion,localization and detection using convolutional networks[C].Scotts-dale,Arizona:International Conference on Learning Representations (ICLR),2013.7KRIZHEVSKY A,SUTSKEVER I ,HINTON G.Imagenet classifcation with deep convolutional neural networks[C]//In Advances in Neural In-formation Processing Systems.[S.L.]:Curran Associates,Inc.,2012:1097–1105.

120指挥与控制学报2卷

8CLARK C,STORKEY A J.Training deep convolutional neural net-works to play go[C]//32nd International Conference on Machine Learn-ing(ICML).Lille:[s.n.],2015:1766–1774.

9WILLIAMS R J.Simple statistical gradient-following algorithms for con-nectionist reinforcement learning[J].Machine Learning,1998,8(3-4): 229-256

10SUTTON R,BARTO A.Reinforcement learning:an introduction[M].

Cambridge,Massachusetts:MIT Press,1998.

11HASSELT H V,GUEZ A,SILVER D.Deep reinforcement learning with double Q-learning[C]//Proceedings of the30th AAAI Conference on Ar-ti?cial Intelligence.Phoenix,Arizona USA:AIAA,2016.

12TESAURO G,GALPERIN G.On-line policy improvement using Monte-Carlo search[C].Denver,CO,USA:In Advances in Neural Information Processing(NIPS),1996:1068–1074.

13COULOM R.E?cient selectivity and backup operators in Monte-Carlo tree search[C]//In5th International Conference on Computers and Games.Turin,Italy:Springer Berlin Heidelberg,2006:72–83.

14DA VE C,JOHN B,TISSERAND III,et https://www.360docs.net/doc/721573600.html,work centric warfare case study[M].Prnnsyllvania:U.S.Army War College Carlisle Barracks, 2003.

15Garstka https://www.360docs.net/doc/721573600.html,work centric operations conceptual framework1.0[M].Vi-enna,V A:Evidence Based Research,Inc.,2003.

16Wikipedia.John Boyd(military strategist).[EB/OL][2016-03-19].

https://https://www.360docs.net/doc/721573600.html,/wiki/OODA-loop

17ALBERTS D S.The agility advantage:a survival guide for complex en-terprises and endeavors[M].[S.L.]:CCRP,2013.

陶九阳(1983?),男,博士研究生,主要研究方向为运筹分析与军事智能决策,战争模拟,态势感知.本文通信作者.Email：taojiuyang@https://www.360docs.net/doc/721573600.html,

吴琳(1974?),男,博士,教授,博士生导师,主要研究方向为复杂系统与网络,战争复杂系统建模.

胡晓峰(1957?),男,教授,博士生导师,主要研究方向为战争模拟,军事运筹,军事信息系统工程

2020年(发展战略)人工智能的状态及今后发展方向展望

（发展战略）人工智能的状态及今后发展方向展望

人工智能的现状及今后发展趋势展望壹．引言人工智能(ArtificialIntelligence),英文缩写为AI，也称机器智能。“人工智能”壹词最初是于1956年的Dartmouth学会上提出的。它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的壹门综合性学科。从计算机应用系统的角度出发，人工智能是研究如何制造智能机器或智能系统来模拟人类智能活动的能力，以延伸人们智能的科学。二．目前人工智能技术的研究和发展情况目前，人工智能技术于美国、欧洲和日本依然飞速发展。于AI技术领域十分活跃的IBMXX公司，已经为加州劳伦斯·利佛摩尔国家实验室制造了ASCIWhite电脑，号称具有人脑的千分之壹的智力能力。而正于开发的更为强大的新超级电脑———“蓝色牛仔”（BlueJean），据其研究主任保罗·霍恩称，“蓝色牛仔”的智力水平将大致和人脑相当。三．技术应用随着AI技术的发展，现代几乎各种技术的发展均涉及到了人工智能技术，能够说人工智能已经广泛应用到许多领域，其典型的应用包括： 1符号计算计算机最主要的用途之壹就是科学计算,科学计算可分为俩类:壹类是纯数值的计算,例如求函数的值;另壹类是符号计算,又称代数运算,这是壹种智能化的计算,处理的是符号。符号能够代表整数、有理数、实数和复数,也能够代表多项式、函数、集合等。随着计算机的普及和人工智能的发展,相继出现了多种功能齐全的计算机代数系统软件,其中Mathematic和Maple是它们的代表。由于它们均是用

C语言写成的,所以能够于绝大多数计算机上使用。 2模式识别模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。这里,我们把环境和客体统称为“模式”。用计算机实现模式（文字、声音、人物、物体等）的自动识别，是开发智能机器的壹个关键的突破口，也为人类认识自身智能提供线索。计算机识别的显著特点是速度快、准确性和效率高。识别过程和人类的学习过程相似，以“语音识别”为例：语音识别就是让计算机能听懂人说的话，壹个重要的例子就是七国语言（英、日、意、韩、法、德、中）口语自动翻译系统。该系统实现后，人们出国预定旅馆、购买机票、于餐馆对话和兑换外币时，只要利用电话网络和国际互联网，就可用手机、电话等和“老外”通话。3机器翻译机器翻译是利用计算机把壹种自然语言转变成另壹种自然语言的过程，用以完成这壹过程的软件系统叫做机器翻译系统。搜文网目前，国内的机器翻译软件不下百种，根据这些软件的翻译特点，大致能够分为三大类：词典翻译类、汉化翻译类和专业翻译类。词典类翻译软件的代表是“金山词霸”，堪称是多快好省的电子词典，它能够迅速查询英文单词或词组的词义且提供单词的发音，为用户了解单词或词组含义提供了极大的便利。汉化翻译软件的典型代表是“东方快车2000”，它首先提出了“智能汉化”的概念，使翻译软件的辅助翻译作用更加明显。 4机器学习机器学习是机器具有智能的重要标志，同时也是机器获取知识的根本途径。有人认为，壹个计算机系统如果不具备学习功能，就不能称其为智能系统。机器

自动化在军事领域的应用

浅谈自动化及在现代军事中的应用 ——军事中的自动化技术一览杨超自动化1202（理科试验班1205）3120104128 内容摘要：在历经了第二次世界大战之后，随着科学技术的迅速发展，各个国家军队建设都产生了一些重要的变革，深刻地影响着现代军事战争的格局。其中电子、信息、计算机等多方面科学技术的突飞猛进，自动化技术就在这一过程中应运而生，在军队部队建设和发展中具有重要作用，处于不可撼动的地位。本文首先介绍了自动化的定义、基本概念及其未来的发展前景，之后比较详尽的说明了自动化技术在军事领域中四个方面的主要应用并举出相应的应用实例。关键词：自动化军事自动化武器精确制导军事指挥自动化军事决策科学化训练、作战仿真模拟化

一、自动化简介（一）自动化的定义自动化是指在生产管理过程中，在没有人或极少人的参与的情况下，机器、设备或某一类系统，按照既定的要求，经过一系列方法，实现预期的目标的过程。其中的方法包括自动检测、信息处理、分析判断、操纵控制等。由此可见，自动化最重要的一点便是目标系统具有完全的自动能力。随着计算机及其相应技术的快速发展，自动化技术从中应运而生，它一方面利用其自动性能，将人类从繁重的体力劳动、费时的脑力劳动及危险恶劣的工作环境中解放出来；另一方面能极大地提高人类的劳动生产率，增强人类发展世界、改造世界的能力。总而言之，自动化的应用与发展，体现了一个国家农业、工业和国防的真正水平，更是一个国家科学技术现代化的重要标志。（二）基本概念在自动化这一概念产生初期，人们认为自动化室能够使用机械劳动替代人力劳作完成预期目标这一动态过程。然而，随着电子信息技术及计算机技术的飞速发展，自动化不仅仅只是帮助人们完成繁重的体力劳动，更多的是辅助或完全替代人类的脑力劳动。这是自动化发展过程中一个质的飞跃，它解放了人类更多的生产力，为经济增长带来了巨大的利润，为科技社会发展注入了一针有力的强心剂。所以我们说，自动化具有多形式、多功能、多范围的优势及特点。（三）发展前景正如前文所说，自动化的应用范围非常的广泛，从早期的电气、工业和国防发展到了交通、经济、建筑、能源、环境等领域，几乎无所不包。自动化的应用在广度和深度上随着电子信息技术和计算机科学的发展而不断拓展，这为自动化今后的发展提供了难能可贵的机遇。就自动化现有的技术发展，基于个人电子计算机或军工业计算机的控制系统已成为自动化的主流，综合自动化系统具有广阔的发展前景，它具有数字化、网络化、智能化的特点，体现了当今信息时代自动化的主流发展的方向。我国自“十五”计划以来大力发展有自主知识产权的自动化产业，特别是在《“十二五”规划纲要》中，多次提出要发展信息产业、提高各领域的自动化水平。由此可见，我国的自动化技术的发展得到了国家强有力的支持。因此，在我看来，在不远的将来，自动化技术一定会给我们的生产生活带来更多意想不到的惊喜。二、军事自动化

论人工智能技术在军事领域的运用

论人工智能技术在军事领域的运用姓名：学号：班级：指导老师：日期：2013年6月25日

中文摘要应用于军事领域，利用计算机模拟人类的学习与推理，能思维、能学习，问题求解，适应环境变化的特征。它是在人工智能学理论指导下的一种综合技术。科技在军事领域中的应用已经更加重要，人工智能技术将会在今后的部队建设与发展中发挥着重要作用。 [关键词]军事技术，军事领域，人工智能，分布式人工智能目录 1.军事技术发展概况 1.1.冷兵器时期军事技术的发展 1.2．冷兵器和火器并用时期军事技术的发展 1.⒊热兵器时期军事技术的发展 1.⒋军用核技术的发展 1.⒌军用高技术的发展 2.军事技术的进步是推动战争发展的直接动力 2.⒈军事技术的进步更新了战争观念 2.2.军事技术的进步改变了军队的成分 2.3.军事技术的进步拓展了战争领域 2.4.军事技术的进步直接改变着战争的作战形式 2.5.高技术战争已经悄然降临 3.分布式人工智能技术简介 3.1.连贯性 3.2.协同性 3.3.协作性 4.DAI研究与探索主要致力于解决的问题 4.1.任务的描述、分解与分配 4.2.通信、交互作用语言与协议 4.3.集体行为的连贯性 4.4.主体表示和主体模型 4.5.主体间的不一致性 4.6.DAI系统的实现 5.分布式人工智能在军事领域中的应用 5.1.军事情报的获取与军事态势的评估 5.2.分布式交互作用仿真与DAI技术

1.军事技术发展概况 ⒈1.冷兵器时期军事技术的发展由此可见，由石器向青铜兵器和铁兵器的跃进，也表明了军事技术在社会发展中不断向前迈进。冷兵器时期的军事技术处于初级阶段，主要是研制和发展刀、枪等近战、直接杀伤兵器；社会集团中尚未建立研究军事技术的专门机构和人员；技术种类比较单一，冶炼术是军事技术的主体。中国古代的冶炼术发展较快。湖北江陵望山出土的越王勾践剑，出土时仍完好如新，光彩照人，锋刃异常锐利，剑身布满菱形暗纹。可见当时冶炼术之一斑。 1.2．冷兵器和火器并用时期军事技术的发展随着火药的发明，军事技术进入了火器的研制与发展的重要时期。同时，由于受手工业生产技术条件的限制，火器的制作技术不够发达，火器尚不能适应军事上各种斗争的需要而代替全部冷兵器，人类社会的战争进入了冷兵器与火器并用的时期，在火器技术得到迅速发展的同时，冷兵器的制造技术仍不断地加以改进。冷兵器于火器并用时期，由于火药的发明，使军事技术产生了革命性的飞跃。以研制远程、间接杀伤武器为主的军事技术的发展，增加了武器的种类，改变了战争的样式。军事技术的内容日趋广泛，火箭技术、战船制造技术等新技术迅速发展，显示出了强大的生命力。与此同时，冷兵器的制作技术仍有逐步改进，但在军事技术中的作用日趋下降。 1.⒊热兵器时期军事技术的发展整个20世纪，由于新技术革命的优异成果和广泛应用于军事领域，两次世界大战和战后局部战争的推动，不仅使一些传统的军事技术产生了“质”的飞跃，而且出现了许多新领域、新技术，开辟了许多新领地。电子技术、弹药技术、雷达技术等先进技术与新材料、新工艺、系统工程的结合，使武器装备的大家族出现了许多新成员。火箭筒、无后坐力炮、快速坦克、自行防坦克火炮、战略轰炸机筹各种各样的新式武器成为常备军的主要装备。生物技术、化学技术，燃烧技术在军事领域的应用，使制造作战武器的技术领域更广泛。军用通信技术的发展，提高了指挥控制系统的效能。 1.⒋军用核技术的发展 20世纪中期以来，随着原子能、电子计算机和空间技术的出现，揭开了近现代科学技术史上的第三次技术革命。核技术在军事上的运用，使军事技术进入了一个崭新的历史时期。第二次世界大战以来，美国和苏联抓紧进行氢弹和军用核动力船舶的研究，大力发展军用核技术。1952年11

(发展战略)人工智能的状态及今后发展方向展望

人工智能的现状及今后发展趋势展望一．引言人工智能(Artificial Intelligence),英文缩写为AI，也称机器智能。“人工智能”一词最初是在1956年的Dartmouth学会上提出的。它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科。从计算机应用系统的角度出发，人工智能是研究如何制造智能机器或智能系统来模拟人类智能活动的能力，以延伸人们智能的科学。二．目前人工智能技术的研究和发展状况目前，人工智能技术在美国、欧洲和日本依然飞速发展。在AI技术领域十分活跃的IBM公司，已经为加州劳伦斯·利佛摩尔国家实验室制造了ASCI White电脑，号称具有人脑的千分之一的智力能力。而正在开发的更为强大的新超级电脑———“蓝色牛仔”（Blue Jean），据其研究主任保罗·霍恩称，“蓝色牛仔”的智力水平将大致与人脑相当。三．技术应用随着AI技术的发展，现代几乎各种技术的发展都涉及到了人工智能技术，可以说人工智能已经广泛应用到许多领域，其典型的应用包括： 1符号计算计算机最主要的用途之一就是科学计算,科学计算可分为两类:一类是纯数值的计算,例如求函数的值;另一类是符号计算,又称代数运算,这是一种智能化的计算,处理的是符号。符号可以代表整数、有理数、实数和复数,也可以代表多项式、函数、集合等。随着计算机的普及和人工智能的发展,相继出现了多种功能齐全的计算机代数系统软件,其中Mathematic和Maple是它们的代表。由于它们都是用C语言写成的,所以可以在绝大多数计算机上使用。 2模式识别模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。这里,我们把环境与客体统称为“模式”。用计算机实现模式（文字、声音、人物、物体等）的自动识别，是开发智能机器的一个关键的突破口，也为人类认识自身智能提供线索。计算机识别的显著特点是速度快、准确性和效率高。识别过程与

人工智能在军事领域的发展现状和应用前景

人工智能在军事领域的发展现状及应用前景知远战略与防务研究所/威远编译自：俄罗斯外交和国防政策委员会网站[知远导读]本文主要介绍了当今世界及俄罗斯本国人工智能技术发展的现状以及未来该技术在军事领域的应用前景.文章还重点分析了人工智能技术实现的可能途径以及人工智能技术对人类战争活动的可能影响。文章编译如下：目前.关于人工智能的说法和文章很多.这让人觉得.人工智能早已研究成熟且无处不在。事实上并未如此。虽然自动化早已成为生产和指挥过程的一部分.而且计算机已经学会语音和脸部识别.操控汽车和分析大量数据。图像识别或者自动翻译属于利用人工智能方法并在完成类似任务时选择存储结果的机器学习技术。人工智能目前还未实现.还需要进行研究.它的应用领域确实非常广泛。国防领域也在其中。发展人工智能成为了保障国家安全的任务。美国和中国希望在人工智能研究中占据领先地位并率先将其运用到网络武器和既可用于监视敌人.也可用于袭击敌人的自主式武器的研制当中。美国国防部在2017年开始抓紧落实所谓的“第三次抵消战略”.该文件中提出的主要目标是“必须集中力量进行创新.旨在通过创新发展美国近年来与对手和敌人已经接近的关键能力.保持并恢复传统遏制力”.这里说的对手和敌人指的也就是俄罗斯和中国。实际上.世界

上已经开始了创新武器竞赛.全部主要大国都将卷入其中。此外.西方已经被普京总统2017年9月1日在雅罗斯拉夫尔公开讲话中提到的内容所震撼：“人工智能不仅仅是俄罗斯的未来.也是全人类的未来。这包含着巨大的机遇和当今难以预测的威胁。谁能成为该领域的领导者.谁就将主宰世界”。著名商人伊隆·马斯克称.人工智能最终将消灭人类。因此.他和另外116名专家、学者、新技术领域公司代表向联合国发出请求书.呼吁禁止研制任何类型使用人工智能技术的武器和自主技术装备。部分商业人士和学者强调.运用自主技术相当于继火药和核武器出现之后.战争中出现的第三次革命.毫无疑问.他们说的没错。但显而易见.联合国开始的关于禁止此类武器公约的讨论不是为了别的什么目的.而是美国及其盟友以讨论普世价值为掩护.阻止其地缘政治对手.首先是俄罗斯和中国研制人工智能武器。然而.履带式装甲车和打击无人机并非战略武器.而是战术武器。这些武器对人类不构成任何威胁。“杀手机器人”的形象被好莱坞复制了无数遍.但现实中的战斗系统未必与之有什么共同点。为了弄清楚.所谓的战斗机器人会不会对人类构成威胁.首先必须弄清.什么是人工智能.它与机器智能.超级计算机的深度学习有什么不同.还有最主要的是人工智能在军事领域的地位和运用范围。国家安全领域人工智能的任务在可预见的未来.新的世界技术竞赛将导致最新的技术革命延伸至军

人工智能未来发展前景展望

人工智能未来发展前景展望：磊(10计本) 学号：长久以来，人工智能对于普通人来说是那样的可望而不可及，然而它却吸引了无数研究人员为之奉献才智，从美国的麻省理工学院(M ＩＴ)、卡基-梅隆大学(CＭＵ)到IＢＭ公司，再到日本的本田公司、ＳＯＮＹ公司以及国的清华大学、中科院等科研院所，全世界的实验室都在进行着ＡＩ技术的实验。不久前，著名导演斯蒂文·斯皮尔伯格还将这一主题搬上了银幕，科幻片《人工智能》(ＡＩ)对许多人的头脑又一次产生了震动，引起了一些人士了解并探索人工智能领域的兴趣。（一）、人工智能的定义人工智能的定义可以分为两部分，即“人工”和“智能”。“人工”比较好理解，争议性也不大。有时我们会要考虑什么是人力所能及制造的，或者人自身的智能程度有没有高到可以创造人工智能的地步，等等。但总的来说，“人工系统”就是通常意义下的人工系统。 “智能”1是一个宽泛的概念。智能是人类具有的特征之一。Intelegere是从中进行选择，进而理解、领悟和认识。正如帕梅拉·麦考达克在《机器思维》(machines who thinks,1979)中所提出的: 在1"智能"源于拉丁语legere，字面意思是采集(特别是果实)、收集、汇集，并由此进行选择，形成一个东西。

复杂的机械装置与智能之间存在长期的联系。从几个世纪前出现的神话般的巨钟和机械自动机开始，人们已对机器操作的复杂性与自身的某些智能活动进行直观联系。经过几个世纪之后，新技术已使我们所建立的机器的复杂性大为提高。1936年，24岁的英国数学家图灵 i(Turing)提出了"自动机"理论，把研究会思维的机器和计算机的工作大大向前推进了一步，他也因此被称为"人工智能之父"。人工智能领域的研究是从1956年正式开始的，这一年在达特茅斯大学召开的会议上正式使用了"人工智能"(artificial intelligence，AI)这个术语。随后的几十年中，人们从问题求解、逻辑推理与定理证明、自然语言理解、博弈、自动程序设计、专家系统、学习以及机器人学等多个角度展开了研究，已经建立了一些具有不同程度人工智能的计算机系统，例如能够求解微分方程、设计分析集成电路、合成人类自然语言，而进行情报检索，提供语音识别、手写体识别的多模式接口，应用于疾病诊断的专家系统以及控制太空飞行器和水下机器人更加贴近我们的生活。我们熟知的IBM的"深蓝"在棋盘上击败了国际象棋大师卡斯帕罗夫就是比较突出的例子。当然，人工智能的发展也并不是一帆风顺的，也曾因计算机计算能力的限制无法模仿人脑的思考以及与实际需求的差距过远而走入低谷，但是随着硬件和软件的发展，计算机的运算能力在以指数级增长，同时网络技术蓬勃兴起，确保计算机已经具备了足够的条件来运

人工智能技术及其发展趋势2020年

1.下列选项中，不属于生物特征识别技术的是（）。（10.0分） A.步态识别 B.声纹识别 C.文本识别 D.虹膜识别我的答案：C√答对 2.生物特征识别技术不包括（）。（10.0分） A.体感交互 B.指纹识别 C.人脸识别 D.虹膜识别我的答案：A√答对 3.立体视觉是（）领域的一个重要课题，它的目的在于重构场景的三维几何信息。（10.0分） A.人机交互 B.虚拟现实 C.自然语言处理 D.计算机视觉我的答案：D√答对 4.下列对人工智能芯片的表述，不正确的是（）。（10.0分）

A.一种专门用于处理人工智能应用中大量计算任务的芯片 B.能够更好地适应人工智能中大量矩阵运算 C.目前处于成熟高速发展阶段 D.相对于传统的CPU处理器，智能芯片具有很好的并行计算性能我的答案：C√答对 1.目前，深度学习主要包括（）。（10.0分）） A.前馈神经网络 B.卷积神经网络 C.循环神经网络 D.对抗神经网络我的答案：ABCD√答对 2.关于人工智能，下列表述正确的有（）。（10.0分）） A.计算机科学的一个分支 B.试图揭示人类智能的实质和真相 C.以模拟人类智能的方式去赋能机器 D.使机器能够模拟人类的智能进行学习、思维、推理、决策和行动我的答案：ABCD√答对 1.神经网络的训练过程不需要人工标记的样本数据集。（10.0分）我的答案：错误√答对

2.机器人一般由执行机构、驱动装置、检测装置、控制系统和复杂机械等组成，涉及到控制论、机械电子、计算机、材料、仿生等学科，在工业、医学、农业、建筑业甚至军事等领域中均有重要用途。（10.0分）我的答案：正确√答对 3.自然语言处理是一门融语言学、计算机科学、数学于一体的科学。（10.0分）我的答案：正确√答对 4.卷积神经网络是一种常用来处理具有网格结构拓扑数据的神经网络，如处理时序数据和图像数据等，广泛应用于人脸识别、物品识别等领域。（10.0分）我的答案：正确√答对

AlphaGo技术原理分析及人工智能军事应用展望_陶九阳

第2卷第2期指挥与控制学报V ol.2,No.2 2016年6月JOURNAL OF COMMAND AND CONTROL June,2016 AlphaGo技术原理分析及人工智能军事应用展望陶九阳1,2吴琳1胡晓峰1 摘要以“深蓝”的技术原理为比对,研究了AlphaGo有监督学习策略网络、快速走子模型、增强学习策略网络和价值网络等核心模块,较为详细地分析了策略网络、价值网络引导的蒙特卡洛树搜索算法的实现；以AlphaGo的技术突破为起点,展望了人工智能在物理域、信息域、认知域和社会域上的可能应用,分析了美国国防部高级研究计划局资助的人工智能军事应用项目；以OODA循环理论为基础,研究了人工智能应用于军事领域可能会带来的颠覆性效果. 关键词AlphaGo,深度学习,增强学习,态势感知,OODA循环引用格式陶九阳,吴琳,胡晓峰.AlphaGo技术原理分析及人工智能军事应用展望[J].指挥与控制学报,2016,2(2):114?120 DOI10.3969/j.issn.2096-0204.2016.02.0114 Principle Analysis on AlphaGo and Perspective in Milltary Application of Arti?cial Intelligence TAO Jiu-Yang1,2WU Lin1HU Xiao-Feng1 Abstract Compared with chess-playing program”Deep Blue”,supervised learning of policy networks，rollout policy，reinforcement learning of policy networks and reinforcement learning of policy networks of AlphaGo are studied.A Monte Carlo tree search(MCTS) algorithm guiding by the policy and value networks is analyzed.Based on AlphaGo’s technological breakthroughs,potential applications of arti?cial intelligence(AI)in physics domain,information domain,cognition domain and social domain of war space are forecasted, and AI programs funded by Defense Advanced Research Projects Agency(DARPA)are analyzed.Finally，the revolutionary impacts of AI on military domain are studied based on the Observation,Orientation,Decision,Action(OODA)loop theory. Key words AlphaGo;deep learning;reinforcement learning;situation awareness;OODA Citation TAO Jiu-Yang,WU Lin,HU Xiao-Feng.Principle analysis on AlphaGo and perspective in milltary application of arti?cial intelligence[J].Journal of Command and Control,2016,2(2):114?120 围棋被誉为人类最后的智慧高地,一直是检验人工智能发展水平的重要标志之一.围棋复杂的盘面局势评估和巨大的状态搜索空间,成为学者们面临的巨大障碍.仅仅依赖常规的知识推理和启发式搜索[1]策略,会有极高的计算复杂度.2016年AlphaGo[2]围棋人工智能的突破,反映出最近兴起的深度学习等人工智能技术解决围棋这类完美信息博弈问题的优异性能.以深度学习为代表的人工智能技术的快速发展,使得人工智能逐渐具备了分层抽象及知识表达的自动化,极大降低了搜索的复杂度,为人工智能解决围棋问题提供了关键技术基础. AlphaGo是谷歌公司旗下DeepMind公司研发的围棋人工智能程序.其分布式版本构建于1920个CPU和280个GPU之上,它综合运用了深度学习和收稿日期2016-05-25 Manuscript received May25,2016 军民共用重大研究计划联合基金(U1435218),国家自然科学基金(61174156,61273189,61174035,61374179,61403400,61403401)资助Supported by Shared Army Major Research Plan Joint Fund(U1435218),Na-tional Natural Science Foundation of China(61174156,61273189,61174035, 61374179,61403400,61403401) 1.国防大学信息作战与指挥训练教研部北京100091 2.解放军理工大学指挥信息系统学院江苏南京210007 1.Department of Information Operation&Command Training,National Defense University,Beijing100091,China 2.College of Command Infor-mation Systems,PLA University of Science&Technology,Nanjing Jiangsu 210007,China 蒙特卡洛树搜索算法,2015年以5:0完胜欧洲围棋冠军、职业二段选手樊麾[2],2016年又以4:1战胜世界围棋冠军李世石.从技术上看,AlphaGo与1997年轰动一时的国际象棋“深蓝”具有本质的不同.“深蓝”依赖计算能力对所有状态空间进行穷尽式暴力搜索,是用确定性算法求解复杂问题,体现的是一种“机器思维”.而AlphaGo依靠深度学习的方法,建模了人类的“直觉”棋感和大局观,通过增强学习的方法,拥有了自主学习、自我进化的能力.它运用蒙特卡洛树搜索随机算法将深度神经网络进行融合,最终具备了在“直觉”基础上的“深思熟虑”,而这正是一种典型的“人类思维”处理复杂问题的方式.这为解决复杂决策智能的问题提供了一种工程技术框架[3]. 以AlphaGo为代表和标志的技术突破,预示着一种具有直觉、认知和自我进化能力的新的人工智能时代的到来,也预示着智能化战争时代可能即将到来.这不仅给工业界带来巨大的震动,也为人工智能的军事应用打开了进入快车道的大门.对AlphaGo 技术原理进行深入剖析,研究其智能化方法框架,预见人工智能技术的军事应用,可以为解决复杂战争问题,储备必要的理论与技术基础并指明方向.

人工智能在生活中的应用与展望

2018年8月人工智能在生活中的应用与展望贾嘉（大连育明高级中学，辽宁大连116023）【摘要】近些年伴随着信息化技术的不断发展，智能化技术也随之成熟，人工智能在我们生活中的应用越发频繁，涉及领域也越来越广，目前已经涉及到了医疗、农业、教育、国防以及能源等多个领域。人工智能对于日常生活的影响正在逐渐深入。对此，本文简要分析人工智能在生活中的应用与展望。【关键词】人工智能；生活；应用与展望【中图分类号】TP18【文献标识码】A【文章编号】1006-4222（2018）08-0210-02 引言人工智能这一概念频繁出现在各类媒体当中,逐渐成为社会热议话题之一。在2017年的7月,国务院开始针对人工智能制定了相应的发展规划,同时开启了人工智能在我国发展的新篇章。就目前而言,人工智能的应用已经比较成熟,例如无人驾驶、智慧城市、智能管家等,这一些都是人工智能的应用案例。对此,探讨人工智能在生活中的应用与展望有显著的现实意义。 1人工智能人工智能最早起始于1956年,这一概念在提出之后便引发了高度关注和讨论,之后研究者们纷纷开展了相应的理论与原理研究,例如斯坦福大学教授便提出了关于人工智能的解释,提出了“人工智能是关于知识的学科,属于怎样表示知识以及如何获得知识并应用知识的学科”[1]。另外,麻省理工的教授也提出了关于“人工智能属于研究计算机如何模仿人的思想、行为进行工作的学科”。虽然各个说法并不相同,但是基本上都表现出了关于人工智能的基本思想与基本内容,总结即人工智能是以人的行为习惯、思维模式作为基础或依据,构建相应的智能化工作系统,也就是探讨计算机硬件、软件,实现对人行为模仿的技术方法。人工智能提出之后快速发展,截至目前,应用案例已经非常多,人工智能和纳米科学、基因工程共同成为世界三大尖端技术。 2人工智能的应用人工智能在生活当中的应用案例非常多,例如在音乐方面,人工智能能够根据用户以往选择音乐的习惯推送用户可能喜欢的音乐作品;在视频甄别方面,可以实现自动化,尤其是在警方的监控系统中应用价值较高;在医疗领域中,人工智能可以及时计算并获取患者的临床资料并为医生提供诊疗数据支持;同时在其他类型的专业系统中也有所应用,例如化学工业、生物工程等[2]。下面以无人驾驶、自动拣货机器人两个具体应用案例进行分析。 2.1无人驾驶近些年随着人们生活水平不断提高,城市中汽车数量不断增多,这也导致交通问题越发严重。传统的交通工具并不能满足人们的出行要求,伴随着人工智能的不断普及,无人驾驶技术随之成熟,作为无人驾驶技术的重点研究与普及对象,城市公交在智能化方面的特征也在越发明显[3]。在我国,无人驾驶技术其实已经在许多场合当中应用,景区、企业园区等领域中都可以发现无人驾驶公交的雏形,但是因为技术方面的限制性,这些无人驾驶公交都存在车型比较小、车速比较慢以及行车路况简单等特征。随着无人驾驶技术的不断发展,无人驾驶公交也在逐渐成熟。在2017年时,深圳开始研发和普及了关于“阿尔法巴智能驾驶公交”,虽然这一公交目前仍然处于测试阶段,上路时也只是试运行,但是这一现象证明了无人驾驶公交车的应用优势与价值,它不仅可以更好地满足人们出行需求,同时在人工智能方面的应用代表性也非常突出。目前,自动驾驶公交车相对于以往的无人观光车有明显的改进,例如以往的观光车只能够听从一个指令,但是“阿尔法巴智能驾驶公交”具备一定的自主思维能力,其能够在脱离人为操控的情况下独立思考。与此同时,其本身还具备多个感知模块实现对前方道路情况的监测,如果有障碍物可以及时判断障碍物的形状、位置以及数秒内可能导致的危害与风险因素,并将这一些数据及时上传到处理器中并进行计算,最终制定出规避的方案,如减速、紧急停车或绕行等,这一些指令都可以及时上传到接收器并快速执行,同时这些功能相对于观光车而言有着明显的创新与发展。 2.2自动拣货机器人随着人工智能技术的不断成熟,在生活当中的应用也在不断普及。对于物流行业而言,因为订单数量较大,所以对于人力的要求也相对较高,传统的物流仓库因为需要大量的人力资源实现对快件的分拣、搬运、运输,所以在人力成本方面相对较高。对此,合理将人工智能应用于物流行业可以显著减少人力资源的消耗,对于物流企业而言,这也是减少经营成本的关键。目前京东、申通以及顺丰等多家快递公司的仓库中都在应用一种小机器人,这一机器人以盒状为主,底部带小轮子,机器人能够按照快读上的条码及时将快递进行分类,并按照快递的信息将快递投入到相应的快递口中,从而实现智能化的快件分拣[4]。这一项技术的关键在于分拣系统本身的控制功能,这也是实现自动化分类的关键。分货系统的核心还在于机器人本身的功能,机器人采用了相机与二维码精确定位两项技术,再加上对线路的规划与计算,机器人之间并不会发生因线路矛盾而碰撞的问题,所以在运行效率方面相对于人工而言更快,在经济效益方面优势更加突出。 3人工智能的未来展望从目前人工智能的发展现状来看,人工智能的未来发展前景可观,在今后几年人工智能的未来展望主要是实现更多领域的应用,尤其是在图像人脸识别、聊天机器人、移动商品购买、快速分拣、货运码头、无人驾驶等多个领域中的成熟应用[5]。在本质上而言,人工智能需要更好地模拟人的思维、意识完成信息探索。其主要的功能与作用仍然是替代人的思想完成工作。对此,在未来社会当中,人工智能的快速发展和逐渐成熟都会更好应用在为人类服务的工作中。例如,可以协助警察实现对违法犯罪行为的监督,帮助人类完成部分高风险的论述210

(完整版)人工智能技术发展趋势及应用

一) 单选题，每题 2 分，共 20 题。 1. 下列有关人工智能的说法中，不正确的是（B）。 (A) 人工智能是以机器为载体的智能 (B) 人工智能是以人为载体的智能 (C) 人工智能是相对于动物的智能 (D) 人工智能也叫机器智能 2. 以下属于素养性知识的是（A）。 (A) 为人处事方面的知识 (B) 行业性知识 (C) 分析性知识 (D) 创造性知识 3. 本课程提到，人工智能皇冠上的明珠是（D）。 (A) 数据智能 (B) 读写智能 (C) 逻辑智能 (D) 语言智能 4. 根据本课程，以下哪项不属于情感分析四维模型的内容（D）。 (A) 读音知情 (B) 读脸知情 (C) 读搏知情

(D) 读书知情 5. 人工神经网络发展的第一次高潮是（C）。 (A) 1986年启动“863计划” (B) 1977年，吴文俊创立吴方法 (C) 1957年，罗森布拉特提出感知机神经元关系 (D) 1985-1986年提出误差反向传播算法 6. 人工智能在围棋方面的应用之一是AlphaGo通过（A）获得“棋感”。 (A) 视觉感知 (B) 扩大存储空间 (C) 听觉感知 (D) 提高运算速度 7. 以下哪项不属于教育信息化的三个阶段（A）。 (A) 教育创新化 (B) 教育技术化 (C) 教育智能化 (D) 教育智慧化 8. 以下不属于人工智能对当前经济社会冲击最大的四个领域的是（C）。 (A) 制造 (B) 教育

(C) 艺术 (D) 金融 9. 2013年，麻省理工学院的基础评论把（D）列为第一大技术突破。 (A) 机器学习 (B) 人工智能 (C) 智能围棋 (D) 深度学习 10. 根据本课程，过去生产一台哈雷机车需要21天，但在工业4.0时代，只需要（D）就可以把私人定制的摩托车交给客户，极大提高了生产效率，同时满足用户的个性化需求。 (A) 2天 (B) 24小时 (C) 12小时 (D) 6小时 11. 根据本课程，根据相关机构数据分析，中国制造业总体成本与美国相比（C） (A) 远远低于美国 (B) 远远高于美国 (C) 已经几乎相等同 (D) 无法判断

分布式人工智能在军事领域的应用

分布式人工智能在军事领域的应用来源：互联网责编：大嘴作者：刘毅勇时间：2004-09-11【大中小】分布式人工智能（DAI）是计算机科学的一个新分枝，它研究一组分布的、松散耦合的主体如何协同运用它们的知识、技能、信息，为尽可能好地实现各自的或全局的目标或规划，如何采取协作性的行动或对问题进行求解的手段和步骤。DAI所研究的系统通常叫做多主体系统(MAS)。其中主体(agent)通常是指一些逻辑上相对独立的节点处理机及运行于其上的进程。主体可以有应用程序、主动式信息资源以及在线网路服务功能等。它能在一定的环境下持续自主运行，能自学习、自增长，同时又可以和别的主体进行协商与协作，以便完成任务。主体要能够持续不断地感知它们周围的环境，并在一个限定的时间内对所受的感官刺激计算出合适的反应。 DAI是人工智能(AI)与分布式计算相结合的产物。但它与AI又有很大的区别。AI把心理学作为思想、动力或参照的源泉，而DAI则把社会学、经济学、管理科学作为动力; AI致力于个体，而DAI则致力于群体。分布式计算正好为这种针对群体的研究奠定了计算方面的基础。但DAI与分布式计算也有很大差别, 在DAI系统或多主体系统中，主体可以为一个共同的全局目标工作，也可以为了各自不同的但却是相互作用的目标工作。这里协同是最为关键的，没有协同，交互作用的一切好处都会消失，而多主体系统也就会退化成为一群各自为政的主体组成的乌合之众。一、分布式人工智能的研究内容 DAI所研究的不仅是智能系统的设计，还要通过对人类之间相互作用的透视与理解，实现人类为了改善自己的环境而组织成各种各样的群体以便协同行动这样一种智能化、社会化的机制。 1.DAI系统(或多主体系统)特性 (1)连贯性连贯性(coherence)指DAI系统作为一个整体如何协同行动，使全局目标及求解过程中的各项性能指标更为合理（整体或局部的特性），它由全局解的效率、质量、清晰程度以及在出现局部失败时问题求解器稳妥地做出平滑衰减(degrade gracefully)的能力来度量。 (2)协同性协同性(coordination)指一组智能主体遂行集体行动时发生相互作用的性质，它表明各主体在实现主要目标的过程中避免有害的、相互作用和无关的活动的能力。有效的协调使主体之间可在一定程度上相互进行预测，进而减少冲突。 (3)协作性

人工智能的应用及展望

人工智能应用及展望唐小军内容摘要：人工智能 (ArtificialIntelligence)诞生于1956年的美国，至今已接近七十年。它属于自然科学和社会科学的交叉。人工智能基于认知科学、哲学、不定性论的边缘科学研究项目，在上世纪80年代中期人工神经网络取得重大进展，其成果大量应用于系统的感知,模型建立和控制。神经网络通过对输入输出样本的学习,不断地调整网络的权值和阈值,使网络实现给定的输入输出映射关系,并具有一定的学习和自适应运用能力。智能技术是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志，借助大数据技术，尤其它在解决远程控制、故障诊断、非线性等问题上的优势，给机械系统、符号计算、模式识别的发展指明了方向。随着时代的发展及信息革命的到来,人工智能的研究领域日益拓宽,其内容逐步丰富,对人类发展有划时代的意义。关键词：认知科学专家系统神经网络大数据前言人工智能(Artificial Intelligence)，人工智能可以分为两部分，“智能”是什么，我们可以从不同方面去定义。这关联到到如意识、自我、心灵等问题.我们唯一理解的智能也就是灵长类动物拥有的能自由做出反应的能力，这种能力也是现在和未来人工智能科研的主要奋斗目标。目前我们对灵长类动物的智能的理解，可以用只可意不可言来准确形容，现阶段还不能对自身智能的理解用科学的表达方式表达出来。 1 人工智能的定义人工智能(Artificial Intelligence,简称AI)是一门研究如何构造智能机器或智能系统，主要研究方向是模拟、延伸、扩展人类智能的。人们通过对外界事物进行长期实践做出一些归纳并对其用数值量化，用传感设备和用严密的逻辑思维进行推理并干预其结果的差错，通过逻辑计算然后再用于控制终端设备服务于受众，智能包含能力包括感知能力、记忆和思维能力、学习和自适应的能力，

人工智能技术及其发展趋势

人工智能技术及其发展趋势单选题 1?下列对人工智能芯片的表述，不正确的是（）。（10.0分） A.一种专门用于处理人工智能应用中大量计算任务的芯片 B.能够更好地适应人工智能中大量矩阵运算 C?目前处于成熟高速发展阶段 D.相对于传统的CPU处理器，智能芯片具有很好的并行计算性能 2?生物特征识别技术不包括（）0（10.0分） A.体感交互 B.指纹识别 C.人脸识别 D.虹膜识别我的答案：A "答对 3.（）,中共中央政治局就人工智能发展现状和趋势举行第九次集体学习 (10.0分） A.2018年3月15日 B.2018 年10 月31 日

C.2018 年12 月31 日 D.2019年1月31日我的答案：B "答对 4.（）是人工智能的核心，是使计算机具有智能的主要方法，其应用遍及人工智能的各个领域。（10.0分） A.深度学习 B.机器学习 C.人机交互 D.智能芯片多选题 1.计算机视觉或机器视觉就是研究用计算机来模拟人类视觉或灵长类动物视觉的一门科学，由图像数据来产生视野环境内有用符号描述的过程，主要研究内容包括（）。（10.0 分）） A.图像获取 B.图像处理 C.图像分析 D.图像识别我的答案：ABCD "答对

2.机器学习的相关算法包括（）。（10.0分）） A.轨迹跟踪 B.决策树 C?数据挖掘 D.K近邻算法我的答案：BCD "答对判断题 1?决策树是一种采用测量不同特征值之间的距离方法进行分类的算法。（10.0分）我的答案：错误"答对 2.卷积神经网络是一种常用来处理具有网格结构拓扑数据的神经网络，如处理时序数据和图像数据等，广泛应用于人脸识别、物品识别等领域。（10.0分） 3.人工智能是科学交叉的结果，它由不同领域多学科综合发展而来。（10.0分）我的答案：正确"答对 4.增强现实技

人工智能日常应用2020考试答案word.doc

人工智能日常应用 1.《国务院关于印发新一代人工智能发展规划的通知》中指出，到（）年人工智能理论、技术与应用达到世界领先水平。（10.0分） A.2020 B.2025 C.2030 D.2035 我的答案：C√答对 2.《国务院关于印发新一代人工智能发展规划的通知》中指出，到2025年人工智能要达到的目标不包括（）。（10.0分） A.人工智能基础理论实现重大突破 B.部分技术与应用达到世界领先水平 C.智能社会建设取得积极进展 D.成为世界主要人工智能创新中心我的答案：D√答对 3.下列对我国未来人工智能产业的表述不当的是（）。（10.0分） A.人机协同成为主流生产和服务方式 B.跨界融合成为重要经济模式

C.共创分享成为经济生态基本特征 D.劳动力成为经济增长的第一要素我的答案：D√答对 4.下列对战斗机器人的表述，不当的是（）。（10.0分） A.目前战场上的主要力量 B.配合人类士兵作战的角色 C.在执行低烈度作战和危险任务时可以大大减轻人类士兵的负担和伤亡 D.具有较高智能、全方位作战能力、较强战场生存能力、绝对服从命令等优势我的答案：A√答对 1.人工智能技术在军事上的应用特点包括（）。（10.0分）） A.行为个人化 B.竞争常态化 C.行为国家化 D.竞争失常化我的答案：BC√答对 2.智能制造发展特点包括（）。（10.0分）） A.向智能化、网络化发展 B.实现高效绿色制造 C.生产过程透明化 D.生产现场无人化

我的答案：ABCD√答对 1.我国于2018年发布了《国务院关于印发新一代人工智能发展规划的通知》。（10.0分）我的答案：错误√答对 2.在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下，人工智能发展进入新阶段。（10.0分）我的答案：正确√答对 3.人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。（10.0分）我的答案：正确√答对 4.无人机作战飞机、无人潜航器、战场机器人等基于人工智能的无人机器能够自动搜索和跟踪目标, 但不能自主识别地形并选择前进道路。（10.0分）我的答案：错误√答对

人工智能的现状及发展展望

人工智能的现状及发展展望从1961年世界上第一个真正意义上的实用机器人在美国问世，到40余年后的今天，机器人的应用领域不断扩大，从工业到农业再到服务业，从工厂走向寻常百姓家，从北非沙漠到南美丛林，从深水世界到浩瀚太空，机器人的触角已经伸向四面八方，成为我们社会生活中一道独特的科技风景。机器人没到人类等级从1956第一次使用“人工智能”这个字汇。到50年后的今天，回顾人工智能这50年的发展中，我们在不断地尝试着把人类的原创性加到机械思考中，虽然我们取得了许多成就，但目前我们所有的知识并不足以到达人类的智能等级，还没有完成一个人类等级的人工智能。用电脑来模拟人脑的高度功能，早在50年前，有人就曾指出，真正的障碍，并不是机器的功能不足，而是我们无法写出程序，来彻底利用我们拥有的资源。人工智能的设备并不是问题，真正难以克服的是关于人工智能基本概念的问题，而且这个问题在50年后的今天依旧存在。人工智能未来继续探索对于人工智能的未来，存在两种不同的观点。第一种观点认为，人工智能是有关于人类智慧，有关于通用机器的。而第二个观点存在于信息科技的前沿。比如，将数据信息化，让它们在网络上产生作用，让基因发挥其作用，让机器人数据发挥作用。机器人人工智能研究的下一个目标是常识知识与推理能力的固定化。但今天的人工智能领域还有很多其它的研究目标。目前，机器人研究存在很多的方向，一些人将机器人人性化，希望越接近人类越好，而另一个方向却正好相反。机器人领域还有一些其他的问题。因为他们必须要在人类的环境中运作，有时候甚至面对一些尚未解决的问题，比方像人类一样抬起两条腿而不是拖着脚的方式行走，或是要能了解物体的三度空间视觉等等。这些问题已经被分别研究，但机器人目前仍旧无法在混乱的房间里行走或是上下楼梯，更不要说爬树了。科幻电影中会有形形色色的机器人，电影往往会让这些机器人有一些人类的动机，变成一个有个性的角色，要假设这些机器人像人类一样十分容易，比如电影《人工智能》里的机器人，会陪伴人还会觉得孤单。电影中假设机器人可以模仿十岁的小孩，然而他们没想到，收养机器人的女主人会变老，当她七十岁或八十岁时，他的机器人小孩还是十岁大。在电影的观点里，甚至不需要思考这个问题，而这只是人们很容易被电影误导的例证之一。机器人潜在威胁尽管目前人工智能的发展还未达到人类智能的水平，但许多人仍存在着顾虑。当机器人真的被赋予了人类式的情感和意志，它将像我们一样，具备各方面的人性特征：创造性的思维、独立的思考与决策、自觉性的行为及各种人情世故，面对与我们一样有人格自尊的机器人，人类该如何以待？机器人是不是也该像我们一样拥有生存与发展的基本权利，谋求政治上的自由和平等。它们会不会打着“人权”的旗号揭竿而起，来一场人工智能的反叛以摆脱人类的控制？一手缔造了机器人神话的我们，是否已经准备好迎接未来的机器人时代？这些场景已在各种科幻作品中提到。机器人三大定律