【猎云网(微信号:ilieyun)】8月5日报道 (编译:小白)
利用游戏提供的独特环境和模拟来指导机器如何做一切任何事情的AI研究如今数不胜数。从直观上来讲,这没毛病,直到不可思议的事发生:Google DeepMind和卡耐基梅陇大学(CMU)的研究人员用类似于《毁灭战士》系列的第一人称射击游戏来教AI程序学习语言技能。
教AI学习语言?
没错,听起来有点天方夜谭,但是真的有效!目前,为了执行特定命令和动作而被赋予了理解人类语言这一任务的大多数设备只能在理解初步的指令或简单的语句。理解对话和复杂的独白和问答则是一个完全不同的过程,充斥着其本身所具有的巨大挑战。编写程序并不能解决这个问题。
本周,在温哥华计算语言学学院年度会议上发表的一篇新研究论文中,CMU和DeepMind组成的团队详细介绍了如何使用第一人称射击游戏指导AI了解更复杂语言形式和结构背后的规则。
视频游戏的竞争机制往往被研究人员用来训练AI的问题解决能力。为了获得成功,程序必须识别出一个战略来达成特定目标,同时它们还必须发展处一个解决问题的能力来实现这个目标。算法玩的游戏越多,它对哪些策略起作用、哪些不起作用知道的也就越多。
这一原理也让利用第一人称射击游戏指导AI学习语言技能这个想法很荒唐,因为这些有些跟语言没有丝毫瓜葛。在第一人称射击游戏中,玩家要做的就是不断寻找目标击杀直到自己被击杀。
在温哥华会议上提交论文的CMU硕士学生Devendra Chaplot认为,3D射击游戏的意义远不止这些。Chaplot此前曾大量使用《毁灭战士》系列游戏训练AI,他对这类游戏具有哪些优势了如指掌。
和训练AI程序拿到尽可能多的分数不同,Chaplot和他的同时决定使用这种密集的3D环境来教两个AI如何将单词与特定对象联系起来,以完成指定任务。程序被告知如“前往绿色柱子”等指令,然后该程序则需要正确地前往指定对象处。
在进行了大量此类任务训练后,该程序已经能够解读这些命令中使用的单词和语法之间的微妙差异。例如,程序甚至还知道如何从“较大”和“较小”这些描述来区分相关的对象,然后利用关键词找到它们之前可能从未见过的对象。
DeepMind一直致力于研究赋予AI即兴并在各种场景中解决它们从未在训练中遇见过之问题的能力,并给出或许从未被测试过的各种解决方案。在这点上,新的语言教学策略是此方法的一个延伸。
然而这一方法的最大缺陷在于,其需要上百万乃至千万次的训练才能让AI变得熟练。而这种程序的时间和精力显然达不到用来训练机器做某件事的理想效率。
但至少,该研究很好地说明了在AI训练中引入3D环境的必要性。如果我们想让机器可以像人类那些思考,那么他们需要首先沉浸到与人类息息相关的日常世界中。