【猎云网(微信号:ilieyun)】11月30日报道(编译:蔡怡然)
两年前,Alphabet的研究人员开发的人工智能软件AlphaGo在精妙复杂的棋盘游戏围棋中击败了世界冠军,为计算领域开创出全新的篇章。今天,亚马逊也想树立全新的里程碑:实现人工智能技术的大众化。令人意外的是,实现如此宏大的目标依靠的却是一辆小型的自动驾驶汽车。
这款身材仅有普通汽车1/18的汽车叫做DeepRacer,目前已经开放预定,原价399美元的产品现在只需249美元就能带回家。按其设计,DeepRacer能够让程序员更容易掌握强化学习技术——强化学习是助力AlphaGo获胜的关键技术之一,它是从动物学习、参数扰动自适应控制等理论发展而来的。尽管强化学习技术已经取得了一些引人注目的研究成果,比如会下围棋、国际象棋或者会玩复杂的多人游戏的机器人,但是目前这项技术还并未像在语音识别和图像分析中使用的模式匹配技术那样得到广泛应用。
DeepRacer是由亚马逊的云计算部门Amazon Web Services(AWS)创建的,实际上,亚马逊的大部分利润都是有这个部门创造的。这款汽车配有高清摄像头,双核英特尔处理器,以及其他自动驾驶所需的的硬件——不过它对自动驾驶技术的掌握目前还是一片空白。公司希望程序员能够利用亚马逊的工具,通过开发自动驾驶汽车技术来掌握强化学习的知识
AWS人工智能项目主管Matt Wood表示:“除了那些资金十分充足、开发潜力巨大的企业之外,几乎没有公司能接触到这项技术。”
Wood希望DeepRacer能帮助程序员们切身的体验强化学习技术,并鼓励他们将其应用到更重要的问题上,进而为亚马逊的云计算部门开辟新的业务。强化学习可以对软件进行培训从而使其对变化的环境做出适当的反应。Wood表示,这项技术非常适合于工业领域,比如在天气或电力需求变化的情况下优化风力涡轮机的运转,或者根据具体情况安排港口的船舶和集装箱调度。在AWS的帮助下,通用电气(General Electric)已经利用强化学习技术改进了核磁共振机的图像处理模型。
亚马逊在周四于拉斯维加斯举行的年度re:Invent大会上发布了DeepRacer。公司计划为世界各地的DeepRacer用户举办十多场比赛,获胜者可以获得AWS的积分或者获得参与明年re:Invent总决赛的资格。这个项目的灵感自于一个普通的遥控汽车比赛,参赛者使用开源的AI软件来建造自己的微型自动驾驶汽车并参与比赛。
强化学习算法通过反复试验并从错误中学习教训而获得技能。这些算法会由来自“奖励功能”的反馈所引导,这个“奖励功能”会通过告诉软件它必须尽量提高自己的得分,或者在不掉东西的情况下举起物体这些方式来催生一种动机。多次尝试后,这个软件就会赢得虚拟相扑比赛或熟练地使用机器人抓手。在这个过程中,软件就会不断的改进,最终实现预期目标。
强化学习系统要经过数百万次失败才能变得熟练,因此大多数使用该技术的项目都依赖于模拟来加速繁琐的过程。Alphabet于去年推出了AlphaGo的进阶版,AlphaZero,它和自己下了2100万盘棋,现在的围棋水平已经超越任何人类棋手了。亚马逊专门为这个项目创建了一个虚拟世界,里面有虚拟车辆,不仅可以家事,还会发生碰撞。想要使用亚马逊DeepRacer的程序员必须先在这里试验他们的代码。
亚马逊并不是唯一一家想要通过强化学习技术来吸引程序员的公司。微软开发了一个名为AirSim 的开源项目,它是一个汽车和无人机自动驾驶仿真平台。这个项目同样也是用来进行强化学习实验的。壳牌公司与微软工程师合作,将该技术应用于十分棘手的水平井钻井问题中。微软首席技术官Kevin Scott表示,这项技术的应用价值已经不再局限于“玩玩游戏”而已了,它已经可以真正的造福于人类。