• 25
探底AI技术:x.ai融资3000万美元打造的机器人助理有多智能?
统计 阅读时间大约6分钟(2245字)

2016-04-28 探底AI技术:x.ai融资3000万美元打造的机器人助理有多智能?

有一款机器人助理不光可以安排会议,说话语气也与一般人无差。

【猎云网(微信号:ilieyun)】4月28日报道(编译:周周公子)

编者注:机器人早已不是什么新鲜事了,但现在居然有一款机器人助理不光可以安排会议,说话语气也与一般人无差。这位助理是谁?又是谁研发了这位助理?他们是怎么做到的?让我们跟着x.ai的CEO Dennis Mortensen来了解这一切。

如今,越来越多的职位上出现了机器人职员。由x.ai研发的人工智能助理机器人,可能将成为六月份Work Awesome会议上的焦点。在这之前,公司的CEO Dennis Mortensen就此与Lars Gaede进行了交流。

Lars Gaede:Dennis,据我了解,我们可以通过邮件指示这位人工智能个人助理与对方联系,确认预约、改期或取消预约。他/她发邮件的语气自然,就像一般人一样。那么,你是怎么想到要将技术人性化,使得对方相信自己就是在与真实的人交流的呢?

Dennis Mortensen:当你计划要制造一位人工智能助理的时候,第一件事就是做决定:是想将他人性化,就像Apple研发的Siri、微软的Cortana以及我们的Amy和Andrew一样;还是只想把它做成一个软件。非此即彼,既然做了决定就全身心投入去做。如果语气既非人又不像机器人,感觉会很奇怪。

Lars:那种感觉就好像是一个笨拙的机器人在和你交流吗?

Dennis:差不多吧,而且我觉得那样毫无用处。之所以会想到要这么做,是因为我们认为存在价值:当这位助理的表现像一位正常人,人们很容易与他建立关系。她/他的全名是Amy Ingram或Andrew Ingram,他能记住你的名字,在第二天对话时还能和之前的谈话内容联系起来。也正因为这样,我们的顾客都称呼Amy和Andrew“她”或“他”,而不是“它”。我觉得这样很好,意味着即使大家知道他们是在与机器打交道,也不止把他当成一件物品。他们和助理的交流就像是和正常人一样。

Lars:那你是怎么做到让他说话的语气听起来就像普通人一样?

Dennis:我们花了两年的时间进行研发。查阅了上万封有关组织会议的邮件并对对话进行分析,不光是对单词和句子本身。这个人是怎么说的?对方是怎么回答的?他们最终的结论是什么?整个协商的流程是怎样的?然后,我们尝试对其进行复制。

Lars:怎么复制呢?是要写上万份样本么?

Dennis:是的,但还有一个问题:光有这些样本感觉还是太生硬。鼠标点1,就有一个人声开始语音内容;鼠标点2,语音其他的内容。这种感觉还是很怪异。于是我们开始重点研究要怎样才能使得对话更灵活一点。也就是说,每一次的对话给你的感觉不是不同的样本对话而已,而是一个整体。但其实要做到这一点真的无比困难。有趣的是,最终解决这一难题的不是工程师,而是一些曾写过剧本和教育背景与神话有关的人。因为他们知道如何才能塑造人物。

就像你去百老汇看演出一样,你希望能与其中的角色建立某种关系。他在舞台上的那两个小时里,应该使你内心有所触动,而不仅仅是他说了一大堆然后你记了下来。在我们创造Amy和Andrew时,就融入了这样的想法。

Lars:那在技术方面这是怎么做到的呢?要怎样才能让他/她理解邮件里的内容呢?怎样才能在回复的时候表达更合理呢?

Dennis:这一部分最难的是我们要保证近100%的准确性。你在谷歌上搜索资料时,即使它没有完全理解你的要求,也能提供一大堆网页结果,这并不要求有100%的准确率。但对我们而言,我们要确保准确。举个例子,你这周想通过Skype与Dennis进行会议,但他在不同的时区。这些信息对于我们来说很简单,但对于系统来说却不那么容易。

Dennis:当你在讨论喜欢的队伍在周六比赛中出色的表现时,Amy可以选择性忽略这些内容。她对这个话题并不感兴趣,她只关心“我们要什么时候和Dennis开会”。所以,如果你想研发一款智能助理,你要做的第一件事对其有一个完整的概念体系。不然你无法预测所有可能的结果。

那么,首先要明确定义——什么是开会?然后要提出如何将数据输入模型的方案。下一个问题来了:你要采用什么数据集模型?可是没有这种安排会议的数据模型可以让我们直接采用。

Lars:那我猜你一定安排了很多场会议。

Dennis:的确。两年前我们安排了第一场会议,研究能收集到什么数据。接着是第二场,第三场……在安排上百万场会议之后,我们现在有了一套带有注释和标签的数据集,根据这个可以直接建立模型并对一般人的反应进行模拟。

我们将Amy所需的全部技巧编成模型。需要Amy考虑时区不同带来的时差问题,我们要为此建立一个数据集模型。需要Amy知道Skype视频会议不需要本人到场,那我们就再建一个模型。这是唯一可以保证100%准确度的方法。然后就是要将这些模型投入使用。出现错误的时候搞清楚原因,反复修改数据和模型。这就是监督学习(supervised learning),也是创建智能系统的方法。

Lars:那这一技术的界限在哪?万一现场状况复杂超出助理的能力范围呢?

Dennis:这有一些可能出现的最糟糕的情况。一个是助理错误理解了你的要求,结果你到了曼哈顿中城之后发现根本没人在等你。助理也是会犯错的。但事实上机器人助理的能力并不比人类助理差,如果你忘记告诉人类助理对方在新加坡或者Lars其实在德国他们一样可能会犯错。但在某些方面,Amy和Andrew的确优于人类助理。

他们是有内存的,只要你告诉他们一次Lars在柏林,他们就永远不会忘记。他们每周工作7天,不要求年薪达到5万美元,也不需要休息时间来杯咖啡,更不抱怨。事实上,他们还做了许多对于人类来说很困难的事,例如为在不同时区说不同语言的参会人员安排会议并持续跟进。再想想网络的影响!当很多人都有了像Amy这样的助理时,预约会议可能仅需几秒就能完成。

Lars:虽然这听起来真的很棒,但一些需要助理出差的工作Amy不是就没法完成了吗?

Dennis:但如今有助理的人还是少数,有Amy和Andrew这种助理的人更是少之又少。大多数的会议还是由像你我这样的普通人组织的。我们希望可以普遍个人助理这个概念,每个人都可以有。补充一下:在进行快速了解后你还可以问任何一位助理:“你难道喜欢在邮件里跟对方进行周旋吗?难道你想和那些工作日也不回邮件只能通过打电话催他的人进行交流吗?”不!他们都讨厌做这些工作。

Lars:你觉得人工智能对于企业而言有什么普遍影响吗?毕竟Amy和Andrew不是唯一有可能取代人类的智能设备。

Dennis:你指的是在不久的未来,十年或二十年之后,可能造成高失业率么?对此我是持乐观态度的。我认为科技的存在是为了改善现状。那些被取代的职位可能从一开始就不应该存在或者说并不值得花费人力来做。不可否认的是,在美国有3000万待业人口。但这并不是我该考虑的问题。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×