• 31
云知声推“语用计算”概念,AI离我们不远了?
统计 阅读时间大约4分钟(1572字)

2016-07-21 云知声推“语用计算”概念,AI离我们不远了?

3.0版本最大突破是可以在整个感知的框架中,融入了语用计算

【猎云网(微信:ilieyun)北京】7月21日报道(文/吴韩)

7月19日云知声举办的“认知世界、更强智能”技术引擎升级分享会上,CEO黄伟宣布了云知声语音交互的最新进展——人工智能引擎升级到了3.0版本。

云知声资深AI技术专家刘升平博士称,此次技术引擎升级之后,云知声在感知智能和认知智能两方面的能力都得到大幅提升。

“在感知智能方面,云知声的语音识别字错误率降低20%,同时,识别速度提升40%。另外,在认知智能方面,云知声正式发布第一个语用计算引擎。语用计算是语义理解的下一阶段,云知声在基于语义理解的基础上,加入了语言的现场环境和背景信息的因素——让机器真正理解语言深层次的含义。”

据介绍,云知声在过去的四年中已经完成了在感知智能阶段的技术和数据的初步积累,并在认知智能上得到了提升。“这次技术引擎的升级的根本原因是AI基础架构的有了较大的突破。AI基础架构是指深度学习为代表的机器学习,高性能计算,大数据”,刘升平称。12584211441153_副本

“深度学习的算法在2000年左右,甚至更早就提出了,但因为计算量非常大,当时并没有得到成功应用。这几年,由于硬件计算能力的飞速发展,GPU比CPU快10倍,一些特定任务上还会快更多。同时,Web2.0以及移动互联网应用有产生了海量的数据,大数据管理技术也得到了很大发展,这样,深度学习算法,高性能计算,大数据,这三驾马车才能让人工智能技术在近几年取得了长远的进步。这几年,正是由于云知声在AI基础架构上大量投入,才能使得在AI具体技术上多点开花。”刘升平表示。

除了语音识别之外,云知声在认知智能方面,云知声高级研发总监刘升平博士带来了一个更智能的语音交互车机Demo。

两个尝试:“无监督式学习”和“语用计算”

人类的自然语言具有复杂性,深度学习恰好适合解决这类复杂文本。根据刘升平的介绍,3.0之前的版本更多使用的仍然是监督式学习。需要使用人工标注的数据供机器学习、训练。而3.0版本已经开始使用无监督式学习的算法,可以使用大量未经过人工标注的海量数据来训练机器。 12584211441152_副本

除此之外,刘升平认为,3.0版本最大突破是可以在整个感知的框架中,融入了语用计算。

简单来说,正常人交流时会考虑语境,除了听对方说什么,也会关注说话人身份,说话时所处的环境,以及交谈上下文,双方都默认知道的背景知识等等。语用理解就是以语境为中心来理解对话内容。

3.0版考虑的语境如上图所示,主要包括物理、言语、知识、环境语境几大类,对语音交谈中需要涉及的语境信息进行了整理。然后在机器学习算法上,云知声认为使用Seq2Seq序列生成的模型可以融入语境信息。

这样以语境为中心的理解方法更符合日常交流习惯。比如可以使对话更加个性化,对不同用户、男女老少给出不同应答。另外语境会影响对话中的一致性。比如现在一些语音对话中会出现上下文中性别认知错乱的情况,原因就在于把很多不同性别人的语料放在一起训练机器,但机器没有考虑语境理解,因而与人“说话”时缺乏一致性。20160720194635_7b8e59de978f801c97ac60e1953b11f2_3_副本

目前云知声整理汇总了语音交互时要考虑的语用信息,从样机展示来看,产品可以简单支持多轮对话,未来将更多信息的融入和算法方面的突破,是云知声要持续的跟进的目标。

在高性能处理器方面,云知声基于谷歌Core OS,建立了大规模通用型CPU集群。所谓通用型,就是保证语音识别、云处理、深度学习、普通统计学习都在一个集群完成。整个集群可以在晚上线上服务空闲时做训练,白天忙的时候做线上服务,线上线下打通,提高集群利用效率。

“前装项目一个车型差不多能卖5万台。云知声后装出货量达到了150万台,并且今年还有计划再增加250台设备。” 当然他也坦言用一个引擎切入后装领域面临的挑战,比如如何面临后装产品中不合规设备时,也能提共非常好的用户体验。 20160720194635_7b8e59de978f801c97ac60e1953b11f2_4_副本

除了在汽车领域收集数据之外,云知声正要推动一个名叫Link Open Data的开放数据联盟,通过与一些高校合作,把公司已经建立的知识图谱放到网上公开。这个项目的意义是,让关系落实到数据层面,由不同参与者共同丰富数据库,未来在查询时可以直接调用关联数据,效率可以更优。

云知声成立于2012年,2012年后发布免费开放的语音云平台。目前,云知声占有中国后装车机市场60%的市场份额。同时,云知声还是白色家电领域唯一落地出货的芯片供应商。云知声的合作伙伴数量也已经超过2万家,覆盖用户已经超过1.8亿,其中语音云平台覆盖的城市超过470个,覆盖设备超过9000万台。

 

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×