猎云网7月2日报道(编译:朱宁)
一切都始于不列颠哥伦比亚惠斯勒的一个小型学术会议。
会议的话题是语音识别,与会人员讨论了这种新的未被证实的机器智能(有时被称为深度学习)是否能帮助电脑更有效地识别口语。微软资助了这个2009年圣诞节前夕召开的小型研讨会,两名研究员邀请了享誉世界的深度学习专家,多伦多大学的Geoff Hinton,来做演讲。
Hinton认为,机器学习模型可以像人脑的神经元一样工作,他想建立一个“神经网络”,当它接收大量口语后,就能形成对它们的理解。神经网络在20世纪80年代火过一阵,但到了2009年却名不副实。
在惠斯勒聚集一堂的语音识别研究者尊重Hinton的想法,但微软研究机构负责人Peter Lee称“他们并不感兴趣”。这些研究员都有自己的算法。但微软团队认为深度学习值得一试,于是微软的几名工程师与惠斯勒的研究员一起合作,用真实数据做了几个实验。结果是“惊人的”,据Lee回忆,自然语音识别的精度提高了25%还多。而在这个领域,5%的提升足以改变格局。“我们公布了结果,就改变了世界。”
现在一晃五年过去了,神经网络的算法正在冲击主流,它以全新的、令人振奋的方式使电脑变得更聪明。Google已用它增强Android的语音识别功能,IBM也在使用。最值得一提的是,微软将它作为类似Star-Trek网络翻译的一部分,它可以将人说的话几乎同时翻译成另一种语言。Hinton说:“刚开始人们很怀疑,但现在这种方法已经深入人心,得到广泛使用。”
苹果公司仍未迈出关键一步,Siri软件有待升级
一个大牌公司仍未迈出关键的一步:那就是苹果,它的Siri软件有待升级。尽管苹果公司对其内部运营是出了名的守口如瓶——对此它不予以评论——但它似乎已预先从最著名的语言识别供应商Nuance那里购进了语言识别技术。人工智能研究员认为苹果即将改变,它明显组成了自己的语言识别小组,增强神经网络的Siri也正在形成。
苹果去年雇佣了微软的高级经理Alex Acero。现在身为苹果Siri项目组高管的Acero在微软研究语言识别技术近二十年。苹果还从Nuance挖走了语言识别研究员,其中包括Siri的经理Gunnar Evermann和爱丁堡大学的研究员Arnab Ghoshal。
被苹果挖走的多伦多大学博士后研究员Abdel-rahman Mohamed说:“苹果不仅聘用管理层,还聘用领导人和研究员。他们正在为语言识别研究建立强大的团队。”
在雅虎负责监管研究并协助启动这一项目、最初催生Siri的Ron Brachman指出,苹果的数字iPhone助手所依靠的远远不止语音识别。但微软的Peter Lee给了苹果六个月赶上微软和Google的时间。他认为这将大大提升Siri的人才。“除了苹果Siri,所有的主力队员都交换过了,”他说,“我认为这只是个时间问题。”
Source:Wired