• 27
你在说什么,看你的脸VocalZoom就知道
统计 阅读时间大约3分钟(875字)

2016-03-16 你在说什么,看你的脸VocalZoom就知道

嘈杂环境下,依然可以轻松识别你的语音指令。

【猎云网(微信号:ilieyun)】316日报道(编译:小马)

Siri的出现实现了科幻小说中炫酷的智能语音梦,但VocalZoom将这个梦想实现推向了一个新高度。

坦白讲,Siri及其它同类产品的出现,用惊为天人这四个字来形容也不为过。在上个世纪八十年代,凡是看过霹雳游侠的人,对年轻的独行侠麦克·奈特和他那辆人性化的电脑车——霹雳车,一定印象深刻。而如今,当我们对像Siri这样的电子助理下达指令时,是不是也仿佛化身成了现代社会的霹雳侠?

但当最初的兴奋劲儿过去,残酷的现实摆在了眼前,实际上,这些电子助理们工作起来并不是那么得心应手。有时候在周围环境没那么嘈杂的时候,语音识别助理确实表现的让人满意,但在我们日常生活中,往往没有事先预定那么好的外部环境,这些电子助理的表现就没有那么完美了。

最近一款名为的VocalZoom产品引起了我的兴趣。它是由以色列的一家初创公司研究开发的光学人机交流传感器。VocalZoom通过捕捉、测量面部震动的数据,并将其转换成一个独立的参考信号,这样不受外部噪音的影响,使得语音识别技术更加精准。

目前,VocalZoom也与中国的语音识别技术厂商科大讯飞达成合作。科大讯飞在中国语音识别技术市场的上的占有率达80%。该协议促成了科大讯飞的语音云智能技术平台和VocalZoom’s的HMC光学人机交流传感器的整合。初步测试显示,这次合作使得科大讯飞的自动语音识别功能平均可以得到50%的改善,在打开车窗周围环境变得嘈杂的时候效果更明显。

HOME

VocalZoom意识到语音识别完全依赖于麦克风的传话,无论麦克风软件做的多好,都无法将声音与外界隔离,对声音进行单独的隔离控制让声音变的清晰。于是VocalZoom通过传感器通过搜集嘴部、脸颊和喉咙周围皮肤的振动数据解决了这个难题。VocalZoom’s的HMC光学人机交流传感器将这些数据转换成一个独立的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。

其实,VocalZoom就好像是用声音做原料绘制了一幅图画。根据声波振动的频率,在这幅图画上,哪些是用户说出的声音,哪些是噪音就变得清晰可见了。

VocalZoom和科大讯飞目前已经开始测试产品在实际状况下的表现了。实验模拟了车内音乐声,周围噪音等不同场景,VocalZoom的表现都堪称完美。要知道,在以前这样嘈杂的环境中,想要使用语音识别几乎是不可能完成的任务。

试想一下,一边聊着天,一边还能以60英里的速度在高速上兜风,耳畔传来都是呼啸的风声。这样炫酷的科幻场景在如今变成了现实!

 

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×