【猎云网(微信号:ilieyun)】3月16日报道(编译:小马)
Siri的出现实现了科幻小说中炫酷的智能语音梦,但VocalZoom将这个梦想实现推向了一个新高度。
坦白讲,Siri及其它同类产品的出现,用惊为天人这四个字来形容也不为过。在上个世纪八十年代,凡是看过霹雳游侠的人,对年轻的独行侠麦克·奈特和他那辆人性化的电脑车——霹雳车,一定印象深刻。而如今,当我们对像Siri这样的电子助理下达指令时,是不是也仿佛化身成了现代社会的霹雳侠?
但当最初的兴奋劲儿过去,残酷的现实摆在了眼前,实际上,这些电子助理们工作起来并不是那么得心应手。有时候在周围环境没那么嘈杂的时候,语音识别助理确实表现的让人满意,但在我们日常生活中,往往没有事先预定那么好的外部环境,这些电子助理的表现就没有那么完美了。
最近一款名为的VocalZoom产品引起了我的兴趣。它是由以色列的一家初创公司研究开发的光学人机交流传感器。VocalZoom通过捕捉、测量面部震动的数据,并将其转换成一个独立的参考信号,这样不受外部噪音的影响,使得语音识别技术更加精准。
目前,VocalZoom也与中国的语音识别技术厂商科大讯飞达成合作。科大讯飞在中国语音识别技术市场的上的占有率达80%。该协议促成了科大讯飞的语音云智能技术平台和VocalZoom’s的HMC光学人机交流传感器的整合。初步测试显示,这次合作使得科大讯飞的自动语音识别功能平均可以得到50%的改善,在打开车窗周围环境变得嘈杂的时候效果更明显。
VocalZoom意识到语音识别完全依赖于麦克风的传话,无论麦克风软件做的多好,都无法将声音与外界隔离,对声音进行单独的隔离控制让声音变的清晰。于是VocalZoom通过传感器通过搜集嘴部、脸颊和喉咙周围皮肤的振动数据解决了这个难题。VocalZoom’s的HMC光学人机交流传感器将这些数据转换成一个独立的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。
其实,VocalZoom就好像是用声音做原料绘制了一幅图画。根据声波振动的频率,在这幅图画上,哪些是用户说出的声音,哪些是噪音就变得清晰可见了。
VocalZoom和科大讯飞目前已经开始测试产品在实际状况下的表现了。实验模拟了车内音乐声,周围噪音等不同场景,VocalZoom的表现都堪称完美。要知道,在以前这样嘈杂的环境中,想要使用语音识别几乎是不可能完成的任务。
试想一下,一边聊着天,一边还能以60英里的速度在高速上兜风,耳畔传来都是呼啸的风声。这样炫酷的科幻场景在如今变成了现实!