阅读时间大约3分钟（875字）

2016-03-16 你在说什么，看你的脸VocalZoom就知道

嘈杂环境下，依然可以轻松识别你的语音指令。

【猎云网（微信号：ilieyun）】3月16日报道（编译：小马）

Siri的出现实现了科幻小说中炫酷的智能语音梦，但VocalZoom将这个梦想实现推向了一个新高度。

坦白讲，Siri及其它同类产品的出现，用惊为天人这四个字来形容也不为过。在上个世纪八十年代，凡是看过霹雳游侠的人，对年轻的独行侠麦克·奈特和他那辆人性化的电脑车——霹雳车，一定印象深刻。而如今，当我们对像Siri这样的电子助理下达指令时，是不是也仿佛化身成了现代社会的霹雳侠？

但当最初的兴奋劲儿过去，残酷的现实摆在了眼前，实际上，这些电子助理们工作起来并不是那么得心应手。有时候在周围环境没那么嘈杂的时候，语音识别助理确实表现的让人满意，但在我们日常生活中，往往没有事先预定那么好的外部环境，这些电子助理的表现就没有那么完美了。

最近一款名为的VocalZoom产品引起了我的兴趣。它是由以色列的一家初创公司研究开发的光学人机交流传感器。VocalZoom通过捕捉、测量面部震动的数据，并将其转换成一个独立的参考信号，这样不受外部噪音的影响，使得语音识别技术更加精准。

目前，VocalZoom也与中国的语音识别技术厂商科大讯飞达成合作。科大讯飞在中国语音识别技术市场的上的占有率达80%。该协议促成了科大讯飞的语音云智能技术平台和VocalZoom’s的HMC光学人机交流传感器的整合。初步测试显示，这次合作使得科大讯飞的自动语音识别功能平均可以得到50%的改善，在打开车窗周围环境变得嘈杂的时候效果更明显。

HOME

VocalZoom意识到语音识别完全依赖于麦克风的传话，无论麦克风软件做的多好，都无法将声音与外界隔离，对声音进行单独的隔离控制让声音变的清晰。于是VocalZoom通过传感器通过搜集嘴部、脸颊和喉咙周围皮肤的振动数据解决了这个难题。VocalZoom’s的HMC光学人机交流传感器将这些数据转换成一个独立的参考信号。系统可以通过这个信号进行运转，而不受噪音水平的影响。

其实，VocalZoom就好像是用声音做原料绘制了一幅图画。根据声波振动的频率，在这幅图画上，哪些是用户说出的声音，哪些是噪音就变得清晰可见了。

VocalZoom和科大讯飞目前已经开始测试产品在实际状况下的表现了。实验模拟了车内音乐声，周围噪音等不同场景，VocalZoom的表现都堪称完美。要知道，在以前这样嘈杂的环境中，想要使用语音识别几乎是不可能完成的任务。

试想一下，一边聊着天，一边还能以60英里的速度在高速上兜风，耳畔传来都是呼啸的风声。这样炫酷的科幻场景在如今变成了现实！