【猎云网(微信号:ilieyun)深圳】5月8日报道(文/Kelsen)
发布会一键出稿,厉害了。
近日猎云君(微信号:ilieyun)接触到一个关于语音转文字,名为会速记的项目。
猎云君得知,会速记目前还处在内测阶段,还未上线,不过可以通过一个演示示例了解它是如何工作。会速记支持上传时长 1 个小时以内的 wav 或 mp3、pcm格式文件,目前只接受中英文。接下来它需要花点时间生成文字,官方说法是,1小时音频5分钟转写完成。
创始人欧咏群表示,接下来你会在网页上看到转录好的文字,但这并不意味着转录结束。文本有标点符号,更根据语义分段,用户在文本框中可手动编辑修改,然后再做导出。会速记就像所有的人工智能学习过程一样,它用来进行语音识别和语料库大数据搜索, 结合深度学习算法和自然语言理解等纠正识别错误,提高准确率。
这个过程就相当于用机器算法取代了速记员、听写员的工作。“会速记会在广泛的领域内带来积极影响,提高生产力,包括医疗机构、法律、商业和媒体。”欧咏群说道。
专业领域的人工听写效率低,1 小时的录音往往需要花费 3-5 个小时,每小时传统人工速录的成本在200元以上,会速记能把完成工作的时间平均缩短 80%。
会速记也有语音实时转写功能,1秒内出文字,可以使声音、文字同步直播。标准普通话转写准确率可达95%以上;
众所周知,语音识别并不是什么新鲜事物,手机里的各种语音助理比如 Siri都基于此。用户关心的唯一问题可能是到底识别的准确性有多高。
据介绍,会速记通过麦克风硬件接收,通过语音转写引擎,最后在线上呈现文本分享,准确率在92%左右。随着语音识别技术的发展、语料库大数据的丰富、说话人口音自适应等,语音识别准确率会提高到98%以上。会速记是一个用户使用越多,语音转写文字准确率越来越高的一个科技产品和工具。
会速记开发了一套智能会议系统,主要针对于会议、教育、培训等需要将语音转成文字需求较高的场景,将会议发言实时录音并转成文字;现场显示屏幕进行文字同步直播。
目前已经与众筹平台达成合作,产品上线首选在众筹平台上曝光。至于软件方面,会速记通过PC端和移动App端对用户进行服务。目前与科大讯飞达成战略合作,主要是使用了科大讯飞语音识别引擎,调用语音转写等API接口和SDK。
团队方面,创始人兼CEO,欧咏群,中国科技大学国际贸易专业,拥有5年互联网市场经验和8年外贸行业经验。技术总监,奉国和博士,现任华南师范大学信息管理系教授,主要研究自动文本分析、数据挖掘、人工智能等领域。
另据悉,目前会速记正在寻找200万天使轮融资。主要用于团队招募、产品开发、市场渠道拓展。
项目:会速记
公司:广州欧锋科技有限公司
网站:www.huisuji.com