【猎云网(微信:ilieyun)北京】10月24日报道(文/苏舒)
每年的10月24日,是程序员的盛会;“1024开发者节”则是科大讯飞的技术盛宴。
“1024开发者节”是全球首个以AI人工智能技术开发者为主要受众群体的行业盛会,由科大讯飞主办,一直为全球各地的开发者们提供交流,探索前沿科技成果的科技平台。2017年,科大讯飞举办了第一届“1024开发者节”,今年已经是第四届。
在今年的“1024开发者节”上,科大讯飞宣布开放由磐石平台和擎天平台组成的讯飞AI平台。
十年前,也是在十月份,科大讯飞发布了全球首个同时提供语音合成、语音搜索、语音听写等智能语音交互能力的移动互联网智能交互平台“讯飞语音云”。
十年的成长,讯飞开放平台已经具备334种复杂的AI能力,应用终端数已超过20亿个,开发者团队也已增长至150万支以上。
可以说,科大讯飞的十年“平台化”,见证了中国前沿科技从移动互联网向人工智能的转变。在人口红利逐步弱化,移动互联网时代退场同时,人工智能技术红利期随之而来。科大讯飞董事长刘庆峰谈及人工智能红利期的衡量标准是表示,在人工智能从技术到应用落地过程中,有越来越多的领域红利都在实实在在地兑现,而判断AI红利是否到来的三大标准,一是有具体的场景;二是有能够规模化推广的产品;三是能证明产品和服务可以创造一定的社会价值。
“一个企业的成功,绝不是单独成为一个帝国,做帝国注定会衰落。只有愿意以自己为核心,开放出自己的资源和能力,形成的产业链,形成的生态体系,才能够生生不息的去发展。我们一直坚定不移的认为,只有生态才能生生不息。”刘庆峰谈到。
科大讯飞这十年,也是在构建AI开发者生态,技术生态全方位探索和布局的十年。在2020科大讯飞全球1024开发者节上,科大讯飞高级副总裁、消费者事业群总裁胡国平现场公布了讯飞开放平台联合艾瑞咨询共同发布的《2020中国人工智能API经济白皮书》。
根据《2020中国人工智能API经济白皮书》,2019年中国人工智能开放平台市场规模104亿,预计2020年市场规模可达222亿。A.I.开放平台目前仍处于初级阶段,未来仍将保持高速增长,艾瑞预计未来5年CAGR在41%左右。
科大讯飞“平台化”的十年
在科大讯飞“1024开发者节”的现场,有一条长长的时间走廊,记录着科大讯飞这十年来的“平台化”成果。
2010年10月28日,科大讯飞首次科大讯飞首次向行业发布基于互联网和移动互联网的语音识别和语音合成引擎,即“讯飞语音云”。 科大讯飞副总裁于继栋回忆道,“最初的讯飞语音云只有语音合成和识别两个通用能力。”
到2012年,讯飞推出语音助手,在2012年到2013年一年间的装机量就已经达到了1.2亿。第二年,讯飞语音助手的语音交互语音交互速度提高到200毫秒以内,缩短至人能够反映的极限水平。同年,科大讯飞在语种识别领域研发出BN-ivec技术。
2014年,科大讯飞正式启动“讯飞超脑计划”,研发基于类神经网络的认知智能系统。到2015年,人工智能开源热潮来临,科大讯飞发布人工智能时代的人机交互界面AIUI。此后,科大讯飞基于深度学习AI向各领域渗透。
2017年,科技部公布了首批百度、阿里云、腾讯云、科大讯飞四家国家新一代人工智能开放创新平台名单。
“从2016年开始,我们整个开发者进入了一个快速增长阶段,在2019年首次突破了百万开发者。通过对百万开发者的优化服务,我们把能力和方案进行大面积的扩展。目的是让开发者能够轻松快捷的开发出自己符合自己场景需要的这样一些应用出来。所以,从2019年开始,我们不断的在平台上扩展能力和解决方案,到现在为止我们已经达到了334项的能力和方案。已经覆盖到了230万的开发者和生态合作伙伴。”于继栋说道。
在开发者服务上,从最早支持安卓、iOS系统,到今年,科大讯飞也率先在行业支持了鸿蒙OS的语音识别和语音合成。此外,在行业的探索上,科大讯飞还开放了涵盖翻译、直播、农业、无接触、数据标注、司法、医疗、智慧城市等14个行业的专题,整合了包括AI中台、数字中台等一些中台,并对开发者开放。
在过去10年,讯飞开放平台从早期的只有语音合成和识别两个通用能力,到今天可以呈现334种更复杂的A.I.的能力;从最早不到10万的应用终端数,到今天的20多亿应用终端数;从最早创业者只有十几个团队创业者,到如今的150多万开发者团队……科大讯飞董事长刘庆峰表示,正是这样一个又一个的登顶和攀登的过程,使开发者们看到了越来越远、越来越大的未来。
讯飞开放平台发布讯飞AI
今年的疫情作为一场“黑天鹅事件”,强推全民进入数字化生存时代。“在疫情稳定之后,我们发现基于讯飞开放平台上的开发者进入了一个更加快的增长节奏,连续三个季度的复合增长率已经超过了53%,这是一个继2016年以来的又一次的一个快速增长。”在于继栋看来,这一次的快速增长离不开人工智能的大面积普及,以及新基建带来的机遇。
对此,于继栋表示,当前,智能升级、数字转型、创新融合企业数字化升级的终局是智能化。“A.I.+大数据”已经成为企业拓宽新局面的决定性因素。以数据为引擎,A.I.将驱动企业实现内生增长,从业务智能化到商业决策优化,企业将在人工智能助力下发现新的价值空间。
针对企业更加个性化的定制需求,基于讯飞开放平台十年技术积累,于继栋在本次平台产品发布会上发布了讯飞AI云。据了解,讯飞AI云由磐石平台和擎天平台组成。
其中,磐石平台主要针对AI服务,能够对云主机集群进行103项专业优化,降低成本、提升效率。同时,它还拥有多重认证与加密,能够保障专属云用户的接入安全。
擎天平台则主要为企业客户提供数据标注、模型训练、引擎托管、服务编排等服务,以在全方位满足不同行业客户面对不同业务场景的AI需求。
经过两年半发展,讯飞开放平台已经引入了超过500家优质服务商,通过AI+招聘、培训、财务、营销、门店(新零售)、客服等方式,帮助上游企业客户解决他们在发展过程中遇到的场景定制化问题。
五大板块构建AI科技树
如何保持核心技术领先,如何实现技术上的不断突破?科大讯飞AI研究院常务副院长刘聪提出了“AI科技树”的构筑理念。
刘聪表示,“AI科技树”包括五大板块,分别是语音识别、语音合成、图像识别OCR、多语种方向以及行业认知方向,并向开发者开放相关内容。
在语音识别板块,刘聪认为语音识别需要持续的去挑战更加复杂的场景,去实现从语音到声音,从单纯的文字内容的识别,到音频的全场景解析。而语音识别的另外一个趋势,可以通过自学习更新的方式,实现各种层次的个性化能力。
对此,讯飞推出了一个多维度自学习的平台,提供给开发者进行模型方案的更新,以及针对某些产品,实现在端侧直接实现用户无感知的个性化训练。
在语音合成板块,刘聪提到,语音合成技术的发展方向不能只以单纯追求自然度为目标,而是要追求用户可感知的技术,同时技术的呈现也需拥有更高的表现力。因此,语音合成也需要实现从语音到声音的全场景音频合成。
在这一个板块,讯飞一方面基于自然语言理解技术,从文本当中分析到合适的情感焦点以及角色相关的信息,并通过语音的方式呈现出来;另一方面,针对不同场景打造不同的背景音乐及音效,并通过单一的情感合成升级到面向交互场景的解决方案,呈现出一个全场景的合成音频。
在图像识别OCR领域,讯飞基于第四代OCR技术框架,结合图神经卷及网络等结构话分析,以及基于对抗生成网络的图文数据生成技术,实现高精度的文档恢复等行业痛点。刘聪表示,讯飞也将各种场景、各种细分能力的OCR能力提供给开发者。“截止今年九月份,此相关能力的调用量已经超过10亿次,并且呈快速发展的趋势。“
在多语种板块,讯飞将开放60个语种的语音合成系统、69个语种的语音识别系统、56个语种的图文识别系统等多语种能力。其中,语音识别系统平均识别率超80%。
在行业认知方向,讯飞达布了认知中台,能够降低问题定义的难度,大幅度提升场景定制的效率。刘聪表示,认知中台将在近期上线,未来讯飞也将持续开放更多的产品和功能。
“除了上述的几个方向,伴随着科技树枝叶的持续点亮,讯飞科技树的全景已经展现在大家的眼前,我想从原始的一颗种子发展到参天大树,科技树的每一片枝叶、每一个技术背后都蕴含了大量的付出和努力。”刘聪坦言,未来,会一如既往的让科技树更加茂盛,并通过行业应用反哺,持续发挥价值。
平台化趋势,打造技术生态
除了在本次“1024开发者节”上发布并表示开放的平台外,科大讯飞还拥有AI全栈服务开放平台“能力星云”和iFLYHOME OS开放平台。
“能力星云”以云端一体化技术框架iFLY-AIKit为基础,给开发者提供服务,AI引擎开发者可用iFLY-AIKit所提供的引擎平台,将自己开发的AI算法模型接入讯飞能力星云,实现快速服务化。
iFLYHOME OS包括Home SAMS和Home SLS两大子系统,Home SAMS(Screen Ability Mall System)致力于为核心屏(大屏)本身的应用服务提供交互基础能力,具备海量终端覆盖、核心能力可定制优化、交互内容支持一键生成、用户聚类服务精准营销等优势。
Home SLS(Screen Link System)则针对核心屏周边的各类设备,可为设备间互联互通提供协议及管理支持,此外,Home SLS还具备蓝牙/WiFi/蜂窝网络多协议支持、终端认证+敏感词过滤保障内容安全、可提供标准化控制信令和展示模板、支持设备联动场景编辑等优势。
此外,在“1024开发者节”上,科大讯飞还正式发布“讯飞·‘顺风耳’图聆工业云平台”据悉,讯飞·“顺风耳”图聆工业云平台作为跨行业、跨领域的A.I.工业互联网平台,结合了人工智能、5G、IIoT等新技术,围绕设备预测性维护、产品质检、人机交互、安全生产、工艺参数优化等工业应用场景,构建了面向能源化工、机械制造等众多行业的全栈式A.I.赋能平台,可为各类企业提供标准A.I.能力、工业A.I.模型训练平台和相关的工业物联设备。
从科大讯飞的财报中,也不难看出科大讯飞的“平台化”趋势,在2020年6月份的半年报中,科大讯飞开放平台收入达5.58亿,占总营收比例为12.83%,而在2019年6月份的半年报中,开放平台营收额为4.58亿,占比11.51%。
从科大讯飞产品业务线来看,科大讯飞开放平台已经成为继教育领域、智慧城市、政务法务后,第四大产品收入来源。
和百度、华为、阿里、腾讯等行业头部企业一样,科大讯飞成立这20年的时间,历经了中国互联网时代的繁盛与衰落,也见证了人工智能时代在中国的初现。从互联网到人工智能时代,科大讯飞也一直在“平台化”的道路上耕耘着,就像李彦宏在《智能经济》一书中提到,“这是一个大生态、大协同、大成长的时代,开放开源,共生协同,各得其所,是面向未来的态度。”