【猎云网(微信:ilieyun)北京】5月22日报道(文/都保杰)
今天上午,第13届百度联盟生态峰会在海南举行,这次李彦宏并未出席,只是发来了一段祝贺视频为本次峰会远程打call。峰会上,除了海南省政府传达对创新技术和人才引进的开放态度之外,以百度高级副总裁、搜索公司总裁向海龙为首的技术高管也向外界透露出了一个新的信号:AI技术让我们进入了新“视”代,百度将全面拥抱视频时代。
向海龙表示,技术的发展让视频成为最直接最高效的沟通方式,全民视频大爆发时代已经来临,百度依托AI能力,能够让复杂视频的生产更容易、视频的内容检索更简单。
全民视频时代来了
向海龙从人类为何成为地球的统治者的话题讲起,人类不是地球最强的物种,但人类超越其他物种的区别是具备想象力的超强神经元大脑,更善于思考,通过想象力统治了地球,进而衍生出庞大的社会合作网络。而人类文明知识的积累传承,也让每一代人类得以在此基础上更进一步,生产力生产关系逐渐远超其他物种。具有想象力的大脑和知识的沉淀和传承,是人类以并不强壮的身躯成为万物之灵的原因。因此,向海龙认为,整个人类的进化史实际上就是知识传承方式的革命史。
而从知识积累和传承的角度来说,从远古时期人类通过口语和手势进行无法留存的沟通,到文字和纸张被发明,人类的文明和知识才得以一代代被传承。直到近代,视频让人类沟通重新回归本源,同时突破了时间和空间限制将信息实现更高效、更广阔的传递。向海龙举了两个例子,比如旅游攻略,说明书等,对比之下,视频都是比文字更简单高效的沟通和表达方式。
另一方面,向海龙也分析了视频至今未能成为主流信息记录模式的四个难点:生产难——视频生产需要专业设备,存储难——需要很大的存储空间,传输难——传输速度慢和流量资费贵使得传输成本高,检索难——基于语义理解和字面匹配的传统检索技术难以在视频这种信息载体上直接应用。
而以上难点将随着技术革新正在逐渐突破,比如智能手机、云端存储、4G网络、wifi、AI的视觉识别及语音识别等各个领域的技术革新陆续出现,原来视频不能成为记录主流模式的障碍已基本被打破。向海龙认为,视频的便利性将让人们重新回归传统的沟通和表达方式,全民视频大爆发的时代已经到来,视频将充斥我们工作和生活的方方面面。百度将依托深耕多年的AI优势,赋能复杂视频生产和视频检索——百度AI将让全民视频时代更简单。
AI赋能视频时代,“生产+检索”更容易
向海龙表示百度AI技术在全民视频时代主要做两项赋能:生产复杂的视频更加容易,检索视频更加准确高效。向海龙提到,拍摄一个高质量视频,特效是必不可少的。而以前,视频中的高级效果大多是通过专业的后期制作实现的。现如今,通过AI技术,任何人都能轻易实现这些酷炫的效果。基于百度AI技术具备的人体识别、形体美化、人景分离、语音识别、语音合成等能力,他在现场分别演示了“瘦身”、“分身术”、“变声”的特效示例视频,呈现了百度如何让生产复杂视频更简单。而关于这类技术的应用,其实目前在一些市面上主打拍照的手机、短视频APP、视频通话工具中都有比较成熟的应用了,想必百度也有意切这块市场。
接下来,向海龙又介绍了百度AI如何让检索视频更准确高效的能力,通过对视频的全景扫描,利用语音识别、人脸识别、物体识别等技术完整分析视频中的内容,甚至给一个视频的每一帧画面打标签,将视频中的背景、人物、语言等信息进行组合,给每个视频生成一个独特的指纹,大幅提升视频检索的效率和准确率。这个比较典型的应用场景,比如DUEROS搜索播放视频的时候,不仅可以搜索到视频,甚至能够快进到视频中指定的某一帧剧情,将搜索做的更加深度。
向海龙还指出,当视频具有丰富标签,未来直接通过文字、语音或图像,都可以快速实现大规模的视频检索。
演讲的最后,向海龙表示时间的窗口非常近了。百度已经准备好跟合作伙伴们一起,全面拥抱视频时代。随着5G时代即将来临,人们的生活也将产生日新月异的变化,医疗和教育资源更均衡,游戏娱乐的体验和真实生活将融为一体,而人们的沟通方式也可能将全面进入视频时代,区别于原始人无法被记录的“声像”沟通,向海龙称之为的“新原始时代”,蕴藏巨大机会,百度希望和伙伴一起,在这个新时代创造更多价值。