• 0
右划科技CTO侯明强:内容领域对技术人员将始终充满挑战
统计 阅读时间大约8分钟(2884字)

2019-04-12 右划科技CTO侯明强:内容领域对技术人员将始终充满挑战

侯明强强调,算法或者工具先进,用户用得更好,数据规模就会上升,这会带来新的问题、新的交互,他表示未来这个领域将始终充满挑战。

【猎云网(微信号:ilieyun)北京】4月12日报道 (文/田甜、周效敬)

在由达泰资本管理合伙人方元主持、以“人工智能技术的成熟到产业融合”为议题的高峰论坛上,右划科技CTO侯明强就论坛议题发表了精彩观点。

侯明强曾在今日头条做视频研发工作,负责头条视频和西瓜视频的研发工作,目前右划科技开发了一个新的短视频和语音APP。短视频业务属于内容产业,侯明强认为内容是与AI结合最深度、最到位的一个产业。

关于AI在内容产业落地的场景,右划科技主要体现在两点:第一是个性化推荐,使用户在单位时间里得到最大的信息收益;第二是关于隐私、版权以及对儿童的保护等。

侯明强发言_副本.jpg
右划科技CTO侯明强(左二)就论坛议题发表精彩观点

侯明强表示,当技术水平提升之后,应用场景又会带来一些新的东西。新的App里又有语音的内容,用户有很多下沉市场人群,他们的语音带有相当程度的方言,对这些内容的识别、理解就比标准的画面有了很多新的技术难度和挑战,到现在还在花非常大的力气突破。

侯明强坦言,随着应用水平越来越高,用户的使用越来越符合自己本身的操作习惯,这也带来新的挑战。

侯明强表示,每个领域都需要有不同的模型,如果该模型什么都能识别,这个模型准确率不会太高,对某些特定领域不够敏感,各种预测的阈值都不会太好。因此,针对特定领域的问题,需要单独设立新模型,分别处理样本数据,进行数据的标注、采集,进行大数据计算,进行分别训练和优化。这些领域都很困难,需要一个个去做。

内容领域,包括后面的软件算法本身,在整个AI各领域走得比较靠前。侯明强再次强调,算法或者工具先进,用户用得更好,数据规模就会上升,这会带来新的问题、新的交互,他相信未来这个领域将始终充满挑战,对于技术人才来说,它是最有挑战的领域。

侯明强金句_副本.jpg

以下为侯明强论坛发言实录,经猎云网整理删改:

方元:按照惯例,先请各位嘉宾介绍一下各自的所在机构和你们本人的情况。

侯明强:大家好,我叫侯明强,我之前在今日头条做视频研发工作,最早的头条视频和现在的西瓜视频是我做的。一直从事视频技术领域的工作。

鉴于之前的经验,我们现在又做了一个新的短视频和语音APP。我们公司的短视频业务属于内容产业,我认为它与AI结合的最合适,也是最深度、最到位的。内容产业有几个特点:

首先,它本身就是数字化的,它已经没有很多信号需要采集,从原来物理的数据转化成数字信号这么一个过程。

内容产业第二个特点,内容非常丰富,非常多。像抖音快手每天上传的数据达一千万量级,对数据规模超大的情况,统一优化也能起到比较好的作用。

AI在内容产业这边落地的场景会比较具体和直接,我们公司主要在两大部分:第一是在个性化推荐上,我们认为个性化推荐非常重要、非常核心。刚才说过的内容很多,必须要给用户一个选择,不管什么场景,可以把我们的产品理解成阅读的助手,过去早晨起来看新闻,现在早晨起床打开手机看内容,这时候手机和APP成为一体就是阅读的助手了,这个助手要给你自己最喜欢的内容,才能让你在单位时间里得到信息的收益最大。

个性化又特别关键,比如欧洲人和东亚人体内DNA的组成确实不一样,我们有很原始的智人的基因,东亚人和欧洲人尼安德特人的比重确实不一样,非洲人绝大部分体内没有尼安德特人的基因。从DNA推断出人跟人真的不一样,但是天生有差异,个性化一定是永恒的,更符合人性的诉求。所以说个性化推荐,在内容产业适应用户的需求,这是特别关键的问题。

我们的应用场景主要有几个大的方面:

隐私。大家很重视隐私保护,要做隐私保护的话,前提是要能识别出来这个内容涉及隐私,以提供更多的工具来保护这个隐私。

版权。从内容识别涉及版权的问题才能对它进行保护。简单说,有一个机构有保护版权的诉求,针对海量用户上传的体系,也需要识别出用户上传的会不会是他的二次转载甚至是盗版侵权的内容,这个需要识别出来。

对儿童的保护。我们也非常重视,我们国家也有很多内容缺少分级,行业也想建立这样的体系,色情、暴力、血腥的内容,不希望自己孩子看到,要识别出哪些内容不适宜儿童,哪些不适宜在公众上面进行传播。

低俗。最近在欧洲和美国Facebook上,有很多内容传播不适宜的东西。过去,大家都认为这个平台要尽可能地兼容并包,给更多人展现内容的机会,但是整体的社会文化在一个特定的文化群体里还是希望有一些内容。

方元:您原来做短视频,现在也是做短视频,AI在海量数据的基础上做精准化推荐。

侯明强:做推荐和内容识别,主要是这两大领域。

方元:我们自己在过去几年看AI项目的时候,我们很好奇,到底您这个生意是什么样子的?你们这个AI到底跟您的生意有什么关联?用在哪方面?刚才侯总提到,短视频里面用于海量数据的筛选,个性化的推荐等方面,侯总关于AI在您这个行业的应用还有其他补充吗?

侯明强:没有了。

方元:从投资机构的角度,过去12个月,行业有哪些你们看到的进展,未来12个月,又会有哪些新的突破?应用的过程当中,你们所在行业的现状有哪些是帮了忙的,有哪些是有挑战的?视频这边对算力有时间要求?就这个话题请各位再展开讲一讲。

侯明强:我简单介绍一下我们内容领域的AI落地情况。其实我们在2015年做今日头条头条视频的时候,在内容安全领域,把AI应用进去,在深度学习这样强大的计算工具帮助下,我们实施比较顺利。为了去掉有害的内容,需要大量人工审核员去做,这对每个企业都是一个烦恼,甚至对于审核员本身也是高强度的工作。大家不太愿意做这个工作,他们有这个需求,我们把内容识别AI化,当时是比较成功的。

当技术水平提升之后,应用场景又会带来一些新的东西。我们到做新的app的时候,我们又有语音的内容,我们的用户有很多下沉市场的人群,他们的语音带有相当程度的方言,对这些内容的识别、理解就比标准的画面有了很多新的技术难度和挑战,到现在还在花非常大的力气突破。

大家都觉得讯飞在语音上做得不错,相对于通用的、更标准的普通话,它的准确率比较高。在内容领域,首先是方言的差别。第二个是针对几个问题,每个领域都需要有不同的模型,这个模型如果什么都能识别,大杂烩,这个模型本身准确率就不会特别高,对某些特定领域不够敏感,各种预测的阈值都不会特别好。

因此,需要针对特定领域的问题,每一个都需要单独设立新模型,需要分别处理样本数据,进行数据的标注、采集,进行大数据计算,分别训练和优化。刚才我们提到的这些领域都很困难,都需要一个个去做。

个性化推荐整体进展比较顺畅。我们在今日头条之前有比较多、比较好的实践方式,现在主要还是在应用的数据规模上去做,但具体应用场景仍有新的挑战。比如,我们的APP可以上下滑动、左右滑动,喜欢的视频可以多看,不喜欢可以滑过去。像快手APP是双瀑布流,有非常明确的信号,告诉你这是正样本还是副样本,等于你要猜用户真正的喜好是什么。

这就取决于你对用户的理解和对数据的把控,这样才能够做得很好,这也是挺难的一个挑战。随着应用水平越来越高,用户的使用越来越符合自己本身的操作习惯带来新的挑战。

方元:类似于语音这样的新功能需求,对算法的模型带来的要求。

侯明强:还有交互方式。

方元:在座各位都是AI各个行业应用当中的领先行业,我们一起展望一下诗和远方,有哪些行业要素、技术进步、人员进步会影响到你这个行业在AI方面的应用。

侯明强:内容领域,包括后面的软件算法本身,在整个AI各领域走得比较靠前。算法或者工具先进,用户用得更好,数据规模就会上升,这总会带来新的问题、新的交互,未来我相信这个领域始终充满挑战,对于技术人才来说,它是最有挑战的领域。

我们现在的产品主要围绕手机,人体第二“器官”,一个智能的全方位的助手。因为获取信息是人永恒的需求,自己的一些想法,可能是场景化的,阅读助手能够跟着你到处走:在厨房的时候,厨房的冰箱上,这个助手也可以显示出来;坐车或做事情的时候,不需要主动掏手机。随着5G带来更快的网络,我们可以畅想一下多屏时代,会有那么一天的。

方元:所以,5G有可能让短视频无处不在。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×