• 23
腾讯副总裁姚星:揭秘腾讯人工智能规划和18年来的技术细节及原力
统计 阅读时间大约10分钟(3670字)

2016-10-25 腾讯副总裁姚星:揭秘腾讯人工智能规划和18年来的技术细节及原力

原力就是我们改变世界的力量,是每个人心中的追寻“自我主宰”梦想。

【猎云网(微信:ilieyun)】10月25日报道

今天,腾讯副总裁姚星在 TEDx漕河泾“科技的原力”沙龙活动中首次向外界揭秘:从QQ、QQ空间到微信,甚至是探索中的AI,腾讯18年来的技术细节及原力。

他说从腾讯的QQ到QQ空间再到微信便是“窄带”到“宽带”再到“移动互联网”的转移,每次的科技变革后面都推动了互联网应用的发展,使得人们的生活品质逐步提升。每个时代也诞生了极具影响力的互联网产品,它们的出现改变了人们的生活方式,也深深的影响了我们这代人的生活。

他还表示,腾讯的使命是立志于要打造一个“通用AI”,让真正的人工智能深入到我们的生活中去。而人工智能的兴起是大数据、云计算科学进步的产物,也是人类对未来世界向往的必然。

以下为姚星演讲全文:

大家好,我叫姚星,来自腾讯,在腾讯工作了12年。

最初,同事告诉我要参加TEDx,让我讲一下腾讯背后的科技的原力,当时我不知道该讲什么,因为我们做的事情都很普通也很平凡。

仔细想来,虽然我们的工作平凡、普通,但平凡中会折射出它的与众不同,今天我就和大家分享一下腾讯认知的“科技的原力”。

大到无穷的能力

原力是什么?电影《星球大战》的定义是“一种极大的能量”。

首先看一组数据:10000亿,100亿,4小时。

10000亿是我们一天中全球IM的消息总量,如果我们把它换算成书籍的容量,它大概是1亿册,相当于我们国内最大的中国国家图书馆藏书量的5倍。

100亿是我们一天中全球的图片分享总量,假设一台数码相机一秒钟拍一张照片,它需要用300万年才能产生100亿的照片,如果我们把这些照片连接起来,它可以绕地球50圈。

4小时是我们平均每天上网的时长,这个时间已经超过了我们观看电视的时间。

过往的20年是信息时代快速发展的20年,信息产业的发展远远超过了其他产业的发展。它经历了3个阶段:分别是窄带时代、宽带时代和移动互联网时代。

filehelper_1477392615409_39

窄带时代由于网络的传输效率比较低,主要解决的是沟通问题,那时的我们无需再像古人那样“飞鸽传书”或者通过传统的邮件进行通信,我们可以通过internet实时传输我们的消息,我们可以结交更广阔的朋友,无论身处天涯海角,只要能连接上internet,信息总是触手可及。

随着基础网络设施能力的提升,网络传输的效率和容量越来越大,我们进入了宽带时代,在宽带时代,人们在internet上的诉求不在是简单的消息传递,更大的诉求是信息分享,“人人为我,我为人人”,人们在朋友之间分享快乐,总结教训;人们在更广阔的互联网世界里帮助他人,或者寻求帮助;人们在熟悉的,不熟悉的,认识的,不认识的人中传递着信息,分享着信息。

随着3G/4G移动通信网络的发展,智能手机的普及,我们进入到移动互联网时代,人们不需要再在指定地点,特定时间段连接信息世界。人们可以无时无刻,随时随地的触达信息。

从“窄带”到“宽带”再到“移动互联网”,每次的科技变革后面都推动了互联网应用的发展,使得人们的生活品质逐步提升。每个时代也诞生了极具影响力的互联网产品,它们的出现改变了人们的生活方式,也深深的影响了我们这代人的生活。

QQ→QQ空间→微信

窄带时代的QQ

QQ是窄带时代极具代表性的产品,在那个网络传输效率比较低的年代,大家还记得Google的首页吗?Google的那个简洁页面,为什么如此简洁?

Google诞生于1998年,也是身处窄带时代,你会发现它的首页字节大小是小于1024的,为什么要小于1024字节,因为以太网的MTU(也就是最大传输单元)是1024,Google为了让用户在一个网络包中传输完成,所以它把页面大小降到了1024以下。这是一种极致传输的表现。

QQ的背后也同样蕴藏着诸多类似的极致追求,早期的QQ客户端安装包是几十k大小,这是为了让用户更快下载,更方便使用。

QQ的传输通信是修改了底层TCP/IP协议栈的,这个技术非常难,因为需要改linux kernel,之所以这样是因为QQ希望传输协议既具备TCP的丢包重传能力,又要具备UDP的高性能,这样QQ可以在保证传输信息的同时又可以维护更多的用户网络连接,在那个年代QQ的单位后台处理能力可能是其他同类产品的10倍以上。

宽带时代的QQ空间

QQ空间是宽带时代的杰出代表产品,2013年Facebook的公开数据显示Facebook日上传照片数3.5亿,照片总量达2500亿。

今天的QQ空间日上传照片数超过5亿,照片总量达6000亿。和Facebook同一级别!

照片的存储是宽带时代极具挑战的技术难题,它不光是海量存储的问题,还是有社交平台带来的海量用户访问的问题,因为你的照片不再仅仅是你自己访问,你的朋友也会来访问,它带来的性能开销是几十上百倍的。

存储的难题除了性能还有成本,极致性能下的极致成本。

QQ空间的存储系统是一个基于物理硬盘的全新存储系统,它是一个非常有挑战的技术,它需要对文件系统的inode索引进行重新的设计,使得存储系统仅能充分的使用磁盘空间,又能很好的管理照片这样的“小文件”。目前QQ空间针对照片的存储系统性价比应该是业界领先的。

移动互联网时代的微信

微信是移动互联网时代的超级APP,它不仅是一款IM,也是一款SNS平台,同时能进行内容分发,还是智慧城市的入口。它不仅能聊天,分享朋友圈,还能打车,购物,交水电费,甚至预约看病挂号,它是一款超级APP。

超级APP肩负着超级责任。有数据显示,Amazon的AWS服务宕机持续时间超过40s,Slack、Netfilx、Pinterest等多款APP出现无响应。

大家还记得去年的天津滨海新区的爆炸吗?就在爆炸的中心区域有我们的微信的数据中心,那次的事故并没有影响的微信的稳定运营,为什么?

因为很快我们把微信的服务切到上海、深圳的数据中心去了。因为我们深知微信的每次闪断不仅仅是一条消息的延迟到达,不再是查看朋友圈时的缓慢,更重要的是你吃晚饭后结账时的困境,也可能是明天无法及时看病的苦恼。

微信的后端采用了全球分布、用户就近接入的架构,在数据的一致性,网络的可靠性做出了极多的容错、容灾设计,这种极致架构使得微信不仅能应对人祸,还能应对天灾。

filehelper_1477392635307_73

未来世界向往的必然——AI

信息时代的科技原力是“摩尔定律”,摩尔定律提升了基础网络建设的进程,由此诞生了相应时代的互联网产品。

2016年是AI起源Dartmouth会议的60周年,人工智能在过往的60年发展中几经沉浮,起起落落,在今年散发出璀璨的光芒。人工智能的兴起是大数据、云计算科学进步的产物,也是人类对未来世界向往的必然。

什么是AI?

AI是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。AI包括:计算机视觉、语音识别、自然语音处理等类似人类的感知、认知智能。

当下很多人认为AI就是机器学习,或者说是深度学习。这是很狭义的。

机器学习是AI的核心算法。确切的讲AI和机器学习的关系是这样的:AI = A->f(x)->B,机器学习是人类智能行为的一种拟合函数。

目前的AI总体来讲还是一个非常初级的阶段,虽然我们在某些“感知”智能上有些突破。

比如我们在计算机视觉上的人脸识别能力,语音识别上的速记能力等垂直领域已经接近或者超过人的平均智能水平。但是这些相对于一个人的综合智能来讲还非常狭窄,本质上我觉得还是算法本身还需要更高维的突破,而不是简单的演进。

比如我们针对视觉的AlexNet到VGG再到现在的ResNet,每次算法的演进还只是停留在更深的神经网络,更复杂的神经网络连接的设计上,通过这样复杂的神经网络学习更多的样本特征来更好的拟合人脑的“感知”。

再比如“认知”智能的自然语言处理,但是面对这种语言序列问题,尽管我们的神经网络从早期的RNN演进到LSTM,再到现在的Attention Model,但至今为止机器还无法完全胜任这种复杂计算。

AI的未来

人的智能是一个非常高的起点,人是经过数十亿年生物进化的过程,即便是新生儿,从他一出生开始他的智能起点就非常高,人认识新生物只需要少量样本就能学会。

但目前的机器学习并不能做到这样,我们无论设计多么领先的神经网络模型,都需要重新训练数据样本,并且需要大量数据训练样本的训练拟合。

不过,我认为目前的本身的机器学习方法是正确的,因为我们学习的不在是表面现象而是深层次的特征。这就犹如人类学习鸟儿飞翔不是仿照鸟一样粘上羽毛,来振翅飞翔一样,本质上的飞翔原理是空气动力学和流体动力学。

AI的核心算法如何突破?

如果类比人,我想需要在3个方面进行突破,分别是创造力、归纳总结能力和举一反三能力,对应到机器学习就是“强化学习”、“无监督机器学习”以及“迁移机器学习”。

filehelper_1477392654302_18

“强化学习”已经通过deepmind在Atari和AlphaGo上证明了巨大成功,AlphaGo之所以厉害,是因为通过强化学习自对弈产生了大量的非人类棋局样本,通过这些样本再来进一步学习提高,未来我们需要采用“强化学习”创造更多的数据。

“无监督机器学习”至今为止没有好的“聚类”算法,也就是归纳总结能力,人类能给表面非因果关系总结出很多原理,如“三点确定一个平面”,“惯性定律”等。这是一个很强的高维抽象能力。未来的无监督机器学习需要在这上面进行突破,通过少量的样本,站在前人基础上的归纳总结。

“举一反三”也是人的一个重要的基本能力,通过学习了“下围棋”,快速的推演到“下象棋”。这需要“迁移机器学习”在模型迁移上的突破。

信息时代的科技原力是摩尔定律,AI时代的科技原力是“算法”,而且这种算法是有如人类进化一样,从“单细胞”到“多细胞”,再到“智能”的演进过程。

AI的未来是什么?

filehelper_1477392663252_22

腾讯的使命是立志于要打造一个“通用AI”,让真正的人工智能深入到我们的生活中去。

我想AI的未来不仅仅是给我们提供更加安全、更加高效、更加便捷的智能工具,还要帮助我们实现每个人心中的那个”大白“,那个超级英雄,使得我们的小朋友更加的“被理解”,他们不会由于父母的不在身边而缺少陪伴;使得我们的成年人更加的“被保护”,他们不会由于危险的工作而使得自身安全得不到保障;使得我们的老年人更加的“被照顾”,他们不会由于在偏远山区而得不到及时的治疗。

无所不在是AI的未来。

从18世纪的第一次工业革命开始,人类的每次进步都源于科技的进步。而当今的互联网时代,从窄带到宽带,从移动互联网,再到当下的AI无不是一浪又一浪的科技变革,这种科技的进步也犹如潮汐一样一次次越来越猛烈的推动着我们进步。

我有时会问自己:是什么样的力量在推动着人类对未知世界的探索和渴望,是什么样的力量在推动着科技的进步?

我想答案是“科技的原力”,“原力”是什么?

原力就是我们改变世界的力量,是每个人心中的追寻“自我主宰”梦想,是人们仰望星空的感觉。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×