【猎云网(微信号:ilieyun)】3月8日报道(编译:蔡妙娴)
编者注:本文主人公为Joaquin Quiñonero Candela,Facebook的机器学习专家。
收到邀请书时,Joaquin Quiñonero Candela意识到自己被邀请去领导公司的机器学习应用团队,为这家全球最大的社交网络插上机器学习的翅膀,Candela心里犹豫了。
倒不是说这位出生西班牙,自诩为“机器学习达人”的科学家未能看到机器学习将给Facebook带来的帮助,自从2012年入职以来,他见证了公司在广告运营上的转型,也就是用机器学习技术来提高付费内容的相关度和推荐效率。
Candela算是一个风云人物,他指挥自己团队的工程师们开发人工智能技术,虽然团队成员并没有相关基础。在他的带领下,广告部门越来越富裕。但是,Candela并不能确定这样一种魔力能在整个Facebook的大舞台上产生相同的效果。谈到公司的这一提拔,Candela说:“我需要有人告诉我这里面是有价值的。”
最后,带着怀疑,Candela还是接受了公司的邀请;时至今日,两年过去了,Candela回头看自己当初的迟疑几乎觉得荒谬。
怎么个荒谬法?上个月,Candela在纽约对一众工程师做了场讲话。“我要说一句大胆的话。”Candela提醒观众道,“没有人工智能,Facebook今天根本不会存在。或许你没有注意到,每一次你使用Facebook或Instagram的时候,都是人工智能在支持用户体验。”
去年11月,我前去Facebook的总部采访了Candela和他的部分团队成员,试图一探究竟,为什么人工智能突然成了Facebook不可或缺的一部分。当前,业内人士对该公司的关注主要集中于那支世界级的人工智能研究团队(FAIR),该团队领导人为著名的神经网络专家Yann LeCun。在谷歌、微软、亚马逊、百度、苹果等多位强势对手的挤压中,FAIR在数字神经网络方面取得的成就引人瞩目,它完善了计算机在看、听甚至对话方面的功能。
而Candela团队的工作,就是将FAIR的技术整合进公司真正的产品当中,或者从更广意义上讲,让全体工程师都能在工作中体验到机器学习的优势。
我参观的日子刚好是总统大选过去两天,也正是在那天,扎克伯格天真地表示,Facebook的假新闻居然是特朗普胜选的推手,简直“忒疯狂了”。这话好比往大火里倒汽油,本来怒气值就在飙升的用户们一下子炸了,对着Facebook破口大骂。虽然管控争议并非Candela的职责所在,但他知道,公司最终应对假新闻危机的办法,还得是机器学习。
眼下,Facebook开发了一种名为“神经风格转换”的技术,能将一幅画通过特定风格重新呈现出来,甚至是视频也能如此。Candela拿出自己的手机给我展示了一番,一点、一滑,他的照片立马变身梵高风。不过我所看不到的是,Facebook正在致力于升级这一技术,使其能够为手机本身所使用。
这并非Facebook的原创,苹果也在探索神经计算技术,不过相对来说Facebook面临的挑战要更大,因为他们无法控制硬件本身。“从最初着手到公开测试,我们只花了8个星期,还是挺疯狂的。”Candela说。
之所以能在短时间内完成这样一项任务,Candela说都是协作的功劳,这也是Facebook企业文化的重要内容。具体来说就是,Facebook的所有部门都互相帮助。Candela说,这项技术让Facebook从整体上更加强大。短期来看,Facebook可以更快地理解语言和文本;长期来看,它可以对你的所见所闻进行即时分析。“我们所说的,是几秒钟,甚至不到几秒钟,也就是即时。”Candela说,“我们是一个社交网络,如果我想预测用户对某个内容的反馈,那么我的系统就必须立即作出回应,对不对?”
Candela又看了一眼手机上的“梵高式”照片,丝毫没有掩藏骄傲的意思。“让神经网络接入手机,这就相当于把人工智能技术送到每个人的手上。”Candela说道,“这不是偶然发生的,而是我们在公司内部奉行的人工智能民主化政策。”他又补充道:“当然,前路还很漫长。”
Candela出生于西班牙,三岁的时候,父母带着他搬到了摩洛哥,在当地学校里,他学会了法语。虽然科学和人文学科的成绩都很优异,但Candela还是决定回马德里念大学,学他认为最难的专业:电信工程。这门专业不仅要求精通天线和功放等实体设备,还要对数据有相当的理解,在Candela看来,这简直酷毙了。
Candela构建了一个智能过滤器系统,用于增强手机在移动时的信号。他形容自己的系统是一个“婴儿神经网络”。2000年,Candela在丹麦度过了一个学期,也正是在这段时间,他对“训练”算法的兴趣愈加浓厚。在那里,他还遇到了机器学习教授Carl Rasmussen,后者在多伦多读书时曾是传奇人物Geoff Hinton的同窗。临近毕业之时,Candela面临着两难选择,是去参加Procter&Gamble的领导力项目,还是接受Rasmussen的邀请攻读博士,最终,他选择了攻读机器学习专业博士。
2007年,Candela来到微软研究位于英国剑桥的实验室。工作不久他就发现公司范围内存在的竞争:当时微软计划上线Bing,但需要在搜索广告的一个关键地方进行改进,让搜索引擎在用户点击广告的时候作出更精准的预测。公司决定在内部展开一场竞赛,获胜团队的解决方案将获得测试机会,团队成员更可以去夏威夷免费度假。共19支团队参与了这次竞赛,而Candela所在的即为获胜团队。于是,他公费去夏威夷玩了一趟,但是在公司所说的“大奖励”——也就是真正运用其解决方案上,Candela对公司的犹豫态度甚是着急。
接下来发生的事情让我们看到了这个男人意志力。他开始了一场“疯狂的运动”,希望公司给他一个机会。比方说在微软内部进行了50多场演讲,甚至造了一个模拟器来展示其算法的优越性。他偷偷摸摸跟踪执掌决策权的副总裁,午餐领取餐食时就蹭到人家身边,人家去洗手间他就蹲到旁边那个坑。他搬到了高管附近无人使用的办公室里,冷不丁地出现在人家面前,制造一切宣传自己的算法的机会。他说,公司既然承诺了就该履行,何况他的算法确实更好。
2009年,Bing搭载Candela的算法登场。2012年早些时候,Candela拜访了在Facebook工作的朋友,并在Menlo Park办公园区呆了周五一天。他惊讶地发现,在这个公司,大家不用苦苦追着高管后面跑才能申请到算法测试权,他们居然就这么去测试。周末过去后,Candela在周一又来到了这家公司,不到一个星期的时间,他拿到了offer。
加入Facebook的广告团队后,Candela的任务就是带领一支小组,实现广告推荐的进一步相关化。虽然当时的系统确实使用了机器学习技术,“但那些模型还不算先进,可以说很简朴。”Candela说。
另一位同期加入Facebook的工程师叫做Hussein Mehanna,和Candela一样,他也很惊讶地发现,这家公司在人工智能领域的研究竟如此落后。“当我还是外部人士时,我看到Facebook产品的质量,我想他们的人工智能技术一定发展地相当完善,但显然,没有。”
Mehanna继续说道,“几个星期的观察后,我对Joaquin说,Facebook真正缺乏的,是一个完善、世界顶级的机器学习平台。我们有的是机器,但缺乏与之配套的软件来帮助我们尽可能地从数据中学习到东西。”
建设机器学习系统必不可缺的一项要素就是高质量的数据,当然了,这正是Facebook的优势所在。当你的日活跃用户超过10亿人时,你可以收集到大量用于训练集的数据,以及无穷无尽的用户行为例证。这就让广告团队能够从每几周出一款新模型,进化到了每周出好几个新模型。由于最终目标是建设一个平台,让内部人员可以在此基础上打造自己的产品,Candela还确保了多个团队参与平台建设。
Candela的广告团队向我们展示了,机器学习技术对Facebook来说具有革命性的影响。“我们在预测用户点击和转化上的成功率得到了大幅提高。”
2015年10月,Candela成了新成立的AML团队的主管。
对于人工智能技术的运用,Candela认为主要体现在4大领域:视觉、语言、对话和相机效果。4大领域的结合,足以打造出一个“内容理解引擎”。
Candela说:“我们正在致力于推动人工智能的普遍化。随着内容呈现爆炸式增加,我们需要对它们加以理解和分析。”而解决方式即:打造通用化的系统,也就是在服务于某一项目的同时,也能给其他研究相关项目的团队带来便利。
Candela团队建设的平台让Facebook能更快地推出审查产品,在平台使用情况尚待观察的情况下,Candela说现在还不能透露公司通过算法推荐来减少假新闻的相关数据。
换句话说,虽然人工智能对Facebook来说至关重要,但它并不是唯一的答案。“我们所面临的挑战是,人工智能还处于婴儿阶段。”Candela说,“我们只是刚刚开始。”