【猎云网(微信:ilieyun )北京】11月9日报道(文/张宁)
在搜狗上市前,搜狗CEO王小川和搜狐董事局主席张朝阳接受猎云网在内的多家媒体连线采访。对于人工智能,王小川认为搜索公司本身就是擅长做AI,围绕语言为核心使得人机的交互更加的自然,以及让机器更加聪明,能够对于网上这样一种知识进行计算,所以搜狗的人工智能称为“自然交互”和“知识计算”。
以下为连线实录:
编辑:小川,现在的心情如何,能不能用几句话形象表述一下?这次敲钟带了哪些人,为什么?
王小川:搜狗从2003年开始做搜索到现在已经经过14年的时间。我们做得非常扎实,现在搜索引擎已经取得了17.8%的市场份额,而输入法到现在每天有超过4亿的用户。有这样扎实业务的基础,我们认为往下能够继续做更多创新,不管是从对用户的服务还是收入利润上,都是一个非常健康的状态,有这样的一个突破和积累,往下还是能够发展得非常好的。
心情当然是非常激动。IPO是对于过去14年工作的总结,更是里程碑。搜狗已经经历了很多里程碑事件,包括我们重新定义了输入法,在搜索上也取得了一定的市场份额,IPO对于我们来讲是一个契机,能够整理过去,开始新的里程。
编辑:请问张朝阳先生,搜狗从搜狐的部门到独立上市,您怎么看待搜狗这些年的发展,对小川是怎样的评价?
请问王小川先生,招股书里面提到腾讯给搜狗带来大概有38%搜索的流量,您怎么看待和腾讯的关系,未来如何提升搜狗自身独立造血的能力,在三年之内赶超百度搜狗靠什么?
王小川:搜狗从2003年开展业务,到2006年发明搜狗输入法,包括搜狗搜索在2000年之后已经取得了很明显的进步。腾讯把我们作为一个很好的合作伙伴,选择我们给他们提供通用搜索的服务,以及给我们提供了很多支持。我们得到腾讯的支持,有30%多的流量是从腾讯过来的。最近两年时间,包括手机厂商和其他合作伙伴也对搜狗非常认可,其间我们的流量取得了巨大的提升。行业蛮希望有另外一家搜索引擎公司去打破垄断者的位置,现在它们很开心的看到了有这样一个挑战者能够重新搅动中国搜索格局,搜狗自身拥有完整产品技术创新能力。因此在往下两年时间里面,搜狗在输入法和自有搜索的流量,以及重新对搜索定义理解上会有突破性的发展。
张朝阳:小川在少年时期就是计算机的天才,获得国际信息学奥林匹克的金牌。搜狗整个团队是技术特别牛的团队。我们非常幸运的是,14年来精抓技术和产品,使得搜狗技术和产品做的很棒,符合今天的市场需求。搜狗输入法的发明其实是一次重要突破,和以前紫光和微软的输入法不同的,这个输入法是把天下所有输入行为和文字行为都用搜索引擎进行研究之后做的,这里面体现了大数据的应用。
还有就是把搜狗拆分,创造出来这样一个实体,小川团队他们有创业精神,一直保持创业文化,包括后来腾讯加盟,他们也有很大资源的提供,贡献了搜狗到今天的成功。希望基于人工智能的技术,搜狗能降低人机沟通成本,重新定义搜索的概念。
编辑:搜狗现在上市了,之前有四大业务条线,更多还是搜索在整体的收入各方面比例都是最大的,现在上市以后咱们给投资者讲什么样新的故事呢?还是原来以高份额的方式发展吗?现在境外投资人对咱们的评价和看法是什么?
王小川:输入和搜索是人的两个最基本跟信息打交道的通道,一个让你表达,让机器听懂你说的话;一个是让你获得信息。沿着这个轨道,在今天这个AI时代,有巨大可以突破的空间。输入不是简单的敲字,可以用语音,能够理解你在说什么,其实是在做人机交互——现在做了非常多的技术积累。而搜索之前是寻找链接的过程,随着技术的发展,它会逐步具备提供推理、知识、答案的能力,会变成一个问答的引擎。最终的机器可以跟人深度交流,进行互动,提供答案和知识。机器会变成你个人助理,一个虚拟的百科知识全书。因此在这个世界中,不要小看输入法和搜索今天的样子,它们在今天的技术发展趋势里面有非常重要的位置和使命。
投资人对搜狗现在有两方面的理解,一方面大家看到了腾讯对搜狗的认可和加持,这是对我们之前肯定;也有一些投资人开始理解输入法的意义——对西方这些投资人、大众而言,输入本身不是一个瓶颈问题,当他们一旦理解中文输入的意义之后,会发现这会有更大的机会,这是中文的困难,我们解决它反而能够带来一个更领先的机会,可以实现跨越性的发展。
编辑:有两个问题。请问张朝阳先生,搜狗业务上市对后续搜狐整体业务模式发展模式会有哪些影响?
请问王小川先生,从2016年到2017年搜狗业务提升很快,这其中人工智能在当中扮演怎样的角色?
张朝阳:搜狐和搜狗,搜狐是搜狗的大股东,在财务上搜狗的上市和业绩良好的表现将会直接反映到搜狐的财报里面,尤其是盈利。这对搜狐是一个利好的消息。整个搜狗的技术文化,在最近几年正在影响搜狐,搜狐产品技术团队也在提升,近几年提升很大,在新闻、信息流、视频领域都有所作为。在大数据方面,搜狐发挥内容的优势,而搜狗又有大数据引擎和用户画像各个方面的优势,其实有很多合作的机会,去创造出不一样的信息流,或者独特的信息流的机会。
王小川:搜索公司本身是AI公司,有能力处理大数据,有很高的计算力,应用最前沿的算法,深度学习到来之后我们第一时间就可以把这样的技术转化为我们的生产力。所以我们一方面有非常清晰的发展roadmap,我们在这些技术里面不仅取得领先,而且用到我们产品里去了。
比如语言识别,在深度学习领域最简单的技术,搜狗因为有搜狗的输入法,不仅输入文字,在语音输入上每天都会处理超过2亿次的语音请求,这在平台里面也是最大的工作。而且语音输入不仅可以用于输入法,本身也可以使得搜索变成语音的搜索,我们很自然的把这种技术用到了我们产品场景中去。
还有机器翻译,现在我们的输入法可以让用户敲中文、说中文的时候能够直接输出英文的内容。一些朋友在海外工作已经体会到这个产品的便捷。在搜狗搜索引擎中输入中文的时候有英文搜索的频道,可以获得全球英文检索的内容,并且实时的翻译成中文,不管是摘要还是全文,都可以进行中文阅读。
更远一点,在自然语言理解里面,这是AI技术最前沿的领域,我们也投入非常多,搜狗输入法和搜索天生是和语音打交道的,我们的搜索目前已经有5%的问题,不管你用文字还是用语音问问题的时候,都可以直接指给你答案。未来我们将不断提升问答中精准答案覆盖的能力,问答会是未来搜索的形态。
张朝阳:做一个比喻的话,从输入对语音的识别、图像的识别计算,相当于我们大脑的延伸,耳朵听觉和眼睛视觉的延伸。搜索引擎AI技术带来更加智能的回答和思考是大脑前额叶和海马区的延伸,对自然语言和人类认知的挑战是AI最为领先的。整个搜狗的输入和搜索,以及我们要重新定义搜索,来重新使得我们人类的大脑获得一个延伸。前所未有的,人类未来将会根据AI的发展,在机器帮助下人类变得越来越聪明,解决人类面临更多的问题、挑战和机会。
编辑:搜狗的招股书中多次提到人工智能这个关键词,而且BAT已经在人工智能上做了大量的布局。搜狗要重新启航,未来在人工智能这块的新的产业应用以及人才引进方面有哪些具体的规划?
王小川:搜索公司本身就是擅长做AI的,相对于竞争对手,用它1/10、1/20的人就能够使得我们在市场份额产品技术中取得不断的突破,关键点是我们有清晰的方向以及使用的场景。输入和信息获取,不要小瞧它今天只是一个“输入法”或者“搜索引擎”这么两个词,这是人本身信息输入、输出的通道,甚至是一个操作系统。《黑客帝国》中的Matrix最终其实就是整个机器接管了人信息的输入、输出,在这个领域里面人工智能能够帮助我们改善人和机器本身交互,能够听懂你,能够给你合成的信息,包括理解你的意义之后,在背后做强大的推理和计算,因此在这方面我们已经有非常清晰的场景,AI技术可以使得我们产品有巨大的升级和突破。
像Charls讲的一样,我们会对搜索引擎重新定义,我们重新定义输入法,今天我们已经再次重新定义输入法的未来,在信息输入输出里面以语言为核心,带来了更方便的人机交互和知识的计算,延伸辅助人的视觉、听觉以及辅助大脑的工作,这是我们现在非常有利的地方。现在也有很多公司在讲人工智能,有很多这种技术布局。但是搜狗在这方面,不管是参加国际比赛,我们拿到翻译、对话的第一名,更重要的地方是我们已经开始在我们产品里面有节奏、突破性的使用了,这是在国内以及全球领域里面都是少有的,这也是输入和搜索这个场景带给我们巨大的机会。
张朝阳:我的理解,如果说一些竞争对手推出一些硬件或者什么智能的东西,他们把人工智能用在了动作、空间的转换和控制方面,而搜狗的人工智能是直接来延伸人类的大脑,是解决你的思维。
王小川:比如说现在一个设备能帮你播放音乐,或者帮你开个灯、关个灯,只是用这样的设备控制它,并不是真正我们理解的智能服务,只是交互更加自然,这件事情上我们本身有足够的积累,更重要的是以搜索为核心对知识的理解,以语言为核心对知识的积累。语言是人类几万年来发展出来独有的能力,是对整个世界的抽象,像我们对话里面就有思考和知识,包括大家读书的时候,也是用语言可以让你最快的获得这样一种信息。因此语言是搜狗发展AI的核心。
张朝阳:实际上在深度学习对图像识别和语音识别这是一个小的例子,更大的挑战在与自然语言的理解,语言太离散了、太难算了。
王小川:大家觉得目前AI能做的事情已经很惊艳了,能够把人的语音翻译成文字。其实这是简单的事情,这个我们已经突破了,下一步要突破的是对语言理解的本身。
编辑:想请问一下。从PC时代三级火箭战略发展到目前移动端的AI战略,贵司整个发展过程中您印象最深刻的事情是什么?
目前AI在公司内部属于一个什么样的位置?上市以后AI的产品落地方面有什么亮点?
王小川:搜狗对于这样的技术概念很少提,但却是用得很深,比如说输入法之前的大数据的应用,输入法就是大数据的产品,输入法上后来是云计算的产品,当你敲击复杂的拼音串的时候客户端的能力已经不够了,客户端只有80兆的存储能力,云端上已经有了上T的存储、计算的能力。再到后来输入法的皮肤,也是中国最大的众包的社群,我们用的10万款以上用户上传的皮肤,本身搜狗在技术理念、产品理念是有足够大的延伸,之前提到的三级火箭是蛮自然的选择,我们知道怎样把这个技术变成最终的产品服务。
三级火箭确实是PC时代的产物,在移动时代里面我们可以看到,AI的战略直接使得你的输入和信息的获取从一种工具变成一种服务。工具是你让它干嘛它就干嘛,输入法你敲字的时候,你敲“京东”不会给你“淘宝”,未来输入也好、搜索也好都会变成智能服务,会延伸你的思考,帮助你选择、判断。因此我们的智能服务核心是由工具向服务的转化,这是我对于AI的理解,机器做决策。
张朝阳:尤其在垂直领域,应用回答问题会非常精准。
王小川:语言是最难的事情,大家都知道图灵测试,如果两个人能够进行对话,分辨不出是人还是机器,在各个领域里面,我们认为机器具有了强人工智能或通用人工智能。这个时代离我们还有距离,当我们没有办法在所有领域做到的时候,就选择垂直领域,比如说医疗、法律,在这些领域里面可以通过大数据的使用,包括像Deep learning的使用,还有像知识图谱的使用,以及对于医疗文献、医疗病例数据、法律判例,在这些垂直领域学习之后,它就可以像医生、律师一样产生智慧的服务。
张朝阳:垂直领域这种结构化数据和大量数据存在,将会使得搜狗成为你的私人医生、律师或者法律顾问。
编辑:搜狗在招股书上写关于垂直领域的竞争,BAT以及今日头条,它在信息流上投入都很大,您怎么看待这一块对搜狗流量、收入上的影响,搜狗怎么应对这种竞争?
搜索公司的广告营收占比都很高,怎么寻找广告业务之外的收入来源,这一块怎么考虑?未来搜狗想象空间在哪里?
张朝阳:信息流和做搜索或者提一个问题是同样一个人在有事干和没事干时候的两种行为,都是对时间的分配。信息流是脑子里没有清晰的想干什么的时候就滑动着去看。我们已经开始做,搜狗在这方面很有优势,输入法的数据量是非常大的,我们对人的用户画像是非常了解的,在对于人群的需求上是很有优势的。
而在搜索必须是脑子里清晰的说想知道什么,落实到输一个关键词。但是未来你脑子里不用很清晰,你说一句话搜索引擎就可以帮你回答问题了。有时候你会把看信息流的时间分配过来,可以更具体地在生活中进行一些事情的处理,而不是说无聊地使劲看视频、使劲滑动信息流。当然两个方面都是很重要的,也都是我们都是要做的。搜狐在内容提供上是有优势的,搜狗在技术上有优势,双方有合作的潜力。
王小川:关于收入的问题,我们有一个简单的理解,本身这样一种商业收入是创造用户价值自然的延伸,我们处于行业搜索是机器帮助人做选择、决策,机器帮助人选择决策过程中自然就有商业的模式,搜索是你输入关键词之后机器帮你做选择,信息流是你不知道想要什么的时候,机器帮助你画像帮你做选择,是这样的一种商业模式。
因此长远来看,AI时代间AI的巨大应用就是让机器变得更聪明,更能够帮人做选择判断,垂直服务能够像你私人医生、一律师一样工作,那就是机器又上升到一个新的地步,不是给你什么链接,而是对于支持有更多分析和推理,帮助你做出判断、选择,这里自然蕴含着巨大的商业价值。
张朝阳:我理解对于信息流这些东西,一方面商业模式是中小企业信息流广告或者搜索关键词的定价广告,但是当你对垂直领域提供了特别有价值服务的时候,你已经给用户提供了更多的价值,就像网络剧视频要收费一样,其实垂直领域的医生和律师是可以收费的,就是月租。
王小川:中国互联网发展在某些领域已经远远超过了美国,比如说像支付,这个时代已经远远不同了,以前我们很苦恼,我们的服务是没有办法相互收费的,只能做广告的模式,先从视频开始,然后到网上搜索的,现在是深度服务,有机会跟个人去收费。
编辑:请问王小川先生,您觉得在AI的布局多长时间会为搜狗带来回报,随着AI技术的发展,搜狗和百度的差异是不是会越来越缩小?
王小川:我们AI路径很清晰,是围绕语言为核心使得人机的交互更加的自然,以及让机器更加聪明,能够对于网上这样一种知识进行计算,所以我们称为“自然交互”和“知识计算”,使得我们的服务更加智能,这是我们很清晰的布局,其实想象力已经远远超出我们今天的搜索或者一个输入法,成为你个人助理。
我们的路径里面提到的“自然交互”和“知识计算”已经持续在投入,像2011年我们做语音识别,这已经充分运用到我们产品中里去了。包括翻译、对语言的理解,垂直领域的知识的积累,本身对我们产品就是在逐步进行升级,比如说现在的搜狗搜索里面,我们在医疗方面就不是直接给广告,我们力所能及地给你提供权威的信息和答案,而不是先给提供医疗或者普通的内容。这使得我们健康相关的内容占比比竞争对手高出了1倍,这部分的这种需求我们仍然不够满意。现在只是给你信息,对老百姓来讲还是医疗是个特别专业的领域,往下我们会继续升级这样的能力,使得只给你权威信息变成像医生一样给你做判断、做建议。所以,搜狗这个场景已经捕获了用户在日常生活当中非常广泛的问题,有医疗的问题、法律的问题、教育的问题、娱乐方面的问题,在每个场景里面进行深化的时候都能够延伸出来更加智能的服务,所以这样的场景是作为我们的母体,所以我们不用着急找客户在什么地方,现在很多做医疗的公司在想怎么拉流量,而我们现在是用户已经来了,我们只要努力把服务做到更好。
编辑:搜狗以后会不会发展金融这方面相关的业务?
王小川:我们在这方面有布局的想法,今天的时代,我们对人的消费已经开始进行数字化、信息化,信用卡发展到现在本身也是在金融服务里面最入门级的应用,能够对用户提供金融上的借款、服务,往下我们会探索小额贷款到保险能够进入到这种行业,搜狗有一天超过4亿的用户在使用,覆盖了中国接近一半的用户每天在用我们的产品,产品里面积累了大量的数据对用户进行画像,这样的用户规模和对用户深度的的理解,我们是有能力对于用户的理解和服务里面做巨大延伸的,在信息的处理里面我们可以尝试更多的方向。