【猎云网(微信:ilieyun)北京】11月16日报道(文/王亚楠)
11月14日-16日,GET2017教育科技大会在北京国际会议中心举行,英语流利说创始人&CEO王翌为大会带来主题演讲,探索AI+教育的最前沿。会后,王翌接受媒体群访,就AI+教育、教育目前的发展趋势等问题展开讨论。
流利说成立人工智能实验室,王翌表示,该实验室的研究方向很明确,打造世界上最智能、最高效的AI英语老师。
传统的老师和学生之间的学习存在互动,现在流利说推出AI老师,怎样做到与学生之间的互动学习?王翌提到,互动很重要,流利说之前能够积累大量的数据,就是因为其产品具有较强的互动性,用户觉得有意思,他就不断地刷,不断地练,我们现在也正沿着这个方向继续深耕下去。
据悉,在本次大会上,王翌还公布了消息,成立英语流利说顾问团。同时,王翌表示:“2017年,将成为‘AI+教育元年’。”在教育领域,随着英语流利说等企业对于AI技术的不断应用,AI已经成为快速提高学习效率,减轻人工负担的重要方式,人工智能在教育领域已从基础技术进入实际应用领域。
以下是王翌的群访内容,猎云网删减整理:
问:很多资本都在提今年是“AI+教育”的元年,这一年所有的公司所有的人都在提AI,你们在没有这个概念之前就做了,您如何看待AI是扎堆还是?
王翌:每一年都会有一些概念出来,2014、2015年“互联网+教育”有一波,后来就没有了。我觉得同样,它一定会有泡沫破灭存在,教育行业,别的行业都是如此。不只是“AI+教育”,AI加任何行业都会有一堆公司出来,所以,教育行业也不例外。
问:英语流利说做AI产品实现了规模化的盈利,也积累了大量的数据,下一步的商业模式是什么?
王翌:我们之前收集数据,一开始收集的是语音数据,确立了一个引擎,并打造了AI老师的产品。之后又收集了第二类数据,就是我收集他完整的学习轨迹数据。有了这些数据,再加上其它的语音数据,对于学生知识掌握情况的了解,可以帮助我们更好的为学生量身定制他接下去的学习。
问:未来流利说的用户目标是什么?
王翌:用户目标,像流利说我们在硅谷成立了一个AI实验室。流利说未来,第一会成为国际化的公司,第二我们目标是成为世界领先的教育科技公司,我们还是坚定地在科技和教育这条道路上走,走得更加坚决一点。
问:您在演讲中提到,现在教育行业的付费模式从课程收费转变到结果收费,对于这个预测,流利说目前往这个方向有没有战略部署?
王翌:我们一直往这个方向努力,一步步来,我们先把它变成不是按照一个小时多少钱,而是一个月多少钱。你爱学几个小时就学几个小时。我们觉得不应该把它和所谓的成本、老师的成本直接挂钩。因为它最终是商家的角度在定义,不是从用户的角度,从学习者的角度定义。
问:现在流利说的英语语音开始给其它教育机构做服务了,以后技术和产品的输出,比如输出给其它教育机构,是不是也会成为流利说业务的方向?
王翌:我觉得是很重要的一部分,因为这个时代本身就是一个很开放的时代,这是我们的一个基本观点。我们三个联合创始人,两个来自于谷歌。谷歌做了Android,不是做了苹果,这是一个理念上的事情,我们觉得这是开放的。我们一些核心的技术,如果我们有合作伙伴觉得这个东西挺好的,我们想合作来用一下,这个没有问题,而且另外一方面,我们现在也在跟一些拥有优质学习内容的第三方合作伙伴进行一些合作。他们有很好的内容,他们觉得流利说的技术和产品不错,我们能不能结合一下,大家一起打造一种新的形态,我觉得这些都是很有意思的一些形式。
问:“AI+教育”大数据是启动了一个壁垒,像流利说在数据收集方面做了哪些?另外您的数据源和数据量怎么样?
王翌:这个可以说是流利说从诞生第一天开始就在做的事情之一。第一种收集方式就是用户在上面练口语,把语音数据都收集下来,今天的数据量应该是6.58亿分钟录音,超过83.9亿个句子,相当于超过1200年的总量。,让我们成为世界上最大的中国人说英语的一个标签数据。
数据源就是用户,语音数据是一大块,然后语音数据里面现在包含了跟读数据,就是开放式的口语数据。还有一块就是我们的AI老师里面的叫学习轨迹的数据。我们有20多种题型,每种题型跟用户结合,我们既有某一类或者某几类内容和题型下,几十万、上百万用户的数据;也有一个以时间轴为视角,在这个水平慢慢提升的,用户进一步学习的轨迹。
编辑:另外,AI做教育肯定是想要介入到个性化教学,个性化教学里面从K12到成人,您怎样做英语分级的?
王翌:英语分级我们想得比较清楚,它不是典型重新造轮子的事,我们用的是国际公认的语言分级的标准,叫做CEFR,Common European Framework of Reference for Languages,简称欧标。它分为六级,A1、A2,B1、B2,C1、C2,每一级覆盖的所谓知识点、能力都会有详细的描述,世界上几乎所有的标准化考试,比如雅思、托福等等都会和这个分级有对应关系。
编辑:在人工智能浪潮中,您也提出大家都看不清方向,而流利说成立人工智能实验室,那么您推动人工智能实验室研究方向是什么?
王翌:我们AI实验室的目标特别明确,就是打造世界上最智能、最高效的AI英语老师。在语音评测方面,我们会对用户的输入做视觉上的呈现,红绿也好、打分也好,这是一种角度的反馈。还有一种情景式讲课,那就直接是语音对语音了,机器人说话,你和他对话,这是我们在做尝试,并且技术比较领先的一个方面。
我们要做最智能、最高效的AI英语老师,那么评判它是否智能、高效的标准就是结果导向,比如有三百名学生,其中一百名学生去传统教室里面听课,另外一百名跟着外教上课,最后一百名跟着流利说学习。同样学一百个小时,三百名学生,谁提升最高,相同时间下谁进步最快,或者达到相同的程度谁时间最短,这么一来就能很清晰地看出学习效果的高低。
问:传统的老师和学生之间的学习是存在互动的。现在流利说推出AI老师,它怎样做到与学生之间的互动学习?
王翌:互动很重要,你如果体验一下我们AI老师,就会发现当中的互动。这种互动是以一种游戏化的形式,你做一道题我们给你反馈,你做得好就得一个金币,你会看到自己的金币往前走。你做得每一个学习行为、练习行为是有实时反馈的。随着慢慢迭代,你会发现互动的形式越来越多,比如我们新推的“情景实战”功能,那也是互动。就是跟一个chatbot(聊天机器人)聊天,而且这里面会抖一些很幽默的东西出来,你们可以去玩一下,很搞笑的,这都是互动。
我觉得互动很重要,其实流利说之所以之前能够积累这么多的数据,就是因为我们的产品具有比较强的互动性,用户觉得有意思,他就不断地刷,不断地练。我们现在也正沿着这个方向继续深耕下去。
问:流利说语音技术方面有没有独特的算法,比如语音的识别,语义的理解、语用方面,哪个东西比较占优势?
王翌:首先我们拥有独特的算法。第一叫发音,发音里面还有很多,不细说,不同的维度、粒度;第二叫语法,我得语法检错,有一些你发音很好,但是语法有问题。关于语法检错,我们的科学家们最近在一个国际会议上,叫Interspeech,发表了一篇论文,他们一边写代码,一边在公司工作,一边写论文,而且是一个国际顶级会议,上面有一篇论文叫Deep Context Model for Grammatical Error Correction,就是关于用深度学习的技术来检测错误;第三,词汇量。你是三千词汇,他也是三千词汇,但是你们讲出来的话不一样。你对词汇量的运用,你怎么样挑一个词,怎样组成一个句子表达你的意思,都很有讲究。我发现你喜欢用这类词,这类词其实不准确,或者不精彩,于是我给你推荐一些词句。以上这些指导在雅思流利说都有;第四,流利度和上下文。比如他问你今天天气怎么样,你却回答说昨天足球很好;或者你前面说了一件事,突然没有任何转折又去说另一件等等。我们的技术可以判断你是不是答非所问。
以上就是口语的四个方面。这不是我们定义的,雅思托福就是考这四个维度,我们就从这四个维度去做。毫无疑问,我们在这方面的技术、数据和内容是齐头并进的。回到前面所说的,团队、数据、技术、产品,这几个环节真的需要打通来做。
问:我有测试我们的流利说,我发现如果某一个音你一直不读准的话,它只是一个语音的提示,有没有考虑解决这个问题,或者通过一些小视频解决这个问题?
王翌:现在我们有一个小功能叫发音攻略,你可以去试试看能不能解决你的问题,如果不能解决,我们后面还有大招,敬请期待。