近日,学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。
据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。
大语言模型(LLM)在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。
“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。
因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。
学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。
事实上,早在2017年,学而思便成立了AI lab 人工智能实验室。公开信息显示,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利220余项,授权专利150余项,软件著作权60余项。
与此同时,“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。
另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。