• 0
“跑步上车”大模型,APUS发布多模态大模型AiLMe并推出7款AI产品
统计 阅读时间大约8分钟(3124字)

2023-04-19 “跑步上车”大模型,APUS发布多模态大模型AiLMe并推出7款AI产品

来源:企业供图
AiLMe参数已达千亿规模。

来源:猎云精选,文/王非

“跑步上车,站立车头”!

这是麒麟合盛网络技术股份有限公司(APUS)创始人兼CEO李涛,宣布全面转型人工智能并总结出中国AI“四步走”战略后,APUS在第三步中要实现的目标。

事实上,作为一家成立于2014年全球化的移动互联网公司,凭借全球超24亿用户积累、领先的产品和技术、多元化场景和海量数据,APUS入局人工智能不仅“有能力”,更“有潜力”。

据李涛介绍,自2018年全面拥抱AI技术以来,APUS已走完“现有信息系统提效”、“现有产品服务改造和重构”前两步。在“新场景,新物种”不断迸发喷涌的第三步,ChatGPT爆火后,所有人开始重新审视AI时代“操作系统”——大模型的潜力,继而催生了当下的“大模型”创业热。

在大模型领域同样“跑步上车”的APUS,于4月18日正式发布其自研多模态人工智能大模型“AiLMe”,并发布国内首份多模态大模型技术白皮书《天燕大模型技术白皮书》。

据悉,AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。针对具体应用场景,APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型,并基于此创新研发出“智能问答大师、简笔成画、墨染、Daily Astro、Star Night、KJV Bible Now、PicPik”等系列AI产品。

不只内部的“提质增效”,以及产品的“多点开花”。未来,APUS还会将天燕大模型“AiLMe”的AI能力对外开放,在“生态建设、能力加强”两个方面发力。

五年积累,APUS用“蒸馏法”让1+2=4

较早意识到人工智能产业赛道坡长雪厚的APUS,是最早开始关注并投入人工智能的入局者之一,“我们在2018年就进行了AI技术布局,并在2018年推出了多款基于AI技术的应用如CutCut、PickU 、Vieka等,用户可以体验智能抠图,变老变年轻等功能”,李涛介绍。

据李涛透露,“今天为止,APUS几乎所有的图片生产、图标生产,超过一半以上的视频生产以及所有代码的review,全部都是用人工智能完成的。”不止于此,他“希望未来在APUS的平台里面,T1、T2、T3这个级别的程序员工作不太需要,几乎可以用人工智能来完成。”

如今伴随ChatGPT爆火,各路互联网大佬、技术大牛“跑步上车”大模型,以BAT为首的互联网大厂也密集展示自家“大模型”产品及能力。

人工智能大模型“利用深度学习模型生成文本、图像、音频或视频等内容”,让处于“手工”时代的信息化产业一跃迈入“工业”时代。在李涛看来,今天人们的生产生活是生长于“信息化”平台之上的,而在未来,AI将取代信息化成为万物生长的土壤。“人工智能是AI时代的操作系统,将重塑信息产业、农业、制造业、服务业等所有产业,起到大规模提质提效的作用。”

事实上,李涛也是较早见识到大模型威力的那批互联网从业者。

2019年,李涛和字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷见到了OpenAI创始人Sam Altman。Altman通过视频demo向所有人展示了GPT-2操作游戏DOTA2的过程,“很震撼”。

而这也为APUS全面拥抱AI,并于今年2月完成战略转型埋下了伏笔。

提及转型人工智能的契机,李涛表示,在ChatGPT“出圈”前两个月,APUS就因为全球化经验感知到了人工智能挥动的“蝶翼”,“今年一月我们就已经在内部所有系统接入人工智能,用来提升工作效率;随后便进行产品的改造升级;大模型AiLMe也是我们阶段性的重要成果”。

在近十年的创业过程中,APUS也已积累了覆盖200多个国家和地区的超24亿全球用户量,拥有多元化场景和海量数据。

在数据方面,目前大模型的训练数据一般来自于互联网公开的语料库、网页以及行业公开数据,但在APUS绘制的训练数据图中可以看到,其自有数据也占了很大比重——在为全球用户提供产品和服务时,APUS积淀的高质量专有数据成为其研发全球性大模型的优势之一。

在算力层面,APUS在国内郑州和新加坡分别建设了两大智算中心,还融合自建GPU服务器算力和第三方的算力协同作用。

在技术架构设计层面,AiLMe在文本、图像、视频、音频的“理解”部分,采用目前业内主流的Transformer架构。同时,AiLMe吸收了目前人工智能最前沿的研究成果,设计了一套“插件式”架构,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe的平台中,可以极大提升AiLMe的能力。在文本、图像、视频、音频的“生成”部分,AiLMe则沿用了目前业内主流的扩散模型(Diffusion Model),并继承了开源社区的生态。

集齐大模型“四要素”——场景、数据、算法、算力后,APUS在1个模型算法+2大智算中心的支撑下,通过“蒸馏法”蒸馏出文字、图像、视频、音频四个精炼模型。

据李涛介绍,所谓“蒸馏”,就是把我们需要配置在应用端的缩小模型从复杂的大模型中提取出来。具体来说,就是在APUS的大模型上加了各种限制参数,就把它蒸馏、提纯形成了无数个精炼模型,或者叫中小模型。然后基于实践训练这些小模型,训练小模型的同时,大模型也得到了训练。大模型被训练的越来越好,反馈到小模型的效率越来越高。

现在的APUS,既有专门有做AIGC的中型模型,也有基于不同场景有不同的小模型,然后在每一个场景上面推出10款不同的产品和软件,用这种方法一方面保障了公司的商业化的运作,一方面又保证了产品有足够大的用户量,然后反过来训练这些模型。

从7到N,用“开放”让AiLMe能力无限释放

“1+2=4”实现后,APUS打出了“大+中小模型”的组合拳,而这也加速了公司各类产品应用的规模化落地。

据李涛介绍,从AiLMe大模型蒸馏出的异雀(八、三、四、六)系列精细模型,分别对应着文、图、视、音四个垂直领域,基于四款精炼模型,APUS创新研发了多款人工智能产品。

第一款产品,是基于“异雀八”文本模型的类ChatGPT产品——“智能问答大师”。它能够在对话之间帮助用户快速完成撰写报告、论文、程序、简历及解答生活疑问等,在小说续写、诗歌创作、工作总结等场景下满足用户需求。

有别于类ChatGPT产品的通用型知识问答,APUS为其添加了“大师”的标签,就在于它“在预训练的基础上针对专门样本做了专业精炼”,从而在法律、医疗等专业领域的问题咨询中,提高生成答案的质量,保证其回答效果能够更好地服务于用户。

第二款产品,是基于“异雀八”文本模型和“异雀三”图像模型构造的AI绘画工具——墨染,主打的就是一句话就能生成一幅画。作为AI绘画工具素材创作社区,墨染除了有慕夏、毕加索等30多款创作风格可选,还具备文案优化等功能。此外,它还可以输出表情包、进行修图、生成海报、包装设计等。

通常而言,很多用户凭借“一句话生成图片的时候,未必可以很好描述很多细节”。在图像模型和文本模型的双重加持下,墨染“会利用智能文本对提示词进行一定补充,帮助AI更好地理解用户的意图,保证较好的出图效果”,从而能够生成一幅高质量的画作。

第三款产品,是基于“异雀三”图像模型的AI绘画工具——简笔成画。它可以让用户变身“神笔马良”,只要在手机屏幕上画出草图,寥寥几笔,它就会自动补全图案,形成精美绘画。据介绍,简笔成画采用的是图生图模式,它最终生成的图像会保留用户简笔画中的关键特征,更能体现“用户的控制力”。

第四款产品,是基于“异雀三”图像模型和“异雀八”文本模型的一款面向海外市场的款塔罗牌产品——Daily Astro,能够让星座、占卜爱好者实现牌面占卜、运势解析。除了卡牌风格由AI生成,在运势解读环节,Daily Astro也并不是简单依靠“后面的产品经理规则,而是AI在解答你的运势怎么样”。

第五款产品,是用到了异雀四个模型的助眠产品——Star night,除了能为用户提供白噪音音频等帮助用户快速入睡,还能依据用户喜好勾勒出理想的数字睡眠伴侣,让它来朗读睡眠故事。下一步,APUS还计划为Star night搭载检测用户睡眠习惯的功能,从而制定出更符合用户睡眠习惯的助眠功能。

第六款产品,基于“异雀八”文本模型和“异雀三”图像模型的一款面向海外市场的《圣经》产品——KJV Bible Now。它能够为海外基督教用户提供在线灵修服务,其中的AI祷告功能,可以帮用户生成很多张祷告图片供用户选择。据了解,目前每天有超过百万的用户在使用这一功能。

值得一提的是,KJV Bible Now进一步融合异雀的四个模型,为用户提供了AI数字人的应用。它能够让用户拥有自己的专属牧师助手,帮助其解答用户困惑,释放情感。

第七款产品,是基于“异雀三”图像模型和“异雀四”视频模型的AI创作平台——PicPik。它是一款AI图片、视频、娱乐创作工具,能够帮助用户高质量、高效率、低门槛的创作。

值得一提的是,PicPik支持AI换装、AI换脸,其通过高精度CV识别,能够清晰识别面部并进行分割,还原脸部所有特征,再加上高精度骨骼检测,能还原图片中人物原有的姿态,最后基于其图生图能力,能对图片中的服装、背景进行二次生成。

不止于此,AiLMe的能力释放让AI产品更加智慧、场景更加多元,既丰富了APUS的产品矩阵,也为开发者打造了创新平台,最终实现“从7到N”的爆发式增长。

据APUS技术专家张旭介绍,后续AiLMe会从两个方面去发力:一个是生态建设,一个是能力加强。“生态建设是指APUS后续会开放API,把AiLMe的AI能力开放给合作伙伴;能力加强,不只是APUS自身AI能力的‘目标驱动、多AI协作’陆续实现,在此基础上,也会以API的形式开放给合作伙伴,相辅相成。”

未来,APUS的客户可根据实际应用需求,调用AiLMe的各项AI技术能力。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×