• 0
携智能单元“全家桶”,RockAI Yan1.3掀起群体智能革命
统计 阅读时间大约7分钟(2437字)

2024-09-30 携智能单元“全家桶”,RockAI Yan1.3掀起群体智能革命

来源:企业供图
为机器注入智能基因,RockAI为设备厂商打开进入AI的大门。

来源:猎云网

群体智能,未来已来。

9月26日,RockAI“真端侧·智无界”开放日活动在上海举行。会上,RockAI正式推出了全新升级的Yan1.3群体智能单元大模型,并展示了其在无人机、机器人、PC、手机等各类终端设备上的超强模力。

相较于1月份首发的Yan1.0,Yan1.3具备了强大的多模态能力,可高效处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑CPU上也能够流畅运行。

CEO刘凡平表示:“我们认为,群体智能才是通往通用人工智能的关键路径。因此,RockAI以Yan架构打造群体智能单元大模型,不单是为了提升某个设备的能力,更是为机器注入一种新的、本质性的智能基因,使其拥有超强的环境适应力和自主学习能力。届时,每个部署了Yan模型的设备都将成为一个智能单元,通过它们的不断协同、交互,最终激发群体智能的涌现。”

智能单元“全家桶”:多模加成,各显神通

活动现场,RockAI团队展示了一款部署了Yan1.3大模型的“飞龙”无人机。

区别于大多数云、边、端协同控制的无人机,飞龙的智能大脑Yan1.3直接部署于设备端,对突发状况能做出即时判断和处理,无需先传回云端判定再回到设备端执行,大大提升无人机在复杂环境中的适应性和自主性,实现高度的自动化水平和快速反应能力。如与某厂商合作的无人机项目,便能解决设备将高清画面传回云端,所产生的5G-A流量成本高的痛点。

在实际应用方面,部署了Yan1.3的飞龙无人机,可全面感知复杂环境并在设备端实时处理,支持各类环境下的智能巡检,不仅高效适配电力巡检、安全监控、环境监测等城市治理及工业场景;更可面向个人用户,广泛运用于AI拍摄、外出旅游、山地越野等日常生活情景,贴心勘探环境、规划行程的同时,还能够解放双手,自动捕捉最佳角度并挑选出最佳照片。

此外,研发团队还演示了Yan1.3在更多端侧设备的广泛应用,比如此前惊艳亮相世界人工智能大会的 “胖虎”智能机器人,能够基于Yan1.3的多模态处理能力,在离线状态下识别复杂环境、准确理解用户意图,并据此控制其机械躯体高效完成各类复杂任务,如展现“七步成诗”“咏春拳法”等。

又比如内嵌在PC端的迅兔智能助手,可以在离线模式下听懂“人话”、看懂图片并快速搜图,精准完成“帮我录音并整理会议记录”、“把所有橘猫图片都删掉”等模糊指令,保护用户隐私安全的同时,真正让每个人享受到AI带来的便利。

RockAI认为,真正的智能是不应受限的,因此,他们始终坚定地走在非Transformer架构、无损部署这条少有人走的路上。如今,未经压缩、裁剪的Yan1.3大模型在越来越多设备端展现出的丝滑适配和超强模力,正向行业证实RockAI技术路线的合理性,及其最终激发群体智能的充分可能。

在刘凡平看来,基于Transfomer架构的通用大模型,未来只有两到三家可能是成立的。但这样的“造神式”大模型未来解决问题的场景依然有限,相比较而言,以群体智能为目标的群体智能单元大模型更有意义。

锚定群体智能:为机器注入智能基因

顾名思义,群体智能主要指通过多个个体的协作和交互,形成的集体智慧和决策能力。无数智能个体通过协作和交流,可以创造出超越个体的能力,推动自然社会的进步,其多样性、适应性和创造力,是任何单一的大模型都无法完全实现的。

因此,在机器领域,群体智能同样是智能进化的关键,并提出了打造群体智能单元大模型的技术路线——以端侧设备为载体构建可高效适应环境并不断进化的智能单元,不同智能单元之间持续交互、协同和互补,激发更高水平的群体智能。

要想达成这个目标,首先就要为群体中的每个个体,寻求一个高效运转、能持续自主学习的模型大脑。然而当下大部分Transformer主流大模型受限于资源及算力,只能通过有损压缩等“性能阉割”的方式在端侧运行,尚且无法高效运转,更无法根据环境的变化进行自主学习,实现推理和训练的同步进行。

彼时,刘凡平就敏锐认识到,训推同步的目标是能在端侧上运行并做训练,这将是一个很大的进步。

“我们希望更廉价的训练,而不是更昂贵的。训推同步可理解为模型的训练与推理同步进行,正如人一样,在聊天的时候可以通过语音输出推理,但同时也可以通过耳朵的听觉、眼睛的视觉作为输入进行实时学习。”

于是,RockAI从对基础架构的突破创新出发研制模型大脑。1月,国内首个非Attention机制的Yan架构应运而生,大大降低了模型的算力需求,并成功实现Yan1.0模型“0压缩0裁剪”的离线部署,迈出了走向群体智能的第一步。

随后,RockAI更是迭代提速,3月,类脑分区激活的工作机制实现;5月初,“无损”跑通树莓派;5月底,全模态部分视觉支持走通,再从Yan1.2进化到当前的Yan1.3,可以在广泛的设备上部署和应用,得以开启了多元化的硬件生态。

正如会上浙江大学人工智能系主任杨洋教授所说,RockAI给更多的设备厂商打开了一扇门,让他们能够进入AI领域。

多元化适配:打通商业化路径

在RockAI的规划中,群体智能的实现包括四个阶段:创新型基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。如果说自主架构的Yan模型是走向群体智能的开端,那么此次发布的Yan1.3群体智能单元大模型,显然已经快速实现了在多元化硬件设备上的适配。

其在端侧的无损推理基于两大核心技术创新,一是以底层神经网络架构MCSD替代Transformer的Attention机制,二是基于仿生神经元驱动的选择算法实现类脑分区激活,大大减少计算复杂度及算力消耗。

众所周知,Attention机制是Transformer架构的核心,其加权算法决定了计算量会随着序列长度的增加呈增长,对计算的算力要求也会越来越高。而RockAI通过MCSD机制替换掉Attention,只把最有效的信息、特征往后传,以线性的方式降低计算的复杂度,提升训练和推理效率。

同时,RockAI借鉴了大脑分区激活的原理,由选择神经网络自己决定处理某个任务时参与运算的神经元,初始具有随机性,但通过大量数据学习、训练后会变得有迹可循。就像人类一样,随着一件事情做的越多,被激活的那部分神经元就会越确定,反应也就越快。此外,由于不是所有参数参与过程,从而算力需求很低,就可以使得训推同步进行,而且在输出时也能调整参数。

基于该算法实现的模型分区激活,不仅节省了算力成本,还可以通过共享神经元实现多模态的对齐。

经过对不同硬件的研究和大量调试,目前RockAI已经适配了英伟达、高通、联发科、英特尔、瑞芯微等平台,商业化进程也在不断加速。随着自主学习机制进入实验室测试阶段,RockAI也与芯片厂商及终端厂商达成初步合作意向。

刘凡平希望,能与更多合作伙伴构建生态,让更多的设备用上RockAI的群体智能单元大模型。

这也就意味着,未来RockAI将突破硬件限制,打造越来越多基于Yan架构的智能单元,让世界上每一台设备拥有自己的智能,实现在广泛覆盖范围下的普惠人工智能应用。

未来,期待这些拥有不同能力、不同个性的智能单元得以协同,涌现更为宏大、多元的群体智能,最终实现个性化与群体智能的共融共生,开启人与机器的智能新时代。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×