本文转载自:投中网,作者:李婉题。猎云网已获授权。
根据外媒消息,成立不到1年的日本人工智能初创公司SakanaAI,即将斩获超1亿美元融资,估值飚至1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。
年初,Sakana已获Lux Capital、Khosla Ventures及多家日本巨头联合注资,政府亦提供了关键算力支持。本轮融资中,上述投资方Lux Capital、Khosla Ventures 将再度加码,显示出对该项目信心。
尽管融资规模非行业之最,但这背后恰恰是其差异点所在。Sakana凭小团队脱颖而出,年初融资时团队仅3人,目前也仅有15名员工,若论人均估值,与OpenAI不相上下。
更引人注目的是其低成本创新路径。Sakana颠覆当前AI生成范式,凭借独创算法自主工作,节省人力,也无需使用耗电量巨大的大型计算机,号称数据学习周期将缩短数百倍。
Sakana的策略也另辟蹊径,拒绝盲目追求大数据模型,拥抱“小模型”战略,“以小博大”,通过模型间相互协作,针对性解决问题。
此番“小步快跑”模式,与朱啸虎的观点颇有几分相似,其看淡大模型,力挺小模型商业化应用,与Sakana实践不谋而合。
Sakana 的崛起,不仅是日本AI领域的突破,更是地域化AI创新趋势的有力注脚。全球范围内,小模型势力崛起,资本“狩猎”的新图景也正徐徐展开。
“日本OpenAI”
避开硅谷,落脚东京,Sakana 选择了一条不同寻常的发展道路。
“如果我们在湾区创办 Sakana AI,那将是一个战略失误,因为我们看起来会更像其他人,很难与众不同”,CEO David Ha 曾如此表示。在他看来,硅谷虽然科技氛围浓厚,但过度的同质化使得新创企业难以在其中脱颖而出。
Sakana 另一层面的野心在于,追求跨文化技术突破,开发非西方AI模型。此外,Sakana 东京的选址,也是创始团队背景的自然延伸。
David Ha曾任谷歌大脑 Google Brains 日本分部的研究负责人。在这之后,David Ha 曾在 Stability AI 担任研究主管。据日媒报道,其退出 Stability 可能是因为工作内容与研究存在距离,而他本人对于神经网络、创意AI和进化计算等多个领域有着广泛的兴趣和深入研究。
CTOLlion Jones同样来自谷歌,在谷歌人工智能研究室担任技术主管多年,是Transformer架构的提出者之一,该架构后来成为 ChatGPT 等生成 AI 驱动产品的基础。Llion Jones对于大型科技公司在创新速度上的不满促使他离开谷歌,为 Sakana 带来技术积淀。
后期加入的另一位联创 Ren Ito,则凭借其在推进 Mercari 全球化和 IPO 的经验,以及在投资领域的人脉,为 Sakana 带来了丰富的运营策略和国际视角。Ren Ito曾投资过独角兽初创企业Stability AI,并曾担任过 Stability 的研究负责人和首席运营官COO。
另一位联创Ren Ito则凭借在推进Mercari全球化和IPO的经验,以及在投资领域的人脉,为Sakana带来运营策略和国际视角。他曾投资过独角兽初创企业Stability AI,并曾担任过其研究负责人和首席运营官。此外,Ren Ito在日本外交部的背景也为公司的国际合作与市场扩展提供了优势。
Sakana的核心团队汇聚了来自Google Brain、DeepMind等机构的专家,其中不乏多位亚裔成员。2023年7月成立以来,不仅挑战硅谷模式,还力求在亚洲建立AI新标杆,目标赶超OpenAI和DeepMind。
年初融资时,公司仅三名创始人,平均每人估值达6670万美元,超越OpenAI的员工平均估值约800多万美元,根据CB Insights,其时团队成员平均估值位居榜首。
可自动“繁衍”的AI模型
技术层面,Sakana 同样试图颠覆AI生成范式。
这一变革的灵感来自自然界,Sakana 通过模拟进化过程,使AI模型适应环境变化,克服传统大语言模型的脆弱性和不可变性,同时极大降低开发成本并提升安全性。
核心亮点是“模型合并”技术,Sakana将多个现有开源AI模型融合,催生出新一代模型,这一过程循环往复,历经数百代演变。再从每一代中选出最成功的模型,成为下一代的“父母”。
虽然该方法以前也存在,但它需要开发人员手动合并模型。Sakana开发的自动化“进化”算法无需人工干预,自主识别并合并每代中最优秀的模型,以实现预设目标。
这一自动化流程加速了模型的进化速度,据 Sakana 宣称,如果能够在短时间内反复“繁衍”促进AI进化,将有可能把AI学习海量数据的周期压缩至现有水平的几百分之一。
生成式AI需要海量数据以及巨量的算力成本,这使得研究先进基础技术的能力仅限于少数资金雄厚的科技企业。Sakana 采用的方法,号称对算力资源的需求极小,几乎不增加额外成本,就能获得高性能的模型。
目前,Sakana 已基于其“自然启发”的机制,推出了涵盖语言、图像转换和图像生成三大领域的AI模型,其中两款开源。这些模型若按常规方式开发,成本或以百万美元计,并需数月时间。
不过,目前 Sakana 尚未推出直接面向消费者的应用,如何将这一革命性的技术转化为商业成果,是市场关注的焦点。
区域化大模型频现
Sakana成功融资,恰逢众多AI初创企业深耕本土模型开发之际,全球资本也开始热捧地域化AI新星,战略落子频繁。
六月间两起融资案即为例证。加拿大 Cohere 以 50亿美元估值揽获 4.5亿美元融资,英伟达、思科助力;法国Mistral AI喜提6亿欧元,General Catalyst领投。国际资本追逐各地“OpenAI”的势头愈发凶猛。
然而,诞生于各地的本土企业,亦须直面“初代”大模型的“入侵”威胁。如美国的人工智能开发商已经在日本建立了业务。今年4月,OpenAI在东京设立办事处,正式拓展亚洲业务。它还聘请了长崎忠雄担任 OpenAI 日本公司的总裁,并为当地企业提供了针对日语优化的模型。
区域竞争日渐白热化,创新与坚守并行成为新命题。尽管盈利模式尚不明朗,Sakana的创新在一定层面为AI领域的可持续发展提供了新思路,预示着一个低成本、高效率AI开发时代的到来。
无独有偶。法国的 Mistral 同样追求“性价比”,也是最为投资人称道的一点。去年发布的Mistral 7B,以70亿参数打败了数百亿参数的开源大语言模型霸主Llama 2;另一款模型Mistral Large开发成本低于2000万欧元(约2200万美元),GPT-4的开发成本可能要超过1亿美元。
Sakana 和 Mistral 的实践,为中小企业和开源社区打开了低成本创新的大门,有望终结大公司在AI技术上的垄断。
法国、加拿大、日本等地新秀频现,也勾勒出非硅谷独角兽的勃兴。
CB Insights 数据显示,截至今年 4 月底,生成式AI领域独角兽企业激增至37家,较去年同期近乎翻倍。新增17家中,10家植根海外,美国虽仍占九成份额,但全球分布趋势显著。
与此同时,各地政府力量参与浓度提高,投资生态不再专属巨头。
如Sakana在开始时,就获得了政府提供的算力支持。正如Khosla Ventures的创始人Vinod Khosla曾强调的那样,本土基础模型关乎国家安全与文化互动,各国渴求自主掌控。