阅读时间大约6分钟（2198字）

2024-06-24 团队15人，估值80亿

来源：图虫

或许是个朱啸虎看好的项目。

本文转载自：投中网，作者：李婉题。猎云网已获授权。

根据外媒消息，成立不到1年的日本人工智能初创公司SakanaAI，即将斩获超1亿美元融资，估值飚至1800亿日元（约合人民币82亿，11.5亿美元），即将跻身AI独角兽行列。

年初，Sakana已获Lux Capital、Khosla Ventures及多家日本巨头联合注资，政府亦提供了关键算力支持。本轮融资中，上述投资方Lux Capital、Khosla Ventures 将再度加码，显示出对该项目信心。

尽管融资规模非行业之最，但这背后恰恰是其差异点所在。Sakana凭小团队脱颖而出，年初融资时团队仅3人，目前也仅有15名员工，若论人均估值，与OpenAI不相上下。

更引人注目的是其低成本创新路径。Sakana颠覆当前AI生成范式，凭借独创算法自主工作，节省人力，也无需使用耗电量巨大的大型计算机，号称数据学习周期将缩短数百倍。

Sakana的策略也另辟蹊径，拒绝盲目追求大数据模型，拥抱“小模型”战略，“以小博大”，通过模型间相互协作，针对性解决问题。

此番“小步快跑”模式，与朱啸虎的观点颇有几分相似，其看淡大模型，力挺小模型商业化应用，与Sakana实践不谋而合。

Sakana 的崛起，不仅是日本AI领域的突破，更是地域化AI创新趋势的有力注脚。全球范围内，小模型势力崛起，资本“狩猎”的新图景也正徐徐展开。

“日本OpenAI”

避开硅谷，落脚东京，Sakana 选择了一条不同寻常的发展道路。

“如果我们在湾区创办 Sakana AI，那将是一个战略失误，因为我们看起来会更像其他人，很难与众不同”，CEO David Ha 曾如此表示。在他看来，硅谷虽然科技氛围浓厚，但过度的同质化使得新创企业难以在其中脱颖而出。

Sakana 另一层面的野心在于，追求跨文化技术突破，开发非西方AI模型。此外，Sakana 东京的选址，也是创始团队背景的自然延伸。

David Ha曾任谷歌大脑 Google Brains 日本分部的研究负责人。在这之后，David Ha 曾在 Stability AI 担任研究主管。据日媒报道，其退出 Stability 可能是因为工作内容与研究存在距离，而他本人对于神经网络、创意AI和进化计算等多个领域有着广泛的兴趣和深入研究。

CTOLlion Jones同样来自谷歌，在谷歌人工智能研究室担任技术主管多年，是Transformer架构的提出者之一，该架构后来成为 ChatGPT 等生成 AI 驱动产品的基础。Llion Jones对于大型科技公司在创新速度上的不满促使他离开谷歌，为 Sakana 带来技术积淀。

后期加入的另一位联创 Ren Ito，则凭借其在推进 Mercari 全球化和 IPO 的经验，以及在投资领域的人脉，为 Sakana 带来了丰富的运营策略和国际视角。Ren Ito曾投资过独角兽初创企业Stability AI，并曾担任过 Stability 的研究负责人和首席运营官COO。

另一位联创Ren Ito则凭借在推进Mercari全球化和IPO的经验，以及在投资领域的人脉，为Sakana带来运营策略和国际视角。他曾投资过独角兽初创企业Stability AI，并曾担任过其研究负责人和首席运营官。此外，Ren Ito在日本外交部的背景也为公司的国际合作与市场扩展提供了优势。

Sakana的核心团队汇聚了来自Google Brain、DeepMind等机构的专家，其中不乏多位亚裔成员。2023年7月成立以来，不仅挑战硅谷模式，还力求在亚洲建立AI新标杆，目标赶超OpenAI和DeepMind。

年初融资时，公司仅三名创始人，平均每人估值达6670万美元，超越OpenAI的员工平均估值约800多万美元，根据CB Insights，其时团队成员平均估值位居榜首。

可自动“繁衍”的AI模型

技术层面，Sakana 同样试图颠覆AI生成范式。

这一变革的灵感来自自然界，Sakana 通过模拟进化过程，使AI模型适应环境变化，克服传统大语言模型的脆弱性和不可变性，同时极大降低开发成本并提升安全性。

核心亮点是“模型合并”技术，Sakana将多个现有开源AI模型融合，催生出新一代模型，这一过程循环往复，历经数百代演变。再从每一代中选出最成功的模型，成为下一代的“父母”。

虽然该方法以前也存在，但它需要开发人员手动合并模型。Sakana开发的自动化“进化”算法无需人工干预，自主识别并合并每代中最优秀的模型，以实现预设目标。

这一自动化流程加速了模型的进化速度，据 Sakana 宣称，如果能够在短时间内反复“繁衍”促进AI进化，将有可能把AI学习海量数据的周期压缩至现有水平的几百分之一。

生成式AI需要海量数据以及巨量的算力成本，这使得研究先进基础技术的能力仅限于少数资金雄厚的科技企业。Sakana 采用的方法，号称对算力资源的需求极小，几乎不增加额外成本，就能获得高性能的模型。

目前，Sakana 已基于其“自然启发”的机制，推出了涵盖语言、图像转换和图像生成三大领域的AI模型，其中两款开源。这些模型若按常规方式开发，成本或以百万美元计，并需数月时间。

不过，目前 Sakana 尚未推出直接面向消费者的应用，如何将这一革命性的技术转化为商业成果，是市场关注的焦点。

区域化大模型频现

Sakana成功融资，恰逢众多AI初创企业深耕本土模型开发之际，全球资本也开始热捧地域化AI新星，战略落子频繁。

六月间两起融资案即为例证。加拿大 Cohere 以 50亿美元估值揽获 4.5亿美元融资，英伟达、思科助力；法国Mistral AI喜提6亿欧元，General Catalyst领投。国际资本追逐各地“OpenAI”的势头愈发凶猛。

然而，诞生于各地的本土企业，亦须直面“初代”大模型的“入侵”威胁。如美国的人工智能开发商已经在日本建立了业务。今年4月，OpenAI在东京设立办事处，正式拓展亚洲业务。它还聘请了长崎忠雄担任 OpenAI 日本公司的总裁，并为当地企业提供了针对日语优化的模型。

区域竞争日渐白热化，创新与坚守并行成为新命题。尽管盈利模式尚不明朗，Sakana的创新在一定层面为AI领域的可持续发展提供了新思路，预示着一个低成本、高效率AI开发时代的到来。

无独有偶。法国的 Mistral 同样追求“性价比”，也是最为投资人称道的一点。去年发布的Mistral 7B，以70亿参数打败了数百亿参数的开源大语言模型霸主Llama 2；另一款模型Mistral Large开发成本低于2000万欧元（约2200万美元），GPT-4的开发成本可能要超过1亿美元。

Sakana 和 Mistral 的实践，为中小企业和开源社区打开了低成本创新的大门，有望终结大公司在AI技术上的垄断。

法国、加拿大、日本等地新秀频现，也勾勒出非硅谷独角兽的勃兴。

CB Insights 数据显示，截至今年 4 月底，生成式AI领域独角兽企业激增至37家，较去年同期近乎翻倍。新增17家中，10家植根海外，美国虽仍占九成份额，但全球分布趋势显著。

与此同时，各地政府力量参与浓度提高，投资生态不再专属巨头。

如Sakana在开始时，就获得了政府提供的算力支持。正如Khosla Ventures的创始人Vinod Khosla曾强调的那样，本土基础模型关乎国家安全与文化互动，各国渴求自主掌控。