来源:猎云网
历史首次!
1月27日,AI领域新“黑马”DeepSeek,强势登顶苹果App Store中国区免费榜首位。
与此同时,DeepSeek也在美区苹果App Store免费榜飚升至第一位,相较于昨日的第六攀升5名,连续超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
值得一提的是,这也是中国应用首次同时在中国和美区苹果App Store占据第一位。此前,小红书、Temu成为美区App Store下载冠军时,未能同步实现在中国区登顶。
或许是感受到来自DeepSeek的压力,据财联社最新消息,Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理。其中两个动员起来的小组正在试图了解High-Flyer如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在试图弄清楚High-Flyer可能使用哪些数据来训练其模型。第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。
公开资料显示,DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由知名量化资管巨头幻方量化创立于2023年7月17日。
DeepSeek是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。作为大厂外唯一一家储备万张A100芯片的公司,幻方量化则为DeepSeek的技术研发提供强大的硬件支持。
2024年1月5日,DeepSeek发布首个大模型DeepSeek LLM,其包含670亿参数,从零开始在一个包含2万亿token的数据集上进行了训练,数据集涵盖中英文。
时隔一年,历经多次迭代,1月20日,DeepSeek正式发布推理大模型DeepSeek-R1,并同步开源模型权重。
作为开源模型,DeepSeek-R1在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o,且训练成本仅为后者的十分之一(约557.6万美元)。其强化学习驱动的训练方法被认为具有创新性,并获得英伟达科学家Jim Fan的高度评价。
同时,在海外开发者社区中,DeepSeek-R1也因支持免费商用和衍生开发而受到推崇,并在Chatbot Arena等评测中排名前列。
值得一提的是,伴随DeepSeek持续火爆,其服务器曾于1月26日下午出现局部服务波动。不过,这一问题在数分钟内便得到了解决。深度求索回应称,此次事件可能与新模型发布后的访问量激增有关。
目前,DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型之一,下载量达10.9万次。