来源:猎云精选;文/邵延港
本周,多家大模型厂商卷进价格战,从“百万tokens1元时代”,逐渐进入到免费时代。“迟到”发布的腾讯混元,也紧跟战事,将混元-lite模型直接免费。
阿里云、百度云、火山引擎等巨头疯狂降价,看起来近乎不理智,背后是巨头们在大模型时代跑马圈地。
但在AI科学家贾扬清看来,大模型“也许不是最便宜的赢得商战,而是最能落地的赢得利润。”
新一轮AI浪潮中,以大模型为代表的生成式AI技术催生出了新的场景和产业模式,新入局者也在探索这一新技术的落地应用。
大模型落地应用路径,不同厂商有着不同的理解:有加强底层基础能力赋能ToB应用,或强调AI原生应用,或为客户提供精调大模型。腾讯云自混元大模型自发布后,就立足“产业实用”,将其作为发展大模型的核心战略。
在5月17日的“腾讯云生成式AI产业应用峰会”上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯是通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。
使用门槛、平台适配性、安全合规保障,被视为大模型产业创新的三大挑战。在卷出天际的大模型赛道,腾讯云会给出了怎样的答案?
多落地路线并行,适配用户需求
生成式AI描绘了美好的未来前景,然而要将其真正应用于实际业务中,还要面对诸多挑战。
过去一年里,腾讯云也注意到产业对模型的需求在不断变化:一是产业信息的载体多元化,让大模型的多模态趋势更加明显;二是大模型在产业场景落地时,来自成本、安全、准确度等因素的挑战。
根据腾讯云联合发布Gartner发布的《生成式AI产业落地路径研究报告》,生成式AI应用落地路线分为3条,分别为标准软件路线、标准模型能力增强路线和定制化模型精调训练路线。
其中,标准软件路线落地最为简单,企业直接采购开箱即用的软件完成落地。标准模型能力增强路线落地复杂度中等,企业需要参与提示词工程等环节来增强模型能力,优化模型输出结果的。定制化模型精调训练路线落地最复杂,企业需要完成二次模型训练工作。
如今,腾讯云将大模型落地路径全线铺开,打造了独特的产品和服务生态。
针对标准软件路线,腾讯云推出一系列开箱即用的大模型应用,如腾讯企点客服、腾讯乐享、企点营销云AI助手、腾讯会议AI小助手等;围绕标准模型能力增强路线,腾讯云正式推出大模型原生工具链, “大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎” 三款PaaS产品;围绕定制化模型精调训练路线,腾讯云提供一站式精调大模型解决方案,最快仅需5步即可完成大模型精调落地,这也是腾讯云最初MaaS方案的主要方向。
针对底层的基础大模型,腾讯云混元大模型正式推出后,经过升级,其参数规模达到了万亿级别。但为适配不同客户场景需求、平衡算力与成本,腾讯云混元大模型提供万亿参数混元-pro、千亿参数混元-standard、百亿参数混元-lite等多种尺寸的模型服务。
在中小型模型方面也同样积极部署,研发了1B、3B、7B、13B等不同参数量下的 Dense 和 MoE 模型。多种尺寸的腾讯混元MoE模型可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
这些模型能力将通过腾讯云API对外开放,以满足企业客户及开发者在不同场景下的模型需求,把技术做得能够在各种场景上面能够适配,让大模型能力真正落地到产业应用中。
其中,混元-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力。该模型以高浓度的行业数据,加强模型对行业专业知识的理解,完全能够支持行业大模型的精调和开发;结合搜索增强与实时查询能力,提升模型解决产业问题的实时性、准确度、安全性等能力。目前,也已经在金融、医疗、教育、汽车、能源等20多个行业落地。
腾讯云还正式发布了教育行业大模型,该模型也是基于自研混元大模型,融合了教材、习题、论文等丰富资源,并通过腾讯云TI平台进行预训练和教育任务精调,在中文阅读理解、问答和教育相关任务上表现出色。
此外,混元上线一站式AI智能体创作与分发平台“腾讯元器”,开启智能体生态。在平台上,用户不仅可以创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云上。5月30日,基于混元大模型打造的助手App腾讯元宝,也将加入大模型C端应用市场。
技术从可见变为可用,5分钟打造一款模型应用
无论是通用大模型,还是精调的行业大模型,都无法完全适配企业用户的需求。一方面是客户对于自己业务场景的理解,另一方面是市场对大模型应用落地还没完全把握。
在当天的沟通会上,腾讯云副总裁、腾讯云智能负责人吴运声对猎云网等多家媒体表示:AI要真正落地实用,推理成本的降低、工程性能极致优化都非常重要,这也是未来商业化取得提升的重要因素。
如今,在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持 16s 视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
让AI技术的真正落地,是所有技术服务商的愿景。大模型能力在提升,但还需要实现从可见到可用的跨越。同时,企业也期待将大模型快速应用于核心业务环节,以应对市场竞争。
因此,大模型的生态发展既需要强大的大模型底座,需要低门槛的开发工具。
腾讯云为此全新推出了大模型原生工具链,“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”三款PaaS产品。
“大模型知识引擎”整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,企业可以利用自有的知识库与专业文档,结合多模态技术,加载到知识引擎。当用户提问时,系统会先匹配相关文档片段,然后大模型基于提取的内容来生成回答。
值得注意的是,腾讯云“大模型知识引擎”可以做到5分钟开发一款知识服务应用,只需要在知识引擎内一键导入企业专属知识、填写基础配置、选择底层模型、测试发布、接入应用,就可以搭建一款企业级的知识问答应用,通过API调用,快速接入智能客服、内部知识问答、数字人等产品,并在客服营销、企业知识社区等各种与人连接的业务场景落地。
“图像创作引擎”基于腾讯混元的底层模型,实现业界领先的AI图像生成和编辑能力,支持文生图、图生图等不同需求。调用混元大模型的API接口,可以实现秒级出图,处理时间远低于业内平均水平,可以被广泛应用在营销、设计等领域。
“视频创作引擎”是基于多模态算法技术,来实现视频转译、视频风格化、画布拓展等多种功能。
三大引擎产品在技术支撑下,进一步缩短了企业和个人开发者与大模型的距离,如腾讯云所说的那样,要构建离产业最近的AI。
AI,离产业越近越实用
大模型,是近年来最火的赛道,腾讯在此花费大量精力,一边开发混元大模型,一边慷慨解囊,推动大模型生态发展,抢占AI时代的先手。
而在商业化落地上,腾讯则认为“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标”。
腾讯云所强调的“产业实用”,是腾讯多年来一直贯彻技术实用主义的价值观。在混元大模型发布之前,腾讯云就将大模型服务作为其开拓ToB业务的利刃。如汤道生此前所说的那样,要让行业客户去使用大模型的能力去解决具体的问题。
混元大模型经过应用实践,已经在腾讯内部600多个业务和场景中落地测试,也在金融、医疗、教育、汽车、能源等20多个行业推进来行业大模型的落地。
在C端,微信读书基于混元大模型推出了AI问书、AI大纲等新功能。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型;腾讯客服还基于混元大模型打造了人工客服助手。
在B端,腾讯广告基于混元推出了一站式AI广告创意平台——腾讯广告妙思。腾讯会议基于混元推出的AI小助手,可即时回答会议内外问题。企业微信、腾讯会议、腾讯文档等腾讯旗下协作SaaS产品,也已全面接入混元大模型。
强大的通用大模型的使用门槛很高,客户用不起。即便购买了通用大模型,后续的推理成本,甚至是精调成本也不低,对于大模型的落地并不能起到推动作用。
腾讯云生成式AI落地的三条路线,兼顾了企业用户的采购成本和技术投入,让企业差异化的需求得以满足。
腾讯云副总裁吴运声表示,无论是去年行业大模型,还是今年发布的大模型原生工具链,腾讯云自始至终的策略导向都是打造“离产业最近的AI”。
本周,腾讯云宣布了降价策略。
5月22日,腾讯云宣布旗下混元-lite模型免费,混元-standard-256k输入价格下调87.5%至0.015元/千tokens,输出价格下降50%至0.06元/千tokens。最高配置的万亿参数模型混元-pro,API输入价格则从0.1元/千tokens降至0.03元/千tokens。
通过工具降低使用门槛,又通过降价吸引新用户,以此来达到腾讯云产业实用的目标。
吴运声称,“技术KPI和市场KPI是相辅相成的,技术也好、产品也好,我们最终做的东西首先要满足客户需求,实现提质增效,在过程中发挥作用。目前大模型赛道还处于能力爬坡的过程中,腾讯云始终重视技术积累与客户体验,会持续为客户提供有竞争力的产品和服务。”