本文转载自:钛度车库,作者:韩敬娴,编辑:张敏。猎云网已获授权。
从传统AI时期开始,国产技术被寄予厚望的一个长板就是应用,大模型时代也是如此。从“玩具”到“工具”,是今年下半年以来国产大模型的一个最显著趋势。
在这样的背景下,关于大模型在汽车领域的应用,也开始热度飙升。
在乘用车部分,特斯拉发布的FSD V12版本已实现端到端的AI自动驾驶方案;阿里巴巴宣布AliOS智能汽车操作系统已接入通义千问大模型测试;东风日产、红旗、长城等多家车企宣布接入百度的“文心一言”...
在商用车部分,基于华为云盘古大模型,一汽解放与华为联手已开展了多个场景的验证测试;福佑卡车与腾讯达成战略合作,共同研发数字货运大模型...
大模型的如火如荼,让行业内颇有“不搞大模型的车企不是好车企”的感觉,但大模型能为汽车行业带来多大的想象空间,依然是目前需要讨论的问题,像图森未来CTO王乃岩就曾呛声“自动驾驶大模型是伪命题”。
不搞大模型的车企不是好车企?
目前,车企在大模型上车部分进行的探索,主要通过两种方式:一部分自建大模型,比如卢伟冰透露今年4月份小米正式组建了AI实验室大模型团队;理想汽车自研大模型MindGPT;广汽集团推出了广汽AI大模型平台;吉利汽车也表示首个全栈自研的全场景AI大模型搭载在吉利银河L6上。
另一部分则是走联合路线,比如小鹏联合阿里的大模型建立自动驾驶智算中心,斑马智行接入阿里大模型;福佑卡车与腾讯共同研发数字货运大模型等。
大模型争相“上车”,一方面是对于大模型来说,汽车是一个垂直领域,应用场景相对较小,对参数的量级要求也没有通用型大模型那么大。因此,普遍认为汽车最有可能成为率先实现大模型落地的B端场景。
但更关键的问题是,大模型到底能给汽车能带来什么样的改变和价值?总结来说,主要分为三部分:智舱、智驾和业务优化。
当前主流车企发力点都是交互领域,也就是智舱部分。目前车内主要使用的交互形式是“命令式交互”,就像语音遥控器,用户通过语音给车机发出一道指令,大模型加持下的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,让车内助手在未来有能力像真人一样跟用户交流,可以理解并满足用户在车内场景的深层次需求。
福佑卡车技术合伙人陈冠岭在与钛媒体App沟通时,从商用车的角度分享了交互形式改变的价值,他表示,福佑的大量用户是司机,司机在开车时跟福佑服务的交集主要是在司机的APP,但是APP的点击式操作并不太符合司机的实用性,而大模型本身是自然语言人机交互的,这更符合货车司机开车使用时的需求。
而在智驾部分的改变,最直接的是“工具链”的优化。以数据标注为例,众所周知海量的数据是无人驾驶的基础,行业通常采用大量的数据去训练自动驾驶算法,但人工标注成本高、效率低,而自动标注就是AI大模型赋能智能驾驶最直接的应用,能大幅降低数据标注的成本。旷视科技智驾业务总裁刘伟曾对钛媒体App透露,过去可能有12%的数据是人工标注,但预计接下来就会大幅下降。
在业务优化部分,其实就是让大模型能够尽快进入业务流程,降本增效。比如陈冠岭对钛媒体App介绍说,与腾讯的合作的端到端的OCR智能识别大模型能力就是针对物流证件识别、各类回单识别等场景实现了智能识别与自动处理,可以降低运营成本,提升服务效率。
对于具体的效果,他进一步介绍说,经过前期实践验证,针对多样式回单识别场景,经过少量样本训练,该大模型对图片字段识别准确率超过99%。图片信息综合识别匹配准确率超过95%,召回率比传统模型提高近20%。
机遇大于挑战还是挑战大于机遇?
大模型拉开了智能汽车领域较量的序幕,但从“首发”到“大规模”之间,也还有不短的距离。
首先,过于高昂的成本,在某种程度上会阻碍大模型大规模上车。毕竟,谁的训练成本低,谁的转化速度才能快。
众所周知,算力基础设施和算力服务对大模型训练不可或缺,其性能、质量和稳定性决定了模型训练成果。但以英伟达的H100为例,其训练效率众所皆知,但价格也是极其高昂,二手价格已经被炒到了4-5万美金。
红杉资本还曾做过一笔测算:全球的科技公司每年预计将花费2000亿美金,用于大模型基础设施建设;相比之下,大模型每年最多只能产生750亿美金的收入。
其次,大模型的准确性仍然让不少业内人士担忧,毕竟汽车驾驶的前提是安全与严谨,大模型给出“差不多”的答案肯定是不行的。
8月26日,马斯克在硅谷帕洛阿尔托(Palo Alto)的街道上直播测试特斯拉全自动驾驶系统FSD 12时,进行到第20分钟左右时,车辆穿过一个交通繁忙的红绿灯时,FSD 12出现了可能致命的误判:将左转车道的绿灯当成了自己车道的绿灯,启动车辆打算穿过路口。好在马斯克立刻介入,刹住了车。在此之后,被问及解决方案时,马斯克的回应是“继续向神经网络投喂大量带有左转交通灯的驾驶视频。”
这也在某种程度上揭开了大模型的弊端:算法运作方式不可知,无法精确定位问题,只能依靠喂养更多数据。
类似的问题在商用车上也难免存在。对此,陈冠岭向钛媒体App解释说,“货运是一个比较严肃的行业,其对大模型的准确性要求很高。福佑之所以会把OCR智能识别的应用放在了智能客服之前,正是之前在探索智能客服、智能分析时候,看到大模型有时候会编造一些结果。”
除此之外,陈冠岭还分享了大模型带来的其它顾虑,在他看来,大模型的应用其实是数字化转型的一个表现,所有数字化转型碰到问题,比如对业务流程的改造、人的接受程度等,其实大模型也会遇到。
比如数据隐私的问题,像数据如何传到云上,特别是一些核心的数据,还需要更多的监管政策;另外一个问题是数据质量的问题。做大模型的训练,对数据的质量要求比较高,企业如果想应用大模型,数据质量有没有达到要求也是关键。
不可否认,大模型将来会为汽车行业带来巨大的改变,也正在成为车企之间竞争的焦点。与此同时,其在算力、算法及数据方面的新挑战也会给发展带来变数,极越CEO夏一平曾在与钛媒体App沟通时说过,“自动驾驶值得用大模型的方式重写一遍,但是,这个事情可能是未来3~5年之内要做的事情,绝对不是明天就要做的事情。”
大模型在未来究竟是机遇大于挑战,还是挑战大于机遇,边走边看。