本文来自合作媒体:华商韬略,作者:陈必章。猎云网经授权发布。
在人工智能时代,AI算力就是电,AI计算中心就是电厂。
电力时代,我们构建了一张“电网”,如今随着国内各地人工智能计算中心的相继落地,我们正在编织一张AI算力网络。
目前,人工智能的发展已提升到国家战略层面,加快人工智能产业发展,保障和提供充沛的AI算力,对于赢在AI时代的国家、城市和企业来说,已经是迫在眉睫的问题。
1、没有算力、就像没有电
最近这段时间,全国很多地方政府和企业领导最闹心的事情什么?
答案可能是两个字:缺电。
但这个闹心的事情还没解决,在全球各国,乃至一国之内的不同地区,又开始面临一个像电力一样,决定国计民生的关键要素。
这个关键要素就是AI算力。
AI算力,顾名思义,就是支撑AI的计算能力。此处的计算不是加减乘除,而是对世界万物的计算,是万物互联、人工智能之下的高度复杂、无所不在的计算。
不同于传统算力,AI算力为了支撑AI模型的开发、训练和推理,对并行处理能力的要求特别高,也因此需要专门的AI芯片和框架。
比如,具备强大浮点运算能力的AI芯片,才能够通过训练、持续迭代优化提供满足行业企业智能化转型的高质量AI模型。复杂模型训练中,需对上千亿个浮点参数进行微调数十万步,需要精细的浮点表达能力。如果没有强大的训练芯片,则难以保障算法模型产出的效率。千亿级中文NLP(自然语言处理)大模型“鹏程·盘古”,面向生物医学领域的“鹏程·神农”平台的发布,都离不开AI芯片的支撑。
再比如,被视为“AI领域操作系统”的AI框架,90%的AI应用是基于AI框架层来开发。在该领域国内科技企业已取得重大成果:业界领先的AI计算框架昇思MindSpore,是一款支持端、边、云全场景的深度学习训练推理框架。除具备自主可控的优势之外,一套框架即可支持AI+科学计算等多样性应用。当前昇思MindSpore社区累计下载量超过60万,有超过100家高校选择昇思MindSpore进行教学。
正是有了这些AI芯片和AI框架释放出的AI算力,我们才能加速进入万物互联和人工智能时代。
今天,从每个人手里的手机,到企业的云上平台,再到城市大脑……我们的生产和生活越来越依赖于AI,越来越深入向AI获取力量。
对中国来说,AI是从制造大国向制造强国转型升级的关键。最近多年,众多城市都在努力争夺各种资源提升城市的发展力和竞争力,而AI算力就是未来发展最重要的“资源”。
在人工智能的世界,没有AI算力,就像没有电。
AI算力已渗入到我们生活和生产的方方面面,以大家较为熟悉的医院药房取药为例:
拿到处方药单,在药房前排队等候,由医务人员拿着处方照单分药,这种漫长的等待和焦虑,很多人都有切身体会。现在,已经有企业开发出利用人工智能技术进行全自动补发药品的机器人,用到了3D视觉定位、机器人智能抓取、智能视觉复核技术,能够确保100%补药准确率,而且效率也更高,发药速度可以达到每小时2500盒,8秒钟就可以处理一个订单。在药品发放过程中,系统可以自主调度搬运药品,不需要人工的干预。
它带来的最直观的改变,就是可以把药品分拣的时间从原来的50秒缩短到3秒,患者只需要一分钟就能取到药品。
这个过程中,怎么识别处方单,怎么准确分拣并发放药品?要实现这些功能就得看这个机器人使用的AI系统能算得有多快、多好、多准,这就是AI算力。
2、要有电,就得有电厂和电网
AI算力如此重要,但很多企业缺乏足够的资金来搭建自己的AI算力。那AI算力需求该如何被满足,国家、城市又该如何提供足够的AI算力支持,推动AI产业发展并赢得AI时代的竞争力呢?答案是,要让AI算力成为公共资源,配套建立新型基础设施。
这种新型的算力基础设施就是人工智能计算中心,用回电气时代的比喻,那就是要建电厂和电网。
首先是,加快人工智能计算中心的建设。
人工智能计算中心,是以基于人工智能芯片构建的人工智能计算机集群为基础,涵盖了基建基础设施、硬件基础设施和软件基础设施的完整系统,其核心功能就是,提供从底层芯片算力释放到顶层应用使能的人工智能全栈能力,也就是输出AI算力。
人工智能计算中心除了是提供公共算力服务的平台,还同时应该是应用创新的孵化平台、产业聚合发展平台和科研创新人才培养平台。只有同时扮演好这些角色,才能打通“政产学研用”,集中最多的力量,形成产业汇聚力并提升AI竞争力。
目前,全世界都在加快人工智能计算中心建设。尤其是美国,它一方面千方百计地打压其它国家的发展,一方面则大手笔投入加强本国人工智能的发展,拜登政府更一度公布了3000亿美元的投资计划,捍卫美国在人工智能领域的领先地位,而其中很重要的投入,就是加强数据中心和智算中心的新基建。
中国当然不会轻易错过人工智能产业发展带来的机遇。早在2017年,国务院就发布了《新一代人工智能发展规划》,并强调要“建设高效能的计算基础设施”。去年疫情期间,中央进一步明确提出新基建战略,而加强数据中心和人工智能计算中心建设,则是整个新基建的重中之重。
因为,没有强大的算力,以数字化为着眼点的新基建七大领域几乎都无法实现其建设目标。
国家战略指引,市场前景召唤,甚至经济转型升级的压力下,诸多地方政府都已积极行动,牵头人工智能计算中心建设,并以此为基础提升本地算力水平,构筑数字时代的核心竞争力。
今年5月31日,科技部批复的15个国家人工智能创新发展试验区中,武汉的人工智能计算中心已率先竣工并投入运营;西安未来人工智能计算中心也已经上线,其它省市的人工智能计算中心建设也陆续规划中。
武汉人工智能计算中心投运以后,为武汉乃至湖北地区的经济发展、科研创新、企业转型等提供了算力支撑。
比如,武汉大学基于武汉人工智能计算中心打造了全球首个遥感专用框架武汉.LuojiaNet,针对“大幅面、多通道”遥感影像,在整图分析和数据集极简读取处理等方面实现了重大突破。
再比如,中科院自动化所利用该中心的算力支持,研发了全球首个视频生成多模态大模型——紫东.太初。作为业内首个千亿级三模态大模型,紫东.太初的视频理解与描述性能已做到全球第一,不仅具有多任务联合学习能力,还能通过学习实现AI化的图文搜索,以及音频、短视频、MV制作,极大缩短音视频的创造时间。
9月份,西北地区第一个人工智能计算中心落子西北重镇西安市,一期规划具备300P AI算力的西安未来人工智能计算中心,基于昇腾AI基础软硬件平台建设,将提供精准可靠的模型训练及推理。
西安未来人工智能计算中心,已经签约了西安电子科技大学遥感项目、西北工业大学语音大模型项目、陕西师范大学“MindSpore研究室”多个项目,在支撑西安“6+5+6+1”现代产业体系发展的同时,也会强化西安乃至整个西北地区的人工智能产业集群,为西北地区人工智能产业的发展提供算力支持。
刚刚上线的西安未来人工智能计算中心,算力使用率已快接近满负荷状态。当地各行业企业、科研机构、高校对于算力的渴求可见一斑。
其次,高效利用人工智能计算中心的算力资源。
当越来越多人工智能计算中心建成、投运,如何让它们的算力更高效并服务到更多的行业和企业?如何避免各地算力分布不均衡、使用效率不一致的情况?如何让没有规划建设人工智能计算中心的地方,也能享受到AI算力的使能?人工智能计算中心之间的互联、协同、共享,成为需要各界考虑的一个问题。
这就需要人工智能算力网络了,就像电网之于电厂和用电对象。
有了算力网络,我们就能将分布在各地的人工智能计算中心节点连接起来,动态实时根据算力资源状态和需求,实现统筹分配和调度计算任务,构成全国范围内的感知、分配、调度人工智能中心的算力网络,然后在此基础上汇聚和共享算力、数据、算法资源。
最重要的是,有了这张网,更多的行业和企业,就能像现在用电一样使用AI算力了。
那么,算力网络这张网还会给整个人工智能行业有哪些作用呢?
首先是算力的汇聚,就是把不同地区、不同城市的算力资源高速互联,实现跨节点之间的算力合理调度,资源弹性分配,这有利于提升各个人工智能计算中心的利用率,实现对于整体能耗的节省,后续可支持跨节点分布学习,为大模型的研究提供超级算力。
其次是数据的汇聚,政府牵头与各行业企业合作,在达成人工智能领域的公共数据开放之后,可依托人工智能计算中心汇聚高质量的开源、开放的人工智能数据集,能够促进人工智能领域的算法开发和行业落地。
最后是生态的汇聚,各个人工智能计算中心之间,统一互联标准、应用接口标准,实现网络内大模型能力开放与应用创新成果共享,强化跨区域科研和产业协作,为全国范围用户进行人工智能应用创新提供更多的资源选择和更便捷的合作方式,加速产业聚合,激活产业共融共生。
简单总结算力网络,就是汇聚大数据+大算力,使能大模型和重大科研创新,孵化新应用。进而实现算力网络化,降低算力成本,提升计算能效。
科技部在三年行动规划中指出,要“布局若干人工智能计算中心,形成广域协同的人工智能平台”。在这一规划的指引下,人工智能计算中心陆续在许多城市落地。就在刚刚结束的HC2021上,20多个人工智能计算中心建设城市联合点亮了“人工智能算力网络”。
这张人工智能行业的算力网络,已经开始编织构建。
3、AI算力建设,不是从长计议而是迫在眉睫
2020年,麻省理工学院计算机科学家、并行计算先驱Charles Leiserson在《科学》杂志上撰文指出:
深度学习正逼近现有芯片的算力极限。
事实上,过去十年,人类最好的AI算法对算力的需求几乎增长了100万倍,平均每3.4个月翻一倍。
相比之下,全球AI算力的增长却十分有限。
需求与供给之间的巨大鸿沟,促使各国政府,尤其是中、美、欧、日等AI技术领先的地区大力建设AI算力。
没有强大AI算力,一个国家或地区必然在未来的科技竞争中处于劣势。
从当前算力基础设施建设进度来看,深圳、武汉、西安等城市均已建成人工智能计算中心并投入运营,成都、河南等城市正在建设中,北京、南京、上海等地的人工智能计算中心加速建设,也是蓄势待发。
未来,一旦人工智能计算中心全部建成,并组成人工智能算力网络,不但将为社会提供跨地域、源源不断的超级算力。而且,还能够实现跨区域的科研和产业协作,使能大模型和重大科研创新,为千行百业孵化新应用。
最终,使得人工智能赋能更多的行业和场景,让我们在未来国家之间的产业和科技竞争中立于不败之地。