今日,腾讯的官方微信号发布消息称,腾讯云新发布面向大模型训练的新一代HCC高性能计算集群,整体性能比过去提升了3倍。
当前大热的人工智能大模型训练,离不开高性能的算力集群。腾讯云本次发布的算力集群,搭载了NVIDIA H800Tensor Core GPU,能够提供高性能、高带宽、低延迟的智算能力支撑。
腾讯官方称,新的算力集群主要有以下几个特点:
一是在计算方面,性能强。在单点算力性能最大优化的基础上,还将不同种类的芯片组合起来,GPU+CPU,让每块芯片去最恰当的地方】。
二是在网络方面,带宽足。GPU擅长并行计算,一次可以做多个任务。腾讯的自研星脉高性能网络,让成千上万的GPU之间互相“通气”,信息传递又快又不堵车,大模型集群训练效率提升了20%。
三是在存储方面,读取快。训练大模型时,几千台服务器会同时读取一批数据集,如果加载时间过长,也会成为木桶的短板。腾讯的最新自研存储架构,将数据分类放进不同“容器”,用作不同的场景,读取更快更高效。
总体而言,腾讯表示其正以新一代HCC为标志,基于自研芯片、自研服务器等方式,软硬一体,打造面向AIGC的高性能智算网络,持续加速全社会云上创新。