首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求

更新时间:2024-03-23 17:56:17作者:橙橘网

首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求


天翼云上海临港国产万卡算力池正式启用。

3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,同时入驻首批用户。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。

会上,人工智能研究院、稀宇科技、百川智能、思必驰科技、亿熵智能科技、澜码科技、赛陇生物科技、天壤智能科技8家合作伙伴签署入驻协议。

全球人工智能发展正在进入“深水区”。随着生成式AI的迭代和发展,大模型规模以惊人的速度扩展,万亿参数级别几乎成为通用大模型的标配,由此带来的是算力需求的急剧增长。

作为践行《新型数据中心“算力浦江”行动计划(2022-2024年)》的重要举措之一,中国电信在临港新片区成立临港算力(上海)科技有限公司,加速临港算力中心建设,为长三角提供更加优质、更加普惠的智算公共服务。2024年初,中国电信在上海临港智算园区投建15000卡公共智能算力中心,这是全国规模最大的运营商级智算中心。

经过紧张的建设,3月22日,上海临港智算园区的首个国产单池万卡液冷算力集群正式交付,并投入商业运营。

此次启用的天翼云上海临港国产单池万卡液冷算力集群创新性地采用网络中置、算力分层的“魔方”型,实现了单一集群内万卡高速互联,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。同时,为了实现绿色低碳的目标,全面采用融合液冷服务和IDC基础设施的新一代智算液冷DC舱,实现了数据中心的能效和智算集群的算效双提升,为“人工智能+”提供智能、弹性的绿色算力。

据介绍,此次正式运营的公共智算中心,以中国电信天翼云自研TeleCloudOS 4.0为底座,承载天翼云算力分发网络平台“息壤”、智算基础设施平台“云骁”、一站式智算服务平台“慧聚”,构建算力聚合分发的新模式,实现全栈能力自主可控、安全可信,多项技术指标领先,可为大模型企业提供从算力供给、算力输送、算力调度到模型训练及推理应用的一站式服务。

会上,八家合作伙伴宣布将作为首批用户入驻临港国产算力池,其中既有通用语言大模型公司百川智能、稀宇科技、思必驰科技、天壤智能,也有金融领域的行业大模型金声玉亮、企业级AI-Agent平台公司澜码科技、AI创新生物制药公司赛陇生物,以及上海人工智能研究院,基本覆盖基础层、技术层、应用层等人工智能完整产业链。

思必驰科技联合创始人、首席科学家俞凯接受澎湃新闻记者采访时表示,此次国产万卡算力池解决了算力供应问题,对租用算力的企业来说主要考虑两个问题,一个是有没有算力,二个是能不能用得起。“现在算力是有了,用不用得起上海是有一系列配套政策的。”俞凯表示,这次国产万卡算力池正式商用是一个很好的开始,在模型训练过程中一些适配以及针对性调整,总体上属于先进水平的算力中心。