您当前的位置 : 东北网  >  龙江看天下  >  龙江资讯  >  企业

中国移动智算中心(哈尔滨)赋能产业升级

时间:2024-11-02 19:37:00  来源:  作者:

  人工智能作为新一轮科技产业革命的核心驱动力和新质生产力,引发了社会、经济、文化等各领域的变革和重塑,从面向单一模态的语言、视觉,到多种类型数据融合的多模态基础大模型研发,再到面向自动驾驶、生命科学等重点行业的专用大模型开发,各行各业都展示出对智能算力的巨大需求。

  中国移动在数智革命深入发展的崭新阶段,正在大力推进“三个计划”,即“AI+”行动计划、“BASIC6”科创计划、“两个新型”升级计划,通过持续推动全方位、系统性创新,为新质生产力贡献更强移动力量。

  攻坚克难,两个100天,建成国内一流智算中心

  中国移动智算中心(哈尔滨)充分利用哈尔滨数据中心软硬件优势、自然冷源地域优势,践行龙江“四大精神”和中国移动“工匠精神”,克服技术新、工期紧、任务重、挑战多等多重困难,在龙江省委工作专班指导下,在中国移动两级核心团队协同组织下,基于“D-PDCA双循环”管理机制,历时两个100天,完成3千多平米高功耗机房重大调整改造,千万级精密器件复杂施工;在30多个单位,千余人的协同作战下,提前4个月,建成全球运营商最大单集群智算中心,充分展现了龙江速度。

  “一个100天”完成机房的电源、空调、电气、建筑结构的扩容及智能化改造。业内首次挑战46KW高功耗风冷,创新引入大型集装箱式“10KV中压直供设备”新型供电模式,通过规、建、监、施协同作战,优化创新方案、专业强化管理等措施,实现430可装机,530全加电,620优交付,工期压缩40%。

  “一个100天”实现智算集群全量设备点亮。面对大规模集群施工在技术领先性、首创性和复杂性的交付挑战,通过“早启动、定标准、造工具、融工序、勇创新、强投入”六大举措,筑牢集群质量,实现610可调测,730全点亮,830全交付,提前4个月投产。

  技术领先,自主可控,打造全球运营商最大单集群智算中心

  中国移动智算中心(哈尔滨)是全球运营商最大单集群智算中心,单集群规模超1.8万卡,可提供6.9EFLOPS(每秒690亿亿次半精度浮点运算)智能算力,融合分级存储达150P。

  通过科学管理、精细化设计和高工艺实施,完成集群稳定性、算力效率、海量数据和高可用性挑战,打造具备极致算力、极限组网、极效存储、极速运维的智算“超级工厂”,释放算力集群优势,为万亿模型训练提供强大的算力底座。

  极致算力AI芯片国产化率100%,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限,算力达到6.9EFLOPS(每秒690亿亿次半精度浮点运算),通过单一集群强大算力有效支撑大型AI模型训练,并通过网络精细化设计、软硬件全栈整合优化,实现集群算力效率的近线性提升,确保万卡集群最大化释放算力,满足万亿参数大模型训练要求。

  极限组网,采用国产46KW风冷网络设备、构建最大规模两级组网。高性能、高功耗国产网络设备首次端口满负荷配置,达到网络设备能力上限,采用高速、低延时、无阻塞两级组网,保证数据的高效通信。创新应用中国移动自研的天池SDN,提供网络功能自服务能力;创新引入中国移动自主知识产权、首个非美标智算组网GSE技术。

  极效存储,面对万亿模型PB级训练数据集的多协议处理,采用大规模融合分级存储,通过训练数据智能分级和统一管理,实现数据高效共享和处理,满足大模型训练时海量、多样数据的高效处理和高吞吐要求。

  极速运维,建立SLA标准服务支撑体系,提供矩阵式维护服务;部署一体化智能管控工具,对AI训练任务进行全生命周期管理,实现小时级智能断点续训、分钟级故障定界定位;建立Class8级机房环境标准,降低千万精密器件故障率。通过制度、技术和标准三大措施,保障万张AI加速卡长时间稳定并行训练,为万亿模型训练提供高性能、高可用、高可靠的算力底座。

  产品齐全,服务高效,赋能产业AI转型升级

  中国移动布局人工智能发展,从多样化算力生态、全栈智算产品服务体系、全链路监控运维调优到“九天”系列通专结合大模型矩阵,打造从基础设施到核心能力的开放AI服务,对内满足“九天”模型自训需求,对外面向千行百业提供一站式智能计算服务。

  通过建立一体化运营运维支撑团队,统筹建立产品运营、客户运营、生态运营、运营支撑全景视图,重点聚焦高校/科研机构、腰部/初创客户,拓展行业市场。

  在龙江省内构建政务智慧大脑,打造了政务智能助手、数字人、龙政智搜等创新应用,推动了黑龙江数字政府智能化升级;聚焦带动农业生态的发展、推动农业产业升级、催生农业生产生活新范式;面向教育、工业、医疗等行业的AI+“智改数转网联”,依托哈尔滨智算中心算力能力和中国移动九天大模型能力,中国移动将当好供给者、汇聚者、运营者,发挥创新纽带作用,引领产业AI转型升级。

责任编辑:王傲