近日,世纪互联与华为在上海签署战略合作协议,双方将通过资源共享、优势互补,深化在AI原生、链网一体、绿色算力加持的超互联分布式算力领域的战略合作,打造新一代AI原生基础设施,加速AI原生应用落地。 此次合作将开启从局域网到互联网,再到云网,乃至面向大模型应用的超互联网络架构“代际”跃迁。
作为全球领先的ICT解决方案提供商,华为公司将在智算广域骨干、分布式智算、xSEC安全加密等方面提供前沿技术能力,并与世纪互联一同在联合创新、标准&生态推进、工程部署等方面开展深度合作,共同赋能服务百行千企的“AI+数字经济联合体”,共同打造新一代超互联城市分布式算力底座(算网大脑)平台。
2024年9月,随着OpenAI 推出“o1”模型,推理范式迎来重大变革。AI加速向智能体迈进,计算从预训练转向推理阶段,并从一定程度突破了原来AI模型训练Scaling Law的瓶颈。受限于持续攀升的算力持有和运营成本,AI发展亟需创新思维与技术来破局。一个有效的解决思路是将分散于各地的GPU、数据和模型资源高效整合,通过优化资源配置并共享,降低企业使用AI成本,助力AI原生应用快速落地。
世纪互联与华为结合自身实践,总结出面向企业AI应用基础设施的四大趋势:第一、需要多点无阻塞的计算和连接架构(东西向流量);第二、延迟和带宽对于整体生产力将产生巨大影响;第三、安全变得更加重要,安全框架也将发生本质的变化;第四、业务自闭环和区域化的特性,使其不再依赖大规模的互联网。
新范式下,传统云网架构已经显得“力不从心”,AI基础设施亟需一场革命性变革。就在今年9月,华为云重磅发布AI原生云基础设施架构 CloudMatrix,以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。此次,华为与世纪互联强强联合,共同打造超互联城市分布式算力底座,进一步提升 AI 原生基础设施的效能。
超互联城市分布式算力底座是基于对于AI原生世界和需求的分解,依托世纪互联在面向企业的算力、网络、平台、服务等的长期积累和实践,结合华为公司领先的硬件和整体解决方案而构建的,持续迭代升级的一体化赋能体系。
1)AI原生超级互联(Ultra Cross Connects,简称UCC)城市计算总线架构:构建园区全光网络和城域高速算力总线。依托华为领先的动态切片、加密、和安全网关产品方案进行集成创新,尤其是基于华为的IPv6+城域算力切片或星河AI网络构建城域算力切片,实现在城域范围内任何算力主体、园区、楼宇、企业、个人都可以通过就近节点,高速安全的接入到该总线。任何企业、家庭、个人,都可以结合业务需求,创建动态私有网络,连接算力、私域数据和模型,构建私有计算空间。作为城市新型市政基础设施平台,UCC将极大的降低企业连接的边际成本,实现城市的智能升级。
2)通过园区、楼宇的改造,以及运营商城域UPF的直连,实现100G直达办公桌面、40G直达AI原住民家庭及5G切片模式下的智能手机接入。作为企业经营活动的主要场所,园区和楼宇的传统网络存在诸多不足,利用华为的无源全光接入方案,进行园区全光极简网络改造,实现园区网络控制面的上移,并简化日常维护和管理的复杂度。同时,结合城域UCC总线,打通园区到算力、园区到5G UPF的链路,实现高速、安全的私域组网。
3)一机双网,最大限度充分利用GPU算力资源。城域AI算力节点同时连接UCC总线和互联网,使得算力资源不仅可以在超互联UCC架构下满足私域计算的需求,同时也可以在闲时通过Neolink.AI算力平台的调度,实现在互联网平台上的售卖,在保证安全和隔离的同时,充分利用GPU算力资源。
4)城域多数据中心,分布式算力资源池融合管理。枢纽型(Hub)、辐射型(Spoke)、边缘型(Edge)等不同形态的智算中心,可以通过UCC计算总线实现高速连接。通过资源的池化和调度,以及远距离RDMA技术,使得城域范围内的多方算力资源得以高效整合与利用。
5)利用边缘智能网关,实现接入侧的协议和安全架构上的整合创新。以独立的公私钥地址,来实现寻址和终端校验,实现UCC城市计算总线内所有连接的“可信、可管、可控”,构建新一代安全原生架构,提供与传统互联网B2B、B2C、C2C不同的新一代数字基础设施。
6)一站式模型和数据平台服务。由于基础模型的持续更新、企业新数据的不断导入和微调训练,企业AI应用始终动态变化,模型规模日益增大,以Llama3.1 405B模型为例,其完整模型文件已经超过TB级别,通过传统互联网需要几天的下载,通过UCC总线架构和远距离RDMA技术,可以在几分钟之内实现快速更新。
随着AI原生时代的全面到来,AI技术边界不断拓展,大模型作为新的技术驱动力,不断催生全新的应用形态。AI原生超互联基础设施的架构和内涵也需要逐步迭代和进一步创新。世纪互联和华为将共同在标准、协议、架构等领域深入合作,构建开放的生态和社群,共同推进AI原生应用和生态的发展。此外,双方也将共同构建标准化的赋能体系,通过技术、方案、工程、维护、人才培养等一站式赋能服务,使得城市合伙人可以快速构建该城市的AI原生基础设施,共同开启AI原生应用的无限可能。