首页 > 最新动态 > 中国网络大会主旨报告 | 规模x10驱动智算集群网络架构新一轮变革
最新动态
中国网络大会主旨报告 | 规模x10驱动智算集群网络架构新一轮变革
2024-10-15147



本报告将全面阐述阿里云HPN架构设计理念,端网融合的技术架构体系,全栈自研(包括交换机,网卡,光互连,RDMA协议栈,集合通信等),以及GPU Scale Up互联架构, XLink协议演进等方面的核心技术创新,并与行业专家一起探讨未来AI智算基础设施演进方向。






阿里云高性能网络(HPN: High Performance Network)是一种专为AI大模型时代而设计的新型智算数据中心网络,HPN架构已在阿里云大规模部署一年多,有效解决了万卡集群的性能和稳定性问题,极大的提升了集群的有效算力。AI大模型的Scaling Law还在持续,在集群规模x10(万卡到10万卡集群),GPU Scale Up互联规模x10,以及面对高性能推理场景,未来数据中心网络架构如何演进?行业生态又会如何发展?本报告将全面阐述阿里云 HPN 架构设计理念,端网融合的技术架构体系,全栈自研(包括交换机,网卡,光互连,RDMA协议栈,集合通信等),以及GPU Scale Up互联架构, XLink协议演进等方面的核心技术创新,并与行业专家一起探讨未来AI智算基础设施演进方向。


报告人:



蔡德忠

阿里云智能集团研发副总裁、基础设施网络负责人


蔡德忠,现任阿里云智能集团研发副总裁,主导设计了阿里云新一代超大规模数据中心网络架构和面向AI大模型时代的新型高性能智算网络架构,带领团队实现了阿里云基础设施网络全域核心软硬件系统的自主研发。任Linux Foundation SONiC项目的创始成员Board Member,UEC(超以太网联盟)技术咨询委员会委员,高通量以太网联盟主席。有十多项网络领域的美国技术专利,在SIGCOMM、NSDI、OSDI、SOSP等国际顶级会议发表十余篇论文。加入阿里云之前,在思科担任Distinguished Engineer,思科运营商事业部全球解决方案首席架构师





*日程信息实时更新,以大会最终公布为准。

获取更多关于2024 CCF中国网络大会(CCF ChinaNet2024)信息,请登录大会官网:https://ccf.org.cn/chinanet2024

注册链接:

https://conf.ccf.org.cn/conf/signup/add.htm?meetingId=m1275479648918179840172413964556


注册二维码:



说明:本次会议通过CCF会议管理系统缴费,退费遵守《CCF关于会议注册费的退费规定》。








点击“阅读原文”,立即注册!

点我访问原文链接