首页 > 最新动态 > 开放互联协议如何重塑AI算力格局?| CNCC
最新动态
开放互联协议如何重塑AI算力格局?| CNCC
2025-10-153

随着AI大模型训练需求的日益增长,AI集群规模越来越大、大模型训练部署方式越来越多样,这种趋势对底层GPU/NPU支撑规模提出了更高的要求,达到了万卡级别以上。然而,如何满足如此庞大规模的训练任务,对网络的规模、性能、可靠性和稳定性等方面提出了前所未有的挑战。业界当前提出了很多互联协议的创新,包括UnifiedBus(灵衢)、NVLINK、UALINK、CXL等,因此寻求提供极致高性能网络已成为人工智能领域的重要研究方向之一,本论坛主要围绕互联总线协议的创新,释放算力性能。



论坛安排




论坛名称:AI网络互联创新:从架构突破到性能跃迁

日程安排:10月23日13:30-17:30

举办地点:华旗饭店-3层301

注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准



时间

议题

时长(min)

主讲人

单位

13:30~13:35

主持人开场及嘉宾介绍

5

   定

13:35~13:40

会议致辞

5

马洪波

华为技术有限公司

13:40~14:10

面向CXL的软硬件协同数据管理技术

30

孙广宇

北京大学

14:10~14:40

UB在智算通算的应用价值

30

  沛

华为

14:40~15:10

Congestion Management in/beyond Datacenter Networks:  Pyrrha as a case

30

  臣

南京大学

15:10~15:40

灵衢的系统逻辑和计算机体系结构新探索

30

程传宁

华为

15:40~15:55

茶歇

15

ALL

15:55~16:25

基于高速互连总线的大内存系统

30

刘海坤

华中科技大学

16:25~16:55

光数直达:长距离高性能数据传输技术之WRDMA

30

张伟哲

哈尔滨工业大学

16:55~17:45

Panel:总线技术创新的核心挑战:架构革新、协议突破与生态共建

50

主持:吴沛

ALL

研讨人:所有演讲嘉宾


论坛主席



吴沛

华为技术有限公司灵衢系统技术专家

在华为工作24年+,长期负责网络、总线领域的芯片和产品设计工作,参与了华为第一代集群产品、第一代和第二代智算超节点的产品系统设计。


报告题目:灵衢在智算通算的应用价值


报告摘要:基于灵衢互联协议,可以实现智算和通算超节点系统架构,具备总线性能、全量池化、平等互联等技术特征;本议题围绕基于灵衢的超节点方案,讨论在智算和通算不同应用场景中的性能收益。


论坛讲者



孙广宇

北京大学教授

北京大学集成电路学院长聘教授。研究领域为领域定制体系架构的设计与自动化,包括高能效计算架构、新型存储架构、DTCO/STCO等。在包括ISCA、MICRO、HPCA、DAC、TCAD在内等高质量会议和期刊上发表论文150余篇, 获最佳论文奖5次、最佳论文提名4次。获得CCF-IEEE CS青年科学家奖、DAC Under-40 Innovators Award等,并入选体系架构会议HPCA“名人堂”、可重构硬件会议FPGA“名人堂”、北京智源人工智能研究院“青年科学家”等。


报告题目:面向CXL的软硬件协同数据管理技术


报告摘要:CXL技术对于存储扩展和共享等场景提供了有力支持,如何减少CXL访问延迟对于系统性能的影响是一个关键的研究方向。本次报告将从扩展内存的分层管理、共享内存的事务访问等场景入手,采用软硬件协同的方法优化冷热数据管理、数据一致性维护等需求,从而显著提升CXL平台的访存性能。另外, 将介绍我们基于FPGA硬件搭建的CXL仿真平台。

田臣

南京大学教授

南京大学计算机学院教授,国家自然科学基金杰出青年。在计算机网络和分布式系统领域SIGCOMM、NSDI、OSDI、FAST、SIGMOD、PPoPP、ASPLOS、Eurosys等多个顶级学术会议和知名国际期刊上录用和发表论文100余篇。他的工作受到了国内外研究者的广泛引用和关注,他为下一代数据中心网络提出以流量控制为中心的拥塞管理理念,设计了拥有自主知识产权的带状态可编程网络测试仪,主导实现了对开源网络仿真软件的大规模并行加速,曾任OpenNetLab国际网络实验设施的轮值主席。

程传宁

华为技术有限公司灵衢协议首席架构师,海思计算互联资深架构师

2007年加入海思处理器平台部门,历经接口IP、转发芯片、通信处理器、鲲鹏处理器、昇腾处理器研发工作;历任角色是芯片工程师、项目架构师、海思图灵IO和互连领域架构师。在2019年那个事件后,作为专职架构师,从事灵衢基础概念、基础特性、协议开发工作,负责灵衢软硬件联合架构组,并看管海思灵衢套片公共特性。

刘海坤

华中科技大学教授

华中科技大学教授,国家高层次青年人才计划入选者,湖北省杰青获得者。2012年于华中科技大学计算机系统结构专业博士毕业,先后在美国、新加坡开展访问交流和博士后研究工作。目前主要研究兴趣为新型内存和存储系统、云计算等。先后主持10多项国家自科基金项目、国家重点研发计划课题以及企业技术合作项目。在包括ASPLOS/ISCA/HPCA/USENIX ATC/FAST /SC等计算机顶级国际会议和期刊发表论文80多篇。获得国家自然科学二等奖、教育部自然科学一等奖、湖北省科技进步奖一等奖、上海市技术发明奖一等奖、华为奥林帕斯先锋奖各一项。


报告题目:基于高速互连总线的大内存系统


报告摘要:大数据、AI大模型等新型应用在当前的计算架构下面临内存扩展的巨大挑战。基于高速互连总线(如CXL/UB)的内存池化是实现大内存系统的基本途径。然而,该内存架构对体系结构、系统软件、编程模型都带来了巨大冲击。本报告将从内存扩展卡控制器设计、分布式内存管理等几个方面探讨设计基于高速互连总线的大内存系统面临的关键挑战,并展望其未来发展方向。

张伟哲

哈尔滨工业大学教授,鹏城实验室新型网络研究部副主任

哈尔滨工业大学计算学部网络空间安全学院副院长。长期从事计算机网络、网络空间安全、高性能计算、云计算和嵌入式计算等领域研究,是科技部十四五国家重点研发计划网络空间安全专项专家组成员,同时担任工信部密码应用推进专家委委员、国家自然科学基金信息学部评审会专家、国家重点研发计划项目评审会专家、中文信息学会评测工委会主任等。


报告题目:光数直达:长距离高性能数据传输技术之WRDMA


报告摘要:广域长距离高性能传输,不仅仅是大科学数据搬运、存算分离、算力协同等应用场景需求,同时也是“中国算力网”、“东数西算”等国家科技战略的重要支撑。RDMA是数据中心内广泛使用的高性能传输技术,将RDMA长距广域化是其中技术挑战。针对该挑战,提出WRDMA传输技术,充分利用全光网专线确定性、大通量特征,结合线路资源感知技术,采用大窗口高重传阈值传输控制算法,减小网络传输吞吐与线路带宽间隙。针对丢包问题,采用基于多队列缓存的选择重传方案,降低丢包对传输性能的影响。此外,研制WRDMA网卡,采用FPGA对现有RDMA(RoCE)与上述算法/方案进行高性能实现。通过“协议栈自主可控-传输算法优化-高性能实现-实网试验”研发流程,构建自主WRDMA技术体系。



CNCC2025



CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。





图片


图片
图片
图片

点击“阅读原文”,进入官网。

点我访问原文链接