CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思辨。
今年Tutorial共设置9大主题板块:AI基础模型、机器学习理论与机理、强化学习与推理、视觉与多模态、AI安全与治理、面向AI的数据管理和治理、Agent与具身智能、新型计算与网络架构、AI4Science。
??Tutorial名称:
面向智能加速的异构算力云
??所属主题:
新型计算与网络架构
??日程安排:
2025年10月22日下午
??举办地点:
哈尔滨市·华旗饭店
注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准
Tutorial 第一部分:异构算力云平台概述
摘要:当前,AI与新型计算领域面临严峻的“算力墙”挑战:摩尔定律放缓制约单一计算架构性能提升,而大模型训/推等场景亟需异构资源动态组合。传统云平台受限于孤立计算单元供给模式,难以满足需求。为此,异构算力云平台应运而生,其通过深度整合CPU/FPGA/GPU/NPU等算力,以云服务形式向开发者提供易获得且高成本效益的异构算力环境。本报告将以一套自研的异构算力云平台原型系统——思沃(SERVE)为例,介绍异构算力云平台的发展背景、架构原理、关键软硬件技术及其典型应用场景。目前该原型系统已应用于中国科学院大学本科生及研究生课程教学中,为系统架构创新提供了高效实验平台。
Tutorial 第二部分:异构计算编译技术基础与智能加速实现
摘要:本报告聚焦异构计算编译核心,解析其如何适配GPU、NPU、FPGA及自定义硬件实现程序加速,厘清传统编译与深度学习编译的异构适配逻辑。首先介绍传统编译的异构能力:通过CUDA、ROCm等既有编译工具链,以指令集定制、硬件逻辑转换完成高级语言到单一异构硬件代码的映射。接着讲解深度学习编译的异构优化:依托传统编译工具,新增模型层级优化(子图划分、算子选择、数据排布)与多层级中间表示(如TVM的Relay IR、MLIR)以统一计算逻辑,并利用TVM等工具为异构硬件设计专属运行时,实现“模型-多硬件”协同。最后简述核心流程:通过计算图优化与中间表示规整逻辑,结合传统编译完成指令转换,借运行时分发任务,为异构算力云协同加速奠定基础。
Tutorial 第三部分:异构算力云平台上的开源处理器敏捷开发实践
摘要:以RISC-V为代表的开源处理器已受到广泛关注,异构算力云平台中的FPGA资源为开源芯片敏捷开发提供了有力支撑。然而,云上FPGA的调试与观测能力受限,亟需新的调试手段与工具。在此部分,我们将介绍基于FPGA的开源加速仿真框架REMU。REMU通过硬件检查点与确定性回放技术,实现对目标处理器的全比特精确与周期精确的仿真与观测,从而提供一种高效、低成本的系统级仿真调试工具。结合“香山”高性能开源处理器,引导参会者从系统级视角体验REMU工具,利用定制的FPGA云服务实现“香山”CPU的软硬协同调试。
Tutorial 第四部分:异构算力云平台上的AI加速器敏捷开发实践
摘要:GPU凭借其强大的算力,在模型训练领域占据主导地位,然而在模型推理领域,却面临高成本、高能耗和低利用率的挑战。相比之下,FPGA算力在AI推理领域展现出显著优势,但其开发复杂度却成为一大制约因素。在此部分,我们利用异构算力云平台讲授从PyTorch Transformer模型生成FPGA加速器IP的全流程自动化开发体系。该体系相对传统流程自动化程度高、开发迭代快,大幅度降低了使用门槛。通过实际案例,参会者将亲历从模型定义到硬件加速推理的端到端流程,感受异构算力在AI加速器敏捷开发的潜力。
Tutorial 第五部分:基于RISC-V算力的大模型应用开发实践及总结
摘要:本部分基于实际业务场景(如政策兑现),融合知识图谱与RAG技术,构建基于RISC-V AI加速卡的智能政务解决方案。采用“知识图谱+RAG”双引擎架构,旨在帮助参会者掌握基于异构算力的大模型应用系统开发全流程,具体内容包括数据源管理、知识图谱构建、服务部署与运维和实际应用。通过本部分的学习与实践,参会者不仅能掌握当前主流AI应用技术,更能获得在国产化AI平台上的实战经验。最后,对本次Tutorial进行总结和展望。
讲者介绍
张科
中国科学院计算技术研究所正高级工程师,中国科学院大学岗位教授
吴艳霞
哈尔滨工程大学计算机科学与技术学院 国家特色化示范性软件学院 副院长
杨碧波
中国科学院计算技术研究所工程师
陈炜
希姆计算执行副总裁
助教团队
王亚洲,中国科学院计算技术研究所工程师,主要从事计算机体系结构研究和计算机组成原理课程教学等工作,研究兴趣为计算机系统外设及芯片原型验证与加速仿真环境。
张思,中国科学院计算技术研究所工程师,主要从事计算机体系结构研究和计算机组成原理课程教学等工作,研究兴趣为云原生异构计算与协同调度及AI工作负载无服务器化解决方案等。
刘士祺,中国科学院计算技术研究所助理工程师,主要从事计算机体系结构研究、计算机组成原理教学等工作,研究兴趣为可信执行环境及通用处理器芯片设计与验证。
CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。Tutorial作为这一设计的起点,为参会者构建坚实的共同知识基础,能够深度参与后续的前沿报告理解与未来方向思辨。同时面向青年学者、行业新锐等人群,通过系统性教学,助力赋能青年人才发展。
点击“阅读原文”,进入官网。