首页 > 最新动态 > 新型算力硬件驱动下的数据系统 | ChinaData
最新动态
新型算力硬件驱动下的数据系统 | ChinaData
2025-11-2647


论坛简介:

我们正步入一个以数据为核心生产要素的时代,而底层计算硬件的革新正以前所未有的力量重塑数据管理的技术范式。GPU、TPU、DPU、智能网卡、持久内存等新型硬件不再仅仅是性能加速器,更是催生全新数据处理架构与算法的核心驱动力。本论坛旨在搭建一个前瞻性的交流平台,聚焦于新型硬件为数据管理各领域带来的深刻变革。我们将深入探讨:智能网卡/DPU驱动的算子与状态卸载,如何重构数据通路以加速流处理并降低尾延迟;CPU+GPU/NPU异构平台的资源编排、任务划分与运行时调度;面向大模型与数据系统协同的全栈性能工程与评测方法;新一代国产超算上的科学数据处理瓶颈与优化路径;面向国产NPU的生成式推荐系统设计与工程落地。我们诚挚邀请学术界与产业界同仁共聚一堂,分享洞察、交流实践、凝练共识,共同勾勒算力新纪元下数据管理技术的未来图景与发展机遇。


论坛安排



顺序

主题

主讲嘉宾

单位

1

基于硬件卸载的流处理引擎加速技术

陈康

清华大学

2

异构计算平台架构与系统设计思考

陈全

上海交通大学

3

面向超智融合时代的全栈式性能工程探索

杨海龙

北京航空航天大学

4

基于新一代国产超算的科学数据处理

陈志广

中山大学

5

面向国产NPU的生成式推荐系统设计:从计算模式、内存访问到结构化稀疏

卢冶

南开大学


论坛主席



张岩峰

CCF数据库专委会执行委员、东北大学教授,入选国家级高层次青年人才、辽宁省杰青。研究方向为数据库、智能计算系统。承担国家重点研发计划课题、国家自然科学基金重点项目课题等多项国家和省部级科研项目,承担华为2012实验室、阿里巴巴达摩院、蚂蚁研究院等校企合作项目。在SIGMOD、VLDB、ICDE、PPoPP、SOCC等国际顶级会议期刊上发表论文50余篇。曾获中国计算机学会自然科学二等奖、云计算国际会议ACM SOCC杰出论文奖、华为年度优秀项目奖等奖励。


论坛讲者



陈康

清华大学计算机系研究员,国家级特聘人才,研究领域为计算机系统。近年来,在包括OSDI、SOSP等顶级系统国际会议上发表了30余篇CCF-A类论文。长期担任OSDI、SOSP、EuroSys、NSDI等系统领域顶级会议的程序委员会委员。荣获2020年电子学会科技进步一等奖(排名第1),获得国家技术发明二等奖、省部级科技特等奖和一等奖各1次。获得了2021年华为全球数据存储“奥林帕斯奖”和2020年中创软件人才奖。主导研发的高性能缓存文件系统MadFS连续5次登顶全球高性能存储领域的IO500榜单。研发的处理器安全隔离环境单一地址空间运行内核Occlum,是蚂蚁金服可信计算的核心,微软Azure云推荐Occlum作为其安全计算环境之一。


报告题目:基于硬件卸载的流处理引擎加速技术


报告摘要:随着实时智能应用的快速发展,系统对高并发与低延迟处理的需求持续增长。然而,以CPU为中心的传统流处理引擎面临线程同步开销大、硬件资源利用率不高等问题。围绕这一挑战,本报告介绍了面向软硬件协同的系统设计路径,将数据分发、流量调度和部分状态操作有选择地下沉到网卡等硬件组件,在底层重构流处理的数据通路与执行机制,从而缓解线程竞争与队列阻塞,提升吞吐能力与时延稳定性。相关成果为新一代高性能实时数据处理基础设施的设计与实现提供有力支撑。

陈全

上海交通大学计算机学院教授。长期从事计算机体系结构、云原生计算相关的研究。主持国家优青、国家自然科学基金重点项目、重点研发计划项目,并在ASPLOS,OSDI,ATC,SC,TC,TPDS,TACO等领域内著名国际会议和期刊上发表学术论文一百余篇。曾获王选杰出青年学者奖、CCF青年科技奖、中创软件人才奖等。目前担任IEEE Transactions on Cloud Computing副主编、及其他多个SCI期刊的编委/青年编委。研究成果曾获2023年CCF技术发明一等奖(排名第1)及国家技术发明二等奖。


报告题目:异构计算平台架构与系统设计思考


报告摘要:计算平台异构化是智能计算时代的重要发展发展趋势,GPU、NPU等异构加速器开始集成到智算中心中。然而,在智能计算负载特征持续演进的现状下,异构加速器的资源利用效率低。该报告中,将介绍一系列面向智能计算的异构计算平台的体系架构和系统设计、并展望未来的发展趋势。

杨海龙

北京航空航天大学教授。国家优秀青年科学基金获得者,国家重点研发计划项目负责人,CCF杰出会员。主要研究方向为高性能计算、性能调优工具、编译优化技术、模型训推系统等。目前已在SC、PPoPP、ASPLOS、ISCA、TPDS、TC、TACO等国际会议和期刊上发表100余篇学术论文,TC论文获评IEEE CS亮点论文。担任CLUSTER’21体系结构领域共同主席,THPC期刊青年编委。担任北航本科生超算队教练,指导团队获得国内外赛事奖项二十余项。指导学生获CCF体系结构优秀博士学位论文、CCF高性能计算优秀博士学位论文。获2024年CCF高性能计算青年科技人才奖,2025年CCF-IEEE CS青年科技奖。


报告题目:面向超智融合时代的全栈式性能工程探索


报告摘要:随着以Chatgpt、DeepSeek等为代表性的生成式大语言模型的出现,智能模型在训推层面上对算力需求不断增长,与此同时模型训推技术不断演化导致系统复杂度增加,如何利用大规模硬件资源实现高效模型训推能力,需要从全栈视角在算法空间、编译空间、系统空间、工具空间开展模型性能工程。本报告从系统空间模型性能工程研究出发,介绍了研究组在大模型自适应投机推理、满足SLA的大模型请求调度等方面一些工作进展,并对未来全栈式性能工程新范式进行了展望。

陈志广

中山大学计算机学院教授,国家超级计算广州中心副主任,主要从事高性能计算与超级计算机相关研究。主持国家重点研发计划课题3项、国家自然科学基金面上项目2项、企业横向项目6项。针对超算系统中高性能计算与大数据处理融合的需求,主导研发面向异构存储的高并发低延迟大规模并行文件系统Kapok,获得“奥林帕斯”先锋奖。获得广东省科技进步特等奖、中国电子学会科技进步一等奖、国家教学成果二等奖。发表PPoPP、SC、EuroSys、VLDB、TC、TPDS、TOS等论文60余篇,授权国家发明专利40余项,参与编写教材4本。


报告题目:基于新一代国产超算的科学数据处理


报告摘要:受限于芯片设计、制程工艺等方面的瓶颈,我国多款超算系统所采用的芯片单核计算能力相对较弱。为了保证整个超算系统的计算能力仍然达到世界前列,计算节点普遍采用NUMA众核结构,整个系统节点规模庞大。以上体系结构特征为应用优化带来挑战。本报告介绍了新一代国产超算的典型结构特征,深入分析了科学数据处理中广泛采用的矩阵运算、Stencil计算等基本算子的优化方法,相关成果为国产超算上的应用优化提供了有力的支撑。

卢冶

CCF杰出会员、CCF嵌入式系统专委会常务委员、CCF天津执委会秘书长、南开大学教授,第一批天津市青年科技人才,国家级青年人才。研究方向:人工智能处理器芯片与系统、系统安全。主持国防科技、国家自然科学基金面上项目、天津市科技计划面上项目等,以及华为、蚂蚁、百度、Google、Intel等多项校企合作项目,具有坚实的大型计算机系统研发能力及丰富的技术管理经验。以第一作者或通信作者在体系结构及系统顶刊ACM TACO、IEEE TC、TPDS等发表论文30余篇,担任CCF A类期刊或会议审稿专家与客座编委;2023年获得华为人工智能难题挑战揭榜“火花奖”(天津地区首次)。


报告题目:面向国产NPU的生成式推荐系统设计:从计算模式、内存访问到结构化稀疏


报告摘要:生成式推荐系统凭借其强大的序列建模和用户兴趣动态捕捉能力,正成为新一代推荐技术的核心。然而,其庞大的计算需求与国产NPU架构之间明显割裂。本次报告聚焦于面向国产NPU的软硬件协同设计,旨在系统性优化生成式推荐系统的计算效能。报告以生成式推荐模型fuxi-γ的设计与部署为例,系统阐述如何重构其计算模式、访存机制、结构化稀疏策略,以及在昇腾NPU上的训推实践。





图片


图片
图片
图片

点击“阅读原文”,加入CCF。

点我访问原文链接