首页 > 最新动态 > CNCC | 高效能智能计算基础设施:高性能计算(HPC)与人工智能(AI)技术融合
最新动态
CNCC | 高效能智能计算基础设施:高性能计算(HPC)与人工智能(AI)技术融合
2024-09-205

收录于话题

#CNCC2024

CNCC2024



论坛简介:

高效能智能计算基础设施:高性能计算(HPC)与人工智能(AI)技术融合

举办时间:10月26日13:30-17:30

地点:夏苑-法国馆二楼剧场

注:如有变动,请以官网(https://ccf.org.cn/cncc2024)最终信息为准



论坛关注的是高性能计算(HPC)与人工智能(AI)技术融合背景下,如何构建和优化能够支持大规模数据处理与复杂模型训练的计算基础设施。


尽管在高效能智能计算基础设施方面已经取得了一定进展,但仍面临诸多挑战。例如,能耗与散热问题严重,数据中心的运行成本高昂;硬件与软件之间的兼容性和效率问题,导致资源利用率不高;异构计算环境下不同设备之间的通信瓶颈;海量数据如何有效管理以应对计算任务快速执行;以及对于安全性和隐私保护的需求日益增加,使得在建设基础设施时必须考虑更多的非功能性需求。


本论坛将探讨构建高效能智能计算基础设施建设的核心技术,涵盖智能计算、智能缓存、网络互联内存、软硬件协同优化、大规模故障预测等方面,希望促进学术界与产业界之间的交流与合作,共同推动高效能智能计算基础设施的发展。








论坛日程


顺序

主题

主讲嘉宾

单位

1

从计算机系统结构角度对智能计算的思考

曾令仿

之江实验室

2

面向智能缓存分配的命中率计算方法

周可

华中科技大学

3

面向DNN的内存和性能协同优化

梁云

北京大学

4

网络互联内存:面向高速互联的统一大内存系统探索

陆游游

清华大学

5

大规模存储设备故障预测的研究

吴晨涛

上海交通大学




论坛主席及嘉宾介绍


 论坛主席


曾令仿博士

CCF杰出会员、理事、之江实验室研究员


博士生导师,先后入选浙江省科技创新领军人才,国家级优秀人才。浙江省人工智能学会常务理事。目前研究领域为智能计算的系统与架构,研究方向为人工智能芯片,存算一体芯片,数据隐私保护,智算集群系统。现主持(或作为项目/课题执行负责人)科技部、工信部、国家基金委等国家级项目多项。

报告题目:从计算机系统结构角度对智能计算的思考


摘要:智能计算是当前研究热点和计算发展的方向,报告将结合我们2018-2024年申报的CNCC技术论坛邀请的专家和学者的观点,分别从器件/芯片、设备、服务器、集群和应用系统等层面,探讨智能计算相关的理论、关键技术和应用的创新与实践。


 论坛讲者


周可博士

CCF杰出会员、CCF信息存储技术专业委员会秘书长,华中科技大学教授


博士生导师,入选国家重大人才工程。主要从事海量数据存储与管理方向的研究,在SIGMOD、ATC、DAC、TPDS、TOC、ACM Multimedia、INFOCOM、MSST等发表论文百余篇。获国家技术发明二等奖1项、湖北省技术发明一等奖1项和技术进步一等奖1项、中国电子学会科学技术奖科技进步一等奖1项、SC‘06存储挑战赛finalist award 1项。

报告题目:面向智能缓存分配的命中率计算方法。


摘要:缓存分配是智能计算基础设施的关键技术之一,其前提是精确计算不同缓存空间大小的缓存命中率,从而为智能缓存分配算法提供决策依据。本报告聚焦如何计算缓存命中率这一经典问题,介绍缓存命中率计算问题的来源、难点和研究进展,并探讨不同场景下的不同求解方法。


梁云博士

北京大学长聘教授


北京大学集成电路学院长聘教授,博雅特聘教授。获国家自然科学基金委杰出青年基金和北京市杰出青年基金,入选国家高层次青年人才计划,IEEE-CCF 青年科学家奖、ACM 杰出科学家、北京市智源青年科学家。主要研究方向为集成电路设计自动化EDA、软硬件协同设计、计算机体系结构,在相关领域的国际顶级会议和期刊DAC、ISCA、MICRO、ICCAD、FPGA等发表论文100余篇,, 担任ACM核心期刊 TECS 和TRETS 的副主编,同时也是MICRO, DAC, ICCAD, HPCA, FPGA 等会议的技术委员会委员。

报告题目:面向DNN的内存和性能协同优化


摘要:近年来,深度神经网络(DNN)对内存的需求逐渐增加,给其在各种设备上的部署带来了挑战。我们发现,图变换能够改变张量形状和图结构,为内存与性能之间的权衡开辟了新的空间。 本次分享将介绍我们提出的一个内存优化框架,它通过协调图变换与图调度,实现高效的内存管理。


陆游游博士

清华大学计算机系副教授、博士生导师


主要研究方向是计算机存储系统,在FAST、OSDI、SOSP等国际顶级会议上发表论文50余篇,曾获得NVMSA’14最佳论文奖、MSST’15最佳论文提名奖、SIGMOD’23研究亮点论文奖。研制高性能文件系统SuperFS,部署于鹏城云脑II,蝉联世界超算存储IO500榜单第一名(目前仍位居第一)。担任FAST、USENIX ATC、EuroSys等国际会议程序委员会委员。曾入选CCF优博、首届中国科协青托工程等计划,获国家自然科学基金重点项目、优青项目和国家重点研发计划青年科学家项目资助,获省部级奖两项。

报告题目:网络互联内存:面向高速互联的统一大内存系统探索


摘要:在面向智算的计算机架构中,存储层级越来越深,包括GPU内存、主机DRAM内存、远程CXL内存、主机SSD存储以及远程SSD;网络与互联技术发展迅速,包括RDMA、CXL等。这种变化对统一的内存访问带来了巨大挑战。本报告主要汇报了我们课题组在统一大内存系统设计方面的探索,内容包括:(1)网络互联内存的设计探索;(2)GPU和CPU内存互联的缓存设计;(3)CPU内存与SSD存储协同的设计等,并讨论新多层级内存与高速互联环境下的未来展望。


吴晨涛博士

上海交通大学教授


国家级青年人才,国家重点研发计划首席科学家,华中科技大学、美国弗吉尼亚联邦(州立)大学双博士。CCF体系结构专委会常委,上海市计算机学会存储专委会主任。研究方向主要为云存储、大数据存储系统。主持国家重点研发计划、国家自然科学基金、上海市自然科学基金等项目20余项,在IEEE TC、IEEE TPDS、ATC、HPCA、DAC等期刊会议上发表论文100余篇。研究成果荣获2019年国家技术发明二等奖、2018年和2022年上海市技术发明一等奖。

报告题目:大规模存储设备故障预测的研究


摘要:当前云计算、大数据系统需要用到海量的存储设备,但存储设备的故障会导致系统宕机和服务的不可用,极大影响上层云计算和大数据应用的平稳运行,给系统运维带来了很大的难度。本报告针对大规模存储设备故障预测算法开展研究,利用GAN等对抗样本的方式解决健康样本和故障样本不均衡的问题,提出了高效的SSD等存储设备故障预测的方法和机制,以提高大规模云计算、大数据系统的可靠性。




关于CNCC2024




CNCC2024将于10月24-26日在浙江省东阳市横店镇举办,大会主题为“发展新质生产力,计算引领未来”。大会为期三天,包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势,分享创新成果。预计参会者超过万人。





点击“阅读原文”,进入CNCC官网。

点我访问原文链接