由CCF主办,CCF分布式计算与系统专委会与吉林大学承办的CCF分布式计算大会(CCF Computility 2024) 暨全国开放式分布与并行计算学术年会(DPCS 2024) 将于2024年7月26日至28日在中国吉林省长春市举行,会议规模预计1000余人。本次会议主题为“算力网:新质生产力背景下的分布式系统”,旨在为分布式系统和算力网相关的从业者提供最专业的学术研讨、技术交流和成果展示的平台。CCF Computility 2024为大家准备了9场由院士等顶级专家带来的主旨报告,15场技术论坛(80位特邀报告),绝对不容错过!
大会主旨报告嘉宾
论坛背景
本优秀博士生和青年学者论坛汇聚了一批优秀青年学者和博士生,分享他们在计算机体系结构、人工智能编译器、边缘智能应用等领域的最新研究成果和科研进展,深入探讨当今分布式计算系统领域面临的关键技术挑战及其解决方案,包括面向高性能处理器的体系结构级可靠性分析及优化研究,GPU及AI加速器在处理器设计中的软错误和电压噪声等可靠性问题及其新的预测模型和效能优化策略,多层次协同优化的人工智能编译器,面向边缘智能应用的多资源控制方法,以及基于云雾自动化的下一代虚拟化工业控制系统等论题。本论坛旨在促进学术交流与合作,推动青年学者在新一代分布式计算技术领域的创新研究与发展,为构建可移植的分布式智能计算系统贡献新的思路和方法。
论坛主席 | 钟诚教授、程大钊教授、曾德泽教授 | |
优秀博士生 | 青年学者 | |
余辉 | 谭婧炜佳 副教授 | |
夏俊旭 | 王豪杰 助理研究员 | |
黄少远 | 胡创 副研究员 | |
叶盛源 | 兰大鹏 副研究员 | |
弓浩 | 庞浦 助理研究员 | |
姜楠 | 吴亚兰 副教授 | |
时间:2024年7月27日 下午 | ||
地点:吉林省长春市安华假日宴会中心多功能厅 |
会议注册方式
门票类型 | 参会者身份 | 6.1~7.28 |
---|---|---|
会议注册费 | CCF专业会员 | ¥2700 |
CCF学生会员 | ¥1700 | |
非会员专业人员 | ¥3200 | |
非会员学生 | ¥2200 |
会议注册二维码 | 大会主页二维码 |
说明:本次会议通过CCF会议管理系统缴费,退费遵守《CCF关于会议注册费的退费规定》。
论坛主席及介绍
钟诚
广西大学
教授、博导,现任国家高性能计算中心南宁分中心主任。主要从事并行与分布计算、生物医学信息计算、网络信息安全与可信软件等方面的研究工作。入选广西高校优秀人才资助计划人选。《计算机科学与探索》和《小型微型计算机系统》编委。现为CCF杰出会员。
程大钊
武汉大学
教授、博导,现任武汉大学计算机学院副院长。主要从事分布式计算、人工智能系统等方面的研究工作。入选为湖北省特聘教授,“武汉英才”创新人才。担任国家重点研发计划和基金委重点项目首席科学家。曾担任美国和加拿大国家科学基金评委。
曾德泽
中国地质大学
教授、博导,现任中国地质大学(武汉)计算机学院副院长,CCF杰出会员。主要从事边缘计算、泛在智能与物联网等方面的研究工作。入选国家级高层次人才计划(青年)及湖北省级人才计划(青年)。主持国家重点研发计划项目课题、国家自然科学基金面上/青年、湖北省重点研发计划项目等10余项。
嘉宾及报告介绍
谭婧炜佳
吉林大学
谭婧炜佳,吉林大学副教授,博士生导师。吉林省青年人才托举工程入选者。研究方向为计算机体系结构及处理器芯片架构可靠性。在TC、TPDS、TCAD、SC、MICRO等期刊和会议发表论文30余篇,获DATE 2018会议最佳论文奖提名。主持国家自然科学基金面上项目1项,国家自然科学基金青年基金1项,吉林省科技发展计划项目4项等10余项科研项目。
报告题目:面向高性能处理器的体系结构级可靠性分析及优化研究
报告摘要:GPU及AI加速器是人工智能与高性能软件的重要平台,但随着芯片工艺微缩和处理器并行度提升,其可靠性面临更大挑战(如软错误、电压噪声等)。为应对这些问题,我们进行了系统分析和优化研究。我们建立了CNN加速器的软错误量化分析框架和故障注入工具,提出了多芯片集成GPU的电压噪声效应模拟及缓解策略,开发了GPU系统的软错误可靠性预测模型,并提出了高能效错误保护策略。这些研究显著提升了高性能并行处理器的可靠性,降低了处理器设计中的电压和频率裕度,充分挖掘了其性能和功耗潜力。
王豪杰
清华大学
王豪杰,清华大学,助理研究员。主要在人工智能编译器和高性能计算领域开展研究工作,相关成果发表于OSDI、ATC、PPoPP、SC、PLDI、TC、TPDS等相关领域内顶级国际会议和期刊,获得了ICS 2021最佳学生论文奖和TPDS 2022 最佳论文亚军。曾获清华大学优秀博士学位论文、北京市优秀毕业生、清华大学“水木学者”、清华大学优秀博士后、ACM SIGHPC China优博奖等荣誉,获国家自然科学基金青年科学基金等项目资助,入选北京市青年人才托举工程。
报告题目:多层次协同优化的人工智能编译器
报告摘要:随着人工智能对算力需求的快速增长,领域定制化人工智能芯片成为主要算力来源。相比通用处理器,人工智能芯片需要定制化编译器支持以发挥其高效计算能力。现有人工智能编译器将编译过程分为高层次图层优化和低层次算子层优化,简化了编译过程但错失了跨层次协同优化机会。多层次协同优化编译器通过图层和算子层间的协同优化,打通软硬件优化信息,为人工智能芯片的高效使用提供方法,扩展优化空间,在大模型推理等场景下具有显著性能优势,支持多种人工智能芯片并适配云边端不同场景,为构建性能可移植的人工智能系统提供路径。
胡创
武汉大学
胡创,武汉大学特聘副研究员,湖北省“楚天学者”,武汉英才“青年人才”。主要研究方向是分布式计算、边缘学习、联邦学习\分析、低功耗计算;主持国家自然科学基金青年基金、 湖北省自然科学基金面上项目等,目前已在国际高水平期刊和会议发表论文40余篇,包括国际顶级期刊TC,TPDS,JSAC,TMC,VLDBJ等,国际顶级会议INFOCOM,MM,WWW,ICDE等。
报告题目:面向边缘智能应用的多资源控制方法
报告摘要:边缘智能使设备执行智能算法,涉及指令密集型和数据密集型计算,分别需要CPU和GPU加速以满足低延迟、高精度需求。然而,传统边缘设备的固定资源无法适应动态计算负载,导致分析精度不稳定和高延时等问题。本报告展示基于双镜像FPGA的弹性CPU-GPU资源:通过配置CPU和GPU镜像,并在运行时切换,实现资源弹性。通过硬件功能抽象和异步通信机制,提供丰富的硬件接口,提升通信效率,减少通信阻塞。提出基于上下文多臂老虎机学习的双资源控制算法,优化资源分配,实现高效、低复杂性的计算资源管理。
兰大鹏
中科院沈阳自动化所
兰大鹏,现任中国科学院沈阳自动化研究所副研究员,辽宁辽河实验室边缘计算和云化控制方向的执行负责人。他参与了挪威研究委员会资助的多个项目,并作为核心成员参与了欧盟H2020项目MORPHEMIC。他的研究兴趣涵盖边缘/雾计算、物联网、人工智能和分布式系统等领域。在多个著名期刊和会议上发表了30多篇论文(含IEEE TII, TITS, IOTJ等)。
报告题目:基于云雾自动化的下一代虚拟化工业控制系统
报告摘要:随着第四次工业革命的兴起,特别是物联网、云计算和人工智能技术的飞速发展,Industry3.0 时代形成的“金字塔式自动化”正在被一种我们称为“云雾自动化(CFA)”的新型范式所取代。云雾自动化通过虚拟化的方式把自动化应用(特别是一:二层闭环控制)部署到新一代网络和云/零计算设施上,可以带来前所未有的灵活性,无限力机器智能。在这个报告里,我将跟大家分享我们在云雾自动化领域的最新进展,基于CFA的下一代虚拟化工业控制系统,甚于CFA的端到端工业具身智能底座等。
庞浦
上海交通大学
庞浦,上海交通大学计算机科学与工程系助理研究员,2023年于上海交通大学获得博士学位。主要研究方向为云计算、计算机体系结构、操作系统,在计算机体系结构、并行与分布计算领域知名期刊与会议上发表多篇论文,包括VLDB、ICS、IEEE TPDS、IPDPS、DATE、ITC。
报告题目:异构NUMA架构上基于偏好感知的任务调度
报告摘要:数据中心里的延迟敏感型应用需要低延迟以满足服务质量需求。由于其负载动态变化,通常与没有服务质量要求的尽力而为型应用混合部署在同一物理服务器上共享资源。然而,现代服务器正向异构、非一致内存访问(NUMA)方向发展,不同CPU核具备不同计算能力,同时存在不同的访存和网络通信延迟。本报告探讨在异构NUMA架构服务器上调度延迟敏感型和尽力而为型应用时的挑战,并介绍如何在运行时动态识别各应用的性能偏好,以准确分配资源。
吴亚兰
广东工业大学
吴亚兰,博士,广东工业大学A类特聘副教授,入选广东省青年优秀人才国际培养计划;主要研究分布式车联网、边缘智能计算、并行分布体系结构;主持国家自然科学基金青年基金、广东省自然科学基金面上项目;研究成果在IEEE T-ITS、ACM TOIT、TNSM等顶级期刊与国际会议上发表,得到国内外同行关注引用。
报告题目:面向多任务推理的车路协同推理算法
报告摘要:车路协同技术是智慧交通的关键技术之一,也是我国智慧交通规划的重要组成部分。为了提供高质量的机器学习推理服务,车路协同算力网络架构成为极具吸引力的计算范式。然而,现有的车路协同推理工作忽视了多机器学习推理任务间的可共享神经网络结构特性,导致需要逐一调用单一类型的推理模型进行计算,造成重复计算和部署以及不断切换模型的浪费。因此,报告人通过引入多任务推理模型的预部署,避免重复性异构推理模型的加载延迟,减少共享结构的重复存储与计算,并协同推理请求调度,提升推理服务效率。
余辉
华中科技大学
余辉是华中科技大学计算机学院2020级博士生,导师是张宇教授,研究方向为高性能图神经网络、系统软件与体系结构,以第一作者在CCF A/B 类会议和期刊上发表5篇论文,研发的图计算引擎在图计算性能权威榜单Graph 500排名中多次位列第一,获2022年 “国际开放图基准数据集挑战赛”的链接属性预测赛道全球第一,获第七届“互联网+”全国金奖、第十三届“挑战杯”全国金奖、2023年中国国际大学生创新大赛全国金奖和2023年鲲鹏应用创新大赛全国金奖
报告题目:面向动态图神经网络的软硬协同优化技术研究
报告摘要:近年来,动态图神经网络(DGNN)因其处理动态图数据的能力备受关注。现有硬件/软件方案在支持DGNN推理时存在数据同步开销高、冗余状态计算和低效采样问题。我们提出链式驱动的异步执行方法减少数据同步,通过冗余感知的增量处理方法重用前一快照状态,利用时序树并行策略提高采样效率。实验表明,我们的方法性能提升6.9X-473.2X,获中国国际创新大赛(2023)全国金奖和鲲鹏应用创新大赛全国金奖,已应用于国家电网和华为等企业。
夏俊旭
国防科技大学
夏俊旭,国防科技大学系统工程学院2021级博士研究生,导师为郭得科教授,联合培养导师为吴文斐助理教授(北京大学)。主要从事计算机网络、在网计算和分布式系统等相关领域研究,以第一作者发表学术论文共10篇,包括ToN、TPDS、IoTJ、ICDCS等,获发明专利共11项。曾获CBD会议最佳学生论文奖、全国数模竞赛一等奖、湖南省数模竞赛一等奖等。以核心骨干完成多项国家和军队科研项目,并以第一负责人承担湖南省研究生科研创新项目重点项目;获湖南省优秀硕士学位论文。
报告题目:基于在网计算的分布式系统加速方法
报告摘要:探讨当前分布式应用在网络通信方面所面临的问题与挑战,并分析典型分布式应用在计算架构和流量相关性上所具备的共同特征。基于此,将探讨如何利用在网计算来提升分布式应用的网络传输性能,以及为在网计算进行路由规划和传输协议设计。本报告重点介绍了针对新型数据中心网络架构以及可编程数据平面的在网计算加速方法,同时探讨如何为边缘分布式应用提供高效安全的在网计算加速服务。本报告期望通过发掘网络架构和网络设备在执行在网计算方面的潜力,提高各类应用的网络传输性能,从而使网络系统能够更好地支持大规模分布式应用。
黄少远
天津大学
黄少远,天津大学智能与计算学部2022级博士生,师从王晓飞教授,研究方向为分布式云场景下的请求分布感知、云网负载预测与调度优化,曾在上海边缘计算独角兽公司PPIO调度算法岗实习。目前已发表论文11篇,其中CCF-A类论文7篇,包含ACM SIGKDD,IEEE INFOCOM,TMC等知名会议或期刊,申请专利12项。担任SIGKDD 2024,ICDCS 2024审稿人,INFOCOM 2024 IEILM Workshop Chair等职务。曾获天津大学优秀毕业生,苏州育才奖学金。
报告题目:边云平台请求感知与调度优化
报告摘要:边云场景下的请求感知与调度优化是云厂商实现智能运维和提升平台效益的关键,受到广泛关注。本报告围绕用户请求感知、设备负载预测与调度优化展开,重点探讨:一、用户请求的分布预测有助于边云平台进行高效调度,但需在广范围内实现细粒度预测,考虑多种特征。二、边云服务器负载是故障检测与智能运维的核心,需设计适应动态场景且兼具准确和鲁棒性的预测模型。三、将请求感知与负载预测引入调度优化是提升平台效率的方案,报告展示了一种协同请求感知与收益优化的主动式直播请求调度框架,探索新范式。
叶盛源
中山大学
叶盛源,中山大学计算机学院三年级博士生,师从陈旭教授。他目前的研究方向是资源高效的边缘算力网络、移动端机器学习系统。相关研究成果发表于MOBICOM, INFOCOM, ICPP, DATE, IEEE Wireless Communications等国际顶级会议与权威期刊,获国家级发明专利3项。博士在读期间,他曾获中山大学校级奖学金4项,腾讯等企业级奖学金3项,获评华为昇思开源框架杰出贡献者等荣誉。
报告题目:边缘算力网络中的边缘协同智能计算系统
报告摘要:边缘算力网络是指依赖于处于网络边缘的服务器和终端设备构建的算力网络,是全局算力网络的一个重要分支。作为边缘算力网络的核心技术之一,边缘协同智能计算技术通过利用广泛分布的边缘算力网络硬件设备,为边缘智能计算提供基础算力保障,并实现资源高效、隐私安全的边缘智能服务。然而,要实现资源高效的边缘协同智能计算面临着诸多挑战,包括计算资源和网络带宽的限制、计算资源的异构性以及计算资源的动态性等。本报告主要分享边缘协同智能计算方向的研究成果和思考,以及大规模语言模型对边缘协同智能领域提出的新要求和挑战。
弓浩
内蒙古大学
弓浩,内蒙古大学计算机(软件)学院2020级博士生,导师为黄宝琦教授,主要从事无人机能耗建模和无人机路径规划等研究工作。相关成果发表在IEEE TMC,IEEE TAES,Applied Soft Computing等期刊。曾获中国研究生数学建模大赛三等奖。
报告题目:利用最少数量的无人机实现高能效的三维无人机地面节点访问
报告摘要:协作多无人机已广泛应用于数据收集、森林监测、边缘计算等领域。由于机载存储有限且硬件成本高,减少能耗和无人机数量至关重要。现有研究多集中在二维场景下的能耗最小化,通用性较差。本研究定义了一个广义三维场景,多个无人机访问多个地面节点,旨在以最少的无人机数量和最小化能耗。问题被分解为两个子问题:单个无人机最小化访问任意两个节点的能耗,以及最少无人机数量的高能效路径规划。仿真结果表明,该方法在优化性和效率方面优于其他同类方法。
姜楠
吉林大学
姜楠,吉林大学计算机科学与技术学院2022级博士研究生,师从魏晓辉教授。研究方向为计算机体系结构、系统可靠性、近似计算等。近年来,在TCAD、SC、TACO、JSA、FGCS等期刊/会议共发表学术论文9篇,曾获得2021年KSEM最佳论文奖及2023年CCF长春优秀论文奖;作为负责人主持吉林大学研究生创新研究计划项目,作为学生骨干参与国家重点研发计划、国家自然基金委面上项目等科研项目。
报告题目:面向GPGPU体系结构的软错误弹性分析方法与容错策略研究
报告摘要:近年来,GPGPUs因其高并发性和高吞吐量优势,在高性能计算中广泛应用。确保GPGPU的可靠执行至关重要,因芯片尺寸缩小、集成度提升,GPGPU易受α粒子或高能中子的撞击,导致软错误。软错误可能引发系统挂起、输出错误等严重后果。现代GPGPU架构采用指令复制、线程冗余等容错技术,但会带来能耗、性能及存储开销。基于此,本报告将研究面向GPGPU体系结构的高效软错误弹性分析方法,并探索能够权衡系统可靠性与性能的高效容错策略。
以上论坛具体安排,请关注大会官网。除主旨报告和本论坛之外,CCF Computility 2024还组织了14场别开生面的专题论坛,每一场都有顶级专家担论坛主席,为大家带来最前沿的学术讨论和技术交流。
目前大会筹备工作接近尾声,欢迎广大对分布式计算感兴趣的领域学者莅临长春,共同见证和推动技术创新。
点击“阅读原文”,加入CCF。