首页 > 最新动态 > 智能时代的数据库系统 | CNCC
最新动态
智能时代的数据库系统 | CNCC
2025-09-213

在人工智能与大模型快速发展的背景下,数据已成为推动数字化转型的关键动力,驱动数据库系统经历从传统模式向智能化范式的深刻变革。在此过程中,如何在开放世界、多模态和多源异构的环境下实现高效、智能的数据存储与管理,已成为学术界和产业界共同关注的前沿问题。


与此同时,随着应用场景与数据类型的日益多样化,以及硬件环境和负载特征的快速演进,传统数据库系统在查询模型、数据管理方式和优化机制等方面都面临新的挑战。如何更好地处理非结构化与多模态数据,让系统优化具备更强的智能化和自适应能力,以及设计适配未来硬件和应用需求的数据存储格式,都是亟待探索的问题。


本论坛将聚焦新一代数据库系统的关键突破口,探讨数据智能体的构建与协作、多模态人机交互下的数据库技术、面向开放应用的新型数据系统架构、人工智能驱动的数据库优化,以及面向未来的开源数据文件格式等内容。



论坛安排



??论坛名称:

智能时代的数据库系统



顺序

主题

主讲嘉宾

单位

1

数据智能体:自主数据处理的新范式

李国良

清华大学

2

智能时代的数据库技术:进展与展望

高云君

浙江大学

3

面向开放应用的新型数据系统

钱卫宁

华东师范大学

4

人工智能驱动数据库系统优化:机遇与挑战

王宏志

哈尔滨工业大学

5

面向未来的开源数据文件格式

张焕晨

清华大学


论坛主席



张岩峰

东北大学教授

东北大学教授、博士生导师、计算机科学与工程学院副院长,入选国家级高层次青年人才,辽宁省杰青。研究方向为数据库系统、AI架构系统。承担国家重点研发计划课题、国家自然科学基金等多项国家和省部级科研项目。曾获中国计算机学会自然科学二等奖、云计算国际会议ACM SOCC杰出论文奖、华为年度优秀项目奖等奖励。


论坛讲者



李国良

CCF数据库专委副主任,清华大学教授

清华大学计算机系教授、副主任,ACM Fellow,IEEE Fellow。主要研究方向为数据库,在顶级会议和期刊上发表论文200余篇,他引20000余次,入选爱思唯尔2014–2024年中国高被引学者榜单。曾主持国家杰出青年基金(延续资助)、重点研发、青年973、自然基金重点等项目。获VLDB青年贡献奖、IEEE数据工程杰出新人奖,曾任SIGMOD 2021大会主席、ICDE 2027程序委员会主席。


报告题目:数据智能体:自主数据处理的新范式


摘要:传统数据处理系统存在三大核心局限:封闭世界查询假设、受限的数据支持和被动式管理模式,导致其难以满足多样化的业务需求、受限的数据处理范畴以及僵化的管理机制。人工智能技术的发展为解决这些问题提供了新契机,其语义理解、推理、编排与生成等能力,为构建支持开放世界数据管理、多模态数据处理和自驱动范式的新一代数据管理系统奠定了基础。为此,我们提出数据智能体(Data Agent),通过整合语义理解、智能推理与编排、智能生成、多智能体协同等能力自主完成各类数据处理任务。本报告将详细介绍数据智能体的关键技术与系统构建方法。

高云君

浙江大学教授

浙江大学求是特聘教授、博士生导师,国家杰出青年科学基金获得者(2020)、优秀青年科学基金获得者(2015)。研究方向为数据库、大数据管理与分析、DB与AI融合,发表CCF A类论文180余篇,出版专著教材6本,授权专利40余项。曾获VLDB、ICDE等最佳/优秀论文奖7次,省部级及全国性学会科技进步特等奖或一等奖3项。现任ACM SIGSPATIAL中国分会副主席、浙江省大数据智能计算重点实验室主任、浙江大学软件学院常务副院长,并担任多个顶级期刊编委及国际会议主席。


报告题目:智能时代的数据库技术:进展与展望


摘要:智能时代,人机交互方式正经历从“机械指令”到“自然对话与多模态融合”的变革,对底层的数据库技术提出了新要求。“自然对话与多模态融合”的人机交互主要涉及海量的非结构化数据,并需要进行多模态数据查询,因而亟需破解大规模非结构化数据存储,高效多模态数据查询等难题。为此,报告人负责团队已在向量数据库、新硬件架构存储、多源异构数据查询、Text-to-SQL、检索增强生成等方面展开了一系列探索。本报告将先汇报其相关进展,而后展望可能的发展方向。

钱卫宁

华东师范大学教授

华东师范大学教授、博士生导师,数据科学与工程学院院长,上海市优秀学术带头人,2021年入选国家级高层次人才计划。目前担任中国计算机学会数据库专委会常务委员,中国计量测试学会计算基准专委会副主任委员,教育部人工智能科技创新专家工作组成员。研究兴趣包括可扩展事务处理,大数据管理系统基准评测,海量数据分析处理及其应用,以及数据驱动的计算教育学。


报告题目:面向开放应用的新型数据系统


报告摘要:信息技术高速发展正促进社会各领域的数字化转型。数据,就像交流电,是支撑数字化转型的新的能源动力(power)。数据管理系统是支撑基于Data Power应用的基础设施。传统的数据库系统针对的是“封闭世界”的数据管理问题,在系统架构、服务方式、实现技术方面不能满足新应用在数据全生命周期管理、应用适配、可靠性、可扩展性等方面的需要。报告将从具体应用领域的数据管理问题切入,讨论我们在新型数据管理系统方面的探索和思考。

王宏志

CCF杰出会员,哈尔滨工业大学教授

哈尔滨工业大学计算学部长聘教授、博士生导师,CCF数据库专委常务委员、大数据专家委委员、数据治理发展委执行委员,任黑龙江省大数据科学与工程重点实验室主任、哈工大海量数据计算研究中心主任。主要从事数据库和大数据研究,主持国家自然科学基金重点项目等20余项,在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文300余篇,成果广泛应用于国产数据库、电力、金融等领域。


报告题目:人工智能驱动数据库系统优化:机遇与挑战


摘要:在人工智能技术爆发式发展的浪潮下,数据库系统优化正经历从经验驱动到数据智能驱动的范式跃迁,人工智能为数据库系统带来了一系列新的机遇,包括突破传统基于静态规则和经验优化瓶颈提升系统适应性、系统调参智能化提升系统韧性、系统协同优化提升整体性能,与此同时,由于当前人工智能和数据库技术都在快速发展之中,人工智能驱动数据库系统优化带来了优化决策不可解释引发可信危机、人工智能方法界限无法证明导致方法可用性低、神经网络等模型需要大量训练数据和时间难以保证数据库系统性能等一系列挑战。本报告将阐述人工智能为数据库系统带来的机遇和挑战,并介绍报告人团队在把握机遇、应对挑战方面的一系列探索。

张焕晨

清华大学助理教授

清华大学交叉信息研究院(姚班)助理教授,研究方向为数据库系统。他于卡内基梅隆大学计算机科学系获得博士学位。加入清华之前,他曾在 Snowflake 担任博士后研究员。他曾获得 ACM 中国新星奖提名(2022),世界人工智能大会云帆奖(2021),SIGMOD Jim Gray 博士论文奖(2021)和 SIGMOD 最佳论文奖(2018)等。


报告题目:面向未来的开源数据文件格式


摘要:诸如 Apache Parquet 和 Apache ORC 等开源列式文件格式已被广泛应用于当今的数据湖和数据分析系统。然而,这些格式的开发距今已超过十年。在此期间,硬件和工作负载环境都发生了显著变化。本次报告将首先分享我们对 Parquet 和 ORC 进行全面基准测试获得的经验,随后介绍我们团队开发的下一代面向未来的数据文件格式F3,重点阐释其高效性、互操作性和可扩展性。


CNCC2025



CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。





图片


图片
图片
图片

点击“阅读原文”,加入CCF。

点我访问原文链接