由CCF主办,CCF数据库专委承办的2025年CCF数据库战略研讨会(SiftDB 2025)于3月28日至30日在江西婺源举行。本次会议以“Data+AI”为主题,邀请了6位数据库领域的专家分享大模型技术驱动下数据库系统的创新发展路径,来自学术界及产业界的200余位代表参会,共同探讨数据库技术与大模型融合的前沿趋势与应用实践。
图1 与会人员合影
图2 清华大学李国良教授主持开幕式
随后,北京大学崔斌教授发表了关于“面向大模型分布式训练的系统优化”的主题演讲,探讨了大模型分布式训练中的通信优化、显存优化、自动并行和系统自适应调优等关键技术。清华大学翟季冬教授分享了“大模型推理系统加速技术研究”,从内存管理、编译优化、模型量化和并行策略四个关键维度剖析了大模型推理加速技术。阿里云智能集团林伟博士随后介绍了PAI灵骏平台在大模型训练与推理中的实战经验,分享了平台的建设思路和关键技术。
图4 崔斌教授、翟季冬教授、林伟博士上午报告
报告分享结束后,李国良、崔斌、翟季冬、林伟四位教授就“数据库在大模型时代的挑战和机遇”的话题开展了精彩的研讨。
图5 Panel讨论:数据库在大模型时代的挑战和机遇
下午议程聚焦产业创新与前沿技术。CCF-华为胡杨林基金数据库专项、CCF-蚂蚁科研基金数据库专项(第三期)以及CCF-阿里云瑶池科研基金分别做了发布和解读,支持学术界优秀学者投身数据库前沿课题的研究,解决产业界面临的挑战难题,实现数据管理和分析的新高度。
图6 数据库专项基金发布会
随后,南洋理工大学丛高教授、浙江大学高云君教授和香港科技大学(广州)汤南教授分别就混合向量索引、向量数据管理和多模态数据湖等主题发表了大会报告。丛高教授在报告中详细阐述了“混合向量索引”技术在数据与人工智能系统中的关键作用。他指出,随着数据规模的爆炸性增长,传统的索引技术已经难以满足高效查询和处理的需求。混合向量索引通过结合多种索引结构的优势,能够在大规模数据集中实现快速查询和高效存储。高云君教授聚焦于“向量数据管理助力LLM推理”,展望了向量数据管理在“数据+AI”融合中的未来发展,强调其在大数据与大模型相互赋能中的重要作用。汤南教授提出了面向多模态数据湖的下一代数据分析框架,重点关注基于问题的智能信息提取和基于问题的数据结构转换两种核心方法。
图7 丛高教授、高云君教授、汤南教授下午报告
报告分享结束后,王晓阳、丛高、汤南、钱卫宁、伍赛教授围绕“Data+Al的挑战和机遇”的主题展开了精彩的研讨。本次研讨会为与会者提供了一个广阔的学术交流平台。参会的专家学者、企业家和青年学者们聚焦前沿问题,充分交流了最新的研究成果,促进了学术界与产业界的深度合作,也进一步推动了探索数据库技术在大模型训练与推理中的应用领域的未来发展指明方向。
图8 Panel讨论:“Data+Al”的挑战和机遇
同期,结合本次战略研讨会开展了数字政府建设专题研讨,全省30余名数字政府建设管理部门负责同志参会学习。
为期两天的CCF数据库战略研讨会(SiftDB 2025)取得了胜利闭幕。本次会议的成功举办,为推动大模型技术与数据库领域的深度融合提供了重要平台,对促进我国数字经济高质量发展具有积极意义。本次会议还得到了CCF数据库专委会钻石长期合作伙伴华为、达梦数据,铂金长期合作伙伴人大金仓KingBase、金篆信科GoldenDB、OceanBase、阿里云、腾讯云数据库、涛思数据TDengine的大力支持。
点击“阅读原文”,加入CCF。