首页 > 最新动态 > CNCC Tutorial|大模型与信息检索:技术融合与范式变革
最新动态
CNCC Tutorial|大模型与信息检索:技术融合与范式变革
2025-07-313

CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思辨。


今年Tutorial共设置9大主题板块:AI基础模型、机器学习理论与机理、强化学习与推理、视觉与多模态、AI安全与治理、面向AI的数据管理和治理、Agent与具身智能、新型计算与网络架构、AI4Science。


??Tutorial名称:

大模型与信息检索:技术融合与范式变革

??所属主题

AI基础模型(语言、图、表格、时间序列、代码等)


Tutorial简介

大语言模型凭借强大的语义理解与内容生成能力,正在重塑信息检索技术的理论与实践,并极大提升人类获取信息的效率与效果。本Tutorial将系统介绍大语言模型与信息检索技术融合的最新理论框架、关键技术实践及前沿研究进展。具体内容涵盖以下三个方面:(1)大语言模型赋能传统信息检索技术。详细介绍大模型在传统信息检索关键环节的应用;(2)信息检索技术增强大语言模型,即检索增强生成(RAG)方法。全面梳理如何利用外部知识库、检索系统有效缓解大模型的幻觉和时效性问题,并提升生成结果的准确性;(3)大语言模型重塑信息获取过程。重点介绍以推理模型为核心驱动的全新信息获取范式。


Tutorial日程

举办时间:2025年10月22日下午

举办地点:哈尔滨华旗饭店


注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准


模块

内容

时长

1. 概述

大模型与信息检索技术融合的背景与趋势

20min

2. 大模型赋能信息检索

传统信息检索系统模块(如查询改写、文档检索、文档重排、文档内容理解等)的前沿方法与技术

50min

3. 检索增强生成技术

检索增强生成(RAG)框架的基本结构以及其中查询理解、文档检索、文档精炼等模块的前沿方法与技术

70min

4. 推理模型驱动的信息获取新范式

以推理模型为核心的深度搜索与深度研究技术的原理与典型方法

40min

5. Q&A与未来趋势探讨

互动交流与前沿问题讨论

30min


报告内容

在第一部分“概述”中,讲者将清晰简要地介绍信息检索领域的核心概念和大模型的基本理论,并进一步介绍大模型与信息检索技术融合的时代背景与最新发展趋势。第二部分以“大模型赋能信息检索”为主题,着重介绍大模型如何赋能传统信息检索系统的各关键环节,系统阐述包括查询改写、文档检索、文档重排序、文档内容理解等方面的创新方法和应用成效,展示大模型带来的技术变革与显著性能提升。第三部分将重点阐释“检索增强生成技术”,系统介绍该技术框架的核心架构与经典方法,并进一步深入分析查询理解、文档检索、文档精炼等关键模块中的前沿方法与创新技术,帮助听众深入理解该技术在学术研究与产业应用中的巨大潜力。第四部分将深入探讨以推理模型为核心的深度搜索与深度研究技术,详细剖析其基本原理与典型方法,结合案例讲解其在实际场景中的应用价值与关键挑战。最后部分“总结与展望”中,讲者将对当前研究进展与已有成果做出简要归纳,进一步展望该领域未来可能的发展方向,并与听众一起探讨大模型与信息检索融合带来的机遇与挑战。


讲者介绍


窦志成

CCF大数据专家委员会秘书长,中国人民大学高瓴人工智能学院副院长、教授

中国人民大学教授,博士生导师,高瓴人工智能学院副院长,CCF大数据专家委员会秘书长,中文信息学会理事、信息检索专委会副主任、CCF大模型论坛常务委员。担任国际期刊ACM TOIS副主编,担任SIGIR 2023短文程序主席、亚洲信息检索学术会议AIRS大会主席(2016)、程序委员会主席(2017),全国信息检索学术会议CCIR程序委员会主席(2020)、大会主席(2023),NTCIR-16和NTCIR-17程序主席、中国大数据技术大会BDTC 2022程序主席等主席职务。长期担任SIGIR、TheWebConf、KDD、ACL等重要学术会议的程序委员会高级委员或领域主席。主要研究新一代智能信息检索技术、大模型、AI搜索、智能体、司法智能等。已在国际知名学术会议和期刊上发表论文150余篇,获得授权专利50余项,研究成果被20余部教材收录,带领团队开发了中国人民大学涉外法治大模型。团队开发的开源大模型检索增强工具包FlashRAG获得星标2400余枚。成果《以用户需求为中心的互联网信息获取关键理论与技术》获教育部自然科学一等奖。获得WWW 2023亮点论文(最佳论文提名)奖、 国际信息检索大会(SIGIR 2013)最佳论文提名奖、 亚洲信息检索大会(AIRS 2012)最佳论文奖获、全国信息检索学术会议最佳论文奖等。

朱余韬

中国人民大学高瓴人工智能学院博士后,讲师

中国人民大学高瓴人工智能学院博士后,合作导师为窦志成教授。CIPS青工委成员,CCIR专委会委员。研究方向为信息检索与大语言模型。2023年毕业于蒙特利尔大学并获博士学位。博士期间曾获谷歌卓越博士生奖学金。目前,在人工智能和信息检索领域的国际顶级期刊和会议上发表学术论文40余篇,谷歌学术统计引用量3600余次。担任多个国际学术会议如ACL、NeurIPS、ICML、ICLR、SIGIR的程序委员会委员,并为TOIS、JASIST、KAIS等国际学术期刊的审稿人。是中国人民大学“玉兰”大模型项目组成员,负责基座模型的训练。主导开发检索增强生成工具包FlashRAG,在Github上获2.6k+星标。在检索增强生成领域具有丰富的研究与开发经验。



CNCC2025


CNCC2025将于10月23-25日在哈尔滨举办。学术专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。Tutorial作为这一设计的起点,为参会者构建坚实的共同知识基础,能够深度参与后续的前沿报告理解与未来方向思辨。同时面向青年学者、行业新锐等人群,通过系统性教学,助力赋能青年人才发展。





图片


图片
图片
图片

点击“阅读原文”,加入CCF。

点我访问原文链接