CNCC Tutorial| 具身智能机理、技术与进展
2025-08-055
CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思辨。
今年Tutorial共设置9大主题板块:AI基础模型、机器学习理论与机理、强化学习与推理、视觉与多模态、AI安全与治理、面向AI的数据管理和治理、Agent与具身智能、新型计算与网络架构、AI4Science。
??Tutorial名称:
具身智能机理、技术与进展
具身智能是人工智能实现与真实物理世界动态交互的核心方向,其通过“感知-决策-行动”闭环机制,赋予智能体理解环境、执行任务及与人交互的能力。本Tutorial将系统介绍具身智能机理、技术与进展,从具身智能的定义、经典范式与核心挑战出发,我们将深入讨论基于大模型的感知、推理与决策,利用大模型技术解析物理世界以驱动具身本体,以及对动态开放环境进行处理,并介绍具身智能在智能体、机器人操作、视觉导航等领域的前沿进展与实践应用。本Tutorial融合理论与实践,旨在为研究者与相关从业者提供具身智能的全景视角,揭示具身智能的挑战与机遇。
举办时间:2025年10月22日下午
举办地点:哈尔滨市·华旗饭店
注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准
序号 | 报告题目 | 讲者 | 单位 |
1 | 开放环境下的视觉导航 | 蒋树强 | 中国科学院计算技术研究所 |
2 | 形态与行为协同增效的具身智能 | 刘华平 | 清华大学 |
3 | 基于大模型的感知、推理与决策以及在多智能体中的应用 | 杨易 | 浙江大学 |
4 | 数字基因:可解析的通用具身操作世界观 | 卢策吾 | 上海交通大学 |
CCF多媒体专委会副主任、中国科学院计算技术研究所研究员
中国科学院大学,教授,博士生导师,国家杰出青年科学基金获得者,国际期刊ACM ToMM编委,CCF多媒体专委会副主任,研究方向为多媒体内容分析与多模态智能技术,主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金等项目20余项,共在IEEE/ACM汇刊和CCF-A类会议上发表论文80余篇,获授权专利20项,先后获CCF科学技术奖、中国图象图形学会自然科学二等奖、吴文俊人工智能自然科学一等奖和北京市科技进步二等奖。
清华大学计算机科学与技术系教授,研究方向为机器人感知与学习,获国家杰出青年科学基金资助。担任机器人领域顶级期刊International Journal of Robotics Research的高级编委、中国自动化学会智能自动化专业委员会主任委员,入选爱思唯尔中国高被引学者。曾获日内瓦发明展金奖、IEEE仪器与测量学会 Andy Chi最佳论文奖、IROS最佳认知机器人论文奖。
演讲题目:形态与行为协同增效的具身智能
摘要:具身智能广泛存在于生物体中,强调智能由脑、身体与环境协同影响,而实际行为是由主体与环境通过信息感知和物理操作过程连续、动态地相互作用而产生的。它与强调逻辑、推理与问题求解的离身智能可以协同发展,相互补充,并为智能的突破提供途径。 本报告从形态与行为协同增效的角度,对具身智能的内涵与外延做简要剖析,梳理具身智能的体系,介绍了具身智能的关键技术做介绍,并针对协同交互感知、具身大模型等前沿课题,以及一些典型应用做具体介绍。
浙江大学求是讲席教授(二级教授)、国家特聘专家。目前担任浙江大学计算机学院副院长、人工智能研究所所长、微软-教育部视觉感知重点实验室主任、人工智能省部共建协同创新中心副主任。主要研究方向为人工智能及其应用。所发论文Google Scholar引用8.5万余次,H-index 140,近6年连续入选Clarivate Analytics全球高被引学者。获教育部全国优秀博士论文(2010)、澳大利亚基金委青年研究职业奖(2013)、澳大利亚计算机学会颠覆创新金奖(2016)、谷歌学者研究奖(2016)、澳大利亚科研终身成就奖(2019)、亚马逊机器学习科研奖(2020)、AAAI最具影响力论文(2021)、ACM MM唯一最佳论文奖(2023)等多项AI领域国际奖项,以及20余次国际科研竞赛世界冠军。
演讲题目:基于大模型的感知、推理与决策以及在多智能体中的应用
摘要:基于大模型的感知、推理与决策技术正成为具身智能系统的重要支撑。大模型通过融合视觉、语言等多模态信息,实现复杂环境的精准感知;利用链式推理、上下文学习和生成规划方案的能力,完成智能决策。同时,大模型显著提升了智能体之间的通信效率、协作水平和任务泛化能力,推动了多智能体系统在群体协同控制、自主导航、机器人操控、仿真交互和群智涌现等领域的广泛应用。
上海交通大学人工智能学院副院长/特聘教授,上海创智学院副院长,长江学者特聘教授,科学探索奖获得者 (具身智能方向贡献)。中国人工智能学会具身智能大会首届、第二届程序主席。2018年被《麻省理工科技评论》评为35位35岁以下中国科技精英 (MIT TR35),2019年获求是杰出青年学者,2020年获上海市科技进步特等奖,2022年获教育部青年科学奖,国际机器人顶会IROS/ICRA最佳论文,2023年获机器人顶会RSS最佳系统论文提名奖 (共四项)。以通讯作者或第一作者在《自然》,《自然·机器智能》,TPAMI等高水平期刊和会议发表论文100多篇;担任Science、Nature、Cell等期刊审稿人,国际人工智能与机器人顶级学术会议NeurIPS、CVPR、ICCV、ECCV、IROS、ICRA领域主席。
演讲题目:数字基因:可解析的通用具身操作世界观
摘要:AI系统在涉及到物理世界理解与交互的具身智能场景下的应用仍然面临困难。这揭示了一个重要问题:仅依赖大模型学习到的语义层面的概念对具身应用来说是远远不够的——AI系统目前缺乏有效的方式来理解物理世界,以实现可靠、准确、通用的机器人操作。本报告介绍“数字基因”的思想,通过解析化的方法来对物理世界通用概念进行表示,让机器智能实现对物理世界可计算、无歧义、高度泛化的结构化抽象建模,实现准确的具身世界模型估计并进一步准确完成操作任务。
CCF多媒体专委会副主任、中国科学院计算技术研究所研究员
演讲题目:开放环境下的视觉导航
摘要:具身智能是真实物理世界中人工智能的重要表现形态,具身导航与重整理是指智能体根据任务目标,感知与理解周围环境并执行交互动作完成指定任务,这是具身智能系统与真实世界交互的关键技术。真实具身场景面临着诸多挑战,包括场景结构和语义的未知性带来的开放场景问题,目标种类和功能属性未知所构成的开放目标问题,以及物体位置和状态随时间演化所导致的动态变化问题。这些因素要求智能体具备更强的环境适应能力、任务泛化能力以及对环境变化的鲁棒应对能力。本报告将首先介绍具身智能、具身记忆、具身导航与重整理的研究背景,重点分享基于场景记忆、功能推理与自适应学习的最新进展,具体包括差异感知驱动的场景重整理、功能推理的开放目标导航以及具备实时适应能力的元学习方法,最后介绍具身导航从虚拟到真实环境的适配并给出演示。
CNCC2025将于10月23-25日在哈尔滨举办。学术专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。Tutorial作为这一设计的起点,为参会者构建坚实的共同知识基础,能够深度参与后续的前沿报告理解与未来方向思辨。同时面向青年学者、行业新锐等人群,通过系统性教学,助力赋能青年人才发展。
点击“阅读原文”,加入CCF。
点我访问原文链接