YEF2026 | 具身决策前沿：从强化学习到具身大模型_最新动态

首页 > 最新动态 > YEF2026 | 具身决策前沿：从强化学习到具身大模型

最新动态

YEF2026 | 具身决策前沿：从强化学习到具身大模型

2026-05-09950

人工智能正经历从虚拟认知向物理交互的战略跨越，具身智能已成为这一进程的核心方向。其中，具身决策作为打通“认知—行动”闭环的关键环节，正成为前沿探索的焦点。从强化学习时代智能体通过试错机制与环境持续交互、依赖奖励信号完成行为优化，到如今具身大模型融合视觉-语言-动作多模态架构、实现对物理世界的深度认知与自主响应，环境交互模型完成了从“底层动作优化”到“高层认知闭环”的根本性跃迁。

为系统梳理这一演进脉络、凝聚前沿学术共识，本次论坛以“具身决策前沿：从强化学习到具身大模型”为主题，聚焦具身决策的核心议题——强化学习与具身大模型的技术演进路径与未来挑战。论坛汇聚领域顶尖学者，分享最新研究成果与典型产业实践，推动理论创新与工程落地的深度协同，为我国智能机器人、自主系统及相关产业的高质量发展提供学术支撑与技术引领。

论坛日程

5月21日下午13:30-17:30

时间	环节	嘉宾以及单位	报告题目
13:30-13:40	开场	魏巍山西大学教授
13:40-14:·10	报告1	蒋树强中国科学院大学	浅谈具身智能中的自我模型
14:10-14:40	报告2	徐凯中国科学院工业人工智能研究所	仿真器-世界模型在环的具身数据飞轮
14:40-15:10	报告3	郝建业天津大学	具身智能体
15:10-15:30	茶歇
15:30-16:00	报告4	张伟男哈尔滨工业大学	基于大模型的具身行为规划
16:00-16:30	报告5	白辰甲中国电信人工智能研究院	数据和模型双向驱动的具身大模型
16:30-17:30	Panel	全体嘉宾

论坛主席

魏巍

CCF杰出会员，山西大学教授

CCF杰出会员，IEEE Senior Member，山西大学计算机与信息技术学院副院长。长期从事数据挖掘、机器学习、具身智能等领域的研究；先后赴香港城市大学、美国纽约州立大学布法罗分校做访问学者；担任CCF人工智能与模式识别专业委员会执行委员、大数据专家委员会执行委员、青年计算机科技论坛（YOCSEF）太原分论坛2022-2023年度主席。先后主持和参与国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金面上项目、山西省自然科学基金项目20余项。重点围绕强化学习、多智能体系统、大模型、粒计算等方向开展研究，先后在IEEE TPAMI、IEEE TKDE、Machine Learning、Pattern Recognition、ICML、NeurIPS、ICLR等重要学术期刊、会议发表论文50余篇，获国家发明专利8项。

共同主席

陈路

山西大学副教授，演化科学智能山西省重点实验室副主任

山西大学副教授、博士生导师，演化科学智能山西省重点实验室副主任，入选山西大学 “文瀛青年学者” 人才支持计划；担任中国计算机学会智能机器人专委会委员、中国自动化学会模式识别与机器智能专委会委员、中国计算机学会 YOCSEF太原AC委员，《Robot Learning》期刊青年编委。主要研究方向为复杂动态场景下机器人智能感知，主持国防科技创新特区项目、国家自然科学基金面上及青年项目等国家级项目4项；在IEEE TSMC、ICRA等重要期刊会议发表学术论文40余篇，授权发明专利10余项。

论坛讲者

蒋树强

CCF监事，中国科学院大学特聘教授

CCF监事、多媒体专委会副主任，中国科学院大学特聘教授，CAAI具身智能专委会主任。主要研究方向是多媒体分析与多模态具身智能技术。发表论文200余篇，先后获省部级或学会奖励5项。

报告题目：浅谈具身智能中的自我模型

摘要：具身智能体要实现环境适应与自主交互，不仅需要理解外部世界，更需要深刻地理解“自己”。我们参照人类对自我的认知，提出面向具身智能的“自我模型”。自我模型是指通过计算机软件/程序，对具身智能系统的自我身体、自我能力、自我记忆、自我行为、自我身份等与自我有关的各个方面进行综合的表示和建模。本报告将介绍自我模型的定义、计算框架和六级分层体系，并给出了自我模型的真机实现方案，最后对未来发展给出展望。

徐凯

中科院工业人工智能研究所研究员

中科院工业人工智能研究所研究员、中科大博导，长期从事计算机图形学、具身智能与数字孪生研究，主持多项国家基金项目，发表A类论文百余篇，入选全球前2%顶尖科学家榜单，获多项省部级及学会自然科学奖励。

报告题目：仿真器-世界模型在环的具身数据飞轮

摘要：高质量数据是制约具身智能发展的核心挑战，传统数据采集与仿真训练模式仍处于“开环”状态，尚未形成可持续的数据闭环与迭代飞轮。报告将剖析“世界模型在环”“仿真在环”“仿真-模型在环”及“通专协同”四种具身数据闭环模式，构建仿真与真实世界交互的可持续数据循环，驱动策略模型进化；并分享团队在通用世界模型训练与适配、SimReady场景重建等关键技术上的最新进展，推动具身智能在真实物理世界中的落地与持续进化。

郝建业

天津大学教授

天津大学教授、国家优青，主要研究强化学习、具身智能与多智能体系统，发表高水平论文百余篇，获多项国际最佳论文和竞赛冠军，曾任华为相关实验室主任及军团副总裁，推动强化学习与大模型技术产业落地。

报告题目：具身智能体

摘要：当前大模型在虚拟交互中表现出色，但面对物理世界的具身智能任务时，仍面临时空理解推理能力不足和精细化操作能力缺失等关键挑战。报告将介绍大模型技术背景、具身智能关键瓶颈，以及从数据、模型、优化和推理三方面实现scaling law面临的技术挑战与最新进展，重点包括自动化任务生成、强化学习驱动的数据生产与能力评估、分层架构演进、高效训练优化方法、端侧部署加速技术，并展望下一代具身模型的发展趋势。

张伟男

哈尔滨工业大学教授

哈尔滨工业大学教授、博导，国家级青年人才，任人工智能学院执行院长等职，研究自然语言处理、大模型、社交机器人与具身智能，主持国家重点研发计划青年科学家项目，获黑龙江省科技进步一等奖等奖励。

报告题目：基于大模型的具身行为规划

摘要：具身智能的研究主要包括具身感知、具身认知和具身执行，其中具身认知主要关注具身智能中的推理能力，而具身行为规划是具身推理中的一个重要研究问题，近年来受到了研究者们的广泛关注。本次报告主要围绕基于大模型的具身行为规划研究进展，分析已有研究存在的问题和挑战，并介绍该方向上的前沿工作，最后总结和展望该方向的未来发展趋势。

白辰甲

中国电信人工智能研究院研究科学家

中国电信人工智能研究院研究科学家、具身智能研究中心主任，聚焦具身智能与机器人控制，构建多项具身大脑、小脑关键平台，发表高水平论文60余篇，主持多类科研项目，获ICCV竞赛冠军等荣誉，获国内外媒体关注。

报告题目：数据和模型双向驱动的具身大模型

摘要：报告将介绍TeleAI具身团队在具身大模型通用化过程中，围绕仿真数据合成与真机数据校验开展的系列成果。一方面，提出多样化、高效率的规模化具身数据合成方式，推动数据采集和合成走向低成本；另一方面，提升数据质量验证和跨本体适配情况，推动数据质量和跨本体能力走向高水平。在此基础上，介绍团队提出的PRTS操作大模型这一强化学习原生操作大模型，以及GN0通用导航大模型，并说明其在实际应用场景中的落地情况。

中国计算机学会青年精英大会（YEF2026）

时间：5月21日至23日

地点：四川绵阳

大会主题：智创未来

报名通道全面开启

类别	即日起-5月20日（含）	5月21日-5月23日（含）
CCF会员	1800	2100
非会员	2200	2500

扫码报名

点击“阅读原文”，加入CCF。

阅读原文

点我访问原文链接