首页 > 最新动态 > YEF2026 | 具身决策前沿:从强化学习到具身大模型
最新动态
YEF2026 | 具身决策前沿:从强化学习到具身大模型
2026-05-0924


人工智能正经历从虚拟认知向物理交互的战略跨越,具身智能已成为这一进程的核心方向。其中,具身决策作为打通“认知—行动”闭环的关键环节,正成为前沿探索的焦点。从强化学习时代智能体通过试错机制与环境持续交互、依赖奖励信号完成行为优化,到如今具身大模型融合视觉-语言-动作多模态架构、实现对物理世界的深度认知与自主响应,环境交互模型完成了从“底层动作优化”到“高层认知闭环”的根本性跃迁。


为系统梳理这一演进脉络、凝聚前沿学术共识,本次论坛以“具身决策前沿:从强化学习到具身大模型”为主题,聚焦具身决策的核心议题——强化学习与具身大模型的技术演进路径与未来挑战。论坛汇聚领域顶尖学者,分享最新研究成果与典型产业实践,推动理论创新与工程落地的深度协同,为我国智能机器人、自主系统及相关产业的高质量发展提供学术支撑与技术引领。



论坛日程

5月21日下午13:30-17:30

时间

环节

嘉宾以及单位

报告题目

13:30-13:40

开场

魏巍 山西大学教授


13:40-14:·10

报告1

蒋树强 中国科学院大学

浅谈具身智能中的自我模型

14:10-14:40

报告2

徐凯 中国科学院工业人工智能研究所

仿真器-世界模型在环的具身数据飞轮

14:40-15:10

报告3

郝建业 天津大学

具身智能体

15:10-15:30

茶歇

15:30-16:00

报告4

张伟男 哈尔滨工业大学

基于大模型的具身行为规划

16:00-16:30

报告5

白辰甲 中国电信人工智能研究院

数据和模型双向驱动的具身大模型

16:30-17:30

Panel

全体嘉宾



论坛主席


魏巍



CCF杰出会员,山西大学教授

CCF杰出会员,IEEE Senior Member,山西大学计算机与信息技术学院副院长。长期从事数据挖掘、机器学习、具身智能等领域的研究;先后赴香港城市大学、美国纽约州立大学布法罗分校做访问学者;担任CCF人工智能与模式识别专业委员会执行委员、大数据专家委员会执行委员、青年计算机科技论坛(YOCSEF)太原分论坛2022-2023年度主席。先后主持和参与国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金面上项目、山西省自然科学基金项目20余项。重点围绕强化学习、多智能体系统、大模型、粒计算等方向开展研究,先后在IEEE TPAMI、IEEE TKDE、Machine Learning、Pattern Recognition、ICML、NeurIPS、ICLR等重要学术期刊、会议发表论文50余篇,获国家发明专利8项。


共同主席


陈路



山西大学副教授,演化科学智能山西省重点实验室副主任

山西大学副教授、博士生导师,演化科学智能山西省重点实验室副主任,入选山西大学 “文瀛青年学者” 人才支持计划;担任中国计算机学会智能机器人专委会委员、中国自动化学会模式识别与机器智能专委会委员、中国计算机学会 YOCSEF太原AC委员,《Robot Learning》期刊青年编委。主要研究方向为复杂动态场景下机器人智能感知,主持国防科技创新特区项目、国家自然科学基金面上及青年项目等国家级项目4项;在IEEE TSMC、ICRA等重要期刊会议发表学术论文40余篇,授权发明专利10余项。


论坛讲者


蒋树强



CCF监事,中国科学院大学特聘教授

CCF监事、多媒体专委会副主任,中国科学院大学特聘教授,CAAI具身智能专委会主任。主要研究方向是多媒体分析与多模态具身智能技术。发表论文200余篇,先后获省部级或学会奖励5项。


报告题目:浅谈具身智能中的自我模型


摘要:具身智能体要实现环境适应与自主交互,不仅需要理解外部世界,更需要深刻地理解“自己”。我们参照人类对自我的认知,提出面向具身智能的“自我模型”。自我模型是指通过计算机软件/程序,对具身智能系统的自我身体、自我能力、自我记忆、自我行为、自我身份等与自我有关的各个方面进行综合的表示和建模。本报告将介绍自我模型的定义、计算框架和六级分层体系,并给出了自我模型的真机实现方案,最后对未来发展给出展望。

徐凯



中科院工业人工智能研究所研究员

中科院工业人工智能研究所研究员、中科大博导,长期从事计算机图形学、具身智能与数字孪生研究,主持多项国家基金项目,发表A类论文百余篇,入选全球前2%顶尖科学家榜单,获多项省部级及学会自然科学奖励。


报告题目:仿真器-世界模型在环的具身数据飞轮


摘要:高质量数据是制约具身智能发展的核心挑战,传统数据采集与仿真训练模式仍处于“开环”状态,尚未形成可持续的数据闭环与迭代飞轮。报告将剖析“世界模型在环”“仿真在环”“仿真-模型在环”及“通专协同”四种具身数据闭环模式,构建仿真与真实世界交互的可持续数据循环,驱动策略模型进化;并分享团队在通用世界模型训练与适配、SimReady场景重建等关键技术上的最新进展,推动具身智能在真实物理世界中的落地与持续进化。

郝建业



天津大学教授

天津大学教授、国家优青,主要研究强化学习、具身智能与多智能体系统,发表高水平论文百余篇,获多项国际最佳论文和竞赛冠军,曾任华为相关实验室主任及军团副总裁,推动强化学习与大模型技术产业落地。


报告题目:具身智能体


摘要:当前大模型在虚拟交互中表现出色,但面对物理世界的具身智能任务时,仍面临时空理解推理能力不足和精细化操作能力缺失等关键挑战。报告将介绍大模型技术背景、具身智能关键瓶颈,以及从数据、模型、优化和推理三方面实现scaling law面临的技术挑战与最新进展,重点包括自动化任务生成、强化学习驱动的数据生产与能力评估、分层架构演进、高效训练优化方法、端侧部署加速技术,并展望下一代具身模型的发展趋势。

张伟男



哈尔滨工业大学教授

哈尔滨工业大学教授、博导,国家级青年人才,任人工智能学院执行院长等职,研究自然语言处理、大模型、社交机器人与具身智能,主持国家重点研发计划青年科学家项目,获黑龙江省科技进步一等奖等奖励。


报告题目:基于大模型的具身行为规划


摘要:具身智能的研究主要包括具身感知、具身认知和具身执行,其中具身认知主要关注具身智能中的推理能力,而具身行为规划是具身推理中的一个重要研究问题,近年来受到了研究者们的广泛关注。本次报告主要围绕基于大模型的具身行为规划研究进展,分析已有研究存在的问题和挑战,并介绍该方向上的前沿工作,最后总结和展望该方向的未来发展趋势。

白辰甲



中国电信人工智能研究院研究科学家

中国电信人工智能研究院研究科学家、具身智能研究中心主任,聚焦具身智能与机器人控制,构建多项具身大脑、小脑关键平台,发表高水平论文60余篇,主持多类科研项目,获ICCV竞赛冠军等荣誉,获国内外媒体关注。


报告题目:数据和模型双向驱动的具身大模型


摘要:报告将介绍TeleAI具身团队在具身大模型通用化过程中,围绕仿真数据合成与真机数据校验开展的系列成果。一方面,提出多样化、高效率的规模化具身数据合成方式,推动数据采集和合成走向低成本;另一方面,提升数据质量验证和跨本体适配情况,推动数据质量和跨本体能力走向高水平。在此基础上,介绍团队提出的PRTS操作大模型这一强化学习原生操作大模型,以及GN0通用导航大模型,并说明其在实际应用场景中的落地情况。


中国计算机学会青年精英大会(YEF2026)

时间:5月21日至23日

地点:四川绵阳

大会主题:智创未来


报名通道全面开启

类别

即日起-5月20日(含)

5月21日-5月23日(含)

CCF会员

1800

2100

非会员

2200

2500


扫码报名






图片


图片


点击“阅读原文”,加入CCF。

点我访问原文链接