具身智能与大模型、人形机器人的紧密结合催生了新兴科研与产业方向。本专题以10个报告(分别来自学界的知名学者与工业界的技术大咖)形式围绕基础技术、前沿领域与应用场景做详细剖析。此外,还将通过展示分享环节等为参会人员提供丰富的学习、交流机会。
CCF学科前沿讲习班
CCF学科前沿讲习班
The CCF Advanced Disciplines Lectures
CCFADL第152期
主题 具身智能
2024年8月10日-12日 北京
本期CCF学科前沿讲习班《具身智能》,将系统地讨论具身智能的内涵与外延,并结合形态智能、感知与学习等多视角探讨包括环境导航、机器人操作等典型具身行为的前沿智能方法。学员经过本次讲习班的研习,能够系统地了解具身智能的体系结构、前沿技术、主要挑战和应用场景,开阔科研视野,增强思考与实践能力。
讲习班邀请了10位来自著名高校与企业科研机构,活跃在前沿领域的专家学者做主题报告。第一天聚焦具身导航与操作,由中国科学院计算技术研究所研究员蒋树强和北京大学助理教授董豪介绍具身导航与操作的关键技术与前沿方向。第二天聚焦通用具身智能,由清华大学助理教授陈建宇和北京邮电大学教授郭迪讲授通用智能机器人、具身协同与交互学习相关内容。第三天上午由黄思远(研究员,北京通用人工智能研究院)介绍三维世界中的通用具身智能体。下午由王兴兴(创始人/CEO/CTO,宇树科技Unitree)、王斌(产品副总裁,达闼机器人有限公司)、袁海辉(副总经理,五八智能科技(杭州)有限公司)、蔡颖鹏(CEO,北京因时机器人科技有限公司)、阿勇(研究员,三星电子中国通信研究院)等专家讲授具身智能的应用。同时讲习班将同期在会场为参会者设立Poster展示环节,促进交流。通过三天的学习,加强学员对具身智能的关键技术与产业应用等领域的深刻理解。
学术主任:刘华平 教授 清华大学 方斌 教授 北京邮电大学
主办单位:中国计算机学会
活动日程:
2024年8月10日(周六) | |
9:00-9:10 | 开班仪式 |
9:10-9:20 | 全体合影 |
9:20-12:20 | 专题讲座1:具身智能中的视觉导航 蒋树强,研究员,中国科学院计算技术研究所 |
12:20-13:30 | 午餐 |
13:30-16:30 | 专题讲座2:具身智能关键技术研究:操作、决策与导航 董豪,助理教授,北京大学 |
2024年8月11日(周日) | |
9:00-12:00 | 专题讲座3:构建人形通用智能机器人 陈建宇,助理教授,清华大学 |
12:00-13:30 | 午餐 |
13:30-16:30 | 专题讲座4:具身协同与交互学习 郭迪,教授,北京邮电大学 |
2024年8月12日(周一) | |
9:00-12:00 | 专题讲座5:三维世界中的通用具身智能体 黄思远,研究员,北京通用人工智能研究院 |
12:00-13:30 | 午餐 |
13:30-14:00 | 专题讲座6:具身智能是实现AGI的最有效途径 王兴兴,创始人/CEO/CTO,宇树科技Unitree |
14:00-14:30 | 专题讲座7:人形机器人具身智能大模型技术与应用实践 王斌,产品副总裁,达闼机器人有限公司 |
14:30-15:00 | 专题讲座8:人形机器人产业发展思考与探索 袁海辉,副总经理,五八智能科技(杭州)有限公司 |
15:00-15:30 | 专题讲座9:灵巧操作能力成为人形机器人落地应用关键 蔡颖鹏,CEO,北京因时机器人科技有限公司 |
15:30-16:00 | 专题讲座10:通用机器人操作技能研究 阿勇,研究员,三星电子中国通信研究院 |
16:00-16:30 | 圆桌论坛及颁奖仪式 |
本期ADL主题《具身智能》, 由清华大学教授刘华平和北京邮电大学教授方斌担任学术主任,邀请到蒋树强(研究员,中国科学院计算技术研究所)、董豪(助理教授,北京大学)、陈建宇(助理教授,清华大学、星动纪元创始人)、郭迪(教授,北京邮电大学)、黄思远(研究员,北京通用人工智能研究院)、王兴兴(创始人/CEO/CTO,宇树科技Unitree)、王斌(产品副总裁,达闼机器人有限公司)、袁海辉(副总经理,五八智能科技(杭州)有限公司)、蔡颖鹏(CEO,北京因时机器人科技有限公司)、阿勇(研究员,三星电子中国通信研究院)等10位专家做专题讲座。
特邀讲者
蒋树强
中国科学院计算技术研究所
讲者简介:蒋树强,中国科学院计算技术研究所研究员,博士生导师,国家杰出青年科学基金获得者,先后担任期刊《IEEE TMM》、《ACM ToMM》、《IEEE Multimedia》、《计算机研究与发展》、《JCST》、《CAD学报》编委,中国计算机学会多媒体专委会副主任、中国人工智能学会智能服务专委会副主任、中国自动化学会网络计算专委会副主任、ACM SIGMM中国分会副主席。主要研究方向是多媒体内容分析、多模态具身智能技术和食品计算。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金等项目20余项,发表论文200余篇,获授权专利20余项,多项技术应用到实际系统中,先后获省部级或学会奖励5项。
报告题目:具身智能中的视觉导航
报告摘要:具身智能是指通过身体与环境互动来实现的智能,具有主动性、交互性和情境化的特点,具身智能是真实物理场景下人工智能的重要表现形态,在动态开放环境的无人系统与人机协同系统中有潜在重大应用价值。视觉导航是具身智能的一项重要任务,是智能系统应用在现实世界中的一项重要能力。在静态且可充分探索的环境中,借助地图定位智能系统能达到令人满意的导航性能。然而对于动态且未知环境,现有技术由于缺乏准确的地图而无法进行高效的导航。相比于机器,人类依赖于对目标先验知识,可以在未知动态环境中高效地寻找并导航至目标物体;此外生理学研究表明,人类在导航中不仅依赖当前探索观测,还能从先前记忆中预想未观测环境,通过探索与预想的结合不断修正与完善对环境的认知。如何将人类的视觉导航能力赋予机器是视觉导航任务所关注的问题。本报告将首先介绍具身智能研究背景、研究现状和研究趋势,并汇报视觉导航技术研究进展,包括类别级/实例级物体导航、单物体/多物体导航、物体导航/视觉语言导航、以及探索与预想相结合的具身导航等技术,并介绍物体导航从虚拟到真实环境的适配并给出演示。
董豪
北京大学
讲者简介:董豪,北京大学计算机学院助理教授、研究员,于2019年获帝国理工博士学位。研究重点包括可泛化的机械臂操作、机器人视觉和移动设备自主决策等方面。董博士在RSS、NeurIPS、ICLR、CVPR、ICCV、ECCV、ICRA、IROS等顶级国际会议和期刊中发表论文50余篇,引用5000余次。其担任NeurIPS 2023 2024领域主席、CVPR 2023 2024领域主席、AAAI 2023 2024高级程序委员、中国科技核心期刊Machine Intelligence Research副编委等。
报告题目:具身智能关键技术研究:操作、决策与导航
报告摘要:在近年来,具身智能和智能机器人领域引起了广泛的学术和产业关注,特别是在探索基于物理身体在开发环境中进行智能感知、决策和执行的能力方面。然而,该领域所面临的主要挑战之一是缺乏大规模的训练数据。本报告将深入研究这一挑战,并详细介绍我们在仿真学习和大模型技术领域的最新研究成果。通过这些探索,我们的目标是赋予具身智能算法对物体操纵、任务规划和导航的泛化能力,以加速通用具身智能的实现,使机器人能够在开放环境中执行复杂的任务。
陈建宇
清华大学、星动纪元
讲者简介:陈建宇,清华大学交叉信息研究院助理教授、星动纪元创始人。他在清华大学取得学士学位,在加州大学伯克利分校取得博士学位,师从美国国家工程院院士、机电控制学科先驱Masayoshi Tomizuka教授。他近年来在机器人与人工智能的交叉领域从事前沿研究与产业化探索。他的目标是构建出具备高性能、高智能的通用智能机器人软硬件系统。他在机器人与人工智能领域的国际顶级会议和期刊上发表了五十余篇论文,部分论文入围L4DC 2022、IEEE IV 2021、IFAC MECC 2021等国际会议优秀论文奖。他在2021年入选了“福布斯中国30under30”榜单。
报告题目:构建人形通用智能机器人
报告摘要:造出像人一样的智能机器,成为造物主是人类一直以来的梦想。以ChatGPT为代表的AGI只能被称作“缸中大脑”,未来更为强大的AGI还应该有灵活的四肢和身体,从而具备和世界更深层次交互的能力,创造出更大的价值。而人形机器人由于其完美适应于人类社会与环境的形态,将有望成为AGI的最佳具身载体。本次报告将介绍团队在构建人形通用智能机器人方面的进展与成果,包括人形机器人的硬件本体研发、运动与操作的小脑部分算法、结合大语言模型的机器人决策,以及对商业落地前景的思考。
郭迪
北京邮电大学
讲者简介:郭迪,北京邮电大学人工智能学院,教授,博导。在机器人控制、机器人感知与人机交互等领域开展了系统深入的研究工作。在机器人、人工智能等领域国际权威期刊及会议发表高水平论文50余篇。担任自动化学会智能自动化专委会秘书长;担任机器人领域重要会议RSS2024领域主席,IROS、ICRA 的Associate Editor。
报告题目:具身协同与交互学习
报告摘要:近年来,多机器人协同技术受到越来越多的关注,在仓储物流、工业制造、协同探索等实际应用场景中应用广泛。本报告将针对具身协同感知,从任务分解、任务分配和任务调度等方面介绍多智能体的具身协同。进一步,将探讨如何利用智能体身体与环境的交互来提升其学习性能,使得智能体能通过在环境中的探索,不断学习并更新自身知识。
黄思远
北京通用人工智能研究院
讲者简介:黄思远博士是北京通用人工智能研究院(BIGAI)的研究科学家,并担任通用视觉实验室负责人。他在加州大学洛杉矶分校(UCLA)统计系获得博士学位,导师是朱松纯教授。他的研究旨在构建一个能够理解和与三维环境交互的类人通用智能体。为实现这一目标,他在以下方向做出了研究贡献:(1)开发可泛化的视觉表征以用于三维重建和语义落地,(2)建模并模仿人类与三维世界的复杂交互,(3)构建擅长与三维世界和人类交互的具身智能体。他的研究发表于四十余篇会议及期刊论文,并曾获得ICML Workshop最佳论文,UCLA优秀博士论文等奖项。他最近致力于开发能理解三维物理世界的具身智能体和视觉机器人。
报告题目:三维世界中的通用具身智能体
报告摘要:创造通用具身智能体是人工智能研究的终极目标之一,目前的绝大多数智能体缺乏理解三维世界并构建世界模型的能力。如何让智能体理解三维世界并进行推理和交互是要解决的重要问题,也是通向通用人工智能的一个重大瓶颈。这次的课程将首先介绍三维场景理解对通用具身智能体的关键作用和其中的瓶颈,并详细展开我们最近的几项研究工作(SceneDiffuser, Arnold, LEO, SceneVerse, Ag2Manip, COME-Robot) 是如何尝试解决这些瓶颈问题,并逐步迈向通用具身智能的。
王兴兴
宇树科技(Unitree)
讲者简介:宇树科技(Unitree)创始人/CEO/CTO,科技至上主义者。在硕士研究生期间全球范围内,个人开创性的开发了使用低成本外转子无刷电机驱动的高性能四足机器人XDog,开创了低成本高性能足式机器人的技术先河。16年毕业后入职DJI工作,与此同时XDog机器人受到了国内外多家媒体的报道,在全球机器人圈内获得巨大反响。随后辞职在2016年8月创立了宇树科技(Unitree),在全球率先公开零售高性能四足机器人,全球销量历年领先,显著推动了全球高性能四足机器人的商业化进程。累计申请国内外专利150余项。带领公司获美团、红杉、顺为、经纬等的多轮投资。曾带领团队让公司产品登上央视牛年春晚舞台、冬奥会开幕式和Super Bowl等。2023年《财富》中国40位40岁以下商界精英。
报告题目:具身智能是实现AGI的最有效途径
报告摘要:分享宇树目前最新的一些进展,以及对AGI的一些设想
王斌
达闼机器人有限公司
讲者简介:王斌,达闼机器人有限公司 产品副总裁。计算机软件硕士,MBA。研究领域包括:云端机器人操作系统、人形机器人关键技术、深度强化学习、Sim2real、机器人应用开发和生态建设,拥有多项云端机器人技术的专利和著作权,现担任国家信标委人形机器人(具身智能)工作组联合组长。曾担任中国CERNET IPv6骨干网建设专家组副组长,中关村软件外包协会副理事长,软件开发环境国家重点实验室研究员,中关村智能交通产业联盟副理事长,物联网与智慧城市联盟创始成员常务理事,主持参与北京奥运城市动态交通项目获得国家科技进步二等奖。
报告题目:人形机器人具身智能大模型技术与应用实践
报告摘要:随着人工智能大模型技术的突破,为人形机器人产业发展带来了新的机遇。未来人形机器人的应用市场潜力巨大,国际和国内知名人工智能企业纷纷入局人形机器人赛道。研制人形机器人产品难度非常大,其中的关键技术包括机器人的大脑、小脑以及肢体技术,涉及到通用人工智能AGI大模型、具身智能Embodied AI、算力、传感器、执行器、运动控制算法等众多领域。其中,具身智能是推动人形机器人发展需要突破的核心技术,如何将通用人工智能大模型与人形机器人有效结合,使人形机器人具有更强大的能力,满足更广泛的应用需求,是当前国内外科研机构与产业界发力的重点。
袁海辉
五八智能科技(杭州)有限公司
讲者简介:袁海辉,高级工程师,五八智能科技(杭州)有限公司副总经理,中国兵器装备集团青年科技拔尖人才,浙江大学机械制造及其自动化专业博士,清华大学自动化系联合培养博士后,主要从事人形机器人方向研究,发表SCI/EI研究论文10余篇,授权国家发明专利20余项,作为项目负责人或技术负责人承担工信部重大任务、国资委重大任务、科技委基础加强计划重点项目与领域基金等国家项目任务多项,带领团队推出国内首个大尺寸仿鸵构型双足机器人平台,并获批中国兵器装备集团仿生足式机器人科技创新团队。
报告题目:人形机器人产业发展思考与探索
报告摘要:报告从人形机器人产业发展角度出发,对人形机器人应用场景、技术发展以及未来市场主体进行了研判,应用场景方面,人形机器人在社区家庭以及复杂作业场景最具应用优势,但未来三年大市政工程将成为主要应用场景;技术发展方面,人形机器人硬件与算法正在趋同,传统核心技术壁垒正在消失,建立测试、标准与质量系统,打造稳定可靠产品,将成为发展关键;市场主体方面,未来可能走向资源高度集中,演变为大平台间的竞争,核心在于掌握高质量供应链、强大产能以及强大市场渠道。基于发展研判,报告介绍了公司在落地应用、资本化运作以及技术创新等方面的产业发展探索。
蔡颖鹏
北京因时机器人科技有限公司
讲者简介:蔡颖鹏先生,北京因时机器人科技有限公司CEO。北京航空航天大学机器人研究所硕士,近二十年机器人研究与开发设计经验;数篇研究成果发表于ICRA、ICSI、The Computer Journal等世界顶级机器人会议、期刊;全国机器人标准化技术委员会人形机器人标准工作组成员;中国人形机器人百人会成员
报告题目:灵巧操作能力成为人形机器人落地应用关键
报告摘要:只有具备灵巧作业能力,机器人才能够在工业、医疗、商业、家庭场景中完成各式各样的任务,实现价值;灵巧手作为机器人灵巧操作的终端,受到广泛关注;本报告将分享因时机器人在灵巧手设计和应用领域的研究进展。
阿勇
三星电子中国通信研究院
讲者简介:本人于2013年在中国科学院大学获得理学博士学位,方向为模式识别;2008年于北京理工大学获得学士学位,方向为数学与应用数学。2018年2月加入三星电子中国通信研究院,现任技术专家职位,软件Expert级人力。任职期间,率队获得多次国际竞赛奖项,包含CVPR21 NAS 竞赛,CVPR23透明场景双目深度估计竞赛等;参与多项视觉技术在手机上的应用落地,申请多项专利。2022年开始主持三星电子中国通信研究院内部机器人操作方向研发,面向服务机器人场景和工业自动化场景。
报告题目:通用机器人操作技能研究
报告摘要:大模型时代机器人操作进入快速发展期,本次报告尝试追寻大模型引导的机器人操作,与基于深度学习的技能学习的平衡。我们将基于ICRA2024,RA-L等文章和后续工作,以及相关综述工作,探讨分层框架的可行性,以及应用技术细节。
学术主任
刘华平
清华大学
简介:刘华平,清华大学计算机科学与技术系教授,国家杰出青年科学基金获得者,中国人工智能学会理事,担任International Journal of Robotics Research的Senior Editor,以及RSS的领域主席。主要研究方向为机器人智能感知与学习。
方斌
北京邮电大学
简介:方斌,北京邮电大学“拔尖人才”教授,主要研究方向具身触觉、灵巧操作、机器人大模型等。兼任中国计算机学会智能机器人专委会常务委员,中国人工智能学会认知系统与信息处理专委会秘书长,中国人工智能学会杰出会员。获得了IEEE仿生机电及机器人技术委员会“早期职业生涯奖”、中国指挥控制学会“青年科学家奖”、北京市“创新大工匠”、中国自动化学会自然科学奖一等奖等。
举办时间:2024年8月10日-12日
举办地点:清华大学FIT楼西门正厅二层多功能厅(北京市海淀区双清路30号)(FIT楼全称:信息科学技术大楼,位于清华大学东南门附近)(乘坐北京地铁13号线出A口向西,经过东升大厦向北,即到清华大学东南门)
报名须知:
1、报名费:CCF会员2800元,非会员3600元。食宿交通(费用)自理。根据交费先后顺序,会员优先的原则录取,额满为止。本期ADL为线下活动,请到北京现场参会。(如果确有特殊情况,不能到现场参会,可以线上参会,请会前发邮件到adl@ccf.org.cn邮箱说明情况。线上线下报名注册费用相同。线上会议室号和密码将在会前1天通过邮件发送。)
2、报名截止日期:2024年8月8日。报名请预留不会拦截外部邮件的邮箱,如qq邮箱。会前1天将通过邮件发送会议注意事项和微信群二维码。
3、咨询邮箱 : adl@ccf.org.cn
缴费方式:
在报名系统中在线缴费或者通过银行转账:
银行转账(支持网银、支付宝):
开户行:招商银行股份有限公司北京海淀科技金融支行
户名:中国计算机学会
账号:110943026510701
报名缴费后,报名系统中显示缴费完成,即为报名成功,不再另行通知。
报名方式:
请选择以下两种方式之一报名:
1、扫描(识别)以下二维码报名:
2、点击报名链接报名:
https://conf.ccf.org.cn/ADL152
CCF推荐
【精品文章】
点击“阅读原文”,立即报名。