编者寄语
视觉感知、视觉理解与视觉生成技术是人工智能技术的重要分支,已成为产业升级的重要驱动力。工业检测、智慧医疗、自动驾驶等领域对动态环境下,视觉深度感知、视频深度理解、AI生成内容的需求持续攀升,推动多媒体智能技术向规模化应用加速演进。然而,开放世界的动态复杂性、生成内容的可控性缺失、多模态协同的技术瓶颈等问题,制约了智能系统的鲁棒性、可靠性与跨模态一致性。
在CNCC2025大会前夕,数图CNCC特辑从多媒体智能出发,以“感知-理解-生成”为主线,聚焦在计算机视觉和多媒体领域的创新实践。内容涵盖多媒体与人工智能的融合探索、开放场景视觉感知中的多模态建模、生成式人工智能的多领域创新应用,希望为研究者提供跨领域的技术启发和未来研究方向的参考。
编委主任:
苏金树 CCF会士 军事科学院教授
本期主编:
闵巍庆 CCF多媒体技术专委会秘书长 中国科学院计算技术研究所副研究员
王瑞平 CCF计算机视觉专委会秘书长 中国科学院计算技术研究所研究员
余 璐 CCF多媒体技术专委会执行委员 天津理工大学副教授
点击底部阅读原文,可浏览详细内容
目录
CNCC2025即将在2025.10.23-10.25于黑龙江省哈尔滨市召开。为了给您带来更贴合需求、更具价值的参会体验,我们特开展此次主题意向度调研。您的反馈将直接影响大会内容的规划与安排,诚邀您抽出宝贵时间参与,感谢您的支持与配合。
点击“阅读原文”浏览《CCF数图焦点》第75期详细内容。