CNCC特辑：多媒体智能中的视觉感知、理解与生成 | CCF数图焦点第75期_最新动态

首页 > 最新动态 > CNCC特辑：多媒体智能中的视觉感知、理解与生成 | CCF数图焦点第75期

最新动态

CNCC特辑：多媒体智能中的视觉感知、理解与生成 | CCF数图焦点第75期

2025-08-2266

点击底部“阅读原文”可浏览《CCF数图焦点》第75期详细内容

编者寄语

视觉感知、视觉理解与视觉生成技术是人工智能技术的重要分支，已成为产业升级的重要驱动力。工业检测、智慧医疗、自动驾驶等领域对动态环境下，视觉深度感知、视频深度理解、AI生成内容的需求持续攀升，推动多媒体智能技术向规模化应用加速演进。然而，开放世界的动态复杂性、生成内容的可控性缺失、多模态协同的技术瓶颈等问题，制约了智能系统的鲁棒性、可靠性与跨模态一致性。

在CNCC2025大会前夕，数图CNCC特辑从多媒体智能出发，以“感知-理解-生成”为主线，聚焦在计算机视觉和多媒体领域的创新实践。内容涵盖多媒体与人工智能的融合探索、开放场景视觉感知中的多模态建模、生成式人工智能的多领域创新应用，希望为研究者提供跨领域的技术启发和未来研究方向的参考。

编委主任：

苏金树 CCF会士军事科学院教授

本期主编：

闵巍庆 CCF多媒体技术专委会秘书长中国科学院计算技术研究所副研究员

王瑞平 CCF计算机视觉专委会秘书长中国科学院计算技术研究所研究员

余璐 CCF多媒体技术专委会执行委员天津理工大学副教授

点击底部阅读原文，可浏览详细内容