编者寄语
以DeepSeek和GPT-4o等为代表的大模型,展现了类人推理与创造性表达能力,标志着大模型技术迈入"能力涌现-风险伴生"的深水区。从内容偏见到幻觉风险,从隐私泄露到伦理争议,大模型的安全对齐问题不仅关乎技术可靠性,更直接影响社会接受度和可持续发展。为应对这些挑战,学术界和产业界亟需探索新型的安全对齐技术、评估框架和系统优化方法。
本次专题聚焦大模型安全对齐的前沿研究与实践,汇集了高等院校,研究机构和大小企业的最新成果,深入探讨大模型对齐测评、对齐与精准神经元控制、大模型性别对齐等关键技术,同时分析安全对齐在不同场景下的安全对齐。
编委主任:
苏金树 CCF会士 军事科学院教授
本期主编:
柳 林 CCF互联网专委会执行委员 国防科技大学计算机学院副教授
目录
点击“阅读原文”浏览《CCF数图焦点》第59期详细内容。