收录于话题
点击底部“阅读原文”可浏览《CCF数图焦点》第50期详细内容
编者寄语
DeepSeek的横空出世,在蛇年春节之际再次在全球范围内引爆了人工智能的热点话题。人们不禁好奇:Deepseek这种大模型是如何训练和部署的?在以DeepSeek为代表的训练和推理过程中,其成功的关键在于对包括网络和系统软硬件的全方位优化。随着人工智能的飞速发展,特别是以GPT为代表的大语言模型的崛起,对传统网络架构和系统提出了前所未有的挑战。为应对海量数据处理、高效模型训练和低延迟推理等需求,智能时代呼唤新型网络架构、系统与优化技术的出现。为了探究大语言模型对于网络和系统的需求,引领未来面向大模型信息系统构建技术的发展,本次专题汇集了华为、腾讯、阿里等互联网大厂的大模型训练部署实践,也梳理了大小模型协同、云际部署、DeepSeek系统软件优化等学术界的前沿技术,方便会员集中观看学习。
编委主任:
苏金树 CCF会士 军事科学院研究员
本期主编:
赵宝康 CCF互联网专委副主任 国防科技大学
本期编委:
周 寰 国防科技大学
目录
点击“阅读原文”浏览《CCF数图焦点》第50期详细内容。