YEF2024大会论坛纪实：大模型与国产算力论坛_最新动态

首页 > 最新动态 > YEF2024大会论坛纪实：大模型与国产算力论坛

最新动态

YEF2024大会论坛纪实：大模型与国产算力论坛

2024-05-20374

收录于话题

#YEF2024

5月16日，YEF2024宛如一场盛大的科技派对，于宁波开幕，千位青年人才与行业专家共聚长江三角洲南翼经济中心，探讨前沿技术，激发创新活力，智启新局。作为本次活动的重头戏，两场大会论坛其中之一，“大模型与国产算力”于当天上午同期举行。YEF2024大会对该论坛进行了专题直播，据统计，有超过3万人通过CCF微信视频号在线观看，爱奇艺人气值更突破58万！

本次论坛由CCF杰出会员、副理事长，北京并行科技股份有限公司董事长陈健博士主持。邀请CCF会士、副理事长，中国科学院院士，清华大学教授胡事民；CCF会士、学术工委主任，清华大学教授陈文光；CCF杰出会员，国家超级计算长沙中心副主任、长江学者、二级教授博导彭绍亮；CCF杰出会员、合肥副主席，科大讯飞研究院执行院长王士进等嘉宾出席，并发表各自主题报告演讲。值得一提的是，各位嘉宾还共同出席大会论坛Panel环节，就相关行业问题开展现场研讨。

陈健主持大会论坛

胡事民在《以深度学习框架为抓手、构建大模型训练与应用的国产生态》中指出，人工智能发展有四驾马车：算力、框架、算法、数据，它们的汇聚促进了人工智能创新发展，所以，人工智能发展应该具有全局观，不要只关注应用端的大模型发展，而要从硬件、框架、模型算法和应用四个层面来看，因为它们各自都对人工智能生态的发展有着重要影响。

硬件领域，国产芯片的发展之路较为艰辛，要融入既有行业生态难度较大，但我们的发展脚步很快，技术路线多样，未来一定是机遇与挑战并存。国产框架方面，仍面临严重生态屏障，我们需要进一步降低框架学习成本，完善软件，实现对下游硬件和上层算法很好的支持，而且，还需要基于国产框架的基础骨干网络的创新与应用，这才有利于改变人工智能生态目前的局面。模型算法方面，尽管国内学者的论文在业内占据了非常名列前茅的位置，但仍要进一步加强创新。应用层面，虽然目前市场发展繁荣，但我们要意识到，底层硬件和软件仍有短板，且都是亟需我们解决的问题。

报告中，胡事民还介绍了清华大学计图框架的优势，包括速度快、内存节省以及通过元算子这套机理做了对国产硬件的适配，并提出了框架间迁移的办法，希望以计图框架为核心，基于国产硬件促进人工智能算法应用的创新，来推动开源开放，构建中国人工智能的生态。

胡事民作大会论坛分享

陈文光以《国产智能算力训练大模型的经验与教训》为题的报告中表示，过去四五年中，自身所在团队已经分别在两个国产平台上训练了大模型，并总结了经验。首先是新神威计算机，这是神威·太湖之光的下一代超级计算机，拥有10万节点。在该平台上，团队训练了一个名为“八卦炉”的系统，该系统能够训练174万亿参数的MOE模型，是目前世界上最大的稀疏模型之一。其次是鹏城云脑2，基于华为鲲鹏920处理器和昇腾910A加速器，该系统拥有4096个加速卡，半精度峰值达到1E ops。

在硬件性能方面，昇腾910A的单卡算力峰值达到256T，但FP16的精度范围较小，这在后续训练中带来了挑战。尽管如此，国产算力平台在机器之间的带宽上与英伟达的A100集群相比仍具有竞争力。在软件层面，国产超算和智算平台的软件生态与英伟达相比尚不成熟。在并行策略上，国产平台的限制较多，需要综合考虑显存容量、通信能力、计算能力和冲算策略等因素。综合来看，国产智能算力平台在大模型训练方面取得了显著进展，但仍面临算子实现、并行策略选择和容错等挑战。

陈文光作大会论坛分享

彭绍亮在题为《Web 3.0 时代下的算力网络和生成式人工智能大模型》的报告中，提出了构建算力共享网络的愿景，旨在提升国家算力基础设施能力，实现东数西算，提供稳定算力供给。这一网络将云计算、智算和超算中心融合，以解决算力和存储通信能力的统一抽象和智能调度问题。

并介绍了由国家超算长沙中心创建的全球第一个名为“Metaverse”的国际期刊，旨在推动Web3.0时代超算、智算、大数据和大模型应用的融合。此外，还承担了很多国家重点研发计划，推动算力资源的全国乃至全球共享。在垂直大模型领域，彭绍亮介绍了面向医药领域开发的“神农GPT”，并已实现了开源，标志着国内大模型技术的信心和透明度。

同时，彭绍亮还介绍了数字孪生技术在智慧城市建设中的应用，如实时多元异构的智慧城市、智慧交通实时渲染平台，这些技术已在长沙等地落地，实现多模态数据融合和AI驱动。强调了教育与AI结合的重要性，并介绍了与北师大合作的教育领域大模型“睿道”，旨在提升教育质量，特别是帮助二三线城市提高教育水平。展示了建筑设计领域大模型的应用，通过预训练模型帮助设计师进行在线图像生成，大幅缩短设计周期。

彭绍亮作大会论坛分享

王士进在《讯飞星火大模型技术及国产训练推理工作进展》报告中表示，自2022年底以来，讯飞围绕大模型技术进行了持续的攻关，从2023年到2024年进行了系列发布。特别值得关注的是，从2024年1月30日发布的3.5版本开始，讯飞的所有版本都基于国产化算力，包括3.5Plus版本以及即将于6月27日发布的4.0版本。

王士进指出，讯飞星火大模型不仅在自然语言处理领域取得了显著成效，还在语音、图像和机器人技术等领域实现了技术融合。例如，通过结合大模型和语音技术，讯飞语音大模型显著提升了语音识别、合成和同传的效果。在图文识别领域，讯飞将大模型与OCR技术结合，不仅提升了识别效果，还增强了对复杂版面的自动切分和识别能力。在机器人领域，大模型与机器人技术的结合为空间感知和人际交互带来了翻天覆地的变化。讯飞开放平台提供了一个机器人创造平台，实现了视觉、语言、动作一体化的大模型。

面对未来行业的发展前景，王士进在报告发言中分别从硬件本身提升算力密度和效率、集群智能化运维、以及算法和底层算子层面的优化等各个方面提出思考。并强调了构建AI生态的重要性，呼吁更多行业中更多专家与团队积极参与，提升国产底层技术的综合实力。