收录于话题
华为联合业界顶尖专家学者共同识别到对计算产业影响最深远的八大场景和六大技术特征,同时将其分解为17个技术创新方向。未来计算将帮助人类跨入智能世界,开启一个新时代。
未来八大计算场景
面向2030年,华为联合业界顶尖专家学者共同识别到对计算产业影响最深远的八大场景(见图1)。
图1 对计算产业影响最深远的八大场景
第一类,面向人工智能(AI)类的场景,包含场景一“更聪明的AI”和场景二“更普惠的AI”。核心追求是实现无所不及的AI,体现在AI无人驾驶、AI智慧交通、AI精准医疗等方面。
第二类,面向AI与感知融合类的场景,包含场景三“更纵深地感知”和场景四“超越现实的体验”。核心追求是无所不在的感知,体现在智慧农业、生产机器人、元宇宙等方面。
第三类,面向高性能计算(HPC)类的场景,包含场景五“更精确地探索未知”和场景六“更精确地模拟现实”。核心追求是满足人类永无止境的探索,体现在生态监测、地震预测、风洞仿真等方面。
最后一类,面向通用计算类的场景,包含场景七“数据驱动业务创新”和场景八“更高的运营效率”。核心追求是满足企业源源不断地创新,体现在算力挖掘数据价值、低碳DC等方面。
根据业务场景,我们按十年周期对算力的规模做了推演。通用算力到2030年会增长10倍,达到3.3 ZFlops;AI算力增长会更加迅猛,达到4000倍,算力达到864 ZFlops;数据量也会爆发性增长,增长23倍达到1 YB;云服务占企业应用支出的比例将会达到87%。
面向未来的六大技术特征
面向上述计算未来八大场景,有哪些关键技术趋势?蕴含哪些技术创新的方向和机会?我们总结出了面向未来的六大技术特征:智能认知、内生安全、绿色集约、多样性计算、多维协同和物理层突破,同时对这六大技术特征做了具体的创新方向推演,将其分解为17个技术创新方向(见图2)。
图2 六大技术特征和17个技术创新方向
智能认知
第一大技术特征是智能认知。智能认知的第一个创新方向是生成式AI,包括通用基础模型、数据工程以及具身智能三个方面。
?通用基础模型。未来通用基础模型的发展会不断地迭代,也会出现新的模型结构替代Transformer。同时模型的规模会继续增大,参数量达到百万亿乃至千万亿,模型训练需要更大的集群规模,单数据中心的功耗难以满足大规模算力集群的需求,需要跨数据中心的分布式协同训练。同时,从整个模型的模态来看,全模态的世界模型占比会逐渐上升,达到30%以上。
?数据工程。数据工程决定了生成式AI的上限。到2026年,人类社会自然产生的语料数据就会消耗殆尽,合成数据会成为必然选择。到2029年,合成数据的占比将达到90%,基于“AI数据合成-AI质量评估-AI训练”的自反馈学习机制将成为主流。同时,数据处理的方式也发生变化,以往是由专家输出专业的SQL语句完成数据处理,以后会变成由人对话的方式完成数据处理,这是一个非常大的变化。多模态向量数据库也会快速发展,其市场规模会在2030年达到500亿美元左右。
?具身智能。具身智能将会引领下一波人工智能的浪潮,因为大模型解决了最重要的具身智能大脑问题,接下来将面临具身智能的物理仿真、物理时空认知能力不足,以及具身长时序任务规划能力不足等问题,这些问题的解决可以在很大程度上促进具身智能商业化的普及。
智能认知的第二个创新方向是类脑智能。类脑智能将从“专用”走向“通用”,创新方向是模拟生物中的神经元、突触和脉冲计算方式,实现低功耗、低时延。类脑基础硬件、类脑芯片、类脑软件框架、类脑模型和算法的相关研究都是重要的方向。
智能认知的第三个创新方向是知识计算。知识计算从低阶的“数据驱动”到高阶的“知识引导”,是一个非常明显的趋势。同时,人工智能从感知走向认知,在感知的基础上理解语义知识,并增加逻辑理解判断能力,可以实现在一些场景中代替人做决策。
内生安全
第二大技术特征是内生安全。AI大模型的出现给安全带来了新的挑战,传统基于外挂式的安全方案无法解决这样的挑战。内生安全有三个具体的技术方向。
1.数字信任与隐私。首先要建立开放的数字根证书基础设施保证基本的设备可信。在此基础之上,需要提供完备的数字身份和数据确权的机制,保证打牢数据流通的基础。然后是机密计算和密态计算,以往的密态计算往往意味着较大的性能损失。未来通过近似计算、硬件加速,可以将芯片性能提升1000倍,使密态计算从传统的基础研究发展出具备商用的可能。
2. AI的安全可信。包括模型与数据保护、用AI保护AI、AI的模型安全和负责任的AI,实现在整个AI全生命周期内都可以做到可信可回溯。
3. 新计算范式安全。主要是指安全与在网计算、多样性计算架构、以数据为中心的架构做协同以及数据中心的动态度量和主动监测,保证新的计算范式可以原生做好安全。
绿色集约
第三大技术特征是绿色集约,包含三个技术方向。
1.芯片工程。从芯片工程视角来看,有两个要素制约了芯片算力提升。第一是工艺,工艺的红利在逐渐消失,从3纳米到1纳米制程,算力提升不到20%,更大的收益在于改善能效。第二是单die的面积,这也是算力提升的一个约束,我们判断850 mm2是单die面积的极限。我们认为有三条技术路线可以更好地提升算力:第一条是Chiplet+2.5D/3D封装,可以提升1倍的算力密度,良率也能够达到比较高的水平;第二条是系统级3D堆叠,算力密度可以提升2~5倍,但是会使良率降到70%左右;第三条是wafer-scale computing,一个晶圆就是一个芯片,会使算力密度提升5~10倍,但是良率只有50%。这三条技术路线都值得探索研究。
2.DC as a Computer。通过这样的理念,可以做到全栈协同设计,达到极致的算力性能。未来全电超节点架构将会是主流架构,节点内部带宽可达到6.4 TB/s以上。在这样的超节点内构建算力池、存储池、固态硬盘(SSD)池等可提升算力的资源利用率,达到较好的性能和能效。在数据中心网络(DCN)层面,短期内通过微机电系统光交叉互连开关(MEMS OXC)实现电交换机;长期来看,芯片会出光,最终实现全光DCN的演进,同时降低光模块数量。
3.算力网络。大模型的规模在持续演进,参数达到百万亿甚至千万亿,需要跨数据中心的分布式协同训练,产生了新的组网要求。通过在数据中心之间提供超高带宽、无损网络、亲和的并行策略和集合通信,以及跨数据中心的算力协同和调度,来支撑跨域训练。同时,通过这样的算力网络提供算力汇聚、数据汇聚和生态汇聚。在算力网络中,数据的流通还会涉及一些标准的定义,包括对应的算力建设标准、节点互连标准、数据共享标准、应用接口标准等,需要大家一起构建。
多样性计算
第四大技术特征是多样性计算,包含两大方向。
1.数据为中心的计算。传统架构软硬件严格分层、标准服务器堆叠,资源(CPU、内存、网络)利用率低,以数据为中心的计算架构的核心逻辑是突破这种传统结构,实现低碳、高效的海量数据处理。包括四个具体的方面:
? 对等互联计算架构。实现数据的全内存处理,把以往需要通过以太网的数据包交互方式变成计算的内存语义交互方式,将极大提升交互效率,使计算性能提升1~3倍,能耗节省40%。在单节点内实现内存的分级,包括片上内存、DDR、SSD等分级内存,使单点内存从个位数TB级提升到10 TB级;同时组成内存的分布式池化,多个分布式节点共享一个内存池,可以非常好地提升性能。
? 数据中心级计算总线。以往节点内和节点间走的是两套不同的总线或者网络,效率不高。未来在整个数据中心内,节点内和节点间会用同一套总线,称为数据中心级的计算总线。通过这种总线,把算力、内存、网络I/O的协议由4变1,能够极大地提升通信效率。
? 泛在计算,即常说的外设智能化。例如在SSD上、网卡上都有算力,数据可以在最合适的地方用最合适的算力进行处理,极大地提升数据处理效率,减少不必要的数据搬移。
? 存算一体。以往内存基本上只做数据缓存(cache)工作,我们判断未来在内存上也会部署算力,数据可以就近处理,极大缓解内存墙问题,提高计算的效率和能效。
2.应用驱动的多样性计算。该方向有两个核心方面。第一是智能科学计算,AI、HPC、大数据的协同是未来的一个必然趋势,现在已经有一些创新成果,比如AI辅助HPC做气象短临预报。短临预报需要在非常短的时间内对气象做精准判断,比如2小时之内就要给出结果,传统HPC需要经过几万次迭代才能完成,经过AI加持以后,可以降低不必要的迭代轮数,更快更好地给出精准结果。第二是渲染、仿真和AI,在GPU算力集群上为渲染、仿真和AI提供算力,可以更好地满足数字孪生和仿真平台的诉求。
多维协同
第五大技术特征是多维协同,有两个技术方向。
1.立体计算。包括边缘计算、智能协同、端边云协同。到2025年,边缘智能化行业渗透率将达到40%,端、边、云的架构会进一步清晰,形成行业标准,更好地定义哪些处理放在端侧、哪些处理放在边侧、哪些处理放在云侧。
2.数字孪生。会建立一个与物理世界对应的数字世界,做到二者协同并能无缝融合,包括多维感知与数字建模、光场全息渲染、虚实协同与交互。这样的趋势之下,会拉动算力/存储的需求百倍增长以及网络连接数量的十倍增长。
物理层突破
第六大技术特征是物理层突破,有4个技术方向。
1.模拟计算。首先是量子计算,预计到2030年,量子计算会达到千级物理比特,达到这种能力后就可以在小范围场景中商用,但是要实现一台通用的量子计算机还有很大的挑战。其次是光计算,预计到2030年,光计算器件集成数量会突破5万个,具备在一定条件下规模部署的能力。
2.非硅基计算。一种是二维材料的晶体管,二维材料晶体管迁移速率是1 纳米硅基半导体路线的10倍。未来在光电、传感器等领域,二维材料晶体管有望实现首次商用,最终将会应用到大规模的集成电路和相关系统中,但是在2030年要实现规模商用还比较困难。另一种是碳纳米管晶体管,碳纳米管具有超高载流子迁移率、原子级厚度,相比硅基晶体管可提升约10倍能效。目前已有基于碳基场效应管的生物、气体传感器产品出现,近年有望实现小规模商用。
3.光交换和光互连。光交换未来会持续扩大规模,到2030年,千端口的光交换会成为智算百万卡集群的一个基础能力。同时,光互连的速率在2026~2027年会达到400 GB/Lane的商用水平。
4.新型存储介质。存储介质分三层:热数据新型介质、温数据高密Flash介质和冷数据光存储介质。热数据的核心需求是实现大量数据实时访问,到2030年热数据量将提升60倍,达到10 ZB。温数据的核心需求是海量数据低成本存储,到2030年温数据的总量将提升45倍,达到16 ZB。冷数据的核心需求是巨量数据长期低成本的存储,到2030年冷数据的存储总量将达到27 ZB。
总结
计算的发展在过去的半个多世纪中加速了科学进步和经济发展,已经深深融入到人类社会的方方面面,是全人类的共同财富,也是未来智能世界的基石。面向2030年,计算将更加开放和安全,每一个人、每一个组织都能够平等地参与未来计算产业的构建和创新,共享计算技术创造的价值。
华为《计算2030》报告在编写过程中得到了来自社会各界知名学者包括CCF相关专委会委员及会员的大力支持,共400多位专家学者参与了材料的讨论、交流和贡献思想,共同畅想了2030年计算产业的关键场景、技术特征和创新方向,在此对参与贡献的专家和学者致以最诚挚的谢意!
鲲鹏展翅,昇腾万里,让我们共同把握计算产业的未来黄金十年,携手共筑智算新时代!
扫码观看本CNCC2024特邀报告视频
https://dl.ccf.org.cn/video/videoDetail.html?id=7225805848594432
刘华伟
华为公司计算产品线研发副总裁、计算技术规划部部长。主要研究方向计算体系结构、大模型集群、存储、大数据、高性能计算、硬件架构等。liuhw@huawei.com
CCF推荐
【精品文章】
点击“阅读原文”,加入CCF。