2024年5月30日,CCF信息存储技术专业委员会(CCF-TCIST专委会)走进浪潮信息成功举行,该会议由中国计算机学会主办,CCF信息存储技术专业委员会和浪潮信息承办,以“大模型时代数据中心存储技术创新和应用探索”为主题进行产学研的研讨和技术交流。
本次活动邀请到CCF信息存储技术专委会副主任王意洁教授,国家自然科学基金杰出青年基金获得者、CCF信息存储技术专业委员会副主任、清华大学张广艳副教授,华中科技大学刘海坤教授和周游副教授,清华大学陆游游副教授,华东师范大学石亮教授,浪潮存储首席架构师孙斌,上海交通大学吴晨涛教授,北京大学张杰助理教授,上海理工大学张启明教授,CCF信息存储技术专业委员会常务委员张晓教授等相关领域的专家学者参加。整个活动分为“开场致辞”,上下午两场的“特邀报告”&“专题思辨”,以及 “企业参观”等交流研讨活动,参会人员进行了热烈的技术研讨和交流。
CCF信息存储技术专业委员会走进企业工作组组长、厦门大学毛波教授主持了上午的研讨会,他对浪潮信息和存储联盟对本次会议的大力支持表示感谢,也对各位老师和同仁参加本次会议表示感谢。浪潮存储产品线总经理李辉先生致开幕辞,对各位老师的到来表示热烈欢迎,并对CCF信息存储技术专业委员会走进企业第一期放在浪潮信息表示感谢。
李辉先生表示,面向国家战略布局与大模型应用的存储需求,倡导业界与学界的深度对接和交流,尤其在国内外当前形势下对关键技术和人才需求方面,学术界和产业界有着强烈的合作愿望,这次专委会走进浪潮信息,正是为了加快信息存储领域的学术创新到产业落地的转化,他希望后期多与各位老师保持联系和沟通交流,实现产学研的有效对接。
上午活动的“特邀报告”首先是由清华大学的张广艳副教授带来的“编码存储系统:架构、理论与方法”的分享,主要针对当前编码存储存在的问题提出了一种资源全局共享架构,介绍了存储阵列的在线恢复、稳定低延迟的固态盘阵列和面向公共云的纠删码存储研究。
北京大学的张杰助理教授带来“近数据计算的研究进展”的分享。主要针对传统的CPU/GPU架构下数据拷贝开销巨大的问题提出了优化思路,介绍了把GNN应用下放到 SSD的工作和联邦学习(FL)使用DPU+CSD加速聚合研究。最后就如何实现近数据计算的通用性介绍了用户态全闪存阵列引擎的设计和页缓存的软硬件结合设计。
华东师范大学的石亮教授带来“面向大规模存储场景的SSD故障预测及部署优化技术研究”的分享,主要针对当前大规模闪存存储系统故障预测性能不佳、故障恢复机制占用计算资源且速度慢的问题作了优化,介绍了差异化的机器学习SSD故障预测研究和基于预测备份的RAID快速恢复技术。
上海理工大学的张启明教授带来“超分辨光信息存储技术进展”的分享,主要针对海量光存储受光学衍射极限限制的问题提出了突破衍射极限的写入技术,并介绍了使用光学神经网络进行图像检测的高效读取技术。
浪潮存储首席架构师孙斌带来“面向未来数据中心的新型存储系统”的分享,主要针对当前数据存储的需求与技术挑战,提出了面向未来数据中心的新型存储系统需要逐步实现平台化,依托一套架构,突破关键技术,重构多形态存储系统。并介绍了浪潮存储进行的产业实践与探索,包括打造数据中心分布式融合存储平台及浪潮存储新技术布局与探索。
上午的专题思辨“以数据为中心的存储技术协同创新的”环节中,厦门大学的毛波教授首先从架构演进、存储独立性和数据交易的角度抛出问题,大家围绕着如何突破传统的以计算为中心设计的冯*诺依曼架构,从存算一体和存算解耦等角度进行了研讨。在存储独立性方面大家对是否有必要建立独立的数据存储中心方面进行了广泛深入的思辨研讨,以体现数据价值,提供数据服务,为以后的数据交易做好数据存储基础平台和底座。大家一致认为有必要建造独立数据存储中心,但是就如何构建、谁来构建、如何制定相关的法规和制度等仍有很多挑战性的问题。
下午活动的“特邀报告”首先是由CCF信息存储技术专委会副主任王意洁教授带来的“算力网时代的云际存储”的分享,在当前云际计算得到国家持续立项支持的背景下提出了支持多方对等协作的云际计算体系结构模型,突破了传统计算系统遵循的集中管控体系结构对多利益主体对等协作的束缚。介绍了四项与云际存储服务相关的工作:基于主动增量支持向量机的低云际修复流量纠删码构造、基于生成矩阵变换的云际纠删码写入、弹性可伸缩的统一冗余存储和时间敏感的可解释异常检测。
华中科技大学的刘海坤教授带来“基于高速互连总线的大内存系统”的分享,介绍了基于新型高速互连总线CXL (Compute Express Link)的单机内存扩展和分布式内存扩展,提出基于CXL构建大型内存池的关键挑战并介绍了融合CXL/RDMA的大内存系统的工作。最后阐述了CXL未来的两个发展趋势:1、CXL/UB总线将颠覆未来数据中心架构(存算融合→存算分离);2、使能以数据为中心的CPU、GPU、FPGA间的对等计算。
上海交通大学的吴晨涛教授带来“分布式机器学习高可靠数据恢复机制的研究”的分享,主要针对在当前大模型的背景下,现有恢复方法存在的问题,介绍了分布式学习过程中硬盘故障恢复加速的研究和故障和繁忙节点的混合全局图恢复方法两项工作。
清华大学的陆游游副教授带来“AI数据基础设施:跨层次存储的数据管理”的分享,主要基于当前大模型背景下存储系统的重要作用,介绍了实现多层级内存管理的Fleche和实现高性能文件系统的SuperFS两项工作。最后展望了未来新的存储方式,包括向量存储、参数存储等。
CCF信息存储技术专业委员会的张晓教授带来“大模型时代的存储系统优化研究”的分享,主要介绍了大模型的发展历史,大模型训推的需求与挑战,当前面向大模型存储技术优化的进展以及大模型未来的挑战。
下午的专题思辨“大模型时代的存储技术与产业发展”环节中,浪潮存储的孙灵川博士从目前大模型的发展与企业的业务背景出发,首先从目前的存储架构,各类存储产品能是否能够支撑近百EB级大型基础设施平台进行了广泛深入的思辨研讨,之后大家进一步探讨国内存储技术如何演进,一致认为有必要在硬件层面加速研发,以适应大模型背景下各行各业的需求,并对TLC/QLC/PLC、PCIe Gen5/6技术和未来存储的架构进行扩展讨论。最后,大家就大模型时代,哪些存储需求是现阶段迫切需要解决的问题进行思考与探讨,在大模型时代背景下存储技术与产业的发展仍存在很多具有挑战性的问题,需要大家携手解决。
整个交流会的最后,参会人员参观了浪潮智算创新中心。至此,本次CCF信息存储技术专业委员会走进企业第一期@浪潮信息活动取得圆满成功。
公司简介:
浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,拥有8个研发中心、14个生产基地、50个业务分支机构,秉承“计算力就是生产力,智算力就是创新力”的理念,致力于推动智慧计算技术创新和应用,加速数实相融。浪潮信息坚持践行创新驱动的发展战略,为客户提供更先进的云计算、大数据、人工智能、边缘计算等各类创新产品和解决方案,并积极参与开放计算技术创新,加快全球计算生态的开放融合进程;落实绿色可持续的发展理念,推动数据中心建设和运行模式的升级,提高数据中心的能源利用水平,降低碳排放。
浪潮信息存储致力于成为全国领先的存储产品提供商,主要面向云数据中心的私有云、混合云应用场景,研发、销售存储产品,为政府、运营商、金融、大企业、能源交通、教育、医疗等行业提供专业、领先的存储产品、解决方案与服务。
点击“阅读原文”,加入CCF。