首页 > 最新动态 > 网络可观测性创新技术与应用 | CNCC
最新动态
网络可观测性创新技术与应用 | CNCC
2025-09-253

网络可观测性技术已成为网络系统优化、智能运维与安全防护的关键基础。随着云原生、微服务、边缘计算等新兴架构的广泛应用,传统网络监测手段难以应对其复杂性与动态性挑战。本论坛旨在汇聚网络领域专家与从业者,共同探讨应对策略与发展机遇,推动网络可观测性技术创新,以期实现网络性能优化、服务质量保障、资源高效配置与安全防护强化,为现代网络基础设施的稳定运行与持续演进提供有力支撑。



论坛安排



??论坛名称:

网络可观测性创新技术与应用



顺序

主题

主讲嘉宾

单位

1

面向大规模RDMA网络的端网故障管理技术研究

张娇

北京邮电大学

2

面向超大规模云网络的深度可观测技术体系

祝顺民

阿里云计算有限公司

3

面向大规模网络的低开销高精度可观测性技术

谢鲲

湖南大学

4

DeepFlow:用数据与 AI 保障业务连续性

向阳

北京云杉世纪网络科技有限公司

5

网络安全检测:从小模型到大模型

王之梁

清华大学

6

Panel



论坛主席



张晗

清华大学副教授

清华大学网络科学与网络研究院副教授,博士生导师。近年来研究成果在SIGCOMM、CCS、NDSS、CONEXT、INFOCOM等网络与安全领域顶会及ToN、TPDS、TIFS等顶级期刊发表高水平论文近100篇、申请授权发明专利20项,第一著作人完成软件著作权3项,出版专著1部,参与制定行业标准近10项。主持国家自然科学基金、工信部重大专项等国家级和企事业单位项目10项。担任多个顶级学术会议的程序委员会委员,荣获多项会议最佳论文、IRTF网络研究应用奖、ACM SIGCSE新星奖、NSGA最佳研究员奖等多项荣誉。主要成果服务于国计民生行业,产生了显著学术价值与社会效益。


论坛讲者



张娇

北京邮电大学教授

国家青年人才计划获得者。2014年获得清华大学博士学位,曾于加州大学伯克利分校联培一年。长期致力于云数据中心网络、网络传输协议研究。在ACM SIGCOMM、USENIX NSDI、ACM EuroSys、IEEE/ACM Trans. On Networking等网络领域重要会议/期刊发表学术论文70余篇,授权国家发明专利30余项。主持国家重点研发计划(青年科学家项目)、装发预研项目、国家自然科学面上/青年基金和华为、字节跳动创新基金等20余项。担任ACM CoNext、IEEE/ACM IWQoS重要网络国际会议分项联合主席及Multimedia、INFOCOM、ICPP等技术委员会委员。获CCF优秀博士学位论文奖、北京市优秀博士毕业生、首届中国科协青年人才托举工程、中国通信学会技术发明一等奖/特等奖和中国电子学会创新团队奖等荣誉。


报告题目:面向大规模RDMA网络的端网故障管理技术研究


报告摘要:RDMA网络规模增大导致网络故障非常频繁,给智算业务性能带来严重影响。因此,面向大规模RDMA网络的高效故障定位系统成为保障智算业务性能的关键。然而,现有网络故障定位系统难以适应大规模RDMA网络。本报告将首先介绍大规模RDMA网络故障定位系统的研究意义及挑战;然后展示报告人在RDMA主机内网络瓶颈定位、大规模RDMA网络端到端网络故障定位的研究工作。

祝顺民

阿里云智能集团研发副总裁、云网络产品线负责人

工业和信息部-信息通信科学技术委员会委员、中国自动化学会-工业物联网技术与应用专业委员会副主任委员;在软件定义网络、网络功能虚拟化以及高性能转发技术领域有多年技术研发和管理经验。带领团队研发了阿里云飞天操作系统的网络子系统-洛神,在ACM SIGCOMM、NSDI、MobiCom、ToN等网络会议及期刊上发表成果十余篇,获得授权发明专利六十余项;获浙江省、中国计算机学会以及中国自动化学会科技成果奖一等奖,并于2023年被授予浙江省有突出贡献中青年专家荣誉称号。


报告题目:面向超大规模云网络的深度可观测技术体系


报告摘要:云网络作为公共云底层关键技术支撑了过去十余年的数字化转型,也是十四五规划中“上云用数赋智”中实现普惠云服务的网络基础。随着过去10年云计算规模的快速发展,云网络呈现出大规模、高动态、多租户以及强异构等特点,给网络可观测带来极大的挑战。本报告将揭示阿里云洛神云网络如何构建起一套面向超大规模云网络的深度可观测技术,包括其在网络测量、监控告警、异常检测以及故障诊断等方面的技术探索及创新,并进一步揭示洛神在网络可观测方向的未来演进方向。

谢鲲

湖南大学二级教授

博士生导师,国家杰出青年基金获得者,湖南省杰出青年基金获得者,湖南省青年骨干教师,湖南省优秀硕士生导师,长沙市“巾帼建功”标兵。谢鲲教授现任教育部重点实验室“超算与人工智能融合计算”主任,同时担任湖南大学信息科学与工程学院学术委员会主任、学位委员会主任。长期从事网络测量、网络安全、人工智能的研究工作。


报告题目:面向大规模网络的低开销高精度可观测性技术


报告摘要:本次报告将介绍一种低开销、高精度的网络可观测性技术。该技术的核心是利用网络数据固有的“低秩”特性,应用张量分解与矩阵补全理论,构建“稀疏测量,完整推断”的框架。此框架通过采集少量关键信息即可重构全局网络状态,为实现高效、低开销的智能运维提供了一种可行方案。

向阳

云杉总裁

负责可观测性产品 DeepFlow,曾获国际顶级会议 ACM IMC 颁发的第一届 Community Contribution Award,并在国际顶级会议 ACM SIGCOMM 上发表可观测性学术论文。


报告题目:DeepFlow:用数据与 AI 保障业务连续性


摘要:在信创化、微服务化的背景下,数字化业务的连续性保障迎来了越来越大的挑战。传统 NPM 的分光镜像方式无法采集到微服务的完整通信;传统 APM 的插桩方式无法覆盖云网关、中间件、数据库、DNS 等基础设施服务。以 eBPF 为代表的网络可观测性技术很好的解决了这些痛点,实现了零侵扰、全栈的可观测性数据采集。在此基础上,基于大语言模型建设运维智能体,能够显著提升人工数据解读的效率问题,优化 MTTR 和 MTBF。报告将会介绍 DeepFlow 在开源和企业用户的实践案例,分享使用全栈观测数据与 AI 智能体保障金融、能源、电信核心业务连续性的经验和教训。

王之梁

清华大学长聘副教授

清华大学网络研究院长聘副教授、博士生导师。主要研究方向包括网络空间安全态势感知、网络空间测绘、网络协议形式化验证与测试等。近年来主持多项国家重点研发计划课题、国家自然科学基金等项目。发表学术论文100余篇,包括Sigcomm、CCS、NDSS等网络与安全领域的国际顶级期刊/会议,获得中国发明专利授权70余项。担任中国电子学会网络空间安全专委会委员、中国指挥与控制学会网络空间测绘专委会委员。获2024年IRTF应用网络研究奖、网络安全顶会NDSS 2023杰出论文奖、CCS 2024杰出技术成果奖、互联网测量领域顶会IMC 2012社区贡献奖,获得中国电子学会、中国通信学会科学技术一等奖等奖励。


题目:网络安全检测:从小模型到大模型


摘要:随着全球网络安全形势日益严峻,针对关键信息基础设施的恶意网络攻击频发,传统的监测防御手段已经不能够保证网络的安全可靠。本报告介绍我们在基于人工智能技术的网络安全检测方面所开展的一系列研究工作,包括基于深度学习的异常检测模型的鲁棒性、可解释性、模型增量更新等研究,以及在网络流量异常检测、主机威胁检测等方面的研究,进而对基于大模型的网络安全检测的技术路径进行了分析和展望。


CNCC2025



CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。





图片


图片
图片
图片

点击“阅读原文”,进入官网。

点我访问原文链接