首页 > 最新动态 > 从LVS到云原生AI,深耕开源二十载——专访“CCF卓越服务奖”得主章文嵩 | CCCF精选
最新动态
从LVS到云原生AI,深耕开源二十载——专访“CCF卓越服务奖”得主章文嵩 | CCCF精选
2026-06-024


现在订阅CCCF12期纸质刊,随刊赠送CCCF20周年纪念帆布包一只,数量有限,赠完即止。





编者按:

章文嵩,CCF会士、常务理事、开源发展技术委员会副主任,开源项目LVS(Linux Virtual Server)创始人。现在主要从事云原生和AI Infra创业孵化与投资。曾任高瓴运营合伙人、滴滴出行高级副总裁、阿里副总裁和阿里云首席技术官、TelTel联合创始人、国防科技大学计算机学院副教授。他在设计和架构大规模系统、云计算、大数据、AI工程、软件研发管理、开源上有着丰富的经验。1998年5月,他创立LVS开源项目,2003年起LVS代码一直出现在官方内核中,LVS作为网络四层负载均衡的事实标准在全世界得到广泛应用。20年来,他积极推动国内开源的发展,曾获“CCF杰出工程师奖”“开源杰出贡献奖”“中国开源领袖人物”等奖项。此外,章文嵩长期服务于CCF,是CCF开源发展技术委员会的主要发起人之一,并推动CCF官方开源创新服务平台GitLink的建设。他还曾任CCF技术前沿委员会首任主席,并为CCF资产管理等作出了重要贡献,为此,CCF奖励委员会授予章文嵩2024年“CCF卓越服务奖”。



技术贡献与初心


Q

章老师,LVS(Linux Virtual Server)作为一款基于Linux内核的高性能负载均衡器,对全球互联网架构产生了深远影响,您作为这一项目的创始人,能否分享一下创建LVS的初心?在多年的开源维护中,是什么动力让您持续投入并推动技术普惠?


章文嵩:当初做LVS纯粹属于个人兴趣,没有商业化的想法。把想到的功能都实现后,就毫无保留地开源出来,并写了详细的文档来描述它们的工作原理以及各种场景下的使用方法。

能做LVS得益于我在国防科技大学受到的教育。1992年底,我以大三学生身份进入实验室。实验室里拥有几乎全系列的SUN服务器和工作站,那时候国防科技大学的计算机设备应该是全国所有大学中最好的。我和老师一起把SUN机器进行传输控制协议/网际协议(TCP/IP)组网,跑通内部域名系统(DNS)、网络信息服务(NIS)、电子邮件(E-mail)和文件传输协议(FTP)等服务,让大家用起来,有机会学习和精通网络协议和TCP/IP。中国教育和科研计算机网(CERNET)在1994年开始建设,紧接着电信公司开始大规模建设互联网。当时国内懂TCP/IP的人很少,我在互联网上了解到开源的概念,觉得能拿到源代码还是挺神奇的。但当时下载速度太慢,我让家人从美国购买Slackware Linux(面向高阶用户的Linux发行版)光盘邮寄给我。后来我游说一家长沙公司从美国软件开发商Walnut Creek CDROM那里采购了几万元的开源光盘,成为国内早期开源玩家获得第一手资料的重要渠道。1995年,我作为硕士研究生有机会帮助长沙电信做信息港建设规划,也看到访问量上升时一台服务器忙不过来的情况。我用开源光盘帮同学们在个人计算机(PC)上安装Linux系统,把PC变成Unix工作站;在长沙信息港项目中,也使用Linux服务器和开源软件。在做博士研究期间,我发现做负载均衡不是难事,恰巧Linux内核中没有这个功能,就在1998年5月花了2个星期时间在Linux内核中写了一个可以工作的版本,然后去Linux网络的邮件列表中发了一个邮件,邮件内容是我写的这个软件解决什么问题和快速入门(QuickStart)的使用步骤,自此LVS开源齿轮就启动了。

持续投入LVS的动力,来自个人成就感、个人成长和更大的社会意义。LVS开源发布不到一个星期,一位澳大利亚用户在他的社区网络中用LVS搭建代理缓存(Proxy cache)集群。有用户使用让我特别开心,这说明我做的东西有价值。持续在邮件列表上回答大家的问题、倾听用户的需求、不断改进LVS、接受其他开发者的补丁包(patch)并把成果再分享给大家,这样就凝聚了一些开发者一起来改进,逐步形成LVS开源社区。在做LVS过程中,我自己也学习到很多东西:跟高手切磋写出更高性能、更简洁的代码,做更好的开源项目,以及如何凝聚开发者共事等。

LVS已经成为四层负载均衡的事实标准,国内外几乎所有互联网公司都在使用LVS代码或基于数据平面开发套件(DPDK)报文收发的LVS,在数据中心侧将请求负载均衡到服务器集群上。看到27年前开始写的代码现在还活着,未来还能活很长很长时间,这种感觉还是挺不错的。



开源理念与社区服务


Q

“CCF卓越服务奖”表彰了您在服务计算机社区方面的杰出贡献,您作为CCF开源发展技术委员会的主要发起人之一,推动了CCF官方开源创新服务平台GitLink的建设。您如何看待开源精神与学术共同体服务之间的关联?对于年轻开发者如何参与开源并回馈社区,您有哪些建议?


章文嵩:我觉得开源精神中的开放、共享、协作和创新与学术共同体服务是强关联的。CCF是一个自由、平等、开放的平台,遵循会员构成、会员治理和服务会员的理念来运作。把这个开放共建理念运用到开源治理上,成立CCF开源发展技术委员会是一种实践,让真正懂开源的人来运营开源共同体。CCF官方开源创新服务平台GitLink是一个其本身也开源的平台,与Github和Gitee不同,后者虽服务开源项目,但本身不是开源的。GitLink本身开源就是希望产学研不同领域的学者一起来共建开源创新服务平台,把更多软件工程上的研究成果应用到平台,吸纳更多用户,跟进用户反馈来改进成果。

不要把开源想得太难,迈出第一步最重要。当你对一个开源项目有疑问或想法,就可以去开源项目的论坛或群中说你的问题和想法;当你看到一个开源项目有问题还没解决并对此感兴趣,可以动手解决它,并把patch回馈回去;如果你有一个软件项目,可以通过开源方式来做,会迭代得更快更好;如果你是高校老师,有一个软件成果,可以把它开源出来,你会接触到更多的用户,会收到很多来自真实世界的用户需求,用以改进和完善软件成果,构建开源生态和影响力,发现更大的商业化机会。通过开源,投入越多,收获会越多。



从技术到管理的转型思考


Q

您拥有从一线工程师到阿里巴巴高级研究员、阿里云CTO,再到滴滴高级副总裁的技术管理经验。这一过程中,您如何平衡技术深度与管理广度?哪些经历对您理解“技术服务业务与社会”产生了关键影响?


章文嵩:我觉得先在一个点上做深,有自己的独到之处,是可以把所获得的经验和感悟迁移到更多领域的。逐步积累技术判断力,会对技术管理带来很大的帮助。在技术管理岗位上,更多时间在做规划,需要进行团队建设与管理;对于新技术、新系统,自己还是要花时间深入学习。凭借过去的技术积累,能很快了解工作原理和关键点。没有自己的技术判断力是很难做好技术管理的。

我大二时在学院的大众电脑中心做软件开发,老师布置的作业是在“386”机器上用汇编语言写在光学字符识别(OCR)软件中应用的.tiff文件的读写库。汇编语言写程序返工是非常费时的,.tiff中用了哈夫曼编码,必须先彻底搞懂哈夫曼编码再写程序。哈夫曼编码是对频度高的部分尽可能用短的编码来表示,对频度很低的部分用很长的编码来表示,最终达到压缩编码长度。这让我领悟到要事优先的道理,重要的事情集中精力优先做,不重要的事情可以慢慢做甚至不做。在系统的架构设计上道理也是一样的,最关键是做取舍(tradeoff),“One size fits all”的设计是不对的,不存在一个系统可以解决所有问题。一方面建设系统的成本投入是有限的,另一方面不同的需求可能是不能相容的。例如,高吞吐和低延时是不可兼得的,所以要识别系统面临的最关键需求,用最优的方式来做。就像LVS中连接状态管理需要考虑几百万连接甚至更多,Netfilter已有连接状态管理要应对很多情形,处理比较复杂,导致性能不高,LVS就得针对请求重新设计连接状态管理,这样能做到简单而高效。

在技术管理上,需要把握大方向,做好技术布局。例如构建淘宝核心系统团队时,根据淘宝业务需求组建了分布式存储、数据库、Web服务器、网络、内容分发网络(content delivery network, CDN)、内核、大数据、机器学习、图像搜索等团队。为了应对“双十一”,必须提升平台的交易吞吐量,这里面最关键的是数据库的性能。2010年淘宝做了双线布局:一个团队利用最新的高性能非易失存储加MySQL做软硬件一体优化提升数据库性能;另一个团队做新数据库OceanBase。通过跟团队推敲合理的架构设计,提炼核心指标,确保系统每月都能不断精进;若提炼不出合适的核心指标,说明我们对系统理解还不够,需要再重新梳理系统的关键点和架构设计。另外,作为技术管理,更重要的是要助力团队,在不影响大局的情况下尽可能让团队自己做决策,帮助团队落实更多的资源,在团队需要技术讨论时提供建议,确保在正确的轨道上推进。



行业趋势与未来挑战


Q

在云计算和基础设施技术快速演进的今天,您认为当前云计算面临的大挑战是什么?未来5~10年,哪些技术方向值得重点关注和投入?


章文嵩:我觉得智能化革命是能持续一百年的大机会,各行各业宝贵的数据资产都有智能化升级的机会。我们每个人都有个人的隐私数据,也会有自己的智能体(Agent),如何更高效地承载智能化升级应用和Agent是云和基础设施服务面临最大的挑战。

未来5~10年,云计算平台本身会继续在计算、存储、网络上通过软硬一体优化,不断降低成本,提升性能。在云平台上需要构建云原生人工智能(AI)基础设施服务和云原生数据基础设施服务,一起来承载AI应用和Agent等。这中间很多技术值得关注和投入,如高性能AI芯片、开源AI算子库、用强化学习做编译器优化、高性能推理引擎、分布式推理服务、高效的AI训练平台、云原生软件重构、云边端协同Agent框架、新的AI算法、AI赋能软件工程等。



获奖感悟与寄语


Q

获得“CCF卓越服务奖”是对您长期服务的肯定。这一荣誉对您个人有何特殊意义?对于计算机领域的研究者和从业者,您希望传递怎样的价值观或使命感?


章文嵩:感谢学会和同仁们的认可,能获得“CCF卓越服务奖”对我是很好的激励。我很高兴在学会和大家一起工作,我很喜欢学会的文化和治理结构,也在学会的服务工作中得到成长。我会更加努力工作,发挥自己的长处,推进开源生态建设;为学会做好投资理财、投资回报,让学会更好地开展服务;建立学会服务质量的度量体系,和学会同仁们一起提升学会服务,让学会活动和服务触及更多的会员,为使会员感受到更好的服务,一起继续努力。

我自己的一点感悟是人的时间和精力是有限的,要聚焦在少数有价值、有意义的事情上,把事情做好,为社会创造价值,其他会随之而来,更主要的是享受过程。

陈娟

CCF杰出会员、理事、高性能计算专委会常委,《计算》动态栏目主编。国防科技大学教授。主要研究方向为高性能计算、低功耗编译优化。

juanchen@nudt.edu.cn

本文发表于2026年第5期《计算》。


更多阅读:



深耕智能漏洞攻防,做兴趣使然的“安全”人——专访CCF青年科技奖获得者张超 | CCCF精选

专访2024年度“CCF杰出工程师奖”获得者朱思语 | CCCF精选

在传承中创新计算机基础教育——专访2024 年“CCF杰出教育奖”获得者郑莉 | CCCF精选




图片


图片


点击“阅读原文”,加入CCF。

点我访问原文链接