第 20 届中国 Linux 内核开发者大会(CLK)由 vivo 承办,于 11 月 1 日在深圳圆满落幕。本次大会上,vivo 多位内核技术专家带来 11 场深度议题分享,聚焦内存管理、文件系统、内核调度、异构计算与 eBPF 五大核心领域,从内核技术突破的实现路径到业务场景的融合落地,全面拆解底层技术优化细节。其中,主论坛 “AI Agent 时代 Linux 内核的现状与发展” 这一议题,更引领大家深入思考内核技术的发展方向。
01
主论坛
AI Agent时代Linux内核的现状与发展
在大会主论坛上,vivo软件系统架设中心高级总监陈俊彦以《AI Agent时代Linux内核的现状与发展》为题,深入探讨了AI大模型对操作系统内核提出的新挑战。
他从AI Agent的感知、记忆、规划、执行四大能力出发,系统分析了内核在调度、内存、存储、度量等方面面临的技术瓶颈,并分享了vivo在AIOS架构演进中的实践与思考。他特别指出,内核需要为AI提供低延迟、高并发的执行环境,这是未来技术演进的重要方向。
02
圆桌论坛
AI时代下Linux内核的机遇、挑战及未来发展方向
vivo存储系统技术中心高级总监刘如一主持了本届圆桌论坛,携手阿里、华为、字节、OpenCloudOS、龙芯、OPPO的相关技术负责人,就AI时代Linux内核的机遇、挑战及未来发展方向展开深入讨论。大家一致认为,算力调度与内存管理是AI场景的核心挑战,业界需要构建更智能的资源编排机制;GPU、NPU等多元算力正在重塑软硬件架构;并强调深耕系统核心技术,以应对AI时代下的业务迭代与场景革新。
03
内存管理与优化分论坛
1.ZRAM 多压缩算法效率实践及评估
vivo性能优化专家汪劼文带来《ZRAM 多压缩算法效率实践及评估》主题分享。她指出,单一压缩算法无法同时兼顾压缩速率和压缩率,在实际产品中难以实现最优用户体验。她创新性地提出“腾内存速度”这一用户体验为导向的技术指标,介绍了基于实际用户场景评估压缩算法优劣,并通过ZRAM多压缩算法的产品实践,使安卓重载多后台场景的应用启动耗时优化2%~20%。
2. ZRAM 异构压缩技术:基于GPU 加速的内存回收方案
vivo性能优化工程师林芝驰分享了《ZRAM 异构压缩技术:基于 GPU 加速的内存回收方案》。他首先分析了当前困境:在资源受限的设备上,内存压缩与UI渲染等任务在CPU上竞争资源,导致性能下降。为此,他提出了一种创新方案,其核心思路是将计算密集的压缩任务从CPU卸载到GPU,旨在让CPU更专心地服务于延迟敏感的关键业务。他还详细介绍了该方案的整体架构,并深入探讨了实现过程中的两大技术难点——数据批量管理及CPU-GPU内存零拷贝——及其解决方案。
3.ZCACHE:异步文件压缩缓存管理方案
在《ZCACHE:异步文件压缩缓存管理方案》的分享中,vivo性能优化工程师林泽生剖析了文件页缓存回收后,系统在I/O高负载下性能衰退的根源。他指出,虽然2013年引入社区的Zcache方案希望通过压缩文件页来提升性能,但其同步压缩机制和ZBud分配器在实际应用中分别导致了内存回收速度慢和压缩率低两大瓶颈。针对这些挑战,林泽生详细介绍了vivo团队的优化方案,该方案最终在真实安卓产品中实现了多后台应用启动速度平均12.1%的提升。
4.Uncached buffer IO 探索与在 f2fs 上的支持
vivo存储系统工程师韩棋分享了在F2FS文件系统中支持uncached buffer I/O的实践。该技术避免了普通buffer I/O在LRU链表管理和内存回收上的开销,其“阅后即焚”的特性明确了数据不长期占用缓存。与direct I/O相比,它的优势在于允许并发读写操作仍能通过Page Cache进行同步。在重载场景的实际测试中,该方案将Page Cache的内存占用量从5.5GB大幅降至200MB,并将内核kswapd内存回收线程的负载从55%降至几乎为0。
5.EROFS 压缩文件 Direct I/O 的探索和支持
在关于EROFS支持direct I/O的分享中,vivo工程师郭纯海和杨晨志指出,其动机是解决手机AI模型等只读文件大量占用页缓存,导致内存回收压力与性能抖动的问题。为此,他们设计了绕过页缓存且无需磁盘对齐的方案,核心实现是将数据直接解压至用户空间,并整合了ztailpacking、fragments和去重等特性。该方案在低内存场景下对比buffer I/O,读性能提升达54.6%。
04
文件系统与存储分论坛
1.Parallelizing filesystem writeback
vivo存储系统工程师王誉霏和张细锐分享了题为《Parallelizing filesystem writeback》的工作,旨在加速文件系统脏页回写。该工作的核心是探索在多核CPU与具体硬件条件下,如何通过多线程并行回写来最大化性能收益,从而提升文件系统在短时高负载写入时的表现。在使用F2FS的手机上实测,回写性能提升了22%。
2.Host Initiated Defragmentation 的实践与优化
在关于磁盘碎片整理的分享中,vivo存储工程师唐欢系统回顾了此项技术从构想、落地、标准化到开源贡献的完整历程。他介绍,HID技术使主机能够主动检查并触发碎片整理。此项工作始于vivo 2019年的提案,历经2020年iQOO 7的产品化,于2024年进入UFS 4.1标准,最终在2025年完成对Linux社区的上游代码贡献。该技术显著增强了存储抗老化能力,改善了I/O服务质量,在碎片严重场景下可使2G文件拷贝速度提升300%以上。
3.Zoned Storage 性能优化探索与实践
vivo存储系统工程师廖远鸿和王骁分享了在Zoned Storage领域的最新探索,这是继2024年在CLK大会首次分享后的持续深入研究。他们认为,Zoned Storage通过将硬件能力上移并赋予系统软件更多决策权,已成为存储演进的一大趋势,旨在实现延迟可控、随机读性能稳定及降低写放大等目标。随着ZNS SSD与Zoned UFS的量产,Linux社区对此的支持也达到高潮。本次分享重点探讨了垃圾回收方向的优化,以提升GC效率与写性能,并展望了Copy Offloading、Zone Write Order Restore等未来技术,有望彻底解决相关性能与效率问题。
05
调度、性能与调试分论坛
Energy-Efficient I/O:Block层约束设备频率的探索与支持
vivo存储系统工程师王建政分享了题为《Energy-Efficient I/O:Block层约束设备频率的探索与支持》的工作。该工作旨在解决存储设备低功耗状态切换与I/O延迟敏感型任务之间的矛盾。他指出,原生动态调频机制因负载检测存在滞后性,导致延迟敏感型任务的头部请求常在设备低频状态下执行,从而影响用户体验。为此,他提出了基于PM QoS的Block层频率约束机制,以优化因功耗状态切换不及时导致的性能问题。实测表明,在间歇I/O负载下,命令完成延迟(clat)提升约15%;在连续I/O负载下,带宽提升约5%。
06
AI基础设施与eBPF应用分论坛
基于 eBPF 支持自定义低功耗策略的 cpuidle_ext 框架
vivo BSP工程师林义凯在《基于 eBPF 支持自定义低功耗策略的 cpuidle_ext 框架》的分享中指出,CPU作为嵌入式设备的最大耗电器件,其低功耗管理至关重要。他提出了一种基于BPF struct_ops扩展的cpuidle_governor_ext框架,该框架允许开发者在用户态灵活定制CPU空闲策略,并已获得社区肯定。最后他分享了一个应用实例:通过该框架识别音乐播放场景,成功将CPU C0状态占比从50%降至10%,系统功耗降低5%。
END
视频回放
▶ 主论坛(点击观看)
▶ 分论坛:内存管理与优化(点击观看)
▶ 分论坛:文件系统与存储(点击观看)
▶ 分论坛:调度、性能与调试(点击观看)
▶ 分论坛:AI基础设施与eBPF应用(点击观看)

