按分类:https://github.com/ForceInjection/articles/blob/main/toc.md
按时间顺序(带封面):https://github.com/ForceInjection/articles/blob/main/articles_with_cover.md
祝大家元旦快乐🎉🎉🎉!
#AI Infra
-
• Nvidia KAI Scheduler 功能架构解析 -
• NVIDIA Model Optimizer 技术详解:功能、原理与实现 -
• 深度融合:大语言模型(LLMs)与知识图谱(KGs)的协同演进全景图 -
• 【翻译】智能体工程现状 By LangChain -
• Google TPU 101 -
• 大模型核心推理优化技术深度解析及方案指导 (写大模型技术规划报告必备) -
• 从 SIMT 到 Tile-Based:GPU 编程范式的演进与实战解析 —— 以矩阵乘法为例 -
• AI 时代 - 不卷算力卷效率!HAMi Meetup 上海站 -
• GPU 管理相关技术深度解析 - 虚拟化、切分及远程调用(v2) -
• TileLang 快速入门 -
• 容易被忽略的 containerd 运行时日志 -
• GPGPU vs NPU:大模型推理与训练的算力选择指南 -
• 使用 LangChain 实现智能对话机器人的记忆功能 -
• 论文解读 - 大模型 Agent 记忆系统:理论基础与交互机制 -
• AI 智能体记忆系统 - MemoryOS 入门指南 -
• AI 原力注入:AI Infra 知识体系 v2.0 -
• Coze 部署和配置手册 -
• DeepSeek-V3 在 32 张 H20 GPU 集群上的部署方案【理论分析篇】 -
• DeepSeek-V3 MoE 模型基于 vLLM + Ascend 910B2 的推理部署方案【理论篇】 -
• Nvidia K8s Device Plugin 原理解析和源码分析 -
• NVIDIA Container Toolkit 原理分析与代码深度解析 -
• 云原生高性能分布式 LLM 推理框架 llm-d 介绍(K8s + vLLM) -
• NCCL 测试验证工具说明文档(更新版) -
• Qwen2-VL-7B-Instruct 昇腾部署入门指南(基于 docker run) -
• NCCL InfiniBand 测试验证工具说明文档 -
• InfiniBand 网络带宽监控脚本使用说明 -
• InfiniBand 网络检查脚本使用说明 -
• InfiniBand 网络理论与实践 -
• JuiceFS 文件修改之 chunk/slice/block 更新机制分析 -
• HAMi GPU 资源管理完整指南 -
• 企业级多智能体 AI 系统构建实战 -
• 6 月-7 月 AI Infra 精华文章合集 -
• GPU 虚拟化与资源管理技术深度解析 - 第四部分:实践应用篇 -
• GPU 虚拟化与资源管理技术深度解析 - 第三部分:资源管理与优化篇 -
• GPU 虚拟化与资源管理技术深度解析 - 第二部分:虚拟化技术篇 -
• GPU 虚拟化与资源管理技术深度解析 - 第一部分:基础理论篇 -
• 不同 GPU 集群规模的推理技术选型策略 -
• 大模型推理优化:集群规模分类与特征分析 -
• 大模型核心推理优化技术深度解析及方案指导 -
• GPU 虚拟化与切分技术原理解析 -
• 中文 RAG 系统 Embedding 模型选型技术文档(模版) -
• GPU 利用率(Utilization) 是一个误导性指标! -
• 原力注入:AI Infra 知识体系(Body of knowledge for AI Infra) v1.1 -
• CUDA Processing Streams -
• AI Infra - CUDA 并发编程之 Stream 简介 -
• AI Infra - nvtop 快速入门 -
• 推荐两本开源 AI 书籍:《动手学深度学习》和《机器学习系统:设计和实现》 -
• AI Infra - 集合通信框架 NCCL 概念介绍 -
• AI Infra - 理解 GPU 架构之 Tesla V100 及 RTX 5000 简介 -
• AI Infra - 理解 GPU 架构之理解 GPU 特性「双语」 -
• 原力注入:AI Infra 知识体系(Body of knowledge for AI Infra) v1.0 -
• AI Infra - 理解 GPU 架构之理解 GPU 内存「双语」 -
• 深入了解 Nvidia CUDA 核心 -
• AI Infra - 使用 CUDA 代码查询 GPU 卡详细信息 -
• AI Infra - nvidia-smi 快速入门 -
• AI Infra - Nvidia GPU 卡 之 ECC 功能 -
• AI Infra - Nvidia GPU XID 故障码解析 -
• 推荐《CUDA Reading Group 相关讲座》 -
• 深度学习(大模型)中的精度 -
• 万卡集群背后的系统架构:《NVIDIA DGX SuperPOD:下一代可扩展的 AI 领导基础设施》 -
• 使用 Nsight 工具定量分析 CUDA 矩阵乘法几种实现 -
• AI Infra 基础知识 - 一文介绍并行计算、费林分类法和 CUDA 基本概念 -
• AI Infra 基础知识 - PCIe 知识大全 -
• AI Infra 基础知识 - NVLink 入门 -
• 【转载】美国玩大模型那帮人:好几万卡集群 + 超级节点
#AI Infra Visualization
-
• 现代数据架构的演讲:从数据仓库到湖仓一体 -
• 《性能之巅》的作者 Brendan Gregg 离开 Intel 了 -
• 全面的 GPU 技术术语词典,涵盖 GPU 架构、CUDA 编程、并行计算等核心概念 -
• 理解 PD 分离和分布式 KVCache 的几张图 -
• 一图胜千言:Function calling vs. MCP -
• 大家眼中的 AI vs (牛马眼中)真实的 AI
#BPF 之巅
-
• 性能调优:学无止境 -
• BPF 性能之巅 - 使用 bcc 工具做 Linux 内存回收性能分析 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• 《BPF 性能之巅》- 使用 perf tools 定位磁盘 IO util 高问题 -
• 《性能之巅》系统可观测性综述 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• 《BPF 性能之巅》- 使用 perf tools 做性能分析(1) -
• 【BPF 性能之巅】 系统性能分析的 USE 方法和 TSA 方法 -
• 【实战篇】使用火焰图定位 jbd2 进程导致系统负载高问题 -
• The State of eBPF - 2024 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• 《BPF 之巅》读书笔记 - Linux 内核锁 -
• 《BPF 性能之巅》读书笔记 - bpftrace 入门 -
• 《BPF 之巅》读书笔记 - 使用 perf + perf-agent-map 制作容器化 Java 火焰图 -
• 周末学习 -《BPF 之巅:洞悉 Linux 系统和应用性能》汇总 -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记(四)火焰图 -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记(三)Linux Kernel 相关知识 -
• 《BPF 之巅》读书笔记(二)番外篇 - Linux 存储软件栈 -
• 《BPF 之巅》读书笔记(一)Linux Tracing System -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记开篇 -
• 系统性的学习 Linux Systems Performance
#Containerd
#cpu
-
• CPU 虚拟化 -
• 【深度】操作系统技术实践:解读 CPU 隔离 -
• 125 张大图诠释 CPU 40 年发展简史(至 2007 年 4 月) -
• 通用 CPU 性能基准测试研究综述 -
• 【转载】主流 CPU 性能比较(Hygon7280、Intel、AMD、鲲鹏 920、飞腾 2500) -
• Linux 基础知识:CPU Usage 和 System Load 的关系 -
• Kubernetes 内存和 CPU 排错 - CPU 节流和 OOM -
• Linux 基础知识 - CPU 上下文切换
#CS
-
• 南京大学“绿导师原谅你了”- AI 时代的操作系统课,开课了! -
• 【南京大学-软件学院】The Missing Course of Your Computer Science Education -
• 不要盲目刷 LeetCode,要巧用编码模式 -
• 为什么机器人不能勾选“我不是机器人”复选框? -
• 一图说清楚《如何构建知识体系》 -
• 【南京大学】推荐 2 位在 B 站上发布课程的计算机系老师
#CUDA
-
• 原力注入:AI Infra 知识体系(Body of knowledge for AI Infra) v1.1 -
• CUDA Processing Streams -
• AI Infra - CUDA 并发编程之 Stream 简介 -
• AI Infra - nvtop 快速入门 -
• 推荐两本开源 AI 书籍:《动手学深度学习》和《机器学习系统:设计和实现》 -
• AI Infra - 理解 GPU 架构之理解 GPU 特性「双语」 -
• 原力注入:AI Infra 知识体系(Body of knowledge for AI Infra) v1.0 -
• 深入了解 Nvidia CUDA 核心 -
• AI Infra - 使用 CUDA 代码查询 GPU 卡详细信息 -
• NVIDIA 全面转向开源 GPU 内核模块 -
• 推荐《CUDA Reading Group 相关讲座》 -
• 使用 Nsight 工具定量分析 CUDA 矩阵乘法几种实现 -
• 好书推荐 - 《CUDA C 编程权威指南》 -
• CUDA 编程模型入门 -
• AI Infra 基础知识 - 一文介绍并行计算、费林分类法和 CUDA 基本概念
#deepseek
-
• 上海人工智能实验室开源工具 MinerU 助力复杂 PDF 高效解析提取 -
• 深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 -
• Deepseek 3FS( Fire-Flyer File System)设计笔记 -
• Hello, DeepSeek Open Infra! -
• 过年八天乐 - 读者来信:请问 7b 阅读分析不同中医古籍的能力怎么样?可以进行专项训练大幅度提高这方面能力么? -
• 过年八天乐 - DeepSeek 1.5b、7b 和官网模型快速对比 -
• 过年八天乐 - 在 Mac 上运行 DeepSeek-R1 模型
#Docker
-
• Containerd 的 Overlay 文件系统简介 -
• 容器实战 - 多架构镜像制作及推送指南 -
• 联合文件系统(Union File System)深度教程 -
• Docker 动手教程重装上阵! -
• Docker 多阶段构建简介 -
• 解读 Linux Cgroup 之 cpuset 子系统及其在 Docker 中的使用 -
• xx - Dockerfile 交叉编译助手 -
• Docker 史上最快捷「单机多平台」镜像构建 -
• 容器技术回顾:消失的 Docker 网络命名空间 -
• 喜大普奔 - 国内可以直接下载 Docker 官方镜像了!!! -
• 容器技术回顾 - OverlayFS 简介 -
• Docker 镜像、容器和存储卷清理指南【双语】 -
• Kubelet 报错:inotify_add_watch ... no space left on device -
• Docker Registry 的一种高可用方案 -
• 如何优化 Docker 镜像体积? -
• 江湖救急:Docker 构建镜像时报“max depth exceeded”,该如何解决? -
• 在 Docker 中使用 Capabilities 实现权限控制 -
• Dockerfile CMD vs Entrypoint -
• 强烈推荐几张容器技术相关的知识图解 -
• Docker attach 与 exec - 有什么区别? -
• 知乎问题:宿主机是 ubuntu 22,容器是 ubuntu 24,容器是否可正常使用 ubuntu 24 特有的一些新功能? -
• 深入研究 Linux Namespace - 第一部分 -
• 在 Docker 中使用 Linux User Namespace 隔离容器用户 -
• 在 Docker 中使用 Linux User Namespace 隔离容器用户 -
• 深入研究 Linux Namespace - 第一部分 -
• 容器技术基础知识 - Cgroup 相关资料汇总 -
• 容器技术发展简史 -
• Docker 小技巧:处理无名称的镜像(悬空镜像) -
• Docker、Containerd 和 runc 之间的关系 -
• 好书推荐 - 《自己动手写 docker》 -
• Linux 小技巧 - 模拟 Docker hang 住 -
• Docker & Kubernetes 原理入门课程推荐 -
• Docker & Kubernetes 原理入门课程推荐 -
• 容器技术回顾 - 如何修改容器的内核参数 -
• 容器技术回顾 - Linux 内存文件系统 -
• 容器技术回顾 - 多 Pod 间共享内存通信 -
• 容器技术回顾 - 从一个“D”状态容器进程回顾 cgroup freezer 子系统 -
• 容器技术回顾 - 如何让我的容器/进程不要被 OOM Kill? -
• 为什么同样使用 2 个 vCPU 的 App 在 VM 中比在容器中运行的快? -
• 为什么同样使用 2 个 vCPU 的 App 在 VM 中比在容器中运行的快? -
• 容器技术回顾(六) - 容器与主机共享内核是什么含义? -
• 容器技术回顾 - Kubernetes memory limit 产生的 OOM -
• 容器技术回顾 - Kubernetes CPU request 和 limit 的作用与原理 -
• 容器技术回顾(三) - 被误解的 Docker 存储驱动 -
• 容器技术回顾 - 什么是优雅关闭以及如何实现 -
• 容器技术回顾 - 容器中的 0 号进程和 1 号进程 -
• 驳斥《把数据库放入 Docker 是一个好主意吗?》
#Java
#Kubernetes
-
• Kubernetes Runtime Class 原理与实现 -
• Kubernetes Pod QoS 原理与实现 -
• 从 Linux 内核到应用层:YARN 与 Kubernetes 资源隔离技术全栈解析(一) -
• Pod Scheduling Readiness 简介 -
• Kubernetes 挂载卷的传播机制介绍 -
• Containerd CRI Plugin 代码分析 -
• Container Device Interface (CDI) 技术介绍 -
• Kubernetes Dynamic Resource Allocation 权威指南 -
• KubeSphere 4.x 架构设计与扩展机制深度分析(三) -
• KubeSphere 架构设计与扩展机制深度分析(二) -
• KubeSphere 4.x 架构设计与扩展机制深度分析(一) -
• Local Path Provisioner 简介 -
• Kubernetes HPA 原理与实践 -
• Kubernetes Operator for Spring Boot 应用开发教学指南 -
• 基于 Colima 虚拟机在 Mac 上搭建容器化开发环境 -
• Kubernetes 调度器生产最佳实践 -
• Kubernetes 调度器介绍 -
• Kubernetes GPU 资源调度方案参考实现 -
• 详解 Kubernetes 中的等待重试机制 -
• 从入门到精通:全面解读 Kubernetes CronJobs -
• 好书推荐 - 《分布式系统应用设计》 -
• Kubernetes 端口转发实战指南 -
• 当我们谈论 Linux 主机/集群管理时,我们需要关注哪些工作呢? -
• 云原生应用生命周期管理:OAM 介绍 -
• Kubernetes 生态中开源软件的 License 分析与合规指南 -
• 云原生应用生命周期管理:主从架构 MySQL 案例解析 -
• 云原生应用生命周期管理:需求分析 -
• Spring Boot on K8s 优雅停机流程解析【修改版】 -
• K8s Pod 出现 UnexpectedAdmissionError 的原因及解决方案 -
• Spring Boot on K8s 优雅停机流程解析 -
• 怀念一下 Mesos -
• CNCF: 在 Kubernetes 上运行数据白皮书 - 数据库模式 -
• Pod 异常状态排查指南 -
• 浅析 Rook 如何管理 Ceph Cluster -
• Open Policy Agent(OPA)简介 -
• Kubernetes 生产最佳实践之「合规治理」 -
• 在离线混部作业调度与资源管理技术研究综述 - 读后感(一) -
• 关于 Pod 驱逐的二三事及深入思考 -
• Kubernetes 存储卷快照「双语」 -
• Kubelet 报错:inotify_add_watch ... no space left on device -
• Docker Registry 的一种高可用方案 -
• Kubernetes 基础知识 - 污点与容忍度、亲和性与节点选择器 -
• Kubernetes 1.31 圆梦之路: 十年了, OCI 镜像借着 AI 的风终于加入 Volume 的大家庭 ~ -
• Kubernetes 生产最佳实践之「集群配置」(双语) -
• Kubernetes 生产最佳实践之「应用适配」(双语) -
• Kubernetes 攻防 - 窃取 Service Account 令牌获取集群权限及对应检测方式 -
• Kubernetes:图解 Kubeconfig 文件 -
• Kubernetes:批量创建命名空间,并为每个命名空间指定「用户」以及 「kube config」 -
• 强烈推荐几张容器技术相关的知识图解 -
• Docker attach 与 exec - 有什么区别? -
• 好书推荐 - 《Certified Kubernetes Administrator (CKA) Study Guide》 -
• Kubernetes 1.30:对 Pod 使用用户命名空间的支持进阶至 Beta -
• Kubernetes 基础知识 - 万字详解升级策略 -
• Kuberentes 小课堂 - 快捷运行 Python 服务 -
• 容器技术基础知识 - Cgroup 相关资料汇总 -
• Kubernetes 小技巧 - 使用 Downward API 将配置传递给 Pod -
• 你现在用的 Kubernetes Secrets 安全吗? -
• 在 Linux 容器中可以使用独立于主机的系统时间吗? -
• Kubernetes 网络和 Cilium:网络工程师手册 -
• Kubernetes 基础知识:持久卷、持久卷声明和 StorageClass -
• 【Kubernetes 网络】好书推荐 -
• 强烈推荐:《Container Networking: From Docker to Kubernetes》中文翻译 -
• Kubernetes 小技巧 - 使用 Helmify 将 K8s YAML 文件转换成 Helm Chart -
• Kuberneters 小技巧 - 将 K8s YAML 文件转换为 Helm Chart -
• Kubernetes 小技巧:kube-state-metrics 入门 -
• Kubernetes 网络和安全简介(一) -
• Docker、Containerd 和 runc 之间的关系 -
• 新书推荐 - 《Containerd 原理剖析与实战》 -
• Kubernetes 基础知识:Finalizers 是什么?有什么作用? -
• 新书推荐 - 《边缘云部署与运营:系统性实现方法》(博主翻译) -
• Kubernetes 缩容工作负载时,如何指定要被删除的 Pod? -
• 好文推荐 - Java 技术栈中间件优雅停机方案设计与实现全景图 -
• 云原生混合部署(在线离线混合部署)资料整理 -
• Kubernetes 基础知识 - Kubernetes 准入控制器 -
• 应用上云 - Azure 官方 Java 容器化策略文档 -
• Kubernetes 内存和 CPU 排错 - CPU 节流和 OOM -
• Kubernetes 容量规划:如何合理设置 limit 大小 -
• Kubernetes 容量规划:如何合理设置 request 大小 -
• Kubernetes 小技巧 - Pod Pending 问题解析 -
• 禁用/启用 SMT 引发的 CGroup 绑定 CPU 的问题 -
• K8s 的核心是 API 而非容器(二):从开源项目看 k8s 的几种 API 扩展机制 -
• Kubernetes 小技巧 - kubectl 指北 -
• Kubernetes 的核心是 API 而非容器(一):从理论到 CRD 实践 -
• 容器技术国产化 - 从 500 行 C 代码到生产级容器运行时 -
• The State of eBPF - 2024 -
• 不敢把数据库运行在 K8s 上?容器化对数据库性能有影响吗? -
• Kubernetes 小技巧 - 通过 API 获取任意节点 kubelet 的配置 -
• Kubernetes 小技巧 - 通过 Events 发现问题 -
• 容器技术回顾 - 节点资源预留让节点更加稳定 -
• Java Spring 应用如何更好地在 Kubernetes 上运行? -
• 容器技术回顾 - 如何修改容器的内核参数 -
• 容器技术回顾 - 使用 UDS 实现 Pod 间通信 -
• 容器技术回顾 - Linux 内存文件系统 -
• 容器技术回顾 - 多 Pod 间共享内存通信 -
• 为啥 Pod 被驱逐了?浅谈 Kubernetes 驱逐机制 -
• 容器技术回顾 - 从一个“D”状态容器进程回顾 cgroup freezer 子系统 -
• 容器技术回顾 - 如何让我的容器/进程不要被 OOM Kill? -
• Kubernetes:如何实现应用零宕机? -
• 从 Kubernetes Pod 的故障诊断需求评价 K8sGPT 的 Pod analyzer 的实现 -
• 插上 AIGC 翅膀的 Kubernetes AIOps 工具 - K8sGPT -
• Kubernetes Pod 异常诊断 -
• 容器技术回顾(六) - 容器与主机共享内核是什么含义? -
• Kubernetes 上运行 Spring 生产应用的注意事项 -
• 容器技术回顾 - Kubernetes memory limit 产生的 OOM -
• 容器技术回顾 - Kubernetes CPU request 和 limit 的作用与原理 -
• Kubernetes Pod 异常诊断 -
• 一文学会 Kubernetes Pod 的生命周期管理 -
• 容器技术回顾(三) - 被误解的 Docker 存储驱动 -
• 三张图了解 Pod 的生命周期(初始化、运行与终止) -
• 容器技术回顾 - 什么是优雅关闭以及如何实现 -
• 【转载】Kubernetes 基于 cgroup 的资源限额:模型设计与代码实现 -
• 容器技术回顾 - 容器中的 0 号进程和 1 号进程 -
• 理性看待数据库/大数据 on K8s -
• 驳斥《把数据库放入 Docker 是一个好主意吗?》
#Linux
-
• Linux 内存 Watermark 工作机制详解:从 3.x 到 6.x -
• Linux 挂载传播机制原理解析 -
• 使用云原生开发现代软件 - Linux 入门课 -
• 从编程视角看 Linux 文件系统 -
• Linux 小技巧 - 使用 iostat 监控磁盘性能 -
• Deepseek 3FS( Fire-Flyer File System)设计笔记 -
• Linux 进程间共享内存通信方案 v2:基于 Futex 锁的实现 -
• Linux 进程间共享内存通信方案(代码版) -
• 好书推荐 - 《高级 Bash 脚本编程指南》 -
• Linux 6.13:30 行代码如何节省 30% 数据中心能耗? -
• 好书推荐 - 《信息存储与管理(第二版):数字信息的存储、管理和保护》 -
• 深入理解 Linux Bond:原理与实践 -
• 当我们谈论 Linux 主机/集群管理时,我们需要关注哪些工作呢? -
• FUSE 文件系统 - 使用 securefs 实现文件系统透明加解密 -
• 【翻译】Linux 中 x86 上下文切换的演变 -
• AWK 入门教程:强大的文本处理工具 -
• 鲲鹏性能优化十板斧 -
• 基于 FUSE 的简单文件系统实现 -
• 文件性能测试工具 IOzone 使用简介 -
• Linux Slab 内存管理机制简介 -
• Linux VFS (Virtual File System)简介 -
• 存储知识拾遗:LVM && Device Mapper -
• To FUSE or Not to FUSE: Performance of User-Space File Systems -
• 网络收发路径上的一些冷知识 - 参数单位 -
• Linux 网络优化:RPS 和 RFS 技术概述 -
• 快速了解 TCP 连接的 11 种状态及其转换 -
• Linux 网络参考书籍推荐 -
• Java 网络异常及其解决方案 -
• Linux FUSE 文件系统的相关一些管理操作 -
• Linux 基础知识 - 软链接 vs. 硬链接 -
• Linux 用户态文件系统 FUSE 简介 -
• Linux 小技巧 - 使用 smem 了解内存使用情况 -
• 解读 Linux Cgroup 之 cpuset 子系统及其在 Docker 中的使用 -
• 「鲲鹏软件性能调优基础知识」之「基于硬件特性的性能调优方向」 -
• 推荐:《百万并发下 Nginx 的优化之道》 -
• TCP Keepalive 指南 -
• Linux 基础知识 - CPU 上下文切换之问题排查 -
• 全新视角解析 Linux 非缓存缓冲 I/O “RWF_UNCACHED”:性能提升 65%~75% -
• 网络协议分析神器 - tcpdump 简介及抓取 HTTP Header 实战 -
• I/O 多路复用与网络服务器并发策略 -
• 超越 POSIX:一个时代的终结? -
• Linux TCP 统计指标详解 -
• 图解 TCP 收发包需要注意的内核参数 -
• 图解 TCP 连接生命周期 -
• 更多关于 Linux 网络报文收发路径图解 -
• 来自《Broadcom 以太网网络适配器用户指南》中提到的「 Linux 命令」 -
• Linux 网络收发包路径简介 -
• 了解 Linux 中的中断、软中断和 Softnet 之原理篇 -
• 周末好书推荐《Linux/Unix 系统编程手册(上下册)》 -
• 好书推荐 《Linux 二进制分析》 -
• Linux 删除文件或者目录时,出现“Operation not permitted” ,如何解决? -
• Linux 二进制文件格式 ELF 入门 -
• 管理 Linux 上的内核驱动程序和模块 -
• 推荐:原力注入 Linux 从入门到精通 -
• 深入了解 SSL 证书(英文版) -
• 安全证书简介 -
• Linux set 命令详解 -
• 容器技术回顾:消失的 Docker 网络命名空间 -
• 理解 Linux 中的进程状态【翻译】 -
• 图解 Overlayfs 文件系统的读写操作流程 -
• 容器技术回顾 - OverlayFS 简介 -
• 江湖救急,远程服务器无法 Reboot!!! -
• Linux 上统计进程 inotify 和 inotify watches 【更新】 -
• Linux inotify 简介「双语」 -
• Docker 镜像、容器和存储卷清理指南【双语】 -
• Kubelet 报错:inotify_add_watch ... no space left on device -
• Docker Registry 的一种高可用方案 -
• 如何在 Linux 中创建 Systemd 服务 -
• Systemd Cheat Sheet -
• Linux 及 Docker 文件句柄数限制及配置指南 -
• 系统调用 sync、fsync 和 fdatasync 的区别 -
• 使用 Stress-ng 对实时系统进行压力测试 -
• 好书推荐 - 《图解 Linux 内核 基于 6.x》 -
• 在 Docker 中使用 Capabilities 实现权限控制 -
• Linux /dev 目录揭秘 -
• 【深度】操作系统技术实践:解读 CPU 隔离 -
• 揭秘静态链接和动态链接 -
• 知乎问题:宿主机是 ubuntu 22,容器是 ubuntu 24,容器是否可正常使用 ubuntu 24 特有的一些新功能? -
• 《Linux 网络编程》第四章进程间通信(4)- System V IPC -
• Kubernetes 1.30:对 Pod 使用用户命名空间的支持进阶至 Beta -
• 深入研究 Linux Namespace - 第一部分 -
• 深入研究 Linux Namespace - User Namespace -
• 在 Docker 中使用 Linux User Namespace 隔离容器用户 -
• 在 Docker 中使用 Linux User Namespace 隔离容器用户 -
• 深入研究 Linux Namespace - User Namespace -
• 深入研究 Linux Namespace - 第一部分 -
• 《Linux 网络编程》第四章进程间通信(3)- 文件和记录锁定 -
• 在 Linux 容器中可以使用独立于主机的系统时间吗? -
• 《Linux 网络编程》第四章进程间通信(2)- 管道 -
• 《Linux 网络编程》第四章进程间通信(1)- 信号 -
• Linux 基础知识 - 进程间通信与同步 -
• Linxu 小技巧 - 使用 nsenter 在主机上调试容器 -
• 补几张 VXLAN 的图 -
• Linux 网络基础知识 - VXLAN 原理介绍 -
• Linux 基础知识 - 一文学会网络虚拟化 -
• Linux 基础知识:连接跟踪 conntrack 入门 -
• Linux 小技巧 - 使用 iftop 监控实时端口流量 -
• Linux 小技巧 - 使用 ab 命令做性能压测 -
• 一文搞清楚操作系统中的锁 -
• 使用 lstopo 查看服务器逻辑拓扑结构 -
• 通用 CPU 性能基准测试研究综述 -
• 【转载】主流 CPU 性能比较(Hygon7280、Intel、AMD、鲲鹏 920、飞腾 2500) -
• Linux 环境为什么文件迁移完成后,源端与目的端文件大小不一致? - “文件空洞”解析 -
• Linux 小知识:ls -l 命令的输出中目录的大小是什么含义? -
• 好书推荐 - 《深入理解 Linux 网络》 -
• Linux 基础知识:CPU Usage 和 System Load 的关系 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• Linux 基础知识 - 内存水位线 -
• 好文推荐 - 掌握 Linux 内存故障追踪:技术指南 -
• Linux 基础知识 - CPU 上下文切换 -
• Linux 小技巧 - 在 fstab 文件中配置 UUID 方式自动挂载(防止盘符漂移导致挂载失败) -
• Linux 基础知识 - The LinuxProcess Journey -
• nmi_watchdog:Softlockup 与 hardlockup 检测机制 -
• 禁用/启用 SMT 引发的 CGroup 绑定 CPU 的问题 -
• Linux 小技巧 - 如何杀死僵尸进程 -
• 容器技术国产化 - 从 500 行 C 代码到生产级容器运行时 -
• Linux 基础知识 - LVM 逻辑卷管理器介绍 -
• The State of eBPF - 2024 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• Linux 小技巧 - 模拟 Docker hang 住 -
• Linux 小技巧 - 查看所有的内核进程 -
• Linux IO Scheduler: noop/deadline/cfq/bfq 到 blk-mq -
• Linux 基础知识 - 进程组、作业和会话 -
• 容器技术回顾 - 节点资源预留让节点更加稳定 -
• Linux 可观测性 - 你真的了解 Linux Load Average 吗? -
• 容器技术回顾 - 如何修改容器的内核参数 -
• 容器技术回顾 - 使用 UDS 实现 Pod 间通信 -
• 容器技术回顾 - Linux 内存文件系统 -
• 容器技术回顾 - 多 Pod 间共享内存通信 -
• 容器技术回顾 - 从一个“D”状态容器进程回顾 cgroup freezer 子系统 -
• 容器技术回顾 - 如何让我的容器/进程不要被 OOM Kill? -
• 为什么同样使用 2 个 vCPU 的 App 在 VM 中比在容器中运行的快? -
• 为什么同样使用 2 个 vCPU 的 App 在 VM 中比在容器中运行的快? -
• 容器技术回顾(六) - 容器与主机共享内核是什么含义? -
• 容器技术回顾 - Kubernetes memory limit 产生的 OOM -
• 容器技术回顾 - Kubernetes CPU request 和 limit 的作用与原理 -
• 容器技术回顾 - 什么是优雅关闭以及如何实现 -
• 容器技术回顾 - 容器中的 0 号进程和 1 号进程 -
• Linux 系统 - 进程管理入门 -
• 《BPF 之巅》读书笔记 - Linux 内核锁 -
• 《BPF 之巅》读书笔记 - 使用 perf + perf-agent-map 制作容器化 Java 火焰图 -
• 周末学习 -《BPF 之巅:洞悉 Linux 系统和应用性能》汇总 -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记(四)火焰图 -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记(三)Linux Kernel 相关知识 -
• 《BPF 之巅》读书笔记(二)番外篇 - Linux 存储软件栈 -
• 《BPF 之巅》读书笔记(一)Linux Tracing System -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记开篇 -
• 系统性的学习 Linux Systems Performance -
• Linux 小技巧 - 删除大量文件
#Linux 小技巧
-
• Linux 内核版本变更记录查看指南 -
• 为何挂载失败?搞懂 systemd 与 fstab 的管理机制与常见坑 -
• Linux 小技巧 - 使用 iostat 监控磁盘性能 -
• AWK 入门教程:强大的文本处理工具 -
• Linux FUSE 文件系统的相关一些管理操作 -
• Linux 基础知识 - 软链接 vs. 硬链接 -
• Linux 小技巧 - 使用 smem 了解内存使用情况 -
• Linux 删除文件或者目录时,出现“Operation not permitted” ,如何解决? -
• 你看到的内存占用是真的吗? -
• Linux 小技巧 - 使用 iftop 监控实时端口流量 -
• Linux 小技巧 - 使用 ab 命令做性能压测 -
• Linux 小技巧 - SIGTERM 与 SIGKILL:有什么区别? -
• Linux 小技巧 - 删除大量文件
#LLM
-
• Kubernetes AIOps 大模型能力评估框架 -
• AIOps 大模型构想:后训练技术与潜在实践路径 -
• 基于上下文工程的 LangChain 人工智能智能体应用 -
• 上下文工程(Context Engineering)原理简介 -
• 成功使用 AI 编程的三大关键要素以及综合项目实战(一) -
• 《Trae 编程实战》课程提纲 -
• 支持多轮对话指代消解的 ChatBot 系统:架构设计与实现详解 -
• AI 智能体记忆系统:理论与实践(包含 MemoryOS 介绍) -
• 多智能体 AI 系统基础:理论与框架 -
• 使用大模型智能写作实现《Linux 基础课程》教案 -
• 基于 ReAct Agent 模式的技术博客撰写系统设计方案 -
• Cursor ReAct Agent 技术架构深度分析 -
• 知乎问题:大模型的 Embedding 层和独立的 Embedding 模型有什么区别? -
• AI 智能阅读助手:深入了解 Google NotebookLM 的强大功能 -
• 微软 NLWeb:用自然语言重新定义 AI 网站开发 -
• 聊聊 AI 编程工具的护城河:从 Cursor 这个案例说起 -
• 让用户"说半句"话也能懂:ChatBox 的意图识别与语义理解机制解析(探讨) -
• 大模型文件格式完整指南 -
• Mooncake 架构概览:以 KVCache 为中心的高效 LLM 推理系统设计 -
• 英伟达发布低延迟分布式推理框架 Dynamo,赋能 AI 模型规模化推理 -
• 吴恩达最新课程 《MCP:使用 Anthropic 构建富上下文 AI 应用》现已上线 -
• 混合专家系统(MoE)图解指南之好书推荐:《图解大模型:生成式 AI 原理与实践》 -
• 零基础入门大模型微调 -
• vLLM + LWS:Kubernetes 上的多机多卡推理方案 -
• LangGraph 实战:用 Python 打造有状态智能体 -
• 使用 n8n 构建多智能体系统的实践指南 -
• DeepWiki 使用方法与技术原理深度分析 -
• 一文入门垂域模型 SFT 微调 -
• 开源大模型应用编排平台:Dify、AnythingLLM、Ragflow 与 n8n 的功能与商用许可对比分析 -
• 好书推荐 - 《大规模语言模型:从理论到实践(第二版)》 -
• MCP-K8s 实践:构建大模型驱动的 Kubernetes 运维管理能力 -
• 深度解析 MCP 与 AI 工具化的未来 -
• LangChain + 模型上下文协议(MCP):AI 智能体 Demo -
• MCP、Function Calling 有什么区别?与 AI Agent 有什么关系? -
• 好书推荐《大模型应用开发极简入门》 -
• 【转载】MCP(Model Context Protocol)全面研究报告:概念、实践与未来趋势 -
• Chroma 技术报告 - Evaluating Chunking Strategies for Retrieval 总结 -
• LLM 嵌入技术详解:图文指南 -
• 基于大型语言模型的意图检测 -
• Qwen2 大模型指令微调入门实战 -
• 学习总结 - RAG 快速开发实战 - 《02 |从 0 到 1 快速搭建 RAG 应用》 -
• 提示词工程 vs RAG vs 微调 -
• 混合专家系统(MoE)图解指南 -
• 大模型量化技术(Quantization)可视化指南 -
• 一文了解思维链(Chain-of-Thought, CoT) -
• 大模型时代,智能体崛起:从技术解构到工程落地的全栈指南 ——《大模型技术 30 讲》 -
• AI Agents for Beginners 课程之 AI Agent 及使用场景简介 -
• 什么是大模型的幻觉?用户如何应对呢? -
• 上海人工智能实验室开源工具 MinerU 助力复杂 PDF 高效解析提取 -
• 深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 -
• DeepSeek Open Infra 开源五天乐及好书《动手学机器学习》推荐 -
• Hello, DeepSeek Open Infra! -
• 万字长文深入浅出文本嵌入(Text-Embedding)技术 -
• Google Cloud 的免费生成式 AI 课程 -
• 解密大语言模型中的 Tokens -
• 全系列 DeepSeek R1 模型单机部署配置要求 -
• 基于大语言模型的文本分类实践 -
• 4090 单卡跑满血版 DeepSeek-R1,清华团队开源项目再破大模型推理门槛 -
• 关于 DeepSeek:五大误解与真相解读 -
• DeepSeek 蒸馏模型简易性能 benchmark -
• 大模型辅助 “Diagram as Code” 设计范式初探 -
• 过年八天乐 - 读者来信:请问 7b 阅读分析不同中医古籍的能力怎么样?可以进行专项训练大幅度提高这方面能力么? -
• 过年八天乐 - DeepSeek 1.5b、7b 和官网模型快速对比 -
• 过年八天乐 - 在 Mac 上运行 DeepSeek-R1 模型 -
• 使用 Spring AI 高效构建 LLM 代理(第一部分) -
• Microsoft AutoGen:具有高级自动化功能的多代理 AI 工作流 -
• 大模型安全之“字节一实习生。。。对算力分配不满、发起恶意攻击。。。被开除”大瓜 -
• 面向大语言模型的检索增强生成技术:综述 [译] -
• Awesome LLM RAG 学习材料 -
• 深度学习(大模型)中的精度 -
• AI Infra 论文:使用 AI 做 vAttention 论文翻译尝鲜 -
• LLM 小技巧 - 在 Mac 上运行大语言模型 -
• 用 Transformers 处理自然语言:创建基于 Hugging Face 的文本内容处理程序 -
• 推荐 - 《大模型技术栈》让我们快速建立起大模型知识体系 -
• 强烈推荐几篇 vLLM 原理及源码解析文章
#RAG 实战
#SRE
-
• 推荐 - SRE 精英联盟发布的《SRE 实践白皮书》1.0.5 版本 -
• 生产环境 Java 程序内存占用过高的问题排查 -
• 【得物技术】一次 K8s 故障诊断:从 CPU 高负载到存储挂载泄露根源揭示
#Tech News
-
• OpenAI 【2024 年 12 月 11 日】停服事件复盘 -
• 归还一座岛屿导致“ .io ”顶级域名面临消失风险,从而影响海量网站和软件 - 让我们一探这可能的黑天鹅事件 -
• 喜大普奔 - 国内可以直接下载 Docker 官方镜像了!!! -
• 老万> 深度吐槽 CrowdStrike 事故报告 -
• 新范式:AIGC 推动的数据要素产业价值促进创新 -
• 阿里云 11.12 事故报告:【AK 异常】
#云原生
#分布式系统
-
• 读《数据密集型应用系统设计》,学分布式系统~! -
• 送书了 - 《数据密集型应用系统设计》 -
• Deepseek 3FS( Fire-Flyer File System)设计笔记 -
• 极客时间《大数据经典论文解读》:建立你的大数据知识网络
#南京大学
#基础知识
#大数据
-
• 从数据仓库到湖仓一体:现代数据架构的演进与原理 -
• 从 40 亿整数到 HBase:一个 Membership Test 问题的抽象与演化 -
• 大数据理论与实践总结课程总结 - 从数据仓库到湖仓一体 -
• 从 ETL 到流式计算:理论与实践入门 -
• Spark on Kubernetes 简介 -
• Feed 流系统架构发展综述 -
• LSM Tree MemTable 的核心结构 SkipList:原理、优势与高并发实现 -
• Google Bigtable: 分布式结构化数据存储系统深度解析与架构实现 -
• Apache Spark 设计与实现(一) -
• Java LSM Tree 14 天循序渐进学习计划 -
• Java LSM Tree 学习之第一天完成总结 -
• LSM Tree 再入门 -
• MapReduce 分布式计算框架:从理论到实践的完整指南 -
• HDFS 常见操作教学指南 -
• HDFS 架构原理、读写流程与性能优化深度解析 -
• HDFS 分布式文件系统原理与设计 -
• Google File System (GFS):大规模分布式存储系统的设计与实现 -
• ZooKeeper Leader 选举机制详解 -
• 列式存储的 Repetition Level 与 Definition Level -
• 大数据中的「文件格式」vs. 「表格格式」 -
• 大数据基础之 Parquet 文件格式解析 -
• RocksDB 工作原理入门 -
• 极客时间《大数据经典论文解读》:建立你的大数据知识网络 -
• 列式存储 vs 行式存储:它们之间的本质区别在哪里? -
• 跟着论文学习数据库 03:数据库行业论文清单 -
• 理性看待数据库/大数据 on K8s
#大模型
-
• LLM 小技巧 - 在 Mac 上运行大语言模型 -
• 用 Transformers 处理自然语言:创建基于 Hugging Face 的文本内容处理程序 -
• 推荐 - 《大模型技术栈》让我们快速建立起大模型知识体系 -
• 【重磅推荐】大模型基础 - Deep Learning System & AI System -
• 从 Kubernetes Pod 的故障诊断需求评价 K8sGPT 的 Pod analyzer 的实现 -
• 插上 AIGC 翅膀的 Kubernetes AIOps 工具 - K8sGPT -
• 复旦大学奇书《大规模语言模型:从理论到实践》- 第 1 章 绪论
#好书推荐
-
• 《动手学大模型智能体》by 上海交大 -
• 深度解析:从原理到工程化落地——读《生成式 AI 开发揭秘》 -
• 《Generative AI in Action》深度导读:从概念到企业级落地实战指南 -
• 好书推荐:《Cursor 与 MCP 快速入门》- 让每个人都能成为 AI 时代的创造者 -
• 好书《AI Engineering》 抢先读 -
• Python 编程新经典:从基础到高级的 Pythonic 编程指南 -
• 当 AI 开始"反向测试"人类:《大语言模型》揭示智能革命的深层奥秘 -
• 好书推荐 - 《MCP 开发从入门到实战》 -
• 豆瓣 9.5 分神作来袭!《深度学习入门 5:生成模型》——"鱼书"系列第 5 部震撼登场 -
• 程序员效率革命!《Cursor 与 Copilot 开发实战》让你的编程速度飞起来 -
• 宇树科技创始人王兴兴重磅推荐:《大模型应用开发 RAG 实战课》——打造面向实践的智能系统技术全景图 -
• 大模型时代为什么需要一本深度学习教科书?揭秘《深度学习:基础与概念》的独特价值 -
• 《百面大模型》打通大模型求职与实战的关键一书 -
• 好书推荐 - 普通人也能立刻上手的 AI 工具书:《DeepSeek 极速上手》 -
• 不写代码,也能做开发?这本书教你用 Cursor 开启 AI 编程新时代 -
• 五一五天乐 - 大模型相关好书推荐汇总 -
• 好书推荐 - 《大规模语言模型:从理论到实践(第二版)》 -
• 好书推荐 -《云原生数据库:原理与实践》 -
• 好书推荐 | 《从零构建大模型》:从理论到实践,手把手教你打造自己的大语言模型 -
• 原力注入公众号全篇合集一文读尽(截止 2025 年 4 月 9 日) -
• MCP、Function Calling 有什么区别?与 AI Agent 有什么关系? -
• 好书推荐《大模型应用开发极简入门》 -
• 文本特征向量化:词袋模型、Word2Vec 以及 TF-IDF 介绍 -
• 《精通特征工程》:让数据真正为模型赋能 -
• 大模型量化技术(Quantization)可视化指南 -
• 读《数据密集型应用系统设计》,学分布式系统~! -
• 送书了 - 《数据密集型应用系统设计》 -
• 好书推荐 - 《分布式系统应用设计》 -
• 好书推荐 - 《信息存储与管理(第二版):数字信息的存储、管理和保护》 -
• FUSE 文件系统 - 使用 securefs 实现文件系统透明加解密 -
• 好书推荐:软件设计的哲学(第二版) -
• 开箱视频 | 第二本 560 页新书《深入理解 Linux 进程与内存》今天正式发布啦! -
• 重磅!《大语言模型》新书出炉,人大出版 -
• 【重磅福利】《深入理解文件系统原理和实践》新书开源下载 -
• 好书推荐 - 《深入理解 Linux 网络》 -
• 新书推荐 - 《边缘云部署与运营:系统性实现方法》(博主翻译) -
• 好书推荐 - 《自己动手写 docker》 -
• 好书推荐 -《Hello 算法》 -
• 【大规模语言模型-从理论到实践】出纸质书了! -
• 《Design Data-Intensive Applications》相关资料分享 -
• 《BPF 之巅:洞悉 Linux 系统和应用性能》读书笔记开篇
#存储
-
• 存储知识拾遗:LVM && Device Mapper -
• ODCC RAID 卡性能测试技术报告 (附批注) -
• Linux /dev 目录揭秘 -
• 【原理篇】《BPF 性能之巅》如何快速分析系统的 I/O 瓶颈? -
• 好文推荐 - RAID 技术介绍 -
• Linux 基础知识 - LVM 逻辑卷管理器介绍
#存储引擎
-
• LSM Tree MemTable 的核心结构 SkipList:原理、优势与高并发实现 -
• 大数据基础之 Parquet 文件格式解析 -
• RocksDB 工作原理入门 -
• 列式存储 vs 行式存储:它们之间的本质区别在哪里?
#应用上云
-
• 华为云业务上云 - 卓越架构技术框架简介 -
• 应用上云 - Azure 官方 Java 容器化策略文档 -
• Java Spring 应用如何更好地在 Kubernetes 上运行? -
• Kubernetes:如何实现应用零宕机? -
• Kubernetes 上运行 Spring 生产应用的注意事项
#旅游
#智能 Agent
-
• KAG:基于知识增强生成的大语言模型逻辑推理与问答框架 -
• Synergized LLMs + KGs 教学:银行反电诈智能系统设计方案与 Demo 实现 -
• 从硅谷杀出的 AI 记忆革命:MemMachine 如何重新定义智能体交互体验 -
• 又开发了一个 MCP Server,用于参考文献和引用的格式化 -
• DIY:基于 MCP 协议集成 Kimi 模型实现图片文字识别 -
• 【Anthropic】面向 AI 智能体的高效上下文工程 -
• 从文本到语义:让智能体高效处理 Markdown 的结构化语义中间层 -
• 从零构建 MCP 服务:为 TRAE IDE 添加智能 Markdown TOC 处理能力 -
• 【论文解读】A Survey on Agent Workflow – Status and Future -
• 科研助手 Agent 需求分析 -
• AI Agent 基础设施——三个决定性层次:工具、数据、编排 -
• AI Agent 基础设施的崛起 -
• 论文解读:深度研究智能体(Deep Research Agents)的定义与核心能力 -
• 深度解读「通义 DeepResearch」:ReAct 范式驱动的智能 Agent 架构 -
• 订单履约 Agent 系统设计文档(一) -
• 订单履约 Agent 需求分析 -
• 《Building Research Agents for Tech Insights》深度解读 -
• 【文章合集】AI 智能体记忆系统 -
• AI 记忆系统 Mem0 快速入门 -
• 12-Factor Agents - 构建可靠 LLM 应用的原则 -
• Databricks Assistant Data Science Agent 使用场景解读 -
• Agentic RAG 实现案例:技术博客撰写智能体设计方案 -
• MCP-K8s 实践:构建大模型驱动的 Kubernetes 运维管理能力 -
• 深度解析 MCP 与 AI 工具化的未来 -
• LangChain + 模型上下文协议(MCP):AI 智能体 Demo -
• MCP、Function Calling 有什么区别?与 AI Agent 有什么关系? -
• Cline 55k 系统提示词刷新了我对提示词工程的认知 -
• 【转载】MCP(Model Context Protocol)全面研究报告:概念、实践与未来趋势 -
• 大模型时代,智能体崛起:从技术解构到工程落地的全栈指南 ——《大模型技术 30 讲》 -
• AI Agents for Beginners 课程之 AI Agent 及使用场景简介
#机器学习
-
• 贝叶斯垃圾邮件过滤器简介 -
• 理解机器学习中的误差与残差:一个生活化的解释 -
• 梯度下降算法:从直觉到实践 -
• 非线性分类入门经典:神经网络是怎么学会异或的? -
• 深度学习概述 -
• 一文读懂隐马尔可夫模型(HMM) -
• 一文读懂贝叶斯网络 -
• 基于矩阵分解的推荐算法入门 -
• 你真的懂“损失函数”吗?一文通透机器学习中的核心概念! -
• 基于内容的推荐算法入门 -
• 协同过滤推荐算法:原理、实现与分析 -
• 推荐系统入门 -
• 【极客时间】零基础实战机器学习 - RFM 模型在用户消费行为分析中的应用 -
• 文本特征向量化:词袋模型、Word2Vec 以及 TF-IDF 介绍 -
• 《精通特征工程》:让数据真正为模型赋能 -
• 动手学机器学习层次聚类算法 -
• 动手学机器学习 Kmeans 聚类算法 -
• 动手学机器学习随机森林算法 -
• 动手学机器学习朴素贝叶斯算法 -
• 动手学机器学习逻辑回归算法 -
• 动手学机器学习支持向量机 -
• 动手学线性回归算法 -
• 分类模型评估工具 - 混淆矩阵 -
• 动手学决策树算法 -
• KNN 算法简介 -
• DeepSeek Open Infra 开源五天乐及好书《动手学机器学习》推荐 -
• 啤酒与尿布的故事,以及背后的 Apriori 算法
#杂项
#模型
#系统可观测性
-
• 鲲鹏性能优化十板斧 -
• 文件性能测试工具 IOzone 使用简介 -
• Linux Slab 内存管理机制简介 -
• 性能调优:学无止境 -
• Linux 小技巧 - 使用 smem 了解内存使用情况 -
• 可观察性 vs 监控「双语」 -
• BPF 入门学习资料汇总 -
• 使用 lstopo 查看服务器逻辑拓扑结构 -
• 通用 CPU 性能基准测试研究综述 -
• 使用 iodump 一步定位磁盘 IO Util 高的元凶 -
• 《BPF 性能之巅》- 使用 perf tools 定位磁盘 IO util 高问题 -
• 《性能之巅》系统可观测性综述 -
• 《BPF 性能之巅》- 使用 perf tools 做性能分析(1) -
• 好文推荐 - 掌握 Linux 内存故障追踪:技术指南 -
• 性能分析实战篇 - Linux 网络性能优化指南 -
• 【实战篇】使用火焰图定位 jbd2 进程导致系统负载高问题 -
• Linux 性能分析课程推荐 -
• Linux 可观测性 - 你真的了解 Linux Load Average 吗? -
• Linux 性能分析课程推荐 -
• 《可观测性成熟度模型白皮书》解读
#网络基础知识
-
• 深入理解 Linux Bond:原理与实践 -
• 网络收发路径上的一些冷知识 - 参数单位 -
• Linux 网络优化:RPS 和 RFS 技术概述 -
• 快速了解 TCP 连接的 11 种状态及其转换 -
• Linux 网络参考书籍推荐 -
• 网络协议分析神器 - tcpdump 简介及抓取 HTTP Header 实战 -
• I/O 多路复用与网络服务器并发策略 -
• 来自《Broadcom 以太网网络适配器用户指南》中提到的「 Linux 命令」 -
• Linux 网络收发包路径简介 -
• 容器技术回顾:消失的 Docker 网络命名空间 -
• 《Linux 网络编程》第四章进程间通信(4)- System V IPC -
• 《Linux 网络编程》第四章进程间通信(3)- 文件和记录锁定 -
• Kubernetes 网络和 Cilium:网络工程师手册 -
• 【Kubernetes 网络】好书推荐 -
• 《Linux 网络编程》第四章进程间通信(2)- 管道 -
• 《Linux 网络编程》第四章进程间通信(1)- 信号 -
• Linux 网络基础知识 - 网络命名空间动手实践(一) -
• 补几张 VXLAN 的图 -
• Linux 网络基础知识 - VXLAN 原理介绍 -
• Linux 基础知识 - 一文学会网络虚拟化 -
• Kubernetes 网络和安全简介(一) -
• 好书推荐 - 《深入理解 Linux 网络》 -
• 性能分析实战篇 - Linux 网络性能优化指南
#虚拟化

