文章标签

Kernel

拒绝重启：Linux 内存分配策略的动态调优实战

在生产环境中，系统稳定性压倒一切。当业务流量突增导致内存压力过大，或者发现内核默认的内存分配策略不符合特定应用（如高性能数据库）的需求时，“重启”往往是最无奈的选择。实际上，Linux 内核提供了丰富的接口，允许我们在不中断业务的情...

2026/4/17 0 106 0 0 0 Linux内核性能优化内存管理
内核升级后显卡驱动又挂了？深度解析 ELRepo kmod 机制：实现驱动与内核的“解耦”

在 Linux 运维或深度开发中，最让人头疼的场景之一莫过于：刚执行完 yum update 重启系统，发现显卡驱动崩溃了。对于使用 NVIDIA 显卡进行深度学习或高性能计算的同学来说，这通常意味着原本配置好的环境瞬间瘫痪，甚至面临...

2026/4/18 0 238 0 0 0 Linux内核 ELRepo 显卡驱动
eBPF零侵入监控实战：在内核层捕获微服务黄金信号的完整方案

分布式系统的可观测性建设长期面临两难选择：侵入式APM（Application Performance Monitoring）虽然功能完善，但需要在业务代码中埋点或引入Sidecar，带来代码侵入、版本依赖、资源开销等问题；而传统的网络层...

2026/4/10 0 176 0 0 0 eBPF 分布式追踪 Linux内核
巧用eBPF：无需修改内核，精准监控进程网络连接延迟

在现代微服务架构和云原生环境中，监控应用程序的网络性能至关重要。网络延迟是影响用户体验的关键因素之一。本文将介绍如何使用eBPF（extended Berkeley Packet Filter）技术，在不修改内核代码的前提下，精准监控特定...

2025/6/22 0 408 0 0 0 eBPF 网络监控性能分析
解剖Metal几何革命：【Mesh Shader + Meshlet】从硬件原理到工程淬炼全指南

传统 Vertex-Fragment 管线在面对数千万多边形场景时遭遇了指令分发瓶颈——无论模型复杂程度如何固定阶段的流水线都需要遍历所有顶点即使大部分顶点最终被剔除这是典型的CPU时代思维 Apple在2022年引入的 Mesh...

2026/5/4 0 203 0 0 0 Metal API 网格着色器
深入NUMA：边缘AI轻量级模型内存访问模式评估与性能调优实战

在当下AI无处不在的浪潮中，将大型模型“瘦身”后下放到边缘设备，进行实时、低延迟的推理，已经成为一股不可逆的趋势。我们把这些经过剪枝（Pruning）或蒸馏（Distillation）处理的“轻量级大模型”部署到资源有限的边缘服务器或特定...

2025/7/29 0 495 0 0 0 NUMA优化边缘AI 内存访问
突破网络吞吐瓶颈：DPDK 与 Linux NAPI 的零拷贝及内核旁路技术深度对比

在万兆（10GbE）、百万兆（100GbE）网卡已成为数据中心标配的今天，传统的 Linux 内核网络栈正面临着严峻的挑战。当网线上的数据包以每秒千万级（PPS）的速度涌入服务器时，网络协议栈的开销（如中断处理、内存拷贝、上下文切换）会迅...

2026/5/23 0 163 0 0 0 DPDK Linux内核网络优化
利用 eBPF 实现无侵入 K8s 四/七层流量拓扑：从内核 Hook 到 K8s 元数据关联的落地指南

在微服务架构中，搞清楚“谁在调用谁、调用频次如何、延迟有多高”是保障系统稳定性的前提。传统的 APM 方案（如 SkyWalking、Jaeger）通常需要业务方埋点、引入 Agent 或注入 Sidecar。这不仅带来了额外CPU/内存...

2026/5/25 0 74 0 0 0 eBPF Kubernetes 流量拓扑
eBPF vs iptables：Service Mesh 流量劫持性能极限对比实测

在 Service Mesh 架构中，Sidecar 代理的流量劫持方式直接影响整个服务网格的延迟和吞吐量。传统的 iptables方案虽然成熟稳定，但在高并发场景下会面临显著的转发开销。本文通过实际压测，对比 eBPF 和 iptabl...

2026/6/1 0 109 0 0 0
裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

在裸金属（Bare-metal）环境下部署 Kubernetes 时，网络性能往往决定了整个集群的吞吐上限和延迟下限。传统的 CNI（如 Flannel、Calico）默认依赖 Linux 虚拟网桥、iptables 或 IPVS。这些机...

2026/6/1 0 86 0 0 0 eBPF Kubernetes CNI
高密度Pod集群nf_conntrack调优：安全扩容与无损热升级实战

先厘清一个常见误解很多人看到 nf_conntrack_full 告警，第一反应是"conntrack_max太小"。但实际上，瓶颈往往不在 max 值本身，而在 bucket 数量。 nf_con...

2026/6/2 0 79 0 0 0 Kubernetes ConnTrack Linux内核
从内核到源码：Cgroup v2 如何终结 Containerd 高并发创建容器时的锁冲突

在 Kubernetes 节点进行大规模、高并发的 Pod 扩容或执行短期批处理任务（如 Serverless 函数计算）时，系统耗时往往会发生非线性暴涨。通过 perf 或 bcc/bpftrace 工具抓取内核热点，通常会发现...

2026/6/7 0 128 0 0 0 Cgroup v2 Containerd runc
挖掘 Windows 内核：用 WinDbg 探秘 APC 机制与线程唤醒的调度内幕

在 Windows 内核调优、驱动开发或排查死锁挂起等高级调试场景中，我们经常会遇到线程无法被正常唤醒的情况。许多时候，这背后的隐形推手就是 APC（Asynchronous Procedure Call，异步过程调用）。 APC...

2026/6/11 0 110 0 0 0 WinDbg APC机制内核线程调度
深度解析 Linux Direct Reclaim 导致 Java 应用 JVM GC 停顿与假死的底层机制

在日常的高并发 Java 服务维护中，你可能遇到过一种诡异的“假死”现象：系统监控显示 Java 进程的 CPU 使用率极低，但业务请求全部超时；查看 GC 日志，发现一次普通的 Young GC（甚至是 Mixed GC）停顿时间（ST...

2026/6/14 0 79 0 0 0 Linux JVM 内存管理
基于eBPF的容器运行时安全：系统调用追踪与实时告警实践

容器技术在现代应用开发和部署中扮演着至关重要的角色。然而，容器的普及也带来了新的安全挑战。由于容器共享主机内核，容器内的恶意行为可能会影响整个系统。为了增强容器安全性，我们需要一种能够实时监控和分析容器内部行为的机制。eBPF（扩展伯克利...

2025/6/20 0 2218 0 0 0 eBPF 容器安全系统调用追踪
Kubernetes服务网格演进趋势：Istio、Linkerd、Cilium及eBPF的对比与应用

作为一名在云原生领域摸爬滚打多年的老兵，我见证了Kubernetes（K8s）生态的蓬勃发展。服务网格（Service Mesh）作为K8s的重要组成部分，也在不断演进。今天，我就来和大家聊聊K8s中服务网格的演进趋势，深入对比几款主流的...

2025/5/12 0 646 0 0 0 Kubernetes Service Mesh eBPF
万亿参数级AI模型推理：NUMA内存墙与分片、同步、数据流优化实践

作为一名深耕高性能计算和AI基础设施的工程师，我深知当我们将万亿参数级别的多模态AI模型推向生产环境时，那些看似微不足道的系统瓶颈会如何放大，最终成为横亘在推理性能面前的“内存墙”。尤其是在现有的非统一内存访问（NUMA）架构下，这个问题...

2025/7/29 0 381 0 0 0 AI推理内存墙 NUMA架构
eBPF 实战：如何用它给 Kubernetes Service 做实时流量分析和自动伸缩？

在云原生时代，Kubernetes 已经成为容器编排的事实标准。但随着业务的增长，如何有效地监控和管理 Kubernetes 集群中的服务，并根据流量变化动态调整资源，成为了一个重要的挑战。今天，我们来聊聊如何利用 eBPF（extend...

2025/4/27 0 451 0 0 0 eBPF Kubernetes Service
高斯过程回归与模型集成：打造更强大的预测模型

高斯过程回归与模型集成：打造更强大的预测模型各位老铁，今天咱们来聊聊高斯过程回归 (Gaussian Process Regression, GPR) 和模型集成这个话题。相信在座的各位都是机器学习领域的行家里手，对模型融合的强大威...

2025/3/25 0 615 0 0 0 高斯过程模型集成机器学习
eBPF实战：用户级文件访问审计与报告生成

在Linux系统中，对用户的文件访问行为进行审计对于安全监控和合规性检查至关重要。传统的审计方法通常依赖于Auditd等工具，但这些工具可能会引入较大的性能开销。eBPF（扩展伯克利包过滤器）提供了一种更高效、更灵活的方式来实现用户级的文...

2025/6/21 0 294 0 0 0 eBPF 安全审计 Linux内核

文章标签

Kernel

拒绝重启：Linux 内存分配策略的动态调优实战

内核升级后显卡驱动又挂了？深度解析 ELRepo kmod 机制：实现驱动与内核的“解耦”

eBPF零侵入监控实战：在内核层捕获微服务黄金信号的完整方案

巧用eBPF：无需修改内核，精准监控进程网络连接延迟

解剖Metal几何革命：【Mesh Shader + Meshlet】从硬件原理到工程淬炼全指南

深入NUMA：边缘AI轻量级模型内存访问模式评估与性能调优实战

突破网络吞吐瓶颈：DPDK 与 Linux NAPI 的零拷贝及内核旁路技术深度对比

利用 eBPF 实现无侵入 K8s 四/七层流量拓扑：从内核 Hook 到 K8s 元数据关联的落地指南

eBPF vs iptables：Service Mesh 流量劫持性能极限对比实测

裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

高密度Pod集群nf_conntrack调优：安全扩容与无损热升级实战

从内核到源码：Cgroup v2 如何终结 Containerd 高并发创建容器时的锁冲突

挖掘 Windows 内核：用 WinDbg 探秘 APC 机制与线程唤醒的调度内幕

深度解析 Linux Direct Reclaim 导致 Java 应用 JVM GC 停顿与假死的底层机制

基于eBPF的容器运行时安全：系统调用追踪与实时告警实践

Kubernetes服务网格演进趋势：Istio、Linkerd、Cilium及eBPF的对比与应用

万亿参数级AI模型推理：NUMA内存墙与分片、同步、数据流优化实践

eBPF 实战：如何用它给 Kubernetes Service 做实时流量分析和自动伸缩？

高斯过程回归与模型集成：打造更强大的预测模型

eBPF实战：用户级文件访问审计与报告生成