文章标签

云原生践行者

Kubernetes DRA：打破 AI 推理算力调度的“静态”瓶颈

在当前的 AI 大模型时代，异构算力（如 GPU、NPU、FPGA）的调度效率直接决定了推理服务的成本与响应速度。长期以来，Kubernetes 社区主要依赖 Device Plugin 机制来管理这些硬件资源。然而，随着 AI 推理...

2026/4/12 0 117 0 0 0 Kubernetes AI推理资源调度
拒绝内存爆炸：Istio 大规模集群下 Envoy XDS 裁剪实战指南

在 Service Mesh 的落地过程中，很多架构师会面临一个尴尬的局面：随着微服务数量的增加，Istio 的 Sidecar（Envoy）内存占用呈线性甚至指数级增长。在一个拥有 1000 个服务、每个服务 10 个实例的集群中...

2026/5/12 0 103 0 0 0 Istio Envoy 性能优化
架构师的抉择：Proxy-Wasm 还是 Lua？深剖 Envoy 扩展在高并发下的长尾延迟

在云原生网关和 Service Mesh 的实践中，Envoy 的可扩展性一直是其核心竞争力。无论是处理复杂的鉴权逻辑，还是实现动态的流量分发，开发者往往需要在 Envoy Lua 和 Proxy-Wasm 之间做出选择。然...

2026/5/12 0 89 0 0 0 Envoy 长尾延迟
深度解析 Rego 引擎：为什么你的 OPA 策略在数据量大时会变慢？

在云原生架构中，Open Policy Agent (OPA) 已经成为了策略引擎的事实标准。无论是 Kubernetes 的准入控制（Admission Control），还是微服务架构中的细粒度鉴权（RBAC/ABAC），Rego 语...

2026/5/16 0 78 0 0 0 Rego性能优化云原生安全
K8s 进阶指南：BuildKit 深度优化——缓存加速与 Rootless 无根化安全实践

在云原生 CI/CD 体系中，镜像构建是耗时最长、安全风险最高的环节之一。传统的 Docker-in-Docker (DinD) 方案不仅需要高风险的 privileged: true 特权模式，还常常因为无法跨 Pod 共享缓存而导...

2026/5/18 0 274 0 0 0 Kubernetes BuildKit 容器安全
Kubernetes云成本优化：Pod资源精细化管理的实战策略

在云原生时代，Kubernetes已成为企业部署和管理应用的核心平台。然而，随之而来的云成本管理也成为了一个日益凸显的挑战。尤其对于Kubernetes集群，如果不对Pod的资源配置进行精细化管理，很容易造成资源浪费，直接体现在高昂的云账...

2025/9/20 0 275 0 0 0 Kubernetes 成本优化资源管理
当 K8s 遇上 Cilium：生产环境下替换 kube-proxy 的避坑指南与性能调优

在 Kubernetes 集群规模达到数百个节点、Service 数量突破万级时，传统的 kube-proxy （无论是 iptables 还是 IPVS 模式）都会遭遇明显的性能瓶颈。iptables 的 $O(N)$ 逐条匹配在大规...

2026/5/24 0 155 0 0 0 Kubernetes Cilium eBPF
大规模 K8s 集群中 RunPodSandbox 频繁超时的深层诱因与落地调优指南

在 Kubernetes 集群规模迈向数百甚至数千个节点时，平台工程师或 SRE 经常会遭遇一个经典而顽固的“幽灵故障”：新调度的 Pod 长期卡在 ContainerCreating 状态，查看 Kubelet 日志或 K8s Ev...

2026/6/6 0 111 0 0 0 Kubernetes CNI
深入内核：如何利用 eBPF 诊断 Kubernetes 容器网络延迟与瓶颈

在云原生架构中，Kubernetes 容器网络的复杂性常常让排查工作变成一场噩梦。多层虚拟化网络设备（Bridge、Veth-pair、OVS）、复杂的网络策略（NetworkPolicy）、频繁的 IPVS/IPTables 规则刷新，...

2026/6/7 0 85 0 0 0 eBPF 容器网络 Kubernetes
如何在 K8s 中动态调整超大内存 Pod 的 OOM Score：自研 Controller 与 Node Agent 的落地实践

在超大规模的 Kubernetes 集群中，混部（Co-location）和高密度部署是压榨物理机资源的常见手段。然而，当大促、秒杀等高并发业务峰值到来时，集群内的流量暴涨会导致某些超大内存 Pod（如 128G+ 的 JVM、缓存服务、...

2026/6/17 0 84 0 0 0 Kubernetes Go Linux 内核

文章标签

云原生践行者

Kubernetes DRA：打破 AI 推理算力调度的“静态”瓶颈

拒绝内存爆炸：Istio 大规模集群下 Envoy XDS 裁剪实战指南

架构师的抉择：Proxy-Wasm 还是 Lua？深剖 Envoy 扩展在高并发下的长尾延迟

深度解析 Rego 引擎：为什么你的 OPA 策略在数据量大时会变慢？

K8s 进阶指南：BuildKit 深度优化——缓存加速与 Rootless 无根化安全实践

Kubernetes云成本优化：Pod资源精细化管理的实战策略

当 K8s 遇上 Cilium：生产环境下替换 kube-proxy 的避坑指南与性能调优

大规模 K8s 集群中 RunPodSandbox 频繁超时的深层诱因与落地调优指南

深入内核：如何利用 eBPF 诊断 Kubernetes 容器网络延迟与瓶颈

如何在 K8s 中动态调整超大内存 Pod 的 OOM Score：自研 Controller 与 Node Agent 的落地实践