文章标签

观测

CentOS 7 进阶指南：升级内核并开启 PSI（Pressure Stall Information）特性全记录

在进行容器化改造或高性能服务器调优时，Linux 的 PSI (Pressure Stall Information) 特性已成为监控 CPU、内存及 IO 资源压力程度的“金标准”。它可以告诉运维人员：系统由于资源短缺导致进程阻塞的...

2026/4/18 0 116 0 0 0 CentOS 7 Linux内核升级 PSI监控
从"告警风暴"到"心理安全"：SRE团队无责复盘文化如何治愈慢性焦虑

当技术降噪遇见心理瓶颈凌晨3点的第17条PagerDuty告警，又是因为那个偶发的连接池抖动。你熟练地执行重启脚本，却在工单系统里犹豫了五分钟——该标记为"已解决"还是"根因待查"？最终你选择...

2026/4/10 0 83 0 0 0 无责复盘 SRE文化心理安全
Istio 进阶：如何利用 WebAssembly 让 OPA 策略鉴权性能翻倍？

在微服务架构中， OPA (Open Policy Agent) 已成为云原生策略引擎的事实标准。然而，在 Istio 环境下，传统的 OPA 落地方式（如 Sidecar 注入或集中式鉴权服务）往往面临着难以逾越的性能鸿沟：网络延迟...

2026/5/12 0 40 0 0 0 Istio OPA
架构师的抉择：Proxy-Wasm 还是 Lua？深剖 Envoy 扩展在高并发下的长尾延迟

在云原生网关和 Service Mesh 的实践中，Envoy 的可扩展性一直是其核心竞争力。无论是处理复杂的鉴权逻辑，还是实现动态的流量分发，开发者往往需要在 Envoy Lua 和 Proxy-Wasm 之间做出选择。然...

2026/5/12 0 35 0 0 0 Envoy 长尾延迟
生产级指南：如何在 Kubernetes 中平滑升级 SkyWalking 并确保数据一致性？

在微服务架构中，SkyWalking 作为核心的可观测性平台，其稳定性直接影响到故障排查效率。在 Kubernetes (K8s) 生产环境中升级 SkyWalking，最大的挑战不在于更换镜像版本，而在于存储 Schema 的变更兼容...

2026/5/14 0 38 0 0 0 Kubernetes SkyWalking 链路追踪
OPA 与 Envoy 配合时的延迟排查指南：当判定延迟超过 10ms 时，你应该检查哪些配置？

在云原生架构中，使用 OPA (Open Policy Agent) 作为 Envoy 的外部授权服务（ext_authz）是实现细粒度接入控制的标准做法。然而，由于每一次请求都需要经过外部授权判定，其延迟（Latency）直接影响系统的...

2026/5/16 0 25 0 0 0 OPA Envoy 性能优化
彻底告别数据丢失：SkyWalking OAP 高并发场景下的性能调优实战指南

在生产环境中部署 SkyWalking 时，随着微服务规模的扩大和流量的激增，许多架构师会发现一个令人头疼的问题： Trace 数据不完整，甚至出现明显的断档。在每秒数万乃至数十万次请求（TPS）的高并发场景下，SkyWalki...

2026/5/14 0 44 0 0 0 SkyWalking 全链路追踪性能调优
突破单核瓶颈：深入解析 eBPF CPUMAP 工作原理与超大规模网络负载均衡实践

在现代超大规模数据中心和高并发网络架构中，Linux 内核网络栈的性能优化已经走过了数个分水岭。从最初的 NAPI 机制，到后来的 DPDK，再到如今成为主流的 eBPF/XDP (eXpress Data Path) 。然而，许...

2026/5/23 0 102 0 0 0 eBPF XDP 网络性能优化
深入骨髓的 eBPF/XDP 性能调优：XDP_TX 与 bpf_redirect(_map) 大流量转发性能深层对比

在现代超大规模数据中心和高性能网络边缘中， XDP (eXpress Data Path) 已经成为绕过传统内核网络栈、实现极速报文处理的事实标准。然而，当我们将 XDP 用于高性能转发（Forwarding/Gateway）场景时，开...

2026/5/23 0 112 0 0 0 eBPF XDP 网络性能优化
万级 Pod 挑战：放弃 iptables，用 Cilium eBPF 实现超大规模 K8s 网络微隔离落地实践

在大规模 Kubernetes 集群中（例如 10,000+ Pod 规模），传统的网络微隔离方案往往会遇到难以逾越的性能瓶颈。如果你仍在使用基于组件如 kube-proxy 默认的 iptables，或者试图通过原生的 Kubernet...

2026/5/24 0 43 0 0 0 Cilium Kubernetes 网络微隔离
突破网络瓶颈：高并发 K8s 中利用 eBPF 绕过 conntrack 提升 30% 吞吐量的技术实践

在超大规模或高并发的 Kubernetes (K8s) 集群中，网络性能往往会率先触及瓶颈。许多平台工程师在 QPS 达到十万级或 TCP 新建连接数（CPS）极高时，会频繁遭遇内核报错： nf_conntrack: table full...

2026/5/24 0 99 0 0 0 Kubernetes eBPF Cilium
突破单核软中断瓶颈：云服务器环境下通过 RPS/RFS 解决 Nginx 丢包实战

在公有云环境（如阿里云、腾讯云、AWS 等）中部署高并发、大吞吐量的 Nginx 网关时，你可能会遇到这样一种诡异的现象：系统整体 CPU 利用率并不高（甚至低于 30%），但 Nginx 开始出现随机的连接超时、握手失败或响应丢包；通...

2026/5/23 0 90 0 0 0 Nginx Linux内核调优软中断
拒绝割裂：XDP 与 tc BPF 协同下的高性能抗 D 架构设计与限速实践

在现代网络安全防护体系中，DDoS（分布式拒绝服务）攻击的流量量级和变化频率正以前所未有的速度增长。传统的基于 Linux 内核网络栈（如 iptables / netfilter ）的防护方案，由于在处理数据包时必须先经历硬中断、...

2026/5/26 0 46 0 0 0 eBPF DDoS防护 Linux内核
eBPF 核心 Map 结构如何在生产环境中实现无损热升级？

在生产环境中，eBPF（Extended Berkeley Packet Filter）已经成为可观测性、网络加速和安全审计的利器。然而，随着业务逻辑的演进，eBPF 程序的升级不可避免。如果仅仅是修改过滤算法或统计逻辑，直接替换 ...

2026/5/26 0 55 0 0 0 eBPF Linux内核数据迁移
深入 Linux 内核：MESI 协议与 eBPF Map 跨核访问的硬件开销分析

在现代高性能网络与系统观测场景中，eBPF（Extended Berkeley Packet Filter）凭借其运行在内核态、无需上下文切换、安全可扩展等特性，成为了技术栈中的明星。然而，许多开发者在编写高性能 eBPF 程序（如 XD...

2026/5/27 0 40 0 0 0 Linux 内核 eBPF MESI 协议
Go 内存泄漏排查实战：pprof heap 与 ReadMemStats 交叉验证指南

在 Go 语言的生产环境实践中，内存泄漏虽然比 C/C++ 少见，但由于 Goroutine 泄露、全局切片/Map 未释放、或者 time.Ticker 未 Stop 等原因，依然是高并发服务中吞噬系统资源的隐形杀手。很多开发...

2026/5/30 0 28 0 0 0 Go语言内存泄漏 pprof
Keepalived失效后的最后防线：硬件看门狗与STONITH物理隔离实战

被忽视的致命盲区做高可用架构的人，十个里有九个会在简历上写"精通Keepalived+LVS"。但真正在生产环境踩过坑的都知道，软件层面的健康检查有个致命的假设前提：当前节点还能正常执行检测逻辑。当这个前提本...

2026/5/31 0 44 0 0 0 Keepalived STONITH 高可用集群
裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

在裸金属（Bare-metal）环境下部署 Kubernetes 时，网络性能往往决定了整个集群的吞吐上限和延迟下限。传统的 CNI（如 Flannel、Calico）默认依赖 Linux 虚拟网桥、iptables 或 IPVS。这些机...

2026/6/1 0 30 0 0 0 eBPF Kubernetes CNI
Istio 中 MaxConcurrentStreams 如何缓解 Head-of-Line Blocking：原理分析与 P99 延迟实测

前置概念：HTTP/2 的「伪」多路复用 HTTP/2 引入了多路复用机制，理论上允许在单个 TCP 连接上并行传输多个请求。但这里有个容易被忽视的陷阱—— HTTP/2 只是解决了应用层的队头阻塞，底层的 TCP 层和 TLS 层依...

2026/6/3 0 98 0 0 0 Istio Envoy
微服务前端性能优化：BFF模式如何超越API Gateway，加速移动端复杂视图加载？

当前前端直接请求多个微服务，导致严重的瀑布流请求，这在提升用户体验、尤其是页面加载速度方面确实是个老大难问题。领导要求优化，我们除了简单的API Gateway聚合之外，确实需要更适合移动端复杂视图的后端优化方案。Backend for ...

2025/12/1 0 263 0 0 0 BFF模式微服务前端性能

文章标签

观测

CentOS 7 进阶指南：升级内核并开启 PSI（Pressure Stall Information）特性全记录

从"告警风暴"到"心理安全"：SRE团队无责复盘文化如何治愈慢性焦虑

Istio 进阶：如何利用 WebAssembly 让 OPA 策略鉴权性能翻倍？

架构师的抉择：Proxy-Wasm 还是 Lua？深剖 Envoy 扩展在高并发下的长尾延迟

生产级指南：如何在 Kubernetes 中平滑升级 SkyWalking 并确保数据一致性？

OPA 与 Envoy 配合时的延迟排查指南：当判定延迟超过 10ms 时，你应该检查哪些配置？

彻底告别数据丢失：SkyWalking OAP 高并发场景下的性能调优实战指南

突破单核瓶颈：深入解析 eBPF CPUMAP 工作原理与超大规模网络负载均衡实践

深入骨髓的 eBPF/XDP 性能调优：XDP_TX 与 bpf_redirect(_map) 大流量转发性能深层对比

万级 Pod 挑战：放弃 iptables，用 Cilium eBPF 实现超大规模 K8s 网络微隔离落地实践

突破网络瓶颈：高并发 K8s 中利用 eBPF 绕过 conntrack 提升 30% 吞吐量的技术实践

突破单核软中断瓶颈：云服务器环境下通过 RPS/RFS 解决 Nginx 丢包实战

拒绝割裂：XDP 与 tc BPF 协同下的高性能抗 D 架构设计与限速实践

eBPF 核心 Map 结构如何在生产环境中实现无损热升级？

深入 Linux 内核：MESI 协议与 eBPF Map 跨核访问的硬件开销分析

Go 内存泄漏排查实战：pprof heap 与 ReadMemStats 交叉验证指南

Keepalived失效后的最后防线：硬件看门狗与STONITH物理隔离实战

裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

Istio 中 MaxConcurrentStreams 如何缓解 Head-of-Line Blocking：原理分析与 P99 延迟实测

微服务前端性能优化：BFF模式如何超越API Gateway，加速移动端复杂视图加载？