文章标签

云原

Volcano 在 K8s 集群中的生产级部署与插件配置实战

Volcano 是 CNCF 孵化的云原生批处理调度系统，专为 AI、大数据、HPC 等高并发计算场景设计。相比默认的 Kube-scheduler，它提供了 Gang Scheduling 、 Queue 管理、任务拓扑感知等...

2026/4/12 0 157 0 0 0 Volcano Kubernetes 批处理调度
Kubernetes DRA：打破 AI 推理算力调度的“静态”瓶颈

在当前的 AI 大模型时代，异构算力（如 GPU、NPU、FPGA）的调度效率直接决定了推理服务的成本与响应速度。长期以来，Kubernetes 社区主要依赖 Device Plugin 机制来管理这些硬件资源。然而，随着 AI 推理...

2026/4/12 0 86 0 0 0 Kubernetes AI推理资源调度
深入浅出 Linux Netfilter 与 Conntrack：从内核机制到高并发排障实战

在维护高并发、高吞吐的互联网业务，或者在大规模 Kubernetes 集群中，你大概率遇到过这样的生产事故：系统突然无法建立新的连接，访问极其缓慢，甚至直接报 502/504 错误。登录服务器，执行 dmesg -T ，屏幕上赫然...

2026/5/25 0 57 0 0 0 Linux内核 Netfilter Conntrack
400G骨干网流量清洗利器基于XDP与eBPF的高性能架构设计与极限调优

在超大规模数据中心和骨干网边缘，面对 400G 带宽的线速（Line-rate）流量清洗挑战，传统的内核网络栈早已力不从心。在 64 字节小包的极端场景下，400G 链路每秒会产生高达 5.95 亿个数据包（595 Mpps）。这意味着每...

2026/5/26 0 79 0 0 0 eBPF XDP 高并发网络
重构十年电商遗留系统：我的首要行动与技术债偿还策略

当面对一个拥有十年历史、代码库庞大且缺乏文档、技术栈老旧的电商遗留系统时，"重构"这个词往往让人既兴奋又恐惧。兴奋于摆脱历史包袱的可能性，恐惧于其巨大的工作量和潜在风险。如果让我来主导这个重构项目，我的首要行动绝不是直...

2025/11/22 0 182 0 0 0 遗留系统系统重构技术债务
突破 Netfilter 极限：基于 eBPF/XDP 的无锁连接跟踪器设计原理与架构实现

在构建高性能软件定义网络（SDN）、高并发四层负载均衡器（L4LB）或防火墙时，**连接跟踪（Connection Tracking, 简称 Conntrack）**是不可或缺的核心模块。它负责维护网络连接的状态机（如 TCP 的三步握手...

2026/5/25 0 68 0 0 0 eBPF XDP 连接跟踪
告别“大海捞针”：微服务调用链过长？分布式追踪助你精准定位问题

你是否也曾深陷微服务复杂调用链的泥沼？一个用户请求进来，背后可能涉及十几个甚至几十个服务的协作。一旦某个环节出现性能瓶颈或错误，你就会发现自己像是在茫茫大海中捞一根针，面对分散的日志、孤立的监控指标，无从下手，更别提快速定位问题了。 ...

2025/11/19 0 222 0 0 0 微服务分布式追踪系统监控
eBPF vs iptables：Service Mesh 流量劫持性能极限对比实测

在 Service Mesh 架构中，Sidecar 代理的流量劫持方式直接影响整个服务网格的延迟和吞吐量。传统的 iptables方案虽然成熟稳定，但在高并发场景下会面临显著的转发开销。本文通过实际压测，对比 eBPF 和 iptabl...

2026/6/1 0 39 0 0 0
无 Sidecar 时代下，遗留系统（Legacy）如何无感接入 zTunnel mTLS 零信任网络？

在 Service Mesh 的演进历程中，Istio Ambient Mesh（无 Sidecar 模式）的出现无疑具有划时代的意义。它通过将数据面拆分为负责 L4 安全传输的 zTunnel 和负责 L7 流量处理的 Waypo...

2026/6/1 0 28 0 0 0 zTunnel 零信任安全
Cilium eBPF 容器网络策略实战：从 L7 细粒度控制到 Hubble 流量排查

在 Kubernetes 默认的网络模型中，传统的网络安全策略（NetworkPolicy）主要依赖 iptables 或 IPVS。当集群规模达到数百个节点、数万个 Pod 时，iptables 规则链的线性匹配会导致网络延迟急剧上升，...

2026/6/1 0 50 0 0 0 Cilium eBPF Kubernetes
裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

在裸金属（Bare-metal）环境下部署 Kubernetes 时，网络性能往往决定了整个集群的吞吐上限和延迟下限。传统的 CNI（如 Flannel、Calico）默认依赖 Linux 虚拟网桥、iptables 或 IPVS。这些机...

2026/6/1 0 36 0 0 0 eBPF Kubernetes CNI
Kube-VIP 与 MetalLB 生产选型指南：一文讲透优劣对比与决策逻辑

做 Kubernetes 生产部署绕不开 LoadBalancer 类型 Service 的实现问题。在没有云厂商 LB 的裸金属（bare-metal）环境下，你只能在 Kube-VIP 和 MetalLB 这两个主流方案里二选一。这篇...

2026/6/2 0 34 0 0 0 kubernetes kube-vip metallb
高密度Pod集群nf_conntrack调优：安全扩容与无损热升级实战

先厘清一个常见误解很多人看到 nf_conntrack_full 告警，第一反应是"conntrack_max太小"。但实际上，瓶颈往往不在 max 值本身，而在 bucket 数量。 nf_con...

2026/6/2 0 36 0 0 0 Kubernetes ConnTrack Linux内核
实时事件流处理瓶颈攻克指南：赋能高并发个性化推荐

突破实时事件流处理瓶颈：赋能高并发个性化推荐的实践之路作为后端工程师，我们常常面临一个棘手的问题：当系统需要处理海量实时事件流时，尤其在数据清洗和聚合环节，性能瓶颈会如影随形。用户提出的痛点——“数据写入和读取的性能问题不解决，再好...

2025/11/21 0 2135 0 0 0 实时流处理性能优化个性化推荐
SDL各阶段如何高效集成自动化漏洞扫描：一份实践指南

在当今快速迭代的软件开发环境中，安全已不再是开发后期才考虑的“附加品”，而是需要贯穿整个开发生命周期的核心要素。安全开发生命周期（SDL）为在软件开发各阶段有效集成安全实践提供了框架。其中，自动化漏洞扫描工具的引入，是实现“安全左移”策略...

2025/10/24 0 223 0 0 0 SDL 自动化安全漏洞扫描
告别深夜告警：应对突发流量，构建永不宕机的核心系统

告别深夜告警：应对突发流量，构建永不宕机的核心系统 “又来警报了！” 屏幕上刺眼的红色提示，在深夜里显得格外扎眼。是不是很熟悉？随着平台用户量激增，尤其是节假日促销活动期间，流量洪峰往往超出预期，数据库连接池被打爆、某个微服务响应超时...

2025/11/16 0 216 0 0 0 高并发系统架构弹性伸缩
微服务故障排查噩梦？分布式追踪是你的救星！

哥们，你说的痛点我太理解了！作为一名后端开发者，尤其是在微服务架构下摸爬滚打，每次线上服务一出问题，那种从茫茫日志中大海捞针，对着几十甚至上百个服务调用链抓狂的感觉，简直是噩梦。请求链太长，哪个服务出了幺蛾子，具体卡在哪一步，全靠猜和经验...

2025/11/21 0 2037 0 0 0 微服务分布式追踪故障排查
提升运维团队的AWS与阿里云跨云管理能力：技术与团队实践

在多云或混合云架构日益普及的今天，运维团队面临着在不同云平台（如AWS和阿里云）之间进行资源管理、部署和优化的挑战。针对团队目前在AWS和阿里云资源管理上存在的“知识壁垒”，本文将从技术方案和团队协作两方面，提供一系列策略和最佳实践，帮助...

2025/11/15 0 243 0 0 0 多云管理 DevOps 知识共享
Service Mesh如何提升微服务稳定性：对比API网关与客户端熔断器

在构建和维护复杂的微服务架构时，稳定性始终是核心挑战。随着服务数量的增长和调用链的深入，如何确保系统在高并发、部分服务故障的情况下依然稳健运行，成为每个开发者和架构师必须面对的问题。Service Mesh（服务网格）作为一种新兴的技术范...

2025/11/24 0 206 0 0 0 微服务稳定性
电商大促数据不一致？解密高并发下的分布式事务一致性方案

电商平台每逢大促，流量洪峰瞬时而至，系统稳定性与数据一致性面临严峻考验。运营同学反馈的订单创建失败、积分或优惠券数量异常，正是这种挑战的集中体现。究其根本，这是多服务间缺乏有效事务协调机制，导致在高并发场景下分布式事务一致性难以保障的...

2025/11/16 0 239 0 0 0 分布式事务高并发电商架构

文章标签

云原

Volcano 在 K8s 集群中的生产级部署与插件配置实战

Kubernetes DRA：打破 AI 推理算力调度的“静态”瓶颈

深入浅出 Linux Netfilter 与 Conntrack：从内核机制到高并发排障实战

400G骨干网流量清洗利器 基于XDP与eBPF的高性能架构设计与极限调优

重构十年电商遗留系统：我的首要行动与技术债偿还策略

突破 Netfilter 极限：基于 eBPF/XDP 的无锁连接跟踪器设计原理与架构实现

告别“大海捞针”：微服务调用链过长？分布式追踪助你精准定位问题

eBPF vs iptables：Service Mesh 流量劫持性能极限对比实测

无 Sidecar 时代下，遗留系统（Legacy）如何无感接入 zTunnel mTLS 零信任网络？

Cilium eBPF 容器网络策略实战：从 L7 细粒度控制到 Hubble 流量排查

裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

Kube-VIP 与 MetalLB 生产选型指南：一文讲透优劣对比与决策逻辑

高密度Pod集群nf_conntrack调优：安全扩容与无损热升级实战

实时事件流处理瓶颈攻克指南：赋能高并发个性化推荐

SDL各阶段如何高效集成自动化漏洞扫描：一份实践指南

告别深夜告警：应对突发流量，构建永不宕机的核心系统

微服务故障排查噩梦？分布式追踪是你的救星！

提升运维团队的AWS与阿里云跨云管理能力：技术与团队实践

Service Mesh如何提升微服务稳定性：对比API网关与客户端熔断器

电商大促数据不一致？解密高并发下的分布式事务一致性方案

400G骨干网流量清洗利器基于XDP与eBPF的高性能架构设计与极限调优