文章标签

Kubernetes

Volcano 在 K8s 集群中的生产级部署与插件配置实战

Volcano 是 CNCF 孵化的云原生批处理调度系统，专为 AI、大数据、HPC 等高并发计算场景设计。相比默认的 Kube-scheduler，它提供了 Gang Scheduling 、 Queue 管理、任务拓扑感知等...

2026/4/12 0 171 0 0 0 Volcano Kubernetes 批处理调度
深度解析 K8s 调度器扩展框架：编写自定义插件支持复杂 AI 任务

在云原生时代，Kubernetes (K8s) 已成为管理容器化应用的事实标准。然而，随着 AI/ML 任务的爆发式增长，默认调度器的“逐个 Pod 调度”逻辑逐渐显露疲态。AI 训练通常涉及分布式计算（如 PyTorch DDP、Ten...

2026/4/12 0 85 0 0 0 Kubernetes AI基础设施调度算法
K8s 调度 DSA 设备：如何化解 NUMA 拓扑感知与 Pod 约束的冲突？

在高性能计算（HPC）和数据密集型应用中，Intel 的 DSA（Data Streaming Accelerator）设备已成为提升内存拷贝与数据转换效率的利器。然而，在 Kubernetes (K8s) 环境中，通过 Device P...

2026/4/12 0 65 0 0 0 Kubernetes DSA NUMA
深入解析 K8s Coscheduling：实现 Gang 调度及其在大规模拓扑下的局限性

在分布式训练（如 AI 模型训练）和高性能计算（HPC）场景中，任务通常要求“要么全部运行，要么全不运行”。这种需求被称为 Gang Scheduling 。虽然 Kubernetes 原生调度器最初是为长连接微服务设计的，但通过 S...

2026/4/12 0 102 0 0 0 Kubernetes 调度插件云原生架构
GitOps 核心理念：如何重塑你的变更审批工作流

各位同行，大家好！在现代云原生应用部署和管理中，GitOps 已经成为了一种主流范式。其核心思想简单却深远：“ 声明式 ”和“ Git 作为唯一真实来源 ”。深入理解这两点，对我们设计高效、安全且可审计的变更审批流程至关重要。声明式...

2026/1/15 0 193 0 0 0 GitOps 声明式变更管理
云原生时代：数据安全如何从“城墙”走向“细粒度防护”？

云原生架构以其弹性、可伸缩性和敏捷性，正在重塑软件开发和部署的格局。微服务、容器化（如Kubernetes）和Serverless等技术，让系统变得更加灵活和高效。然而，这种范式转变也带来了前所未有的数据安全挑战，传统“城堡式”的边界防御...

2026/3/26 0 124 0 0 0 云原生安全数据安全微服务安全
Linkerd生产环境可观测性深度实践：Prometheus、Grafana与Jaeger联手，打造全链路故障排查与性能优化利器

在微服务横行的今天，服务网格（Service Mesh）已成为提升服务间通信弹性和可观测性的关键基础设施。Linkerd作为一款轻量级、高性能的服务网格，以其简洁的架构和出色的默认可观测性赢得了不少拥趸。然而，在面对复杂的生产环境时，仅仅...

2025/8/21 0 226 0 0 0 Linkerd 可观测性生产环境
基于 eBPF 的云原生网络性能分析工具设计：如何精确监控和诊断虚拟机网络瓶颈？

作为一名架构师，我深知云原生环境下网络性能监控的复杂性和重要性。面对成百上千的虚拟机，如何实时掌握它们的网络延迟、丢包率，并快速定位性能瓶颈，是云服务提供商面临的巨大挑战。传统的网络监控方案往往侵入性强，对虚拟机性能影响较大，且难以应对动...

2025/5/2 0 360 0 0 0 eBPF 网络性能分析云计算
云原生安全架构师的自白-我是如何设计云原生安全解决方案的？

作为一名云原生安全架构师，我深知云原生环境的复杂性和动态性给安全带来了前所未有的挑战。与传统的安全模型相比，云原生安全必须更加敏捷、自动化和集成化。今天，我就以一个“过来人”的身份，跟大家聊聊我是如何设计云原生安全解决方案的，希望能帮助大...

2025/5/10 0 445 0 0 0 云原生安全安全架构 DevSecOps
高并发网络架构抉择：深度对比 DPDK 与 XDP 的技术本质与落地痛点

在构建百 G 带宽、千万级 PPS（Packet Per Second）的高并发网络系统时，传统的 Linux 内核网络栈（Netfilter/IPVS）往往会因为中断引入的上下文切换、SKB（socket buffer）结构体的分配与...

2026/5/26 0 69 0 0 0 DPDK XDP eBPF
裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

在裸金属（Bare-metal）环境下部署 Kubernetes 时，网络性能往往决定了整个集群的吞吐上限和延迟下限。传统的 CNI（如 Flannel、Calico）默认依赖 Linux 虚拟网桥、iptables 或 IPVS。这些机...

2026/6/1 0 42 0 0 0 eBPF Kubernetes CNI
Kubernetes VPA 生产环境落地：挑战应对与优化实践

在 Kubernetes 集群中，Vertical Pod Autoscaler (VPA) 扮演着资源优化和提升应用稳定性的关键角色。然而，在实际的生产环境中部署 VPA 并非一帆风顺。我会深入探讨在生产环境中部署 VPA 时可能遇到的...

2025/8/20 0 193 0 0 0 Kubernetes VPA 资源优化生产环境部署
eBPF：微服务性能无侵入监控的革命性利器

在微服务架构日益普及的今天，应用的性能监控变得前所未有的复杂。传统的监控方式，如修改应用代码、注入代理或使用Sidecar模式，往往伴随着侵入性、性能开销、部署复杂性以及对应用逻辑的耦合。这使得在快速迭代的微服务环境中，获取全面、低延迟的...

2025/11/10 0 170 0 0 0 eBPF 微服务监控性能优化
Istio Telemetry V2 深度解析：指标采集机制与 Envoy Filter 定制方法

你好，我是老码农。今天我们来聊聊 Istio Telemetry V2，特别是它的指标采集机制以及如何通过 Envoy Filter 进行定制。我相信对于很多正在使用或者准备使用 Istio 的同学来说，了解 Istio 的遥测体系至关重...

2025/3/5 0 639 0 0 0 Istio Telemetry Envoy Filter
让APM部署隐形：产品经理如何推动可观测性自动化，加速产品迭代

作为产品经理，我们深知用户体验和快速迭代是产品成功的生命线。我们渴望每一次发布都能快速触达用户，并及时获得真实的使用反馈。然而，现实往往是残酷的：研发团队为了上线前配置各种环境和监控工具而反复“加班”，发布计划一再延误。其中，可观测性（特...

2025/10/26 0 264 0 0 0 APM自动化产品迭代 CICD
运维福音? 基于 eBPF 的容器网络监控利器，性能分析与故障诊断一网打尽!

前言：容器网络的复杂性与监控挑战各位运维老哥、开发同仁，咱们在容器化的道路上摸爬滚打，享受着它带来的便捷与高效，但容器网络这块，一直是个让人头疼的领域。微服务架构下，服务拆分得越来越细，容器间的通信也变得更加频繁和复杂。容器网络的性...

2025/5/8 0 438 0 0 0 eBPF 容器网络性能监控
etcd集群负载均衡的最佳实践：从理论到实战经验分享

etcd集群负载均衡的最佳实践：从理论到实战经验分享 etcd作为分布式键值存储系统，在微服务架构和Kubernetes集群中扮演着至关重要的角色。为了保证etcd集群的高可用性和性能，负载均衡是必不可少的。本文将分享一些etcd集群...

2025/1/15 0 461 0 0 0 etcd 集群负载均衡
容器性能瓶颈深解：CPU、内存、I/O之外的“隐形杀手”与优化实践

在容器技术日益普及的今天，我们常常将容器的性能问题归结为CPU、内存和I/O这“三大件”的资源不足。然而，经验丰富的开发者和运维工程师会发现，即使这些核心资源看似充裕，容器化应用依然可能表现不佳，甚至出现意想不到的延迟和故障。这背后，往往...

2025/11/23 0 219 0 0 0 容器性能优化排障
监控 etcd 性能时，你需要关注哪些关键指标？

etcd 作为分布式键值存储系统，在 Kubernetes 等容器编排系统中扮演着至关重要的角色。它的性能直接影响着整个集群的稳定性和效率。因此，监控 etcd 的性能至关重要。但是，面对 etcd 提供的众多指标，我们该如何选择并关注关...

2025/1/15 0 487 0 0 0 etcd 监控性能
网络工程师视角：如何用 eBPF 实时监测并防御 DDoS 攻击？

作为一名网络工程师，我深知服务器网络流量监控和恶意流量检测的重要性。DDoS 攻击就像潜伏在暗处的幽灵，随时可能让服务器瘫痪，业务中断。传统的防御手段往往滞后，无法应对快速变化的攻击模式。自从我接触到 eBPF（Extended Berk...

2025/4/27 0 473 0 0 0 eBPF DDoS攻击防御网络流量监控

文章标签

Kubernetes

Volcano 在 K8s 集群中的生产级部署与插件配置实战

深度解析 K8s 调度器扩展框架：编写自定义插件支持复杂 AI 任务

K8s 调度 DSA 设备：如何化解 NUMA 拓扑感知与 Pod 约束的冲突？

深入解析 K8s Coscheduling：实现 Gang 调度及其在大规模拓扑下的局限性

GitOps 核心理念：如何重塑你的变更审批工作流

云原生时代：数据安全如何从“城墙”走向“细粒度防护”？

Linkerd生产环境可观测性深度实践：Prometheus、Grafana与Jaeger联手，打造全链路故障排查与性能优化利器

基于 eBPF 的云原生网络性能分析工具设计：如何精确监控和诊断虚拟机网络瓶颈？

云原生安全架构师的自白-我是如何设计云原生安全解决方案的？

高并发网络架构抉择：深度对比 DPDK 与 XDP 的技术本质与落地痛点

裸金属 Kubernetes 基于 eBPF 的高性能 CNI 架构设计与调优实践

Kubernetes VPA 生产环境落地：挑战应对与优化实践

eBPF：微服务性能无侵入监控的革命性利器

Istio Telemetry V2 深度解析：指标采集机制与 Envoy Filter 定制方法

让APM部署隐形：产品经理如何推动可观测性自动化，加速产品迭代

运维福音? 基于 eBPF 的容器网络监控利器，性能分析与故障诊断一网打尽!

etcd集群负载均衡的最佳实践：从理论到实战经验分享

容器性能瓶颈深解：CPU、内存、I/O之外的“隐形杀手”与优化实践

监控 etcd 性能时，你需要关注哪些关键指标？

网络工程师视角：如何用 eBPF 实时监测并防御 DDoS 攻击？