文章标签

GC

RocksDB + ZenFS on ZNS SSD：从理论到生产的调优实战笔记

最近半年在负责一个海量 KV 存储集群的硬件升级，目标是把单机存储密度从 16TB 提升到 64TB，同时保持 P99 写入延迟 < 10ms。在传统 NVMe SSD 上，RocksDB 的写放大（Write Amplificat...

2026/4/11 0 213 0 0 0 RocksDB ZNS SSD 存储引擎优化
Service Mesh可观测性实战：如何用Prometheus+Grafana+Jaeger精准监控Java应用性能

一、Service Mesh的可观测性架构解析当我们在Kubernetes集群中部署由50+微服务组成的Java电商系统时，传统监控方案就像用渔网捞金鱼——不仅漏关键指标，上下游链路追踪更是形同虚设。这正是Service Mesh异...

2025/3/5 0 489 0 0 0 Service Mesh Java性能优化可观测性
Kibana大规模集群部署与优化：高负载下的稳定之道

Kibana大规模集群部署与优化：高负载下的稳定之道各位运维老铁、架构大神们，大家好！我是你们的“码农老司机”。今天咱们来聊聊 Kibana 在大规模集群下的部署和优化，这可是个硬核话题，直接关系到咱们的系统能不能扛住高并发、大数据...

2025/3/14 0 487 0 0 0 Kibana Elasticsearch 负载均衡
Node.js 内存泄漏排查实战：heapdump 深度分析与三大典型案例

在 Node.js 服务端开发中，最让开发者头疼的莫过于“内存泄漏”。它不像代码报错那样瞬间崩溃，而是像一个隐形的杀手，一点点吞噬服务器资源，直到触发 OOM (Out of Memory) 导致服务频繁重启。虽然 V8 引擎拥...

2026/5/3 0 162 0 0 0 Nodejs 内存泄漏 heapdump
架构师视角：TypeScript 与 Rust 处理复杂业务逻辑的“隐形成本”博弈

在当前的互联网架构选型中，TypeScript（以下简称 TS）和 Rust 经常被放在一起比较。虽然它们的应用领域有所重叠（如边缘计算、Serverless、大型中后台），但在处理复杂业务逻辑时，两者的底层逻辑和长期演进特征截然不同。 ...

2026/5/8 0 112 0 0 0 TypeScript Rust 架构设计
高并发系统自保护与降级：新工程师排查指南

在构建高并发系统时，我们常常追求极致的性能和吞吐量。然而，一个真正健壮的系统，不仅要能处理高并发，更要在面临超出预期的流量洪峰时，具备“自保”和“降级”的能力。这就像一艘航空母舰，在遭遇重创时，不仅要能继续航行，还要能有序地关闭部分舱室，...

2025/11/16 0 301 0 0 0 高并发系统架构故障排查
从 OOM 到 Root Cause：一次生产环境 JVM 内存泄漏排查全纪实

在 Java 程序的生命周期中，内存泄漏（Memory Leak）像是一个隐形的“慢性病”。它最初可能只是让你的服务响应稍微变慢，但随着运行时间的推移，频繁的 FullGC 会导致 Stop-The-World (STW) 时间变长，最终...

2026/5/20 0 112 0 0 0 JVM 内存泄漏性能调优
eBPF与Prometheus的结合：解锁高级监控的无限可能

最近一直在啃 eBPF 这块硬骨头，不得不说，这玩意儿是真的强大。它能在内核里“插桩”，而且性能损耗极低，简直是做性能分析和安全监控的神器。正好最近也在用 Prometheus，就琢磨着把这两个家伙结合起来，看看能擦出什么火花。为什...

2025/7/1 0 497 0 0 0 eBPF Prometheus 监控
夜间交易处理缓慢？分布式系统“隐形”性能问题排查指南

最近分布式系统总是在晚上十点到十一点之间出现交易处理缓慢的问题，但所有服务日志看起来都正常，客户投诉也越来越多。怀疑是数据库在那个时间点做了什么操作，但运维那边没查到特别的备份任务。别慌，这里提供一套排查“隐形”问题的实用方法：第...

2025/11/11 0 232 0 0 0 分布式系统性能优化故障排查
从技术指标到用户体验指标：产品经理如何更好地理解用户

作为一名数据驱动的产品经理，我们经常会收到来自技术团队的监控报告，里面充斥着QPS、RT、GC等技术术语。虽然我们知道这些指标很重要，但很难直接将它们与用户抱怨的“卡顿”、“加载慢”等问题联系起来。我们需要一套更直观、更贴近用户感知的指标...

2025/9/3 0 184 0 0 0 产品经理用户体验数据驱动
Java 21 虚拟线程中 ThreadLocal 的内存泄露与 OOM 隐患排查

在 Java 21 引入虚拟线程（Virtual Threads）后，高并发通道的建设变得极其简单。开发者无需再纠结于复杂的异步回调或响应式编程，只需像往常一样编写同步阻塞代码，就能轻松应对数万乃至数百万的并发连接。然而，这种“无缝...

2026/6/15 0 61 0 0 0 Java 21 虚拟线程内存泄露
JDK 21虚拟线程：哪些Native方法会引发Carrier Thread Pinning？如何排查与平替？

在JDK 21中，虚拟线程（Virtual Threads）的引入极大地提升了Java在高并发I/O场景下的吞吐量。然而，虚拟线程并非万能药。当虚拟线程中执行某些特定操作时，它会“钉”在底层的平台线程（Carrier Thread）上，导...

2026/6/16 0 104 0 0 0 JDK21 虚拟线程 JNI
JVM 突然消失？Linux 环境下 Java 进程被 OOM Killer 强杀深层排查指南

在大规模 Java 应用的生产环境中，最让运维和开发头疼的不是 JVM 内部抛出的 java.lang.OutOfMemoryError ，而是进程毫无征兆地突然消失。最诡异的是：应用日志戛然而止，没有异常堆栈，没有 JVM C...

2026/6/20 0 93 0 0 0 Java Linux JVM 调优
拒绝 OOM Killer：K8s 环境下 JVM 内存与容器 Cgroup 限制的最佳配比指南

在 Kubernetes (K8s) 环境中部署 Java 应用，最让 DevOps 和研发同学头疼的问题之一就是 OOMKilled (Exit Code 137) 。很多时候，我们明明在 JVM 中设置了 -Xmx2g ，而...

2026/6/20 0 93 0 0 0 Kubernetes JVM 性能调优
Spring Boot 3 开启虚拟线程后 ThreadLocal 内存泄露的深层原因与 ScopedValue 迁移指南

在 Spring Boot 3.2+ 中，通过一行配置 spring.threads.virtual.enabled=true 就能轻松开启虚拟线程（Virtual Threads）。这种“低成本榨干 CPU”的特性让很多开发者兴奋不...

2026/6/21 0 71 0 0 0 虚拟线程
虚拟线程时代的内存救星：ThreadLocal 与 ScopedValue 深度对比

在 Java 21 正式迎来虚拟线程（Virtual Threads）之后，高并发高吞吐的编程范式发生了根本性的改变。我们可以轻松创建数十万甚至数百万个虚拟线程来并发处理任务。然而，这种极其低廉的线程创建成本，却让 Java 开发者...

2026/6/22 0 76 0 0 0 Java 21 虚拟线程
容器内 Java 进程 RSS 持续暴涨？用 pmap 和 smaps 诊断 Native 内存泄露的硬核指南

在容器化时代，不少开发者都遇到过这样一个诡异的问题： Java 进程的 JVM 堆内存（Heap）设置了上限（如 -Xmx4g ），容器的 OOM Killer 却依然在某个深夜悄然降临，杀死了这个容器。通过监控会发现，容器的实...

2026/6/30 0 63 0 0 0 JVM Linux 内存泄露
除了主流选择，还有哪些值得关注的数据库连接池？

在Java企业级应用中，数据库连接池是提升数据库访问效率和稳定性的关键组件。HikariCP以其极致的性能和简洁的API广受好评，Druid凭借强大的监控和防护功能在国内占据一席之地，而C3P0和DBCP作为老牌连接池，也仍在一些项目中发...

2025/9/18 0 282 0 0 0 数据库连接池 Vibur
避免显存溢出：WebGPU 中 GPUBuffer 内存释放的特殊要求及其与 GPUTexture 的异同

在 WebGL 时代，许多开发者习惯了依赖 JavaScript 的垃圾回收（GC）机制来顺便释放底层的 GPU 资源。然而，在 WebGPU 这套现代图形 API 中，显存管理走向了“半手动时代”。如果编写复杂的 WebGPU 应...

2026/7/16 0 32 0 0 0 WebGPU 显存管理前端性能优化
Logstash Input 插件监控实战：API、Prometheus 与 Grafana 的完美结合

哥们，你好！我是老码农。这次我们聊聊 Logstash 监控，特别是 Input 插件这块。作为一名开发或者运维，你肯定希望对 Logstash 的运行状态了如指掌，尤其是那些负责数据输入的 Input 插件。想象一下，如果 Input ...

2025/3/15 5 1602 1 0 0 Logstash Prometheus Grafana

文章标签

GC

RocksDB + ZenFS on ZNS SSD：从理论到生产的调优实战笔记

Service Mesh可观测性实战：如何用Prometheus+Grafana+Jaeger精准监控Java应用性能

Kibana大规模集群部署与优化：高负载下的稳定之道

Node.js 内存泄漏排查实战：heapdump 深度分析与三大典型案例

架构师视角：TypeScript 与 Rust 处理复杂业务逻辑的“隐形成本”博弈

高并发系统自保护与降级：新工程师排查指南

从 OOM 到 Root Cause：一次生产环境 JVM 内存泄漏排查全纪实

eBPF与Prometheus的结合：解锁高级监控的无限可能

夜间交易处理缓慢？分布式系统“隐形”性能问题排查指南

从技术指标到用户体验指标：产品经理如何更好地理解用户

Java 21 虚拟线程中 ThreadLocal 的内存泄露与 OOM 隐患排查

JDK 21虚拟线程：哪些Native方法会引发Carrier Thread Pinning？如何排查与平替？

JVM 突然消失？Linux 环境下 Java 进程被 OOM Killer 强杀深层排查指南

拒绝 OOM Killer：K8s 环境下 JVM 内存与容器 Cgroup 限制的最佳配比指南

Spring Boot 3 开启虚拟线程后 ThreadLocal 内存泄露的深层原因与 ScopedValue 迁移指南

虚拟线程时代的内存救星：ThreadLocal 与 ScopedValue 深度对比

容器内 Java 进程 RSS 持续暴涨？用 pmap 和 smaps 诊断 Native 内存泄露的硬核指南

除了主流选择，还有哪些值得关注的数据库连接池？

避免显存溢出：WebGPU 中 GPUBuffer 内存释放的特殊要求及其与 GPUTexture 的异同

Logstash Input 插件监控实战：API、Prometheus 与 Grafana 的完美结合