使用 eBPF 监控 Kubernetes 网络流量：捕获 Pod HTTP 请求与响应

2025/6/20 06:28:17 109 0 0 0

在云原生环境中，Kubernetes 已经成为容器编排的事实标准。随着微服务架构的普及，Kubernetes 集群中的网络流量变得越来越复杂。为了更好地理解和监控这些流量，我们需要强大的工具。eBPF (extended Berkeley Packet Filter) 正是这样一种技术，它允许我们在内核级别动态地追踪和分析网络流量，而无需修改应用程序代码或内核模块。

本文将介绍如何使用 eBPF 监控 Kubernetes 集群中的网络流量，并提供一个实际的例子：如何捕获特定 Pod 的 HTTP 请求和响应。

什么是 eBPF？

eBPF 最初是作为 BSD 数据包过滤器（BPF）的扩展而引入的，用于网络数据包的过滤。后来，它被扩展成一个通用的内核虚拟机，允许用户在内核中运行自定义的程序，而无需修改内核代码或加载内核模块。

eBPF 程序运行在内核的安全沙箱中，可以访问内核数据结构和函数。这使得 eBPF 成为一个强大的工具，可以用于各种用途，包括：

网络监控和分析： 追踪网络流量，分析网络性能，检测网络攻击。
安全： 实现入侵检测系统（IDS），防止恶意代码执行。
性能分析： 追踪应用程序的性能瓶颈，例如 CPU 使用率、内存分配等。
可观测性： 收集应用程序的指标和日志，用于监控和故障排除。

eBPF 如何与 Kubernetes 集成？

eBPF 可以通过多种方式与 Kubernetes 集成。以下是一些常见的用例：

网络策略执行： 使用 eBPF 实现 Kubernetes 网络策略，控制 Pod 之间的网络流量。
服务代理： 使用 eBPF 实现 Kubernetes Service 的负载均衡和服务发现。
可观测性： 使用 eBPF 收集 Kubernetes 集群的指标和日志，用于监控和故障排除。
安全： 使用 eBPF 实现 Kubernetes 集群的入侵检测和防御。

一些流行的工具，如 Cilium、Falco 和 Inspektor Gadget，都利用 eBPF 技术来增强 Kubernetes 的功能。

捕获 Pod HTTP 请求和响应的步骤

现在，我们将介绍如何使用 eBPF 捕获特定 Pod 的 HTTP 请求和响应。以下是步骤：

准备工作：
- 确保你有一个正在运行的 Kubernetes 集群。
- 安装必要的工具，例如 kubectl、bcc (BPF Compiler Collection) 和 bpftrace。
- 了解目标 Pod 的 IP 地址和端口号。

编写 eBPF 程序：

我们将使用 bpftrace 编写一个简单的 eBPF 程序来捕获 HTTP 请求和响应。以下是一个示例程序：

#include <linux/ptrace.h>

kprobe:tcp_sendmsg {
  // 获取套接字地址
  @sock = arg0->sk;
  // 获取源 IP 地址和端口
  $src_ip = ntop(@sock->rcv_saddr);
  $src_port = @sock->rcv_sport;
  // 获取目标 IP 地址和端口
  $dst_ip = ntop(@sock->daddr);
  $dst_port = @sock->dport;

  // 过滤目标 Pod 的流量 (替换为你的 Pod IP 和端口)
  if ($dst_ip == "10.244.0.10" && $dst_port == 8080) {
    printf("HTTP Request: Source IP = %s, Source Port = %d, Destination IP = %s, Destination Port = %d\n", $src_ip, $src_port, $dst_ip, $dst_port);
    // 尝试读取发送的数据
    $len = arg2;  // 数据长度
    if ($len > 0 && $len < 512) { // 限制读取长度
      printf("Data: %s\n", str(arg1, $len));
    }
  }
}

kprobe:tcp_recvmsg {
// 获取套接字地址
@sock = arg0->sk;
// 获取源 IP 地址和端口
$src_ip = ntop(@sock->rcv_saddr);
$src_port = @sock->rcv_sport;
// 获取目标 IP 地址和端口
$dst_ip = ntop(@sock->daddr);
$dst_port = @sock->dport;

  // 过滤目标 Pod 的流量 (替换为你的 Pod IP 和端口)
  if ($src_ip == "10.244.0.10" && $src_port == 8080) {
    printf("HTTP Response: Source IP = %s, Source Port = %d, Destination IP = %s, Destination Port = %d\n", $src_ip, $src_port, $dst_ip, $dst_port);
    // 尝试读取接收的数据
    $len = arg2;  // 数据长度
    if ($len > 0 && $len < 512) { // 限制读取长度
      printf("Data: %s\n", str(arg1, $len));
    }
  }
}
```

**代码解释:**

*   `kprobe:tcp_sendmsg` 和 `kprobe:tcp_recvmsg` 分别是内核探针，用于追踪 `tcp_sendmsg` (发送数据) 和 `tcp_recvmsg` (接收数据) 函数的调用。
*   `@sock = arg0->sk;` 获取套接字（socket）的地址，套接字是网络通信的基本单元。
*   `ntop(@sock->rcv_saddr)` 和 `@sock->rcv_sport` 用于获取源 IP 地址和端口。
*   `ntop(@sock->daddr)` 和 `@sock->dport` 用于获取目标 IP 地址和端口。
*   `if ($dst_ip == "10.244.0.10" && $dst_port == 8080)`  是一个过滤器，用于只捕获目标 Pod 的流量。你需要将 `10.244.0.10` 和 `8080` 替换为你目标 Pod 的实际 IP 地址和端口。
*   `printf` 函数用于打印捕获到的信息，包括源 IP 地址、源端口、目标 IP 地址和目标端口。
*   `str(arg1, $len)` 尝试读取发送或接收的数据，并将其打印出来。这里限制了读取长度为 512 字节，以避免读取过多的数据导致性能问题。`arg1` 指向数据缓冲区的指针，`$len` 是数据的长度。

运行 eBPF 程序：

将上面的代码保存为 http_monitor.bt 文件，然后使用 bpftrace 运行它：
```
sudo bpftrace http_monitor.bt
```
这会启动 eBPF 程序，并开始捕获目标 Pod 的 HTTP 请求和响应。
测试：

向目标 Pod 发送 HTTP 请求，例如使用 curl：
```
curl http://10.244.0.10:8080
```
你将在 bpftrace 的输出中看到捕获到的 HTTP 请求和响应信息。

进阶用法

过滤更多信息： 你可以根据需要修改 eBPF 程序，以捕获更多的信息，例如 HTTP 头、Cookie 等。
聚合数据： 你可以使用 eBPF 聚合数据，例如统计 HTTP 请求的延迟、错误率等。
可视化： 你可以使用 Grafana 等工具将 eBPF 收集到的数据可视化。

注意事项

性能影响： eBPF 程序运行在内核中，可能会对系统性能产生影响。请谨慎使用，并进行性能测试。
安全风险： eBPF 程序可以访问内核数据结构和函数，如果编写不当，可能会导致安全风险。请确保你的 eBPF 程序是安全的。
内核版本： 不同的内核版本可能支持不同的 eBPF 功能。请确保你的内核版本支持你使用的 eBPF 功能。

总结

eBPF 是一个强大的工具，可以用于监控 Kubernetes 集群中的网络流量。通过编写 eBPF 程序，我们可以捕获特定 Pod 的 HTTP 请求和响应，并分析这些流量。这对于理解和监控 Kubernetes 集群的网络行为非常有帮助。希望本文能够帮助你开始使用 eBPF 监控 Kubernetes 网络流量。

相关资源:

NetObserver eBPF Kubernetes 网络监控