告别 Fluentd：拥抱 Fluent Bit，打造轻量级 Kubernetes 日志收集方案

2025/3/9 07:45:37 479 0 0 0

你是否还在为 Fluentd 占用过多资源而烦恼？还在寻找更轻量、更高效的 Kubernetes 日志收集方案？今天，咱们就来聊聊 Fluent Bit，一个专为容器环境设计的日志收集利器，看看它是如何帮你解决这些问题的。

为什么选择 Fluent Bit？

在 Kubernetes 环境中，日志收集至关重要。它可以帮助你：

监控应用状态： 实时了解应用的运行情况，及时发现问题。
故障排除： 快速定位错误，缩短故障恢复时间。
安全审计： 跟踪用户操作，满足合规性要求。
性能分析： 分析应用性能瓶颈，优化系统资源利用率。

Fluentd 作为老牌的日志收集工具，功能强大，插件丰富。但随着 Kubernetes 的普及，其资源消耗高、配置复杂等问题也日益凸显。而 Fluent Bit 则以其轻量级、高性能和资源效率高的特点，成为了 Kubernetes 环境下更受欢迎的选择。

Fluent Bit 的优势

相比 Fluentd，Fluent Bit 具有以下显著优势：

轻量级： Fluent Bit 的二进制文件大小通常只有几 MB，而 Fluentd 则可能达到几十 MB。这意味着 Fluent Bit 占用的内存和 CPU 资源更少，对系统性能的影响更小。
高性能： Fluent Bit 采用 C 语言编写，并针对性能进行了优化，能够处理大量的日志数据，且延迟较低。
资源效率高： Fluent Bit 在设计时就考虑了资源利用率，能够有效地利用系统资源，避免资源浪费。
易于配置： Fluent Bit 的配置文件相对简单，易于理解和维护。支持多种输入、过滤器和输出插件，可以灵活地满足不同的日志收集需求。
原生 Kubernetes 支持： Fluent Bit 提供了与 Kubernetes 的原生集成，可以自动发现和收集容器日志，并支持 Kubernetes 的元数据，如 Pod 名称、命名空间、标签等。
活跃的社区： Fluent Bit 拥有一个活跃的社区，提供了丰富的文档、示例和支持。

Fluent Bit 核心概念及配置

Fluent Bit 的核心概念包括：

Input（输入）： 定义日志的来源，例如从文件中读取、从标准输入读取、从系统日志读取等。
Parser（解析器）： 将原始日志数据解析成结构化数据，例如 JSON、正则表达式等。
Filter（过滤器）： 对日志数据进行过滤、修改、添加字段等操作。
Buffer（缓冲区）： 临时存储日志数据，提高处理效率。
Output（输出）： 将处理后的日志数据发送到目标位置，例如 Elasticsearch、Loki、Kafka 等。
Router (路由): 根据特定条件将日志路由到不同的输出。

常用配置示例

下面是一个简单的 Fluent Bit 配置文件示例，用于收集 Kubernetes 容器的标准输出日志，并将其发送到 Elasticsearch：

[SERVICE]
    Flush        1
    Daemon       off
    Log_Level    info
    Parsers_File parsers.conf

[INPUT]
    Name              tail
    Tag               kube.*
    Path              /var/log/containers/*.log
    Parser            docker
    DB                /var/log/flb_kube.db
    Mem_Buf_Limit     5MB
    Skip_Long_Lines   On
    Refresh_Interval  10

[FILTER]
    Name                kubernetes
    Match               kube.*
    Kube_URL            https://kubernetes.default.svc:443
    Kube_CA_File        /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    Kube_Token_File     /var/run/secrets/kubernetes.io/serviceaccount/token
    Kube_Tag_Prefix     kube.var.log.containers.
    Merge_Log           On
    Merge_Log_Key       log_processed
    K8S-Logging.Parser  On
    K8S-Logging.Exclude On

[OUTPUT]
    Name            es
    Match           kube.*
    Host            ${FLUENT_ELASTICSEARCH_HOST}
    Port            ${FLUENT_ELASTICSEARCH_PORT}
    Logstash_Format On
    Replace_Dots    On
    Retry_Limit     False

配置说明：

[SERVICE] 部分定义了 Fluent Bit 的全局配置，例如刷新间隔、日志级别等。
[INPUT] 部分定义了日志的来源，这里使用 tail 插件从 /var/log/containers/*.log 读取日志，并使用 docker 解析器解析 Docker 日志格式。
[FILTER] 部分定义了过滤器，这里使用 kubernetes 过滤器，从 Kubernetes API Server 获取 Pod 的元数据，并将这些元数据添加到日志中。
[OUTPUT] 部分定义了日志的输出，这里使用 es 插件将日志发送到 Elasticsearch。

自定义解析器 (parsers.conf)

[PARSER]
    Name        docker
    Format      json
    Time_Key    time
    Time_Format %Y-%m-%dT%H:%M:%S.%L%z

这个配置文件定义了一个名为 docker 的解析器, 它假设日志是 JSON 格式，并指定了时间字段的键和格式。

与不同日志后端的集成

Fluent Bit 支持多种日志后端，可以根据实际需求选择合适的后端。

1. 集成 Elasticsearch

Elasticsearch 是一个流行的开源搜索和分析引擎，常用于存储和分析日志数据。Fluent Bit 提供了 es 输出插件，可以方便地将日志发送到 Elasticsearch。配置如上所示.

2. 集成 Loki

Loki 是 Grafana Labs 推出的一个水平可扩展、高可用、多租户的日志聚合系统，特别适合 Kubernetes 环境。Fluent Bit 提供了 loki 输出插件，可以方便地将日志发送到 Loki。

[OUTPUT]
    Name          loki
    Match         *
    Host          loki.example.com
    Port          3100
    Labels        {job="fluent-bit"}
    LineFormat    json
    LabelKeys     pod, namespace

3. 其他后端

除了 Elasticsearch 和 Loki，Fluent Bit 还支持其他多种后端，例如：

Kafka: 用于构建实时数据管道和流应用程序。
Splunk: 用于安全信息和事件管理（SIEM）。
CloudWatch: 用于 AWS 云上的日志监控。
Stackdriver: 用于 Google Cloud 上的日志监控。

可以根据实际需求选择合适的后端，并配置相应的输出插件。

高级特性与最佳实践

1. 多行日志处理

有些应用程序的日志会跨越多行，例如 Java 异常堆栈信息。Fluent Bit 提供了 multiline 过滤器，可以将多行日志合并成一条完整的日志记录。

[FILTER]
    Name      multiline
    Match     *
    Multiline.Parser  docker, java

2. 日志过滤与转换

Fluent Bit 提供了多种过滤器，可以对日志数据进行过滤、修改、添加字段等操作。例如，可以使用 grep 过滤器过滤掉不需要的日志，使用 modify 过滤器修改字段值，使用 record_transformer 过滤器添加新的字段。

[FILTER]
    Name    grep
    Match   *
    Exclude log error

[FILTER]
    Name    modify
    Match   *
    Rename  log message

[FILTER]
    Name    record_transformer
    Match   *
    Record  hostname ${HOSTNAME}

3. 性能调优

可以通过以下方法对 Fluent Bit 进行性能调优：

调整缓冲区大小： 根据实际情况调整 Mem_Buf_Limit 参数，避免内存溢出或资源浪费。
使用多线程： Fluent Bit 支持多线程处理，可以通过 Workers 参数配置线程数。
优化解析器： 使用高效的解析器，例如 JSON 解析器通常比正则表达式解析器更快。
合理选择输出插件： 不同的输出插件性能可能不同，可以根据实际情况选择性能最好的插件。

4. 监控 Fluent Bit

可以使用 Prometheus 监控 Fluent Bit 的运行状态，例如收集的日志量、处理延迟、错误数等。

[SERVICE]
    Flush        1
    Daemon       off
    Log_Level    info
    Parsers_File parsers.conf
    HTTP_Server  On
    HTTP_Listen  0.0.0.0
    HTTP_PORT    2020

启用 HTTP_Server 后，Fluent Bit 会暴露一个 HTTP 接口，可以通过该接口获取监控指标。

总结

Fluent Bit 是一款优秀的日志收集工具，特别适合 Kubernetes 环境。其轻量级、高性能、资源效率高、易于配置等特点，使其成为替代 Fluentd 的理想选择。通过本文的介绍，相信你已经对 Fluent Bit 有了更深入的了解，赶快动手试试吧！从 Fluentd 迁移到 Fluent Bit，你将体验到更流畅、更高效的日志收集体验，为你的 Kubernetes 集群保驾护航。

技术老炮儿 Kubernetes Fluent Bit 日志收集