Logstash 是如何工作的

此篇文章翻译于官方文档：https://www.elastic.co/guide/en/logstash/7.10/pipeline.html

Logstash 事件处理管道分为三个阶段：inputs -> filters -> outputs。inputs 生成事件，事件其实是数据的输入，filters 处理输入的数据，outputs 将处理完毕的数据搬运到其他位置。inputs 和 outputs 支持编解码，它可以让你在进入或退出管道时对数据进行编解码，而无需使用单独的 filter。

Inputs

使用 inputs 将数据输送给 Logstash，下面是一些常见的 inputs：

file：从文件系统读取的文件；
syslog：从 514 端口获取系统日志，并根据 RFC3164 规范进行解析到 Logstash；
redis：从 redis 服务器读取，可以通过 redis channel 和 redis list 两个渠道。Redis 通常作为 Logstash 整体流程中的”中间商“，负责将远程的 Logstash ”采集者“的数据进行存储排队；
beats：通过 beats 将数据发给 Logstash。

更多可用的 inputs 种类查看 Input Plugins。

Filters

Filters 是 Logstash 管道中的中间处理设备。如果数据符合特定条件，可以将 filter 与条件结合起来对数据执行操作。以下是一些常见的 filters：

grok：可以解析和构造任意文本。Grok 目前是 Logstash 中将非结构化日志数据转换为结构化可查询数据的最佳方式。它将 12 种模式内置于 Logstash，你很可能会找到满足你需求的模式；
mutate：对数据的字段进行常规转换。可以重命名、删除、替换和修改数据中的字段；
drop：完全删除一条数据，比如：用作调试的数据；
clone：制作数据的副本，可能会添加或删除数据；
geoip：可以添加 IP 地址对应的地理位置数据（同时在 Kibana 也会有很惊艳的图标展示！）。

更多可用的 filters 种类查看 Filter Plugins。

Outputs

outputs 是 Logstash 管道处理的最后阶段。一个数据可以经过多个 output，但是一旦所有的 output 都处理完成，这条数据就算是完成了它的执行。一些常用的 outputs：

elasticsearch：将数据发送到 Elasticsearch。如果打算以高效、方便且易于查询的格式保存数据，Elasticsearch 是不二之选；
file：将数据写入到磁盘上的文件中；
graphite：将数据发送到 Graphite，Graphite 是一种用于存储和绘制指标的流行开源工具。http://graphite.readthedocs.io/en/latest/
statsd：将数据发送到 statsd，这是一项”监听统计信息，如计数器和计时器，通过 UDP 发送并将数据聚合发送到一个或多个后端服务“的服务。

更多可用的 outputs 种类查看 Output Plugins。

Codecs

Codecs 可以视为在 Inputs 和 Outputs 端运行的流过滤器。编解码器能够轻松的将消息的传输与序列化过程分开。流行的 codecs 包括 json、msgpack 和 plain（文本）。

json：使用 JSON 的形式进行编解码；
multiline：将多行文本数据（例如 Java 异常和堆栈信息）合并为一条消息。

更多可用的 codecs 种类查看 Codec Plugins

Java SPI

[图片] 是什么 Java SPI 的全称是 Java Service Provider Interface，是一种动态加载服务的机制。这些专有名字听起来有点难理解，比较抽象，其实从用法和最后的实现结果上来看，Java SPI 就是一个让开发者可以使用配置文件来动态指定某个接口或者抽象类的具体实现是哪一个类的机制。我们 ..

使用 k8s 搭建 elk

[图片] ELK 到底是什么呢？ELK 是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash 和 Kibana。Elasticsearch 是一个搜索和分析引擎。Logstash 是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如 Elasticse ..

ELK 系统搭建笔记

[图片] 在微服务架构下，服务的数量以及服务集群等，日志散落在各个服务器里，这样不管是运维还是查找问题，都是一件非常困难的事情，这时候日志的统一管理就显得非常重要，ELK 就是为了解决日志管理的问题，ELK 被称为日志分析系统，是三款开源软件的简称，分别是 Elasticsearch+Logstash+Kibana，本 ..

从一份定义文件详解 ELK 中 Logstash 插件结构

[图片] 概述当下分布式系统的日志收集、日志分析、日志处理、可视化的热门技术栈方案当然非 ELK（ElasticSearch、Logstash、Kibana）莫属，从 L → E → K 构成了一条数据的 Pipeline 管道： Logstash：与数据源对接，用于收集、过滤处理你的日志、事务或其他数据 Ela ..

开源翻译公告 2020.10.26：新上线了几个文档

我们已翻译的文档非常多，免得各位眼晕，以后就不直接贴整个列表了，只把新上线的文档公告一下。（1）AILearning 新增“数据分析”和“PyTorch”部分：阅读：https://ailearning.apachecn.org 仓库：https://github.com/apachecn/ailearning （ ..

FFmpeg Utility 帮助文档翻译

描述这个文档描述了一些由 libavutil library 提供的通用特性。语法 FFmpeg libraries 和 tools 使用了这部分文档的语法和格式。引用和转义除了特殊标明的地方，FFmpeg 默认采用下述规则进行引用和转义： ' 和**\** 是特殊符号（分别用于引用和转义）。除它们外，取决于包 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于