Kafka 入门安装

背景

Kafka 和 RabbitMQ 均为消息队列产品，各自特点如下：

吞吐：Kafka >> RabbitMQ
可靠性：RabbitMQ > Kafka，RabbitMQ 有消息确认机制，支持事务
可用性：Kafka 支持主备，RabbitMQ 支持 queue 的 mirror

安装

下载：http://kafka.apache.org/downloads
解压：tar xf kafka_2.11-1.0.0.tgz

启动 Server

启动单机版 Zookeeper


bin/zookeeper-server-start.sh config/zookeeper.properties

启动 Kafka Server


bin/kafka-server-start.sh config/server.properties

topic

创建 topic

创建一下 test 的 topic，包含一个分区和一个分片


$ bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

Created topic "test".

查看 topic


$ bin/kafka-topics.sh --list --zookeeper localhost:2181

test

发送消息


$ bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
>This is a message
>This is another message

订阅消息


$ bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning
This is a message
This is another message

如果发送和订阅在两个终端，在发送消息时，可以在订阅终端实时看到消息

删除 topic


bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic test

多 broker

略，详见官方 quickstart

使用 kafka connect 来导入导出数据

导入导出数据

生成测试数据


echo -e "foo\nbar" > test.txt


bin/connect-standalone.sh config/connect-standalone.properties config/connect-file-source.properties config/connect-file-sink.properties

三个配置文件，分别为

集群配置文件
source connector: 从 input 文件 test.txt 读入数据，到 kafka
sink connector: 从 kafka 读出数据，写入文件 test.sink.txt

重新订阅数据

上面的测试数据保存在 topic: connect-test 中，可以从头再订阅数据


$ bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic connect-test --from-beginning
{"schema":{"type":"string","optional":false},"payload":"foo"}
{"schema":{"type":"string","optional":false},"payload":"bar"}

继续写数据


$ echo "Another Line" >> test.txt

使用 kafka stream 来数据处理

官方 quickstart

Java Client

pom

pom.xml


		<dependency>
			<groupId>org.apache.kafka</groupId>
			<artifactId>kafka_2.10</artifactId>
			<version>0.10.2.1</version>
		</dependency>

producer


import  java.util.Properties;

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;

public class MainKafkaProducer {
    public static void main(String[] args) throws InterruptedException {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        Producer producer = new KafkaProducer(props);

        for(int i = 0; i < 100; i++) {
            producer.send(new ProducerRecord("fw-blink-test", i % 1, Integer.toString(i), Integer.toString(i)));
            Thread.sleep(1000L);
        }
        producer.flush();
        producer.close();
    }
}

Consumer


import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;

import kafka.consumer.Consumer;
import kafka.consumer.ConsumerConfig;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;

public class MainKafkaConsumer {
    public static void main(String[] args) throws InterruptedException {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("zookeeper.connect", "localhost:2181");
        props.put("group.id", "group1");

        ConsumerConnector consumer = Consumer.createJavaConsumerConnector(new ConsumerConfig(props));

        Map topicCountMap = new HashMap();

        String topic = "fw-blink-test";

        // 一次从主题中获取一个数据
        topicCountMap.put(topic, 1);

        Mapbyte[], byte[]>>>  messageStreams = consumer.createMessageStreams(topicCountMap);

        // 获取每次接收到的这个数据
        KafkaStream<byte[], byte[]> stream = messageStreams.get(topic).get(0);
        ConsumerIterator<byte[], byte[]> iterator =  stream.iterator();
        while(iterator.hasNext()){
            String message = new String(iterator.next().message());
            System.out.println("接收到: " + message);
        }
    }
}

什么是形变（Type Variance）？

[图片] 在类型系统中，协变（covariance）和逆变（contravariance）统称为型变（variance）。它们描述的是在类型变换的作用下，子类型关系是否以及如何发生变化。什么是型变（Variance）？我们先看一个抽象模型：设有两个类型 X 和 Y，若 X ≤ Y 表示 X 是 Y 的子 ..

什么是责任链模式？

[图片] 什么是责任链模式在构建复杂系统时，我们常常面临这样的挑战：一个请求或事件需要经过多个处理环节，这些环节可能动态变化，处理者在运行时才能确定。如何优雅地组织这些处理逻辑，避免代码陷入臃肿的'巨无霸方法'困境？想象这样的场景：系统启动初始化流程需要依次执行用户初始化、展示数据加载、元数据配置和系统 Ban ..

源码学习方式

方法论：先会使用全局观，不要专注细节看注释（类、方法、接口）见名知意大胆猜测，小心验证画图（时序图、类图、结构图、总结图），ipad 做笔记学习顺序坚持！！（不管多难）学习顺序： spring -> springmvc -> mybatis -> springboot -> s ..

mvn 常用的基本命令

怎么在笔记中单独引用（或插入同步）数据库里的一个单元格？一、通过 Maven 命令行拉取依赖打开 IDEA 的终端操作路径：点击 IDEA 底部工具栏的 Terminal 标签（或顶部菜单 View → Tool Windows → Terminal）。快捷键：Windows/Linux: Alt + F12， ..

== 和 equals

　　==对比的是栈中的值，基本数据类型是变量值，引用类型是堆中内存对象的地址　　equals：object 中默认也是采用==比较，通常会重写 public boolean equals（Object obj）{ return (this == obj); } String 中的equals方法被重写 public ..

开源项目分享：JavadocMark - 为 AI 时代重新定义 Java 文档

[图片] 开源项目分享：JavadocMark - 为 AI 时代重新定义 Java 文档在当前以 Cursor、Copilot 为代表的 AI 辅助编程时代，Java 开发者面临着一个独特的挑战：尽管传统的 Javadoc 文档系统完备且规范，但 AI 模型往往难以准确理解和运用这些文档，导致生成的代码可能无法准确 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于