如何理解kafkajava代码的使用Producer和Consumer

这篇文章给大家介绍如何理解kafka java代码的使用Producer和Consumer，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。

成都创新互联是专业的通河网站建设公司，通河接单;提供网站制作、网站建设,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行通河网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!

用java代码对kafka消息进行消费与发送，首先我们得引入相关jar包

maven:


    org.apache.kafka
    kafka_2.10
    0.8.2.1

gradle:

compile("org.apache.kafka:kafka_2.10:0.8.2.1")

在新版本的kafka中（具体版本记不清楚了），添加了java代码实现的producer，consumer目前还是Scala的，之前的producer和consumer均是Scala编写的，在这里则介绍java版本的producer。

另一点需要特别注意：

当发送消息时我们不指定key时，producer将消息分发到各partition的机制是：

Scala版本的producer：在你的producer启动的时候，随机获得一个partition，然后后面的消息都会发送到这个partition，也就是说，只要程序启动了，这个producer都会往同一个partition里发送消息

java版本的producer：会轮询每个partition，所以发送的会比较平均

所以当使用Scala版本的producer时，尽量传入key，保证消息在partition的平均性

下面是具体的代码：

import java.io.Serializable;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.Future;

import kafka.consumer.Consumer;
import kafka.consumer.ConsumerConfig;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;

import org.apache.commons.lang.SerializationUtils;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;

import cn.qlt.study.domain.User;

public class KafkaUtil {

	
	private static KafkaProducer producer=null;

	private static ConsumerConnector consumer=null;
	
	static{
		//生产者配置文件，具体配置可参考ProducerConfig类源码，或者参考官网介绍
		Map config=new HashMap();
		//kafka服务器地址
		config.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.100.90:9092,192.168.100.91:9092");
		//kafka消息序列化类 即将传入对象序列化为字节数组
		config.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.ByteArraySerializer");
		//kafka消息key序列化类 若传入key的值，则根据该key的值进行hash散列计算出在哪个partition上
		config.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer");
		config.put(ProducerConfig.BATCH_SIZE_CONFIG, 1024*1024*5);
		//往kafka服务器提交消息间隔时间，0则立即提交不等待
		config.put(ProducerConfig.LINGER_MS_CONFIG,0);
		//消费者配置文件
		Properties props = new Properties();
		//zookeeper地址
	    props.put("zookeeper.connect", "192.168.100.90:2181");
	    //组id
	    props.put("group.id", "123");
	    //自动提交消费情况间隔时间
	    props.put("auto.commit.interval.ms", "1000");
	    
	    ConsumerConfig consumerConfig=new ConsumerConfig(props);
		producer=new KafkaProducer(config);
		consumer=Consumer.createJavaConsumerConnector(consumerConfig);
	}

	/**
	 *启动一个消费程序 
	* @param topic 要消费的topic名称
	* @param handler 自己的处理逻辑的实现
	* @param threadCount 消费线程数，该值应小于等于partition个数，多了也没用
	 */
	public static void startConsumer(String topic,final MqMessageHandler handler,int threadCount) throws Exception{
		if(threadCount<1)
			throw new Exception("处理消息线程数最少为1");
	   //设置处理消息线程数，线程数应小于等于partition数量，若线程数大于partition数量，则多余的线程则闲置，不会进行工作
	   //key:topic名称 value:线程数
	   Map topicCountMap = new HashMap();
	   topicCountMap.put(topic, new Integer(threadCount));
	   Map>> consumerMap = consumer.createMessageStreams(topicCountMap);
	   //声明一个线程池，用于消费各个partition
	   ExecutorService executor=Executors.newFixedThreadPool(threadCount);
	   //获取对应topic的消息队列
	   List> streams = consumerMap.get(topic);
	   //为每一个partition分配一个线程去消费
	   for (final KafkaStream stream : streams) {
		   executor.execute(new Runnable() {
			@Override
			public void run() {
			     ConsumerIterator it = stream.iterator();
			     //有信息则消费，无信息将会阻塞
			     while (it.hasNext()){
			        T message=null;
					try {
						//将字节码反序列化成相应的对象
						byte[] bytes=it.next().message();
						message = (T) SerializationUtils.deserialize(bytes);
					} catch (Exception e) {
						e.printStackTrace();
						return;
					}
			    	//调用自己的业务逻辑
			    	try {
						handler.handle(message);
					} catch (Exception e) {
						e.printStackTrace();
					}
			     }
			}
		});
       }
	}
	/**
	 *发送消息，发送的对象必须是可序列化的 
	 */
	public static Future send(String topic,Serializable value) throws Exception{
		try {
			//将对象序列化称字节码
			byte[] bytes=SerializationUtils.serialize(value);
			Future future=producer.send(new ProducerRecord(topic,bytes));
			return future;
		}catch(Exception e){
			throw e;
		}
	}
	
	//内部抽象类 用于实现自己的处理逻辑
	public static abstract class MqMessageHandler{
		public abstract void handle(T message);
	}
	
	
	public static void main(String[] args) throws Exception {
		//发送一个信息
		send("test",new User("id","userName", "password"));
		//为test启动一个消费者，启动后每次有消息则打印对象信息
		KafkaUtil.startConsumer("test", new MqMessageHandler() {
			@Override
			public void handle(User user) {
				//实现自己的处理逻辑，这里只打印出消息
				System.out.println(user.toString());
			}
		},2);
	}
}

如何理解kafkajava代码的使用Producer和Consumer

其他资讯