版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
消息队列:Pulsar:Pulsar消息模型与消息类型1消息队列基础1.1消息队列的定义消息队列是一种应用程序间通信(IPC)的模式,它允许消息在发送者和接收者之间异步传递。消息队列中的消息遵循先进先出(FIFO)原则,但同时也支持更复杂的路由策略。消息队列可以提高系统的解耦性、可扩展性和容错能力。1.2消息队列的作用消息队列在现代分布式系统中扮演着关键角色,主要作用包括:异步处理:允许发送者和接收者异步操作,提高系统响应速度。负载均衡:通过消息队列,可以将任务均匀地分配给多个处理者。削峰填谷:在高负载时,消息队列可以缓存消息,避免系统过载。系统解耦:发送者和接收者不需要直接通信,降低了系统的耦合度。数据持久化:消息队列通常会将消息持久化到磁盘,确保消息不会因系统故障而丢失。1.3Pulsar简介ApachePulsar是一个高性能、可扩展的分布式消息队列系统,由Yahoo开发并开源,现已成为Apache软件基金会的顶级项目。Pulsar提供了消息队列和发布/订阅两种消息模式,支持多种消息类型,包括二进制、JSON、Avro等。Pulsar的核心特性包括:持久化和非持久化消息:消息可以被持久化到磁盘,也可以选择在内存中短暂存储。多租户和多层安全性:支持多租户环境,提供细粒度的访问控制和身份验证。水平扩展:可以轻松地通过增加更多的Broker来扩展系统的吞吐量和存储能力。全球分布:支持跨数据中心的全球分布,确保数据的高可用性和低延迟访问。1.3.1Pulsar消息模型Pulsar的消息模型基于主题(Topic)和订阅(Subscription)。一个主题可以有多个生产者(Producer)和消费者(Consumer),生产者向主题发送消息,消费者从主题中消费消息。订阅者可以以独占、共享或键共享模式订阅主题,这决定了消息如何在消费者之间分发。1.3.2Pulsar消息类型Pulsar支持多种消息类型,包括:二进制消息:最基础的消息类型,可以是任何二进制数据。JSON消息:用于传输结构化数据,便于解析和处理。Avro消息:提供数据序列化和反序列化,支持模式演进。示例:使用Java发送JSON消息到Pulsarimportorg.apache.pulsar.client.api.Schema;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassPulsarProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
//创建Pulsar客户端
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
//创建生产者,使用JSON模式
Producer<String>producer=client.newProducer(Schema.JSON(String.class))
.topic("my-topic")
.create();
//发送消息
for(inti=0;i<10;i++){
Stringmessage="HelloPulsar"+i;
producer.send(message);
}
//关闭生产者和客户端
producer.close();
client.close();
}
}在上述示例中,我们首先创建了一个Pulsar客户端,然后使用Schema.JSON(String.class)指定了消息的类型为JSON。接着,我们创建了一个生产者并发送了10条消息到主题my-topic。最后,我们关闭了生产者和客户端,确保资源被正确释放。示例:使用Java从Pulsar消费JSON消息importorg.apache.pulsar.client.api.Consumer;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importorg.apache.pulsar.client.api.SubscriptionType;
publicclassPulsarConsumer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
//创建Pulsar客户端
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
//创建消费者,使用JSON模式
Consumer<String>consumer=client.newConsumer(Schema.JSON(String.class))
.topic("my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Exclusive)
.subscribe();
//消费消息
while(true){
Message<String>msg=consumer.receive();
System.out.println("Receivedmessage:"+msg.getValue());
//确认消息已被消费
consumer.acknowledge(msg);
}
}
}在这个消费示例中,我们创建了一个消费者,同样使用了Schema.JSON(String.class)来指定消息类型。我们订阅了主题my-topic,并使用了独占订阅模式(SubscriptionType.Exclusive)。然后,我们进入一个无限循环,接收并打印消息,最后确认消息已被消费。通过这些示例,我们可以看到Pulsar如何处理不同类型的异步消息,以及如何在生产者和消费者之间建立通信。Pulsar的灵活性和强大的功能使其成为构建现代分布式系统时的首选消息队列系统。2消息队列:Pulsar:深入理解Pulsar消息模型2.1消息的结构在ApachePulsar中,消息的结构设计得非常灵活和高效,以适应不同的应用场景。一个Pulsar消息主要由以下几部分组成:Payload:消息的实际内容,可以是任何类型的数据,如JSON、XML或二进制数据。Properties:一组键值对,用于存储消息的元数据,如消息的创建时间、内容类型等。MessageID:每个消息都有一个唯一的ID,用于消息的追踪和管理。Schema:定义了消息的结构,使得消息的发送者和接收者能够理解消息的内容。2.1.1示例代码importorg.apache.pulsar.client.api.Schema;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassMessageStructureExample{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<String>producer=client.newProducer(Schema.STRING)
.topic("persistent://sample/standalone/ns/my-topic")
.create();
StringmessageContent="{\"name\":\"John\",\"age\":30}";
Message<String>message=Message.builder()
.value(messageContent)
.properties(Map.of("type","user","timestamp",String.valueOf(System.currentTimeMillis())))
.build();
producer.send(message);
producer.close();
client.close();
}
}在上述代码中,我们创建了一个Producer对象,使用Schema.STRING定义了消息的结构。然后,我们构建了一个消息,其中包含了实际的payload(messageContent)和一些properties(如类型和时间戳)。2.2消息的生命周期Pulsar消息的生命周期从消息被生产者发送开始,直到被消费者消费并确认为止。在这个过程中,消息可能会经历以下状态:待发送:消息在生产者缓存中等待发送。发送中:消息正在通过网络发送到PulsarBroker。已发送:消息成功发送到Broker,存储在消息日志中。待消费:消息存储在Broker中,等待被消费者消费。消费中:消费者正在处理消息。已消费:消费者成功处理消息,并向Broker发送确认。2.2.1示例代码importorg.apache.pulsar.client.api.Consumer;
importorg.apache.pulsar.client.api.MessageId;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassMessageLifecycleExample{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Consumer<String>consumer=client.newConsumer(Schema.STRING)
.topic("persistent://sample/standalone/ns/my-topic")
.subscriptionName("my-subscription")
.subscribe();
Message<String>message=consumer.receive();
System.out.println("Receivedmessage:"+message.getValue());
//消费者处理消息
//...
//确认消息已被消费
consumer.acknowledge(message.getMessageId());
consumer.close();
client.close();
}
}在本例中,我们创建了一个Consumer对象,订阅了特定的主题。当消息到达时,consumer.receive()方法将消息从Broker中取出,进入“消费中”状态。一旦消息被处理,我们通过调用consumer.acknowledge()方法来确认消息已被消费,从而完成其生命周期。2.3消息的发布与订阅机制Pulsar提供了多种发布与订阅机制,以满足不同的需求。主要的发布与订阅模式包括:独占订阅(Exclusive):只有一个消费者可以订阅一个主题,所有消息都只能被这一个消费者消费。共享订阅(Shared):多个消费者可以订阅一个主题,消息会被分发给所有订阅者中的一个,确保每个消息只被消费一次。故障转移订阅(Failover):类似于独占订阅,但是当当前的消费者不可用时,消息会被转发给下一个消费者。2.3.1示例代码importorg.apache.pulsar.client.api.Consumer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassPublishSubscribeExample{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Consumer<String>consumer1=client.newConsumer(Schema.STRING)
.topic("persistent://sample/standalone/ns/my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Exclusive)
.subscribe();
Consumer<String>consumer2=client.newConsumer(Schema.STRING)
.topic("persistent://sample/standalone/ns/my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Exclusive)
.subscribe();
//尝试接收消息,由于是独占订阅,consumer2将无法接收消息
Message<String>message1=consumer1.receive();
Message<String>message2=consumer2.receive();//这里consumer2将阻塞,直到consumer1确认或放弃消息
//消费者处理消息
//...
//确认消息已被消费
consumer1.acknowledge(message1.getMessageId());
consumer1.close();
consumer2.close();
client.close();
}
}在上述代码中,我们创建了两个消费者consumer1和consumer2,并使用SubscriptionType.Exclusive指定了独占订阅模式。这意味着所有发送到主题的消息将只被consumer1或consumer2中的一个消费,而不会同时被两个消费者接收。通过这些示例,我们可以看到Pulsar消息模型的灵活性和强大功能,以及如何通过代码实现消息的结构定义、生命周期管理和发布订阅机制。这为构建高效、可靠的消息处理系统提供了坚实的基础。3Pulsar消息类型详解在ApachePulsar消息队列中,消息可以采用多种格式进行编码和传输,以适应不同的应用场景和数据处理需求。本教程将深入探讨Pulsar支持的四种主要消息类型:二进制消息、JSON消息、Avro消息以及其他消息格式。3.1进制消息二进制消息是最基本的消息类型,它允许消息以原始字节流的形式发送。这种类型的消息适用于任何可以序列化为字节流的数据,包括但不限于自定义的二进制数据、图像、音频文件等。3.1.1示例代码importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassBinaryProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<byte[]>producer=client.newProducer().topic("binary-topic").create();
//创建二进制消息
byte[]binaryData=newbyte[]{0x01,0x02,0x03,0x04};
producer.send(binaryData);
//关闭生产者和客户端
producer.close();
client.close();
}
}3.1.2解释在上述示例中,我们创建了一个Pulsar客户端,并使用它来创建一个生产者,该生产者将二进制数据发送到名为binary-topic的主题中。二进制数据直接以字节数组的形式发送,无需额外的编码或解码步骤。3.2JSON消息JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。Pulsar支持JSON消息,这使得在消息中传输结构化数据变得简单。3.2.1示例代码importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importcom.fasterxml.jackson.databind.ObjectMapper;
publicclassJSONProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<String>producer=client.newProducer().topic("json-topic").create();
//创建JSON消息
ObjectMappermapper=newObjectMapper();
Useruser=newUser("JohnDoe",30);
StringjsonMessage=mapper.writeValueAsString(user);
producer.send(jsonMessage.getBytes());
//关闭生产者和客户端
producer.close();
client.close();
}
staticclassUser{
Stringname;
intage;
publicUser(Stringname,intage){
=name;
this.age=age;
}
}
}3.2.2解释此示例展示了如何使用Java的ObjectMapper类将一个简单的User对象转换为JSON字符串,然后将其发送到Pulsar的主题json-topic中。User对象包含姓名和年龄两个字段,通过序列化为JSON格式,可以方便地在消息中传输结构化数据。3.3Avro消息ApacheAvro是一种数据序列化系统,它不仅提供紧凑、快速的二进制数据序列化,还支持模式演进,即在不破坏向后兼容性的情况下,可以修改数据模式。Pulsar通过Avro编码支持高效地传输复杂数据结构。3.3.1示例代码importorg.apache.avro.Schema;
importorg.apache.avro.generic.GenericData;
importorg.apache.avro.generic.GenericRecord;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importorg.apache.pulsar.client.impl.schema.AvroSchema;
publicclassAvroProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<GenericRecord>producer=client.newProducer(AvroSchema.of(User.class)).topic("avro-topic").create();
//创建Avro消息
Useruser=newUser();
user.setName("JaneDoe");
user.setAge(25);
producer.send(user);
//关闭生产者和客户端
producer.close();
client.close();
}
staticclassUserextendsGenericData.Record{
publicUser(){
Schemaschema=newSchema.Parser().parse("{"
+"\"type\":\"record\","
+"\"name\":\"User\","
+"\"fields\":["
+"{\"name\":\"name\",\"type\":\"string\"},"
+"{\"name\":\"age\",\"type\":\"int\"}"
+"]"
+"}");
super(schema);
}
publicvoidsetName(Stringname){
put("name",name);
}
publicvoidsetAge(intage){
put("age",age);
}
}
}3.3.2解释在AvroProducer示例中,我们首先定义了一个Avro模式,该模式描述了User对象的结构,包括name和age字段。然后,我们使用Pulsar的AvroSchema创建一个生产者,将User对象直接发送到avro-topic主题。Avro的模式演进特性使得在数据结构发生变化时,仍然能够保证消息的正确传输和解析。3.4其他消息格式除了上述提到的二进制、JSON和Avro消息格式,Pulsar还支持其他消息格式,如Protobuf、XML等。这些格式的选择取决于具体的应用场景和数据处理需求。3.4.1Protobuf消息Protobuf(ProtocolBuffers)是Google开发的一种数据交换格式,它提供了高效的序列化和反序列化机制,特别适合于传输大量结构化数据。3.4.2示例代码importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importtobuf.GeneratedMessageV3;
publicclassProtobufProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<GeneratedMessageV3>producer=client.newProducer(Schema.PROTOBUF(UserProto.User.getDefaultInstance())).topic("protobuf-topic").create();
//创建Protobuf消息
UserProto.Useruser=UserProto.User.newBuilder()
.setName("Alice")
.setAge(35)
.build();
producer.send(user.toByteArray());
//关闭生产者和客户端
producer.close();
client.close();
}
}3.4.3解释在ProtobufProducer示例中,我们使用了Google的Protobuf库来定义User消息的结构,并通过Pulsar的ProtobufSchema创建了一个生产者。User对象通过toByteArray方法转换为字节数组,然后发送到protobuf-topic主题。Protobuf的高效性和紧凑性使其成为处理大量结构化数据的理想选择。3.5结论Pulsar通过支持多种消息格式,如二进制、JSON、Avro和Protobuf,为开发者提供了灵活的数据传输和处理选项。选择合适的消息格式可以显著提高消息处理的效率和可靠性,同时简化数据的序列化和反序列化过程。在实际应用中,应根据数据的特性和处理需求来选择最合适的格式。请注意,上述代码示例假设你已经定义了相应的Protobuf消息结构(UserProto),并且在项目中包含了必要的依赖库。在实际应用中,你可能需要根据自己的数据模型和需求进行相应的调整。4消息发布4.1生产者角色在ApachePulsar消息队列中,生产者是负责生成和发送消息的组件。生产者通过连接到Pulsar的Broker,将消息发送到特定的Topic中。每个Topic可以有多个生产者,这意味着多个应用程序或服务可以同时向同一个Topic发送消息,从而实现高并发的消息发布能力。4.1.1发布消息流程创建Producer对象:生产者首先需要创建一个Producer对象,这通常通过PulsarClient的createProducer方法完成。发送消息:使用Producer对象的send方法将消息发送到指定的Topic。消息可以是任意类型的数据,但在发送前需要被序列化为字节流。确认消息发送:Pulsar支持消息发送的确认机制,确保消息被成功发送到Broker。如果消息发送失败,生产者可以重新发送消息。关闭Producer:在完成消息发送后,生产者应该调用close方法来释放资源。4.1.2消息持久化策略Pulsar提供了多种消息持久化策略,以确保消息在Broker故障时不会丢失。这些策略包括:消息存储:Pulsar使用ApacheBookKeeper作为其后端存储系统,所有消息都会被持久化到磁盘上。消息复制:Pulsar支持消息的跨Broker复制,以提高系统的可用性和容错性。复制策略可以是同步或异步的。消息过期:Pulsar允许设置消息的过期时间,过期的消息将被自动删除,以节省存储空间。4.2示例代码:创建生产者并发送消息importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.ProducerConfiguration;
importorg.apache.pulsar.client.api.Schema;
publicclassPulsarProducerExample{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
//创建PulsarClient实例
PulsarClientclient=PulsarClient.builder()
.serviceUrl("pulsar://localhost:6650")
.build();
//创建Producer配置
ProducerConfiguration<String>producerConfiguration=ProducerConfiguration.builder()
.schema(Schema.STRING)
.build();
//创建Producer
Producer<String>producer=client.newProducer(producerConfiguration)
.topic("persistent://public/default/my-topic")
.create();
//发送消息
for(inti=0;i<10;i++){
Stringmessage="HelloPulsar"+i;
producer.send(message);
}
//关闭Producer
producer.close();
//关闭PulsarClient
client.close();
}
}4.2.1代码解释创建PulsarClient:通过PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();创建一个PulsarClient实例,其中serviceUrl指定了Pulsar服务的URL。创建Producer配置:使用ProducerConfiguration.builder().schema(Schema.STRING).build();创建一个Producer配置对象,指定了消息的Schema为字符串类型。创建Producer:通过client.newProducer(producerConfiguration).topic("persistent://public/default/my-topic").create();创建一个Producer,其中topic指定了消息将被发送到的Topic。发送消息:使用producer.send(message);方法发送消息到指定的Topic。关闭Producer和PulsarClient:在完成消息发送后,调用producer.close();和client.close();来释放资源。通过以上步骤,我们可以看到Pulsar消息队列中消息发布的完整流程,从创建生产者到发送消息,再到资源的释放,每一步都遵循了Pulsar的API规范,确保了消息的正确发送和系统的稳定运行。5消息消费5.1消费者角色在ApachePulsar消息队列中,消费者是消息的接收者。它们订阅主题,接收并处理由生产者发送的消息。消费者可以是任何能够接收和处理消息的应用程序或服务。在Pulsar中,消费者通过创建一个Consumer对象来订阅主题,这个对象提供了接收消息的方法。5.1.1示例代码importorg.apache.pulsar.client.api.Consumer;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassPulsarConsumerExample{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
//创建Pulsar客户端
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
//创建消费者,订阅主题
Consumer<String>consumer=client.newConsumer()
.topic("persistent://public/default/my-topic")
.subscriptionName("my-subscription")
.subscribe();
//接收消息
Message<String>msg=consumer.receive();
//处理消息
System.out.println("Receivedmessage:"+msg.getValue());
//确认消息已处理
consumer.acknowledge(msg);
//关闭消费者和客户端
consumer.close();
client.close();
}
}5.2消息消费模式Pulsar支持两种主要的消息消费模式:独占(Exclusive)和共享(Shared)。5.2.1独占消费在独占消费模式下,一个订阅只能被一个消费者使用。这意味着如果多个消费者尝试订阅同一个主题和订阅名称,只有第一个消费者能够成功订阅,其他消费者将收到错误。这种模式适用于需要确保消息只被一个消费者处理的情况。5.2.2共享消费共享消费模式允许多个消费者订阅同一个主题和订阅名称。消息将被分发给订阅中的任意一个消费者,确保消息至少被处理一次。这种模式适用于需要高可用性和负载均衡的场景。5.2.3示例代码//独占消费模式
Consumer<String>exclusiveConsumer=client.newConsumer()
.topic("persistent://public/default/my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Exclusive)
.subscribe();
//共享消费模式
Consumer<String>sharedConsumer=client.newConsumer()
.topic("persistent://public/default/my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Shared)
.subscribe();5.3消息重试与死信队列在处理消息时,如果消费者未能成功处理消息,Pulsar提供了消息重试机制。消息可以被重新发送给消费者,直到成功处理。如果消息在多次重试后仍然无法处理,它可以被移动到死信队列(DeadLetterQueue)。5.3.1消息重试消费者可以通过negativeAcknowledge方法来标记消息为未处理,这将触发消息重试。Pulsar允许配置重试策略,包括重试次数和重试间隔。5.3.2死信队列死信队列用于存储那些无法被正常处理的消息。这些消息可以被单独处理或分析,以找出处理失败的原因。在Pulsar中,可以通过配置主题的策略来启用死信队列。5.3.3示例代码//消费者处理消息失败,请求重试
consumer.negativeAcknowledge(msg);
//配置主题策略,启用死信队列
TopicPoliciespolicies=newTopicPolicies();
policies.setDeadLetterTopic("persistent://public/default/my-dead-letter-topic");
client.getAdmin().topics().updateTopicPolicies("persistent://public/default/my-topic",policies);通过上述代码和解释,我们深入了解了Pulsar中消费者角色的定义、消息消费的不同模式,以及如何处理消息重试和死信队列。这些机制确保了消息的可靠处理和系统的高可用性。6消息路由策略6.1消息分发原理在消息队列系统中,如ApachePulsar,消息的分发是一个关键过程,它决定了消息如何从生产者到达消费者。Pulsar通过其独特的消息模型和灵活的路由策略,确保了消息的高效、有序和可靠传输。消息分发原理基于以下几点:主题(Topic):在Pulsar中,消息被发布到特定的主题上,这些主题可以是持久的或非持久的,根据消息的存储需求而定。分区(Partition):为了提高吞吐量和可扩展性,主题可以被划分为多个分区,每个分区独立存储和处理消息。消费者(Consumer):消费者订阅主题以接收消息。Pulsar支持独占、共享和键共享三种订阅类型,以满足不同的消费模式。消息路由:生产者发送消息时,Pulsar根据配置的路由策略决定将消息发送到哪个分区。这确保了消息的均衡分布和处理。6.2路由策略类型Pulsar提供了多种消息路由策略,以适应不同的应用场景和需求:RoundRobin:轮询策略,将消息均匀地分发到所有分区,以实现负载均衡。KeyBased:基于消息键的策略,根据消息中的键将消息路由到特定的分区,确保具有相同键的消息被发送到同一分区,便于实现消息的有序处理。Custom:自定义策略,允许用户实现自己的消息路由逻辑,提供最大的灵活性。6.2.1RoundRobin路由策略原理RoundRobin策略是最简单的消息分发方式,它将消息轮流发送到不同的分区,确保每个分区的负载大致相同。这种策略适用于消息大小和处理时间相对均匀的场景。示例假设我们有一个主题my-topic,它被划分为4个分区。使用RoundRobin策略,消息将按照以下顺序被发送:第1条消息发送到分区0第2条消息发送到分区1第3条消息发送到分区2第4条消息发送到分区3第5条消息再次发送到分区0,以此类推。6.2.2KeyBased路由策略原理KeyBased策略根据消息中的键(key)将消息路由到特定的分区。如果消息包含相同的键,它们将被发送到同一分区,这有助于实现消息的有序处理和聚合。键可以是消息中的任意字段,也可以是自定义的键生成逻辑。示例假设我们有一个主题my-topic,它被划分为3个分区。消息包含一个用户ID作为键,ID为1的消息将始终被发送到分区0,ID为2的消息将被发送到分区1,ID为3的消息将被发送到分区2,以此类推。#Python示例代码
importpulsar
client=pulsar.Client('pulsar://localhost:6650')
producer=client.create_producer('my-topic',key_type='string')
#发送消息,键为用户ID
foriinrange(10):
key=str(i%3)#生成键,确保消息被均匀分布到3个分区
producer.send(('message-'+str(i)).encode('utf-8'),key=key)
client.close()6.2.3Custom路由策略原理Custom策略允许用户实现自己的消息路由逻辑。这提供了最大的灵活性,但同时也要求用户对消息队列的性能和可靠性有深入的理解。自定义策略可以通过实现Pulsar的MessageRouter接口来实现。示例假设我们想要根据消息的类型(例如,交易、日志、警报)将消息路由到不同的分区,可以实现一个自定义的路由策略。//Java示例代码
importorg.apache.pulsar.client.api.MessageRouter;
importorg.apache.pulsar.client.api.MessageRouterBuilder;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
publicclassCustomMessageRouterimplementsMessageRouter<String>{
@Override
publicintroute(Stringkey,intnumPartitions){
if(key.startsWith("transaction")){
return0;//交易消息发送到分区0
}elseif(key.startsWith("log")){
return1;//日志消息发送到分区1
}elseif(key.startsWith("alert")){
return2;//警报消息发送到分区2
}
returnnumPartitions/2;//默认情况下,将消息发送到中间分区
}
}
publicclassCustomProducer{
publicstaticvoidmain(String[]args)throwsException{
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
MessageRouterBuilder<String>routerBuilder=MessageRouter.custom(newCustomMessageRouter());
Producer<String>producer=client.newProducer(Schema.STRING)
.topic("my-topic")
.messageRoutingMode(MessageRoutingMode.SinglePartition)
.messageRouter(routerBuilder)
.create();
//发送不同类型的消息
producer.send("transaction-1","transaction");
producer.send("log-2","log");
producer.send("alert-3","alert");
client.close();
}
}6.3策略配置示例在Pulsar中,配置路由策略可以通过修改生产者创建时的参数来实现。以下是一个使用RoundRobin策略的配置示例://Java示例代码
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.Producer;
PulsarClientclient=PulsarClient.builder().serviceUrl("pulsar://localhost:6650").build();
Producer<String>producer=client.newProducer(Schema.STRING)
.topic("my-topic")
.messageRoutingMode(MessageRoutingMode.RoundRobinPartition)
.create();在这个示例中,messageRoutingMode参数被设置为RoundRobinPartition,这告诉Pulsar使用轮询策略来分发消息。对于KeyBased策略,可以通过在发送消息时指定键来实现:producer.send(("message-"+i).getBytes(),"key-"+(i%3));在这个示例中,消息的键被设置为"key-"+(i%3),这确保了具有相同键的消息被发送到同一分区。对于Custom策略,需要实现MessageRouter接口,并在创建生产者时指定自定义的路由策略。MessageRouterBuilder<String>routerBuilder=MessageRouter.custom(newCustomMessageRouter());
Producer<String>producer=client.newProducer(Schema.STRING)
.topic("my-topic")
.messageRoutingMode(MessageRoutingMode.SinglePartition)
.messageRouter(routerBuilder)
.create();在这个示例中,CustomMessageRouter类实现了自定义的路由逻辑,通过MessageRouterBuilder和messageRouter参数,可以将这个自定义策略应用到生产者上。通过以上示例,我们可以看到Pulsar提供了丰富的消息路由策略,以满足不同场景的需求。选择合适的策略对于优化消息队列的性能和可靠性至关重要。7高级消息处理7.1消息压缩在消息队列系统中,如ApachePulsar,消息压缩是一种优化网络传输和存储空间的有效手段。Pulsar支持多种压缩算法,包括LZ4、ZLIB、ZSTD等,以适应不同的性能和压缩比需求。7.1.1原理消息压缩在消息发送前进行,将原始消息数据转换为更小的二进制格式,从而减少在网络上传输的数据量和存储空间的占用。接收方在消费消息时,会自动解压缩消息,恢复原始数据。7.1.2示例在Pulsar中,可以通过设置producer的compressionType属性来启用消息压缩。以下是一个使用LZ4压缩算法的示例:importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassCompressedProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder()
.serviceUrl("pulsar://localhost:6650")
.build();
Producer<byte[]>producer=client.newProducer()
.topic("persistent://sample/standalone/ns/my-topic")
.compressionType(CompressionType.LZ4)
.create();
Stringmessage="Hello,Pulsar!";
producer.send(message.getBytes());
producer.close();
client.close();
}
}7.1.3解释在上述代码中,我们创建了一个PulsarClient实例,并指定了服务URL。然后,我们创建了一个Producer,设置了topic和compressionType为LZ4。发送消息时,原始字符串被转换为字节数组,然后通过压缩的Producer发送。接收方会自动解压缩消息,无需额外的解压缩逻辑。7.2消息时间戳在Pulsar中,每条消息都有一个时间戳,用于记录消息的创建时间或发送时间。时间戳可以用于实现时间窗口、消息延迟发送等功能。7.2.1原理Pulsar允许在消息发送时指定时间戳,如果没有指定,系统会自动使用消息发送时的时间作为时间戳。时间戳以毫秒为单位,存储在消息的元数据中。7.2.2示例以下是一个在发送消息时指定时间戳的示例:importorg.apache.pulsar.client.api.MessageBuilder;
importorg.apache.pulsar.client.api.Producer;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
publicclassTimestampProducer{
publicstaticvoidmain(String[]args)throwsPulsarClientException{
PulsarClientclient=PulsarClient.builder()
.serviceUrl("pulsar://localhost:6650")
.build();
Producer<byte[]>producer=client.newProducer()
.topic("persistent://sample/standalone/ns/my-topic")
.create();
longtimestamp=System.currentTimeMillis()+10000;//发送10秒后的时间
Stringmessage="Hello,Pulsar!";
producer.newMessage()
.value(message.getBytes())
.timestamp(timestamp)
.send();
producer.close();
client.close();
}
}7.2.3解释在本例中,我们创建了一个Producer,并通过newMessage()方法创建了一个消息构建器。我们指定了一个未来的时间戳,使得消息在10秒后才被标记为发送。这在实现延迟消息处理时非常有用。7.3消息顺序保证在分布式系统中,消息的顺序处理是一个常见的需求。Pulsar提供了消息顺序保证的机制,确保消息按照发送的顺序被消费。7.3.1原理Pulsar通过在Producer和Consumer上设置相应的属性来实现消息顺序。在Producer端,可以设置blockIfQueueFull属性为true,以确保消息在队列满时被阻塞,直到队列有空间。在Consumer端,可以设置subscriptionType为Exclusive,以确保一个Consumer独占一个topic,从而保证消息顺序。7.3.2示例以下是一个使用Pulsar保证消息顺序的示例:importorg.apache.pulsar.client.api.Consumer;
importorg.apache.pulsar.client.api.Message;
importorg.apache.pulsar.client.api.PulsarClient;
importorg.apache.pulsar.client.api.PulsarClientException;
importorg.apache.pulsar.client.api.SubscriptionType;
importjava.util.concurrent.TimeUnit;
publicclassOrderedConsumer{
publicstaticvoidmain(String[]args)throwsPulsarClientException,InterruptedException{
PulsarClientclient=PulsarClient.builder()
.serviceUrl("pulsar://localhost:6650")
.build();
Consumer<byte[]>consumer=client.newConsumer()
.topic("persistent://sample/standalone/ns/my-topic")
.subscriptionName("my-subscription")
.subscriptionType(SubscriptionType.Exclusive)
.subscribe();
while(true){
Message<byte[]>msg=consumer.receive(5,TimeUnit.SECONDS);
if(msg!=null){
System.out.println("Receivedmessage:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华师大版初中科学2.1压强
- 信息论与编码课件(全部课程内容)
- 医院节能环保与资源利用管理制度
- 人教部编版四年级语文上册第6课《夜间飞行的秘密》精美课件
- 【寒假阅读提升】四年级下册语文试题-文言文阅读(三)-人教部编版(含答案解析)
- 2024年客运从业资格证继续教育手机
- 2024年汕尾从业资格证客运考试题库
- 2024年雅安道路客运输从业资格证考试
- 2024年银川客运资格用什么练题好
- 吉首大学《管理思想史讲座》2021-2022学年第一学期期末试卷
- 院前急救与院内急诊有效衔接工作制度
- 2.1充分发挥市场在资源配置中的决定性作用(课件) 2024-2025学年高中政治 必修2 经济与社会
- Unit+5+Fun+Clubs+Section+A++(1a-1d)教学课件-2024-2025学年人教新目标(2024)七年级英语上册
- 超聚变 FCIA 考试题库
- 2024-2025学年初中地理七年级上册(2024)晋教版(2024)教学设计合集
- 第一单元第二节 改造家庭网络(第二课时)教案2024-2025学年川教版(2024)信息科技 七年级上册
- 智联招聘在线测评真题
- 陕煤集团笔试题库及答案
- 33 《鱼我所欲也》对比阅读-2024-2025中考语文文言文阅读专项训练(含答案)
- (正式版)HGT 22820-2024 化工安全仪表系统工程设计规范
- (高清版)TDT 1075-2023 光伏发电站工程项目用地控制指标
评论
0/150
提交评论