close
文章出處

前言

最新項目中要用到消息隊列來做消息的傳輸,之所以選著 Kafka 是因為要配合其他 java 項目中,所以就對 Kafka 了解了一下,也算是做個筆記吧。

本篇不談論 Kafka 和其他的一些消息隊列的區別,包括性能及其使用方式。

簡介

Kafka 是一個實現了分布式的、具有分區、以及復制的日志的一個服務。它通過一套獨特的設計提供了消息系統中間件的功能。它是一種發布訂閱功能的消息系統。

一些名詞

如果要使用 Kafka ,那么在 Kafka 中有一些名詞需要知道,文本不討論這些名詞是否在其他消息隊列中具有相同的含義。所有名詞均是針對于 Kafka。

Message

消息,就是要發送的內容,一般包裝成一個消息對象。

Topic

通俗來講的話,就是放置“消息”的地方,也就是說消息投遞的一個容器。假如把消息看作是信封的話,那么 Topic 就是一個郵筒,如下圖所示:

Partition && Log

Partition 分區,可以理解為一個邏輯上的分區,像是我們電腦的磁盤 C:, D:, E: 盤一樣,
Kafka 為每個分區維護著一份日志Log文件。

每個分區是一個有序的,不可修改的,消息組成的隊列。 當消息過來的時候,會被追加到日志文件中,這個追加是根據 commit 命令來執行的。

分區中的每一條消息都有一個編號,叫做 offset id,這個 id 在當前分區中是唯一的,并且是遞增的。

日志,就是用來記錄分區中接收到的消息,因為每一個 Topic 可以同時向一個或者多個分區投遞消息,所以實際在存儲日志的時候,每個分區會對應一個日志目錄,其命名規則一般為 <topic_name>-<partition_id>, 目錄中就是一個分區的一份 commit log 日志文件。

Kafka 集群會保存一個時間段內所有被發布出來的信息,無論這個消息是否已經被消費過,這個時間段是可以配置的。比如日志保存時間段被設置為2天,那么2天以內發布的消息都是可以消費的;而之前的消息為了釋放空間將會拋棄掉。Kafka的性能與數據量不相干,所以保存大量的消息數據不會造成性能問題。

對日志進行分區主要是為了以下幾個目的:第一、這可以讓log的伸縮能力超過單臺服務器上線,每個獨立的partition的大小受限于單臺服務器的容積,但是一個topic可以有很多partition從而使得它有能力處理任意大小的數據。第二、在并行處理方面這可以作為一個獨立的單元。

生產者 Producers

和其他消息隊列一樣,生產者通常都是消息的產生方。
在 Kafka 中它決定消息發送到指定Topic的哪個分區上。

消費者 Consumers

消費者就是消息的使用者,在消費者端也有幾個名詞需要區分一下。

一般消息隊列有兩種模式的消費方式,分別是 隊列模式訂閱模式

隊列模式:一對一,就是一個消息只能被一個消費者消費,不能重復消費。一般情況隊列支持存在多個消費者,但是對于一個消息,只會有一個消費者可以消費它。

訂閱模式:一對多,一個消息可能被多次消費,消息生產者將消息發布到Topic中,只要是訂閱改Topic的消費者都可以消費。

Consumer && Subscriber

Group: 組,是一個消費者的集合,每一組都有一個或者多個消費者,Kafka 中在一個組內,消息只能被消費一次。

在發布訂閱模式中,消費者是以組的方式進行訂閱的,就是Consumer Group,他們的關系如下圖:

每個發布到Topic上的消息都會被投遞到每個訂閱了此Topic的消費者組中的某一個消費者,也就是每個組都會被投遞,但是每個組都只會有一個消費者消費這個消息。

開頭介紹了Kafka 是 發布-訂閱 功能的消息隊列,所以在Kafka中,隊列模式是通過單個消費者組實現的,也就是整個結構中只有一個消費者組,消費者之間負載均衡。

Kafka 集群

Borker: Kafka 集群有多個服務器組成,每個服務器稱做一個 Broker。同一個Topic的消息按照一定的key和算法被分區存儲在不同的Broker上。


上圖引用自:http://blog.csdn.net/lizhitao

因為 Kafka 的集群它是通過將分區散布到各個Server的實現的,也就是說集群中每個服務器他們都是彼此共享分區的數據和請求,每個分區的日志文件被復制成指定分數,分散在各個集群機器,這樣來實現的故障轉移。

對于每一個分區都會有一個服務器作為它的 "leader" 并且有零個或者多個服務器作為"followers" 。leader 服務器負責處理關于這個 partition 所有的讀寫請求, followers 服務器則被動的復制 leader 服務器。如果有 leader 服務器失效,那么 followers 服務器將有一臺被自動選舉成為新的 leader 。每個服務器作為某些 partition 的 leader 的同時也作為其它服務器的 follower ,從而實現了集群的負載均衡。

.NET Core Kafka 客戶端

在 .NET Core 中,有相對應的開源 kafka sdk 項目,就是 Rdkafka。它同時支持 .NET 4.5,并且支持跨平臺,可以運行于Linux,macOS 和 Windows。

RdKafka Github :https://github.com/ah-/rdkafka-dotnet

RdKafka Nuget :Install-Package RdKafka

生產者 API

// Producer 接受一個或多個 BrokerList
using (Producer producer = new Producer("127.0.0.1:9092"))
//發送到一個名為 testtopic 的Topic,如果沒有就會創建一個
using (Topic topic = producer.Topic("testtopic")) {
    //將message轉為一個 byte[]
    byte[] data = Encoding.UTF8.GetBytes("Hello RdKafka");
    DeliveryReport deliveryReport = await topic.Produce(data);
    
    Console.WriteLine($"發送到分區:{deliveryReport.Partition}, Offset 為: {deliveryReport.Offset}");
}

消費者 API

由于 Kafka 是以消費者組的形式進行消費的,所以需要指定一個GroupId。

在內部實現上,消費者是通過一個輪詢機制來實現的對 Topic 消息的監控,這也是Kafka推薦的方式,在 Rdkafka 中輪詢的間隔為 1 秒鐘。


//配置消費者組
var config = new Config() { GroupId = "example-csharp-consumer" };
using (var consumer = new EventConsumer(config, "127.0.0.1:9092")) {

    //注冊一個事件
    consumer.OnMessage += (obj, msg) =>
    {
        string text = Encoding.UTF8.GetString(msg.Payload, 0, msg.Payload.Length);
        Console.WriteLine($"Topic: {msg.Topic} Partition: {msg.Partition} Offset: {msg.Offset} {text}");
    };

    //訂閱一個或者多個Topic
    consumer.Subscribe(new[] { "testtopic" });
    
    //啟動
    consumer.Start();

    Console.WriteLine("Started consumer, press enter to stop consuming");
    Console.ReadLine();
}

本文地址:http://www.cnblogs.com/savorboard/p/dotnetcore-kafka.html
作者博客:Savorboard
歡迎轉載,請在明顯位置給出出處及鏈接


文章列表


不含病毒。www.avast.com
arrow
arrow
    全站熱搜

    AutoPoster 發表在 痞客邦 留言(0) 人氣()