實習項目用到了 Kafka,系統學習一下
成都創新互聯公司是專業的綠春網站建設公司,綠春接單;提供成都網站建設、網站建設,網頁設計,網站設計,建網站,PHP網站建設等專業做網站服務;采用PHP框架,可快速的進行綠春網站開發網頁制作和功能擴展;專業做搜索引擎喜愛的網站,專業的做網站團隊,希望更多企業前來合作!文章目錄參考鏈接
一 概述common.yml
放在節點中,系統 A、B、C 監聽節點數據有無變更,如變更及時響應組件 | 作用 |
---|---|
Producer | 消息生產者 |
Consumer | 消息消費者 |
Consumer Group | 消費者組 |
Broker | Kafka 實例 |
Topic | 消息主題(邏輯概念) |
Partition | Topic 分區(物理概念),一個 Topic 可以包含多個分區,單分區內消息有序;每個分區對應一個 Leader 和多個 Follower,僅 Leader 與生產者、消費者交互;Partition 在物理上對應一個文件夾 |
Segment | Partition 物理上被分成多個 Segment,每個 Segment 對應一個物理文件 |
Zookeeper | 保存元信息,現已廢除 |
同一 Broker 對同一個分區也只能存放一個副本,所以分區副本數不能超過 Broker 數
消費者組內的消費者,與分區的關系
分區數 >= 一組內的Consumer數
,以實現系統的可伸縮性,否則有一些 Consumer 是無法消費的屬性值 | 值 | 含義 |
---|---|---|
enable_auto_commit | false | 自動提交偏移量,當一個Group在一個Topic上提交偏移量時,下次再使用該Group讀取該Topic的消息時,就會從偏移量的位置開始讀取 |
session_timeout_ms | … | 檢測Consumer發生崩潰所需的最長時間。超過該時間Consumer未匯報心跳,則認為Consumer失效,將其移出group |
auto_offset_reset | earliest | 決定當Group在某Topic上無偏移時,開始讀取的位置。設置為earliest 使得每次抽樣都從Topic的開始位置進行抽樣,如果設置為latest 就只能抽樣那些正在寫入消息的Topic |
max_poll_records | … | 單次poll() 的大消息數 |
group_id | … | Group名 |
max_poll_interval_ms | … | 兩次poll() 的大間隔時間,超過該時間則認為Consumer失效,將其移出Group |
heartbeat_interval_ms | … | Consumer向Cooperator匯報心跳的間隔時間 |
只有完成所有流程的消息才可以被消費
acks | 行為 |
---|---|
0 | 生產者發起消息寫入請求后,不會等待任何來自 Broker 器的響應(最不安全) |
1 | 生產者發起消息寫入請求后,分區的 Leader 成功落盤后,Broker 即向生產者返回成功響應 |
-1 | 生產者發起消息寫入請求后,ISR 集合中的所有副本都落盤,Broker 才向生產者返回成功響應(最安全) |
3 數據不重復:冪等性Kafka 副本備份策略——如何保證消息不丟失
AR(Assigned Repllicas):一個分區的所有副本
ISR(In-Sync Replicas):能夠和 Leader 保持同步的 Follower + Leader本身 組成的集合
OSR(Out-Sync Relipcas):不能和 Leader 保持同步的 Follower 集合
AR = ISR + OSR
- Kafka 只保證對 ISR 集合中的所有副本保證完全同步
- ISR 集合是動態調整的,如果一些副本**和 Leader 完全同步兩次時間差超過閾值
replica.lag.time.max.ms
**則被移出 ISR(因為生產者可以批量發送消息,所以不能指定未同步的消息條數作為檢測標準)- 要使消息不丟失,需要滿足
(acks = -1) && (replication.factor>=2) && (min.insync.replicas>=2)
(acks = -1) && (replication.factor>=2) && (min.insync.replicas>=2)
(acks = 0)
(冪等性) && (至少一次)
enable.idempotence = true
,其中 PID 在 Kafka 啟動時分配,Partition 代表分區,SeqNumber 自增Offset 存放于內置 Topic__consumer_offsets
,由 Coordinator 管理
Consumer 的偏移量是按照 組 + Topic + 分區 進行維護的
偏移量相關概念
偏移量的提交方式
enable_auto_commit = true
和auto_commit_interval_ms
設置自動提交間隔consumer.commitSync()
提交失敗的時候一直嘗試提交,直到遇到無法重試的情況下才會結束consumer.commitAsync()
消費者線程不會阻塞,提交失敗的時候也不會進行重試,可以配合回調函數記錄錯誤信息KafkaConsumerconsumer = new KafkaConsumer(configs);
consumer.subscribe(Collections.singletonList("topic_0"));
try {while (true){ConsumerRecordsrecords = consumer.poll(3000);
for (ConsumerRecordrecord : records) {System.out.println(record.value());
}
consumer.commitAsync(); // 異步提交
}
} catch (Exception exception){// ...
} finally {consumer.commitSync(); // 消費者關閉前,或者異步提交發生異常時,使用同步阻塞式提交
consumer.close();
}
5 分區分配和重平衡partition_assignment_strategy_config
Range
:計算每個消費者要消費的分區數,多余的分區分配給前幾個消費者(Topic 增加時容易造成消費不均衡)RoundRobin
:輪詢向消費者分配分區Sticy
:盡量均勻地分配分區,根據上次的分配結果盡量減少變動頁緩存
零拷貝
參考鏈接
作用是在數據報從網絡設備到用戶程序空間傳遞的過程中,減少數據拷貝次數,減少系統調用,實現 CPU 的零參與
網絡數據持久化到磁盤 (Producer 到 Broker)
磁盤文件通過網絡發送 (Broker 到 Consumer)
磁盤順序寫入
批量操作
分區并行處理
你是否還在尋找穩定的海外服務器提供商?創新互聯www.cdcxhl.cn海外機房具備T級流量清洗系統配攻擊溯源,準確流量調度確保服務器高可用性,企業級服務器適合批量采購,新人活動首月15元起,快前往官網查看詳情吧
分享名稱:后端學習-Zookeeper&Kafka-創新互聯
路徑分享:http://m.newbst.com/article44/hpehe.html
成都網站建設公司_創新互聯,為您提供網站設計、網頁設計公司、小程序開發、微信小程序、商城網站、網站策劃
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯