實用指南：【Kafka系列】第四篇｜硬核Kafka面試題集錦：一網打盡32道核心題詳情 - 數據,kafka,負載均衡,HarmonyOS,後端開發 mb61c46a7ab1eee 博客 | YeLogs.com

博客 / 詳情

實用指南：【Kafka系列】第四篇｜硬核Kafka面試題集錦：一網打盡32道核心題

04:04 PM · Nov 17 ,2025

1. 請簡述 Kafka 的核心架構組件及作用？

核心組件：

Producer：消息生產者，支持批量、異步向 Topic 發送消息。
Broker：服務器節點，存儲消息並提供讀寫服務，集羣可橫向擴展。
Consumer：消息消費者，通過消費者組訂閲 Topic，構建負載均衡。
Topic：消息邏輯分類，物理由多個 Partition 組成。
Partition：最小存儲單位，消息順序寫入日誌文件，支持並行讀寫。
Replica：分區副本（默認 3 個），Leader 處理讀寫，Follower 同步數據並備災。
ISR：與 Leader 同步的副本集合，確保數據可靠性，僅 ISR 成員可參與 Leader 選舉。

2. 為什麼 Kafka 要設計分區（Partition）？

並行處理：多分區可被不同消費者並行消費，提升吞吐量。
負載均衡：分區均勻分佈在 Broker 集羣，避免單節點壓力過大。
水平擴展：通過增加分區數提升 Topic 存儲和處理能力（需謹慎擴容）。
順序性保障：單分區內消息按寫入順序存儲，滿足 “分區級有序” 需求。

3. 副本機制中，Leader 和 Follower 的職責是什麼？ISR 的作用是什麼？

Leader：唯一處理生產者 / 消費者的讀寫請求，維護分區元素材。
Follower：通過拉取機制同步 Leader 數據，Leader 故障時參與選舉。
ISR：

包含 Leader 和同步滯後在閾值內（replica.lag.time.max.ms）的 Follower。
作用：確保數據可靠性，消息需被 ISR 中所有副本確認（可通過 acks 配置）才算提交。

4. 消費者組（Consumer Group）的核心機制是什麼？如何建立負載均衡？

核心機制：一組消費者共享 Topic 訂閲，每個分區僅被組內一個消費者消費（消費者可對應多分區）。
負載均衡：

觸發條件：初始化、消費者增減、分區變化時觸發重平衡（Rebalance）。
過程：由 Coordinator（Broker 角色）重新分配分區 - 消費者映射（如 3 分區 + 2 消費者：消費者 1 處理分區 0/1，消費者 2 處理分區 2）。
注意：重平衡會導致消費暫停，需合理設置 session.timeout.ms（心跳超時）和 heartbeat.interval.ms（心跳頻率）。

5. Kafka 如何保證消息的投遞語義（至少一次、最多一次、精確一次）？

至少一次（At-Least-Once）：

生產者：acks=all（等待 ISR 確認）+ 失敗重試（retries>0）。
消費者：先消費，後提交 offset（可能因消費失敗重複消費）。

最多一次（At-Most-Once）：

生產者：acks=0（不等待確認）或不重試。
消費者：先提交 offset，後消費（可能因提交後消費失敗導致丟失）。

精確一次（Exactly-Once）：

生產者：開啓冪等性（enable.idempotence=true）+ 事務機制（避免重複）。
消費者：結合事務，將 offset 提交與消息處理綁定為原子操作（如 Kafka Streams 的 exactly_once 模式）。

6. Kafka 的高吞吐能力源於哪些設計？

順序讀寫：消息追加到分區日誌（磁盤順序 IO 性能接近內存）。
批量處理：生產者批量發送（batch.size）、消費者批量拉取（fetch.min.bytes）。
數據壓縮：支持 GZIP/Snappy 等，批量壓縮效率更高。
零拷貝：通過 sendfile 系統調用直接將磁盤數據發送到網絡，減少拷貝。
分區並行：多分區同時讀寫，充分利用集羣資源。

7. 如何處理 Kafka 消息積壓問題？

臨時擴容：增加消費者實例（需保證消費者數≤分區數，否則新增者空閒）。
優化消費邏輯：異步處理非核心流程，提升單消費者吞吐量。
調整分區數：若分區過少，新建 Topic 遷移內容實現擴容（分區數不可直接修改）。
監控預警：通過 kafka-consumer-groups.sh 監控 Lag 值（消費滯後量），提前干預。

8. Kafka、RabbitMQ 與 RocketMQ 的核心區別？如何選型？

維度	Kafka	RabbitMQ	RocketMQ
吞吐量	高（適合 TB 級大資料場景，單節點十萬級 / 秒）	中（適合小消息，單節點萬級 / 秒）	高（支持十萬級 / 秒，略低於 Kafka）
消息可靠性	依賴 ISR 和持久化，配置靈活（需手動調優）	協助鏡像隊列，開箱即用高可靠	原生支持多副本 + 同步刷盤，金融級可靠性（默認不丟消息）
路由能力	輕鬆（Topic + 分區路由）	複雜（交換機、綁定鍵、多模式：Direct/Fanout/Topic/Headers）	中等（Topic + Tag 過濾，支持廣播）
特色功能	流式處理集成（Kafka Streams）、日誌壓縮	死信隊列、延時交換機、插件生態豐富	事務消息、定時消息、重試隊列（適合金融場景）
生態成熟度	大數據生態無縫對接（Spark/Flink）	開源社區活躍，客户端語言支撐廣泛	阿里背書，國內生態完善（適配 Dubbo/Spring Cloud）
適用場景	日誌收集、大數據流式處理、高吞吐場景	業務解耦、實時通信（如訂單通知）、複雜路由場景	金融交易（事務消息）、高可靠業務、中高吞吐場景

選型原則：

高吞吐、大數據量、對接流式計算 →Kafka
艱難路由、低延遲小消息、需豐富插件 →RabbitMQ
金融級可靠性、事務消息、國內分佈式生態 →RocketMQ

9. 如何保證 Kafka 消息的順序性？

分區級有序：單分區內消息按寫入順序存儲和消費（天然保證）。
全局有序：

方案 1：Topic 僅設 1 個分區（犧牲吞吐量，適合低併發）。
方案 2：按 “有序鍵”（如用户 ID）哈希到固定分區，確保同一鍵的消息進入同一分區（局部有序 + 下游合併）。

10. Kafka 的日誌清理策略有哪些？

刪除策略（delete）：按時間（log.retention.hours）或大小（log.retention.bytes）刪除過期日誌。
壓縮策略（compact）：保留每個 Key 的最新版本，適合 “更新型數據”（如用户配置）。

11. Kafka 中的 Controller 是什麼？作用是什麼？

定義：Broker 集羣中的主節點（由 ZooKeeper 選舉產生）。
作用：

管理分區 Leader 選舉（如 Broker 故障時重新選舉）。
同步集羣元數據（分區分佈、副本狀態等）到所有 Broker。

12. ZooKeeper 在 Kafka 中的作用是什麼？Kafka 2.8+ 有什麼變化？

傳統作用：

存儲集羣元數據（Broker 列表、Topic 分區分佈）。
選舉 Controller、協調重平衡。
存儲消費者 offset（舊版本，已逐步廢棄）。

2.8+ 變化：支持 KRaft 模式（無 ZooKeeper），元材料由 Broker 集羣自行管理，提升穩定性和擴展性。

13. 消費者 offset 存儲在何處？如何保證不丟失？

存儲位置：

舊版本：ZooKeeper 的 /consumers/<group>/offsets/<topic>/<partition> 節點。
新版本：默認存儲在 Kafka 內部 Topic __consumer_offsets 中（高可用，支持分區和副本）。

不丟失保障：__consumer_offsets 開啓副本機制（默認 3 副本），且 offset 提交支持同步寫入。

14. 什麼是分區重分配？如何實現？

定義：將 Topic 分區從部分 Broker 遷移到其他 Broker（如節點擴容 / 縮容時）。
實現步驟：

用 kafka-reassign-partitions.sh 生成遷移計劃（JSON 格式）。
執行計劃，Follower 同步數據後切換 Leader，達成遷移。

15. Kafka 消息重複消費的原因是什麼？如何解決？

原因：

消費者提交 offset 後崩潰，重啓後重復消費。
網絡波動導致生產者重試，消息重複發送。

解決：

消費端構建冪等性（如基於消息 ID 去重）。
開啓生產者冪等性（enable.idempotence=true）。

16. 如何優化 Kafka 生產者的性能？

調大 batch.size（批量發送閾值，默認 16KB）和 linger.ms（等待批量的最大時間）。
啓用壓縮（compression.type=snappy）。
增加生產者實例（多線程發送）。
合理設置 acks（非核心數據用 acks=1 減少等待）。

17. 如何優化 Kafka 消費者的性能？

增加消費者實例（不超過分區數）。
調大 fetch.min.bytes（批量拉取閾值）和 fetch.max.wait.ms（等待批量的最大時間）。
減少消費端處理耗時（如異步處理、優化業務邏輯）。

18. Kafka 中消息的最大大小限制是多少？如何調整？

默認限制：生產者端 max.request.size=1MB，Broker 端 message.max.bytes=1MB。
調整方式：同步增大兩端參數（需注意：過大消息會降低吞吐量，建議拆分大消息）。

19. 什麼是 Kafka Streams？它有什麼優勢？

定義：Kafka 內置的流式處理庫，用於實時處理 Kafka 中的消息。
優勢：

輕量級（無需單獨部署集羣）。
與 Kafka 無縫集成（基於 Topic 讀寫）。
支持精確一次語義和狀態管理。

20. Kafka 如何實現跨數據中心同步？

方案 1：使用 MirrorMaker 工具（基於生產者 / 消費者，跨集羣複製消息）。
方案 2：自定義同步軟件，消費源集羣消息併發送到目標集羣。
注意：需處理網絡延遲導致的同步滯後，以及雙寫場景下的一致性疑問。

什麼？就是21. 什麼是墓碑消息（Tombstone）？作用

定義：Key 存在但 Value 為 null 的消息。
作用：在日誌壓縮策略（compact）中，標記該 Key 的舊版本可被刪除（觸發清理）。

22. Kafka Broker 如何處理請求負載均衡？

分區分佈：通過 log.dirs 配置多目錄，分區數據均勻分佈在不同磁盤。
請求路由：客户端直接與分區 Leader 所在 Broker 通信，避免集中訪問單節點。
Controller 協調：動態調整分區分佈，平衡各 Broker 的讀寫壓力。

23. 消費者為什麼會發生 Rebalance？如何避免頻繁 Rebalance？

觸發原因：消費者加入 / 退出、心跳超時（session.timeout.ms）、分區數變化。
避免措施：

確保消費者正常發送心跳（heartbeat.interval.ms 設為超時時間的 1/3）。
避免消費者處理耗時過長（超過 max.poll.interval.ms）。
使用靜態成員（group.instance.id）減少重平衡次數。

24. Kafka 如何保證數據不丟失？

生產者：acks=all + 重試機制 + 持久化（linger.ms 合理設置）。
Broker：副本機制（ISR）+ 日誌持久化（log.flush.interval.messages 控制刷盤）。
消費者：手動提交 offset（enable.auto.commit=false），確保消費完成後再提交。

25. 什麼是 Kafka Connect？它的作用是什麼？

定義：Kafka 官方提供的連接器框架，用於在 Kafka 與外部系統（數據庫、文件系統等）間同步數據。
作用：簡化材料導入導出（如從 MySQL 同步數據到 Kafka，或從 Kafka 導出到 HDFS），支持分佈式模式。

26. Kafka 分區的 Leader 選舉機制是什麼？

觸發條件：Leader 所在 Broker 故障、Controller 檢測到 Leader 無響應。
選舉規則：從 ISR 中選擇第一個副本（unclean.leader.election.enable=false 時，禁止非 ISR 副本當選，避免數據丟失）。

27. 如何監控 Kafka 集羣狀態？

核心指標：

Broker：分區數、副本同步率、請求延遲（request-latency-avg）。
生產者：發送成功率、批量大小、壓縮率。
消費者：Lag 值（消費滯後）、重平衡次數、每秒消費消息數。

工具：JMX 暴露指標 + Grafana/Prometheus 可視化，或 Kafka 自帶 kafka-topics.sh/kafka-consumer-groups.sh。

28. Kafka 支持消息回溯消費嗎？如何實現？

支持：通過重置消費者 offset 實現。
方式：

命令行：kafka-consumer-groups.sh`` --reset-offsets（指定 --to-earliest/--to-timestamp 等）。
代碼：調用 seek() 方法手動設置 offset。

29. 什麼是 Kafka 的冪等性生產者？如何開啓？

定義：確保生產者發送的消息不重複（即使重試），通過 Producer ID（PID）和序列號實現。
開啓：enable.idempotence=true（默認 false），需配合 acks=all。

30. Kafka 中，為什麼建議分區數不要過多？

問題：

增加 Broker 內存佔用（每個分區需維護元信息）。
重平衡耗時增加（分區越多，分配邏輯越複雜）。
記錄句柄佔用過多（每個分區對應多個日誌文件）。

建議：根據集羣規模合理設置（單 Broker 分區數通常不超過 1000）。

31. 如何搭建 Kafka 消息的延時投遞？

方案 1：使用延時隊列 Topic（如按延遲時間分 Topic：delay_10s、delay_1m），消費者定時拉取。
方案 2否到期。就是：藉助外部組件（如 RabbitMQ 延時交換機），或自定義定時器檢測消息
注意：Kafka 無原生延時隊列，需通過業務層完成。

32. Kafka 集羣擴容時，如何遷移分區？

步驟：

用 kafka-reassign-partitions.sh 生成包含新 Broker 的遷移計劃。
執行計劃，Follower 副本在新 Broker 同步數據。
同步完成後，Controller 將 Leader 切換到新 Broker（可選）。

注意：遷移期間不影響讀寫，但可能短暫增加延遲。

總結：Kafka 面試核心圍繞 “可靠性（副本 / ISR）、性能（分區 / 批量）、擴展性（消費者組 / 集羣）、運維實踐（監控 / 遷移）”，理解底層機制比死記答案更核心。

#Kafka #面試指南 #消息隊列

數據 , 負載均衡 , 後端開發 , harmonyos , kafka

nian_5aedc008c1353 頭像

codecraft 頭像

u_16496558 頭像

xcye 頭像

hashdata 頭像

u_16864929 頭像

6 位用戶收藏了這個故事！