日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯網營銷解決方案
每次都碰到面試官問我如何保證Kafka不丟失消息,快哭了

每次都碰到面試官問我如何保證Kafka不丟失消息,快哭了

作者:石杉的架構筆記 2022-08-26 05:24:04
云計算
Kafka 這篇文章,我們來聊聊在線上生產環(huán)境使用消息中間件技術的時候,從前到后的全鏈路到底如何保證數據不能丟失。

成都服務器托管,創(chuàng)新互聯公司提供包括服務器租用、中國電信云錦天府、帶寬租用、云主機、機柜租用、主機租用托管、CDN網站加速、域名申請等業(yè)務的一體化完整服務。電話咨詢:028-86922220

一、背景引入

這篇文章,我們來聊聊在線上生產環(huán)境使用消息中間件技術的時候,從前到后的全鏈路到底如何保證數據不能丟失。

這個問題,在互聯網公司面試的時候高頻出現,而且也是非?,F實的生產環(huán)境問題。

如果你的簡歷中寫了自己熟悉MQ技術(RabbitMQ、RocketMQ、Kafka),而且在項目里有使用的經驗,那么非常實際的一個生產環(huán)境問題就是:投遞消息到MQ,然后從MQ消費消息來處理的這個過程,數據到底會不會丟失。

面試官此時會問:如果數據會丟失的話,你們項目生產部署的時候,是通過什么手段保證基于MQ傳輸的數據100%不會丟失的?麻煩結合你們線上使用的消息中間件來具體說說你們的技術方案。

這個其實就是非常區(qū)分面試候選人技術水平的一個問題。

實際上相當大比例的普通工程師,哪怕是在一些中小型互聯網公司里工作過的,也就是基于公司部署的MQ集群簡單的使用一下罷了,可能代碼層面就是基本的發(fā)送消息和消費消息,基本沒考慮太多的技術方案。

但是實際上,對于MQ、緩存、分庫分表、NoSQL等各式各類的技術以及中間件在使用的時候,都會有對應技術相關的一堆生產環(huán)境問題。

那么針對這些問題,就必須要有相對應的一整套技術方案來保證系統(tǒng)的健壯性、穩(wěn)定性以及高可用性。

所以其實中大型互聯網公司的面試官在面試候選人的時候,如果考察對MQ相關技術的經驗和掌握程度,十有八九都會拋出這個使用MQ時一定會涉及的數據丟失問題。因為這個問題,能夠非常好的區(qū)分候選人的技術水平。

所以這篇文章,我們就來具體聊聊基于RabbitMQ這種消息中間件的背景下,從投遞消息到MQ,到從MQ消費消息出來,這個過程中有哪些數據丟失的風險和可能。

然后我們再一起來看看,應該如何結合MQ自身提供的一些技術特性來保證數據不丟失?

二、目前已有的技術方案

經過之前幾篇文章的討論,目前我們已經初步知道,第一個會導致數據丟失的地方,就是消費者獲取到消息之后,沒有來得及處理完畢,自己直接宕機了。

此時RabbitMQ的自動ack機制會通知MQ集群這條消息已經處理好了,MQ集群就會刪除這條消息。

那么這條消息不就丟失了么?不會有任何一個消費者處理到這條消息了。

所以之前我們詳細討論過,通過在消費者服務中調整為手動ack機制,來確保消息一定是已經成功處理完了,才會發(fā)送ack通知給MQ集群。

否則沒發(fā)送ack之前消費者服務宕機,此時MQ集群會自動感知到,然后重發(fā)消息給其他的消費者服務實例。

手動ack機制之下的架構圖如下所示:

當時除了這個數據丟失問題之外,還有另外一個問題,就是MQ集群自身如果突然宕機,是不是會導致數據丟失?

默認情況下是肯定會的,因為queue和message都沒采用持久化的方式來投遞,所以MQ集群重啟會導致部分數據丟失。

此時如果消息還沒來得及投遞給消費者服務,然后MQ集群突然宕機了,數據是不會丟失的,因為MQ集群重啟之后會自動從磁盤文件里加載出來沒投遞出去的消息,然后繼續(xù)投遞給消費者服務。

同樣,該方案沉淀下來的系統(tǒng)架構圖,如下所示:

三、數據100%不丟失了嗎?

大家想一想,到目前為止,咱們的架構一定可以保證數據不丟失了嗎?

其實,現在的架構,還是有一個數據可能會丟失的問題。

那就是上面作為生產者的訂單服務把消息投遞到MQ集群之后,暫時還駐留在MQ的內存里,還沒來得及持久化到磁盤上,同時也還沒來得及投遞到作為消費者的倉儲服務。

此時要是MQ集群自身突然宕機,咋辦呢?

尷尬了吧,駐留在內存里的數據是一定會丟失的,我們來看看下面的圖示。

四、按需制定技術方案

現在,我們需要考慮的技術方案是:訂單服務如何保證消息一定已經持久化到磁盤?

實際上,作為生產者的訂單服務把消息投遞到MQ集群的過程是很容易丟數據的。

比如說網絡出了點什么故障,數據壓根兒沒傳輸過去,或者就是上面說的消息剛剛被MQ接收但是還駐留在內存里,沒落地到磁盤上,此時MQ集群宕機就會丟數據。

所以首先,我們得考慮一下作為生產者的訂單服務要如何利用RabbitMQ提供的相關功能來實現一個技術方案。

這個技術方案需要保證:只要訂單服務發(fā)送出去的消息確認成功了,此時MQ集群就一定已經將消息持久化到磁盤了。

我們必須實現這樣的一個效果,才能保證投遞到MQ集群的數據是不會丟失的。

五、需要研究的技術細節(jié)

這里我們需要研究的技術細節(jié)是:倉儲服務手動ack保證數據不丟失的實現原理。

之前,筆者就收到很多同學提問:

  • 倉儲服務那塊到底是如何基于手動ack就可以實現數據不丟失的?
  • RabbitMQ底層實現的細節(jié)和原理到底是什么?
  • 為什么倉儲服務沒發(fā)送ack就宕機了,RabbitMQ可以自動感知到他宕機了,然后自動重發(fā)消息給其他的倉儲服務實例呢?

這些東西背后的實現原理和底層細節(jié),到底是什么?


當前名稱:每次都碰到面試官問我如何保證Kafka不丟失消息,快哭了
當前路徑:http://www.5511xx.com/article/dpijcgd.html