本篇內(nèi)容主要講解“Kafka中的Leader選舉是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Kafka中的Leader選舉是什么”吧!
創(chuàng)新互聯(lián)公司是一家業(yè)務(wù)范圍包括IDC托管業(yè)務(wù),網(wǎng)站空間、主機(jī)租用、主機(jī)托管,四川、重慶、廣東電信服務(wù)器租用,德陽服務(wù)器托管,成都網(wǎng)通服務(wù)器托管,成都服務(wù)器租用,業(yè)務(wù)范圍遍及中國大陸、港澳臺(tái)以及歐美等多個(gè)國家及地區(qū)的互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)公司。
一條消息只有被ISR中所有Follower都從Leader復(fù)制過去才會(huì)被認(rèn)為已提交。這樣就避免了部分?jǐn)?shù)據(jù)被寫進(jìn)了Leader,還沒來得及被任何Follower復(fù)制就宕機(jī)了,而造成數(shù)據(jù)丟失。而對(duì)于Producer而言,它可以選擇是否等待消息commit,這可以通過request.required.acks來設(shè)置。這種機(jī)制確保了只要ISR中有一個(gè)或者以上的follower,一條被commit的消息就不會(huì)丟失。
什么是ISR?
有一個(gè)很重要的問題是當(dāng)Leader宕機(jī)了,怎樣在Follower中選舉出新的Leader,因?yàn)镕ollower可能落后很多或者直接crash了,所以必須確保選擇最新的Follower作為新的Leader。一個(gè)基本的原則就是,如果Leader不在了,新的Leader必須擁有原來的Leader commit的所有消息。這就需要做一個(gè)折中,如果Leader在一個(gè)消息被commit前等待更多的Follower確認(rèn),那么在它掛掉之后就有更多的Follower可以成為新的Leader,但這也會(huì)造成吞吐率的下降。
一種非常常用的選舉Leader的方式是“少數(shù)服從多數(shù)“,Kafka并不是采用這種方式。這種模式下,如果我們有2f+1個(gè)副本,那么在commit之前必須保證有f+1個(gè)replica復(fù)制完消息,同時(shí)為了保證能正確選舉出新的Leader,失敗的副本數(shù)不能超過f個(gè)。這種方式有個(gè)很大的優(yōu)勢,系統(tǒng)的延遲取決于最快的幾臺(tái)機(jī)器,也就是說比如副本數(shù)為3,那么延遲就取決于最快的那個(gè)Follower而不是最慢的那個(gè)?!吧贁?shù)服從多數(shù)”的方式也有一些劣勢,為了保證Leader選舉的正常進(jìn)行,它所能容忍的失敗的Follower數(shù)比較少,如果要容忍1個(gè)Follower掛掉,那么至少要3個(gè)以上的副本,如果要容忍2個(gè)Follower掛掉,必須要有5個(gè)以上的副本。也就是說,在生產(chǎn)環(huán)境下為了保證較高的容錯(cuò)率,必須要有大量的副本,而大量的副本又會(huì)在大數(shù)據(jù)量下導(dǎo)致性能的急劇下降。這種算法更多用在Zookeeper這種共享集群配置的系統(tǒng)中而很少在需要大量數(shù)據(jù)的系統(tǒng)中使用的原因。HDFS的HA功能也是基于“少數(shù)服從多數(shù)”的方式,但是其數(shù)據(jù)存儲(chǔ)并不是采用這樣的方式。
實(shí)際上,Leader選舉的算法非常多,比如Zookeeper的Zab、Raft以及Viewstamped Replication。而Kafka所使用的Leader選舉算法更像是微軟的PacificA算法。
Kafka在Zookeeper中為每一個(gè)Partition動(dòng)態(tài)的維護(hù)了一個(gè)ISR,這個(gè)ISR里的所有replica都跟上了Leader,只有ISR里的成員才能有被選為Leader的可能(unclean.leader.election.enable=false)。在這種模式下,對(duì)于f+1個(gè)副本,一個(gè)Kafka Topic能在保證不丟失已經(jīng)commit消息的前提下容忍f個(gè)副本的失敗,在大多數(shù)使用場景下,這種模式是十分有利的。事實(shí)上,為了容忍f個(gè)副本的失敗,“少數(shù)服從多數(shù)”的方式和ISR在commit前需要等待的副本的數(shù)量是一樣的,但是ISR需要的總的副本的個(gè)數(shù)幾乎是“少數(shù)服從多數(shù)”的方式的一半。
上文提到,在ISR中至少有一個(gè)Follower時(shí),Kafka可以確保已經(jīng)commit的數(shù)據(jù)不丟失,但如果某一個(gè)Partition的所有replica都掛了,就無法保證數(shù)據(jù)不丟失了。這種情況下有兩種可行的方案:
等待ISR中任意一個(gè)replica“活”過來,并且選它作為Leader
選擇第一個(gè)“活”過來的replica(并不一定是在ISR中)作為Leader
這就需要在可用性和一致性當(dāng)中作出一個(gè)簡單的抉擇。如果一定要等待ISR中的replica“活”過來,那不可用的時(shí)間就可能會(huì)相對(duì)較長。而且如果ISR中所有的replica都無法“活”過來了,或者數(shù)據(jù)丟失了,這個(gè)Partition將永遠(yuǎn)不可用。選擇第一個(gè)“活”過來的replica作為Leader,而這個(gè)replica不是ISR中的replica,那即使它并不保障已經(jīng)包含了所有已commit的消息,它也會(huì)成為Leader而作為Consumer的數(shù)據(jù)源。默認(rèn)情況下,Kafka采用第二種策略,即unclean.leader.election.enable=true,也可以將此參數(shù)設(shè)置為false來啟用第一種策略。
unclean.leader.election.enable這個(gè)參數(shù)對(duì)于leader的選舉、系統(tǒng)的可用性以及數(shù)據(jù)的可靠性都有至關(guān)重要的影響。下面我們來分析下幾種典型的場景。
如果上圖所示,假設(shè)某個(gè)Partition中的副本數(shù)為3,replica-0, replica-1, replica-2分別存放在Broker0, Broker1和Broker2中。AR=(0,1,2),ISR=(0,1)。 設(shè)置request.required.acks=-1, min.insync.replicas=2,unclean.leader.election.enable=false。這里將Broker0中的副本也稱之為Broker0起初Broker0為Leader,Broker1為Follower。
當(dāng)ISR中的replica-0出現(xiàn)crash的情況時(shí),Broker1選舉為新的Leader[ISR=(1)],因?yàn)槭躮in.insync.replicas=2影響,write不能服務(wù),但是read能繼續(xù)正常服務(wù)。此種情況恢復(fù)方案:
嘗試恢復(fù)(重啟)replica-0,如果能起來,系統(tǒng)正常;2. 如果replica-0不能恢復(fù),需要將min.insync.replicas設(shè)置為1,恢復(fù)write功能。
當(dāng)ISR中的replica-0出現(xiàn)crash,緊接著replica-1也出現(xiàn)了crash, 此時(shí)[ISR=(1),leader=-1],不能對(duì)外提供服務(wù),此種情況恢復(fù)方案:
嘗試恢復(fù)replica-0和replica-1,如果都能起來,則系統(tǒng)恢復(fù)正常;
如果replica-0起來,而replica-1不能起來,這時(shí)候仍然不能選出Leader,因?yàn)楫?dāng)設(shè)置unclean.leader.election.enable=false時(shí),leader只能從ISR中選舉,當(dāng)ISR中所有副本都失效之后,需要ISR中最后失效的那個(gè)副本能恢復(fù)之后才能選舉Leader,即replica-0先失效,replica-1后失效,需要replica-1恢復(fù)后才能選舉Leader。保守的方案建議設(shè)置unclean.leader.election.enable=true,但是這樣會(huì)有丟失數(shù)據(jù)的情況發(fā)生,這樣可以恢復(fù)read服務(wù)。同樣需要將min.insync.replicas設(shè)置為1,恢復(fù)write功能;
replica-1恢復(fù),replica-0不能恢復(fù),這個(gè)情況上面遇到過,read服務(wù)可用,需要將min.insync.replicas設(shè)置為1,恢復(fù)write功能;
replica-0和replica-1都不能恢復(fù),這種情況可以參考情形2.
當(dāng)ISR中的replica-0,replica-1同時(shí)宕機(jī),此時(shí)[ISR=(0,1)],不能對(duì)外提供服務(wù),此種情況恢復(fù)方案:嘗試恢復(fù)replica-0和replica-1,當(dāng)其中任意一個(gè)副本恢復(fù)正常時(shí),對(duì)外可以提供read服務(wù)。直到2個(gè)副本恢復(fù)正常,write功能才能恢復(fù),或者將將min.insync.replicas設(shè)置為1。
到此,相信大家對(duì)“Kafka中的Leader選舉是什么”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
網(wǎng)頁題目:Kafka中的Leader選舉是什么
URL分享:http://sd-ha.com/article42/gddcec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)站收錄、網(wǎng)站設(shè)計(jì)、電子商務(wù)、外貿(mào)建站、網(wǎng)站維護(hù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)