VMware vSphere
5.1
Clustering Deepdive
HA.DRS.Storage DRS.Stretched Clusters
Duncan Epping &Frank Denneman
Translate By Tim2009 / 翻譯:Tim2009
目錄
版權(quán)
關(guān)于作者
知識點(diǎn)
前言
第一部分 vSphere高可用性
第一章 介紹vSphere高可用性
第二章 高可用組件
第三章 基本概念
第四章 重新啟動虛擬機(jī)
第五章 增加高可用靈活性(網(wǎng)絡(luò)冗余)
第六章 訪問控制
第七章 虛擬機(jī)和應(yīng)用監(jiān)控
第八章 集成
第九章 匯總
第二部分 vSphere DRS(分布式資源調(diào)度)
第一章 vSphere DRS介紹
第二章 vMotion和EVC
第三章 DRS動態(tài)配額
第四章 資源池與控制
第五章 DRS計算推薦
第六章 DRS推薦向?qū)?/p>
第七章 DPM介紹
第八章 DPM計算推薦
第九章 DPM推薦向?qū)?/p>
第十章 匯總
第三部分 vSphere存儲DRS
第一章 vSphere存儲DRS介紹
第二章 存儲DRS算法
第三章 存儲I/O控制(SIOC)
第四章 數(shù)據(jù)存儲配置
第五章 數(shù)據(jù)存儲架構(gòu)與設(shè)計
第六章 對存儲vMotion的影響
第七章 關(guān)聯(lián)性
第八章 數(shù)據(jù)存儲維護(hù)模式
第九章 總結(jié)匯總
第四部分 群集架構(gòu)的擴(kuò)展
第一章 群集架構(gòu)的擴(kuò)展
第二章 vSphere配置
第三章 故障排錯
第四章 總結(jié)匯總
第五章 附錄
第四部分 群集架構(gòu)的擴(kuò)展
第二章 vSphere配置
這種情況下,我們的重點(diǎn)是擴(kuò)展群集環(huán)境中vSphere HA,vSphere DRS和存儲DRS之間的關(guān)系,以及圍繞這些vSphere組件在設(shè)計和運(yùn)作方面經(jīng)常被忽視和低估的考慮。歷來很多重點(diǎn)放在存儲層,而很少考慮工作負(fù)載如何配置和管理。
如我們之前提到的,擴(kuò)展群集關(guān)鍵的驅(qū)動力是工作負(fù)載平衡和災(zāi)難避免。怎樣確認(rèn)我們的環(huán)境是處在合理的平衡中而沒有影響可用性或者大幅減少操作開銷?我們怎樣建立配置需求和持續(xù)管理過程,我們怎樣定期驗證我們?nèi)匀粷M足我們的需求?定義和遵從需求失敗會使環(huán)境混亂難以管理、各種故障場景難以預(yù)測,也會希望它來幫助你。事實(shí)上,忽略過程會導(dǎo)致故障事件中產(chǎn)生額外的停機(jī)時間。
這三個VMware vSphere功能每一個都有特別的配置需求,能加強(qiáng)你環(huán)境的彈性和工作負(fù)載的可用性,通過這一部分,架構(gòu)建議將產(chǎn)生,這些建議將基于測試期間的各種場景發(fā)現(xiàn)的問題。每一個故障場景測試在接下來的章節(jié)中都被記錄,請記住,這些故障場景直接應(yīng)用這些實(shí)例的配置,基于你的實(shí)施和配置選項你的環(huán)境可能會受到額外故障。
vSphere HA特性
我們的實(shí)例環(huán)境中有4臺主機(jī)和一個統(tǒng)一擴(kuò)展存儲解決方案。當(dāng)全部站點(diǎn)發(fā)生故障是需要考慮彈性架構(gòu)的一個場景,我們建議開啟接入控制(Admission Control),工作負(fù)載的可用性是許多擴(kuò)展群集環(huán)境的主要驅(qū)動力,它建議有足夠的容量允許全站點(diǎn)故障,盡管如此,兩個站點(diǎn)將平等的分配主機(jī),來確保所有的工作負(fù)載能通過HA重新開始,建議配置接入控制策略為50%。
我們建議使用基于百分比的策略來提供架構(gòu)的靈活性和減少操作開銷,盡管新主機(jī)加入環(huán)境中沒有必要改變百分比,而且沒有整合率偏差,導(dǎo)致使用虛擬機(jī)級別預(yù)留資源的風(fēng)險,更多詳情請見第6章。
HA使用心跳檢測機(jī)制來驗證主機(jī)的狀態(tài),如第3章解釋的有兩個心跳檢測機(jī)制;稱為網(wǎng)絡(luò)和數(shù)據(jù)存儲心跳檢測,網(wǎng)絡(luò)心跳檢測時HA驗證主機(jī)的主要機(jī)制,數(shù)據(jù)存儲心跳檢測是一旦網(wǎng)絡(luò)心跳檢測失敗通過HA來確定主機(jī)狀態(tài)的另一種機(jī)制。
如果主機(jī)沒有收到任何的心跳檢測,它檢測是否僅僅是從其它主機(jī)隔離或者網(wǎng)絡(luò)中完全隔離。這個過程包括了Ping主機(jī)的默認(rèn)網(wǎng)關(guān),或者一個或者多個手工設(shè)置的隔離地址來代替主機(jī)網(wǎng)關(guān),從而加強(qiáng)隔離檢測的可靠性。我們建議指定最少兩個額外的隔離地址并且每個地址能到本地網(wǎng)絡(luò),即使在站點(diǎn)之間連接失敗的情況下,開啟HA能夠驗證完整的網(wǎng)絡(luò)隔離,并提供冗余允許一個IP故障。
但是,如果主機(jī)被隔離,vSphere HA觸發(fā)響應(yīng),這在之前有解釋過,叫做隔離響應(yīng),當(dāng)主機(jī)同管理網(wǎng)絡(luò)之間的連接斷開,觸發(fā)隔離響應(yīng)來保證妥善管理虛擬機(jī)。隔離響應(yīng)在第三章有深入討論,根據(jù)使用不同的存儲和物理網(wǎng)絡(luò)完成,隔離響應(yīng)用來在需要時做出決定,我們提到在第四章,表3中支持的決定。
在我們的測試環(huán)境中,一部分這些地址將屬于Frimley 數(shù)據(jù)中心,另一部分屬于Bluefine數(shù)據(jù)中心,屏幕截圖顯示了怎樣配置多個隔離地址的實(shí)例,vSphereHA高級設(shè)置使用das.isolationaddress,更詳細(xì)的如何配置可以在KB 文章 1002117中找到。
為了vSphere HA數(shù)據(jù)存儲心跳在任何故障場景中都運(yùn)行正常,我們建議增加數(shù)據(jù)存儲心跳的數(shù)量為2-4,最少的數(shù)據(jù)存儲心跳為2,大為5,擴(kuò)展群集環(huán)境中建議4,這樣將提供本地的全冗余。還建議定義4個指定數(shù)據(jù)存儲為優(yōu)先數(shù)據(jù)存儲心跳,選擇一個站點(diǎn)的2個然后選擇另一個站點(diǎn)的2個。這樣做即使站點(diǎn)之間發(fā)生連接故障也允許vSphere HA的數(shù)據(jù)存儲心跳。如果站點(diǎn)之間發(fā)生連接故障后站點(diǎn)還存在部分網(wǎng)絡(luò),這些數(shù)據(jù)存儲將非常有用。
數(shù)據(jù)存儲心跳的數(shù)量能通過HA高級設(shè)置das.heartbeatDsPerHost.進(jìn)行增加。
我們建議使用“選擇考慮加入我的選項的任何群集數(shù)據(jù)存儲”,它將允許vSphere HA選擇任意4個設(shè)計的數(shù)據(jù)存儲,我們手工選擇變得不可用,原因是如果我們建議的站點(diǎn)間4個心跳連接失敗,vCenter將最終在一個站點(diǎn)上,這樣另一個站點(diǎn)的主機(jī)就沒有機(jī)會HA來改變數(shù)據(jù)存儲心跳。這個設(shè)置的截屏如下。
圖163:數(shù)據(jù)存儲心跳
vSphere 5.0 U1永久設(shè)備丟失(PDL)增強(qiáng)
vSphere 5.0 U1版本中,介紹了永久設(shè)備丟失(PDL)的條件—允許數(shù)據(jù)存儲上的虛擬機(jī)自動故障轉(zhuǎn)移,我們將在其中一個故障場景中展示一個PDL環(huán)境,溝通的環(huán)境是通過陣列控制器經(jīng)過一個指定的SCSI代碼到ESXi,這些條件聲明一個設(shè)備(LUN)將不可用,并且可能是永久不可用。當(dāng)存儲管理員設(shè)置這個LUN脫機(jī),這個實(shí)例場景通過陣列通信,當(dāng)撤回訪問LUN,不統(tǒng)一的環(huán)境發(fā)生故障期間用來確定ESXi進(jìn)行合適的行動,應(yīng)該注意的是當(dāng)全部存儲發(fā)生故障,可能生成永久磁盤丟失的情況,在陣列和ESXi主機(jī)之間沒有通信的可能,這個狀態(tài)通過ESXi主機(jī)來識別當(dāng)做所有路徑斷開(APD)。
重要的是認(rèn)識到接下來的設(shè)置只應(yīng)用PDL環(huán)境,而不是APD環(huán)境,在我們的故障環(huán)境中,我們將論證兩種環(huán)境的不同行為。
為了允許vSphere HA響應(yīng)PDL環(huán)境,vSphere U1里介紹了兩個高級設(shè)置,第一個主機(jī)設(shè)置是disk.terminateVMOnPDL Default。這個設(shè)置在/etc/vmware/settings里配置,由默認(rèn)設(shè)置為“True”,注意這是每主機(jī)的設(shè)置,主機(jī)需要重新啟動這個設(shè)置才生效,當(dāng)數(shù)據(jù)存儲進(jìn)入了PDL狀態(tài),這個設(shè)置確保殺掉虛擬機(jī)。PDL環(huán)境中一旦殺掉虛擬機(jī),數(shù)據(jù)存儲就磁盤I/O初始化。如果虛擬機(jī)的文件沒有在同一個數(shù)據(jù)存儲上,并且PDL存在其中一個數(shù)據(jù)存儲上,通過HA虛擬機(jī)可能不會重新啟動,vSphere 5.1里修正了這個問題,為了確保PDL環(huán)境中能通過HA進(jìn)行遷移,我們建議設(shè)置disk.terminateVMonPDL Default 為“True”,并將虛擬機(jī)文件放置單個數(shù)據(jù)存儲上,請注意當(dāng)數(shù)據(jù)存儲沒有產(chǎn)生I/O,虛擬機(jī)只是被殺掉,虛擬機(jī)可以恢復(fù)活動的。正在運(yùn)行密集內(nèi)存負(fù)載而數(shù)據(jù)存儲沒有產(chǎn)生I/O的虛擬機(jī)可能恢復(fù)活動狀態(tài)。
第二個設(shè)置是vSphere HA的高級設(shè)置,稱之為das.maskCleanShutdown Enabled。vSphere 5.0 U1中介紹了這個設(shè)置,默認(rèn)是禁用的,需要設(shè)置你的HA群集為“True”,這個設(shè)置允許HA觸發(fā)PDL環(huán)境中自動殺掉的虛擬機(jī)重啟,HA不能區(qū)分虛擬機(jī)是被PDL殺掉還是被管理員關(guān)閉,設(shè)置標(biāo)記“True”假定是前者。注意在APD期間用戶關(guān)機(jī)將被行為標(biāo)記
我們建議設(shè)置das.maskCleanShutdown Enabled 為“True”,為了限制PDL環(huán)境數(shù)據(jù)存儲上虛擬機(jī)的停機(jī)時間,當(dāng)das.maskCleanShutdown Enabled沒有設(shè)置“True”,PDL環(huán)境也存在,disk.terminateVMonPDL Default被設(shè)置為“True”,殺掉虛擬機(jī)后,虛擬機(jī)重新啟動不會發(fā)生,HA將假定虛擬機(jī)是管理員斷電(或者關(guān)閉)。
vSphere DRS
vSphere DRS在很多環(huán)境中用來分配群集負(fù)載。vSphere DRS提供很多其它功能來幫助擴(kuò)展環(huán)境,我們建議開啟vSphere DRS允許群集的主機(jī)之間的負(fù)載平衡,vSphere DRS 負(fù)載平衡計算是基于CPU和內(nèi)存的使用情況,同樣,關(guān)于存儲和網(wǎng)絡(luò)資源利用率和流量也必須小心照顧,為了避免擴(kuò)展群集環(huán)境中非預(yù)期的存儲和網(wǎng)絡(luò)流量開銷,我們建議執(zhí)行vSphere DRS關(guān)聯(lián)規(guī)則來允許合乎邏輯和可預(yù)測的分開虛擬機(jī),這將幫我們提高可用性,負(fù)責(zé)架構(gòu)服務(wù)的AD,DNS虛擬機(jī),這將有助于確保這些服務(wù)跨站點(diǎn)分離。
vSphere DRS關(guān)聯(lián)規(guī)則還幫助阻止存儲不要的停機(jī)時間和網(wǎng)絡(luò)流量過載,我們建議調(diào)整vSphere VM-Host的存儲配置關(guān)聯(lián)規(guī)則,我們的意思設(shè)置VM-Host關(guān)聯(lián)規(guī)則,這樣虛擬機(jī)偏向于運(yùn)行在同一站點(diǎn)的主機(jī)上,同時數(shù)據(jù)存儲陣列的主要讀/寫節(jié)點(diǎn)進(jìn)行配置。例如,我們的測試配置中,虛擬機(jī)存儲在Frimley-01數(shù)據(jù)存儲設(shè)置了VM-Host關(guān)聯(lián)規(guī)則是偏向于Frimley數(shù)據(jù)中心的主機(jī)。這樣確保了站點(diǎn)間網(wǎng)絡(luò)連接發(fā)生故障時,虛擬機(jī)不會斷開與存儲系統(tǒng)的連接。VM-Host關(guān)聯(lián)規(guī)則配置取決于這些建議,從而確保虛擬機(jī)呆在主數(shù)據(jù)存儲本地。巧合的是所有的讀I/O來自于它們站點(diǎn)的本地虛擬機(jī),注意:不同存儲廠商使用不同的技術(shù)來描述LUN到陣列或者控制器的關(guān)系,在這個章節(jié)我們將使用通用術(shù)語“Storage Site Affinity”,“Storage Site Affinity”意味著偏向于LUN的本地讀寫訪問。
我們建議執(zhí)行“should rules”,這些在HA發(fā)生故障時都能夠被沖突,服務(wù)的可用性應(yīng)該一直勝過性能。在“Must rule”情況下,HA將不會同設(shè)置的規(guī)則沖突,在站點(diǎn)或主機(jī)發(fā)生故障時它可能導(dǎo)致服務(wù)中斷。一個數(shù)據(jù)中心發(fā)生故障的場景,“Must rules”將使它不可能為vSphere HA重啟虛擬機(jī),同時他們沒有關(guān)聯(lián)規(guī)則請求來允許虛擬機(jī)在其它數(shù)據(jù)中心的主機(jī)上開啟。vSphere DRS同HA的溝通這些規(guī)則,把他們存儲在允許啟動的兼容性列表。vSphere DRS還有一個注意的地方,在某些情況下,如果大量的主機(jī)不平衡和激進(jìn)建議設(shè)置,會與“Should rule”沖突。盡管非常罕見,我們建議監(jiān)控對你的工作負(fù)載產(chǎn)生可用性和性能有沖突的規(guī)則。
我們建議手工定義創(chuàng)建站點(diǎn)的一組主機(jī),基于數(shù)據(jù)存儲關(guān)聯(lián)規(guī)則添加虛擬機(jī)到這個站點(diǎn)上,在我們的場景中只有限制數(shù)量的虛擬機(jī)被發(fā)布,我們建議使用vCenter Orchestrator或者Power CLI自動定義站點(diǎn)關(guān)聯(lián)規(guī)則,如果沒有選擇自動,我們推薦使用一個通用的命名慣例,簡化創(chuàng)建這些組,我們建議這些組定期驗證,來確保屬于組的虛擬機(jī)有正確的站點(diǎn)關(guān)聯(lián)規(guī)則。
接下來的截屏描述了用于該場景的配置,在第一張截圖中,所有的虛擬機(jī)應(yīng)保持在Bluefin本地的虛擬機(jī)組內(nèi)。
圖164:DRS組-虛擬機(jī)
接下來,創(chuàng)建一個本地包括所有主機(jī)的Bluefin 主機(jī)組。
圖165:DRS組-主機(jī)
最終,Bluefin本地創(chuàng)建好了一個新的規(guī)則,定義了連接到主機(jī)組虛擬機(jī)組“should run on”規(guī)則
圖166:VM-Host規(guī)則
兩邊本地都應(yīng)該完成,直接導(dǎo)致了4個組合2個規(guī)則。
圖167:結(jié)果-管理規(guī)則
調(diào)整關(guān)聯(lián)性規(guī)則沖突
DRS分配了高優(yōu)先級來調(diào)整關(guān)聯(lián)性規(guī)則沖突,在調(diào)用期間,DRS的主要目標(biāo)是調(diào)整任何沖突和為群集主機(jī)組主機(jī)清單上虛擬機(jī)生成遷移建議,這些移動的優(yōu)先級比負(fù)載平衡高,所以將在負(fù)載平衡之前開始虛擬機(jī)遷移。
DRS默認(rèn)每5分鐘調(diào)用一次,但是如果群集檢測到更改DRS還是會觸發(fā),當(dāng)主機(jī)重新連接上群集,DRS被調(diào)用,并生成建議來調(diào)整任何識別的沖突。我們的測試展示了在主機(jī)重新連接群集后的30秒內(nèi)DRS生成建議來調(diào)整關(guān)聯(lián)規(guī)則沖突。注意DRS限制了vMotion網(wǎng)絡(luò)的總吞吐量,這意味著在所有的管理規(guī)則沖突被調(diào)整之前,可能需要多次調(diào)用。
vSphere Storage DRS
當(dāng)定義的性能或者容量閾值超出,Storage DRS從管理員角度和虛擬機(jī)、磁盤平衡來考慮啟用激進(jìn)的單一數(shù)據(jù)存儲,存儲DRS確保你的工作負(fù)載中足夠的磁盤資源可用,我們建議開啟存儲DRS。
存儲DRS使用存儲vMotion在數(shù)據(jù)存儲群集內(nèi)的數(shù)據(jù)存儲上來遷移虛擬機(jī),由于底層擴(kuò)展存儲系統(tǒng)使用同步復(fù)制,一個遷移或者一系列遷移將對重復(fù)流量有影響,導(dǎo)致在移動磁盤的時候出現(xiàn)網(wǎng)絡(luò)資源爭用,可能引起虛擬機(jī)臨時不可用。從站點(diǎn)的角度,如果虛擬機(jī)不一起遷移它們的磁盤,在同一訪問配置中遷移漫游數(shù)據(jù)存儲還可能導(dǎo)致額外的I/O延遲。例如,如果Frimley主機(jī)上的虛擬機(jī)有磁盤遷移到Bluefin的數(shù)據(jù)存儲上,它將繼續(xù)操作,但可能降低性能。虛擬機(jī)讀取磁盤受制于站點(diǎn)B讀取虛擬iSCSI IP延遲的增加和受制于站點(diǎn)間的延遲。
當(dāng)遷移發(fā)生時能夠控制,我們建議配置存儲DRS手工模式,這允許人工驗證每個建議,并允許在非峰值時間應(yīng)用建議,同時獲得操作的益處和初始化位置的效率。
我們建議基于存儲配置遵從存儲站點(diǎn)關(guān)聯(lián)來創(chuàng)建數(shù)據(jù)存儲群集,站點(diǎn)A關(guān)聯(lián)的數(shù)據(jù)存儲不能同站點(diǎn)B的數(shù)據(jù)存儲相互混合。這將允許操作的一致性和緩和DRS VM-Host關(guān)聯(lián)規(guī)則的創(chuàng)建和持續(xù)。因此當(dāng)數(shù)據(jù)存儲群集和定義存儲站點(diǎn)關(guān)聯(lián)邊界之間的虛擬機(jī)被遷移,建議來保證所有的vSphere DRS VM-Host關(guān)聯(lián)規(guī)則被更新。我們建議調(diào)整數(shù)據(jù)存儲群集和VM-Host關(guān)聯(lián)規(guī)則的命名約定,以簡化配置和管理流程。
命名約定在我們的測試中用來給數(shù)據(jù)存儲和數(shù)據(jù)存儲群集一個特別的站點(diǎn)名稱,從而簡化站點(diǎn)上發(fā)布虛擬機(jī)的DRS主機(jī)關(guān)聯(lián)性。在我們的站點(diǎn)“Bluefin”和“Frimley”里的站點(diǎn)特指存儲見下圖。請注意vCenter映射功能不能用來查看存儲當(dāng)前的站點(diǎn)關(guān)聯(lián),同時也不能顯示數(shù)據(jù)存儲群集的對象。
圖168:數(shù)據(jù)存儲群集架構(gòu)
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
本文題目:VMwarevSphere5.1群集深入解析(二十八)-創(chuàng)新互聯(lián)
本文網(wǎng)址:http://sd-ha.com/article8/dedhop.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、Google、微信公眾號、手機(jī)網(wǎng)站建設(shè)、品牌網(wǎng)站設(shè)計、網(wǎng)站維護(hù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容