介 紹
Kubernetes在Github上擁有超過4萬顆星,7萬以上的commits,以及像Google這樣的主要貢獻者。Kubernetes可以說已經(jīng)快速地接管了容器生態(tài)系統(tǒng),成為了容器編排平臺中的真正領(lǐng)頭羊。
理解Kubernetes和它的Abstractions
在基礎(chǔ)設(shè)施層,Kubernetes集群好比是一組扮演特定角色的物理或虛擬機器。其中扮演Master角色的機器作為全部操作的大腦,并由運行在節(jié)點上的編排容器控制。
°kube-apiserver – 為其他master組件提供APIs
°etcd – 具有一致性且高可用的key/value存儲,用于存儲所有內(nèi)部集群數(shù)據(jù)
°kube-scheduler – 使用pod規(guī)范中的信息來確定運行pod的節(jié)點
°kube-controller-manager – 負責(zé)節(jié)點管理(檢測節(jié)點是否失?。?、pod復(fù)制和端點創(chuàng)建
°cloud-controller-manager – 運行與底層云提供商交互的controller
°kubelet:處理Master和運行它的節(jié)點之間的所有通信。它在使用container runtime時提供接口來部署和監(jiān)視容器。
° kube-proxy:維護主機上的網(wǎng)絡(luò)規(guī)則,處理在pods、host和外部世界之間包的傳輸。
°container runtime:負責(zé)在host上運行容器。雖然Kubernetes支持來自rkt、runc以及其他各式的container runtime,當(dāng)下最流行的引擎還是Docker。
從邏輯層面來看,Kubernetes部署由各種組件組成,每個組件在集群中提供的服務(wù)都有特定的目的。
Pods是Kubernetes部署時的基本單元。一個pod由一個或者多個共享相同網(wǎng)絡(luò)命名空間和IP地址的容器組成。最佳實踐推薦我們?yōu)槊總€應(yīng)用程序創(chuàng)建一個pod,這樣你就可以分別擴展和控制它們。
Services設(shè)置在pods集合之前,給它們提供一致的IP地址以及一套策略用來控制對它們的訪問。Service所針對的pod集合通常由label selector(標簽選擇器)決定。這樣在升級或者藍/綠部署期間很容易就讓Service指向不同的pod集合。
ReplicaSets由部署控制,并確保運行該部署所需要的pods數(shù)量。
Namespaces為諸如pods和services資源定義了一個邏輯命名空間。它們允許資源使用相同的名稱,而單個命名空間中的資源名稱必須唯一。Rancher使用命名空間和機遇角色的訪問控制,為命名空間和其中運行的資源之間提供安全隔離。
監(jiān)控Kubernetes
多個服務(wù)和命名空間可以跨基礎(chǔ)設(shè)施分布。就像上面所說,每個服務(wù)都是由pods組成,而pod可以包含一個或多個容器。有了如此多的移動部件,即便是監(jiān)控一個小型的Kubernetes集群也會帶來挑戰(zhàn)。為了高效地監(jiān)控它,這就需要深入了解應(yīng)用程序體系結(jié)構(gòu)和功能。
Kubernetes提供了用于監(jiān)控集群的工具:
Probes能積極地監(jiān)控容器的健康狀態(tài)。如果Probe檢測到容器不健康,那么它就會重啟容器。
cAdvisor是一個開源代理,它監(jiān)控資源的使用情況并分析容器的性能。cAdvisor最初由Google創(chuàng)建,現(xiàn)在已經(jīng)和Kubelet集成。它能夠收集、聚合、處理和導(dǎo)出在給定節(jié)點上運行的所有勇氣的度量指標,比如CPU、內(nèi)存、文件和網(wǎng)絡(luò)的使用情況。
Kubernetes由從故障中自動回復(fù)的強大能力。如果進程發(fā)生崩潰,它可以重新啟動pods,如果節(jié)點出現(xiàn)錯誤,它能重新分配pods。然而,盡管有如此能力,還是會有不能解決問題的情況。為了檢測到這些情況,我們還需要額外的監(jiān)控。
監(jiān)控的層次
基礎(chǔ)設(shè)施
服務(wù)器級別的問題會在工作負載中出現(xiàn),因此所有集群都應(yīng)該監(jiān)控底層服務(wù)器組件
監(jiān)控什么
CPU利用率。監(jiān)控CPU既能顯示系統(tǒng)和用戶的開銷,也能顯示iowait。擋在云中或者任何網(wǎng)絡(luò)存儲中運行集群時,iowait會提示存儲讀寫(i/o過程)的瓶頸等待時間。超額訂閱的存儲框架會影響性能。
內(nèi)存使用情況。監(jiān)控內(nèi)存可以顯示出有多少內(nèi)存在使用,以及有多少可用內(nèi)存,可用內(nèi)存可以是空閑內(nèi)存,也可以是緩存。出現(xiàn)內(nèi)存限制的系統(tǒng)會開始進行交換(swap),交換會迅速降低性能。
磁盤壓力。如果系統(tǒng)正在運行諸如etcd或者任何數(shù)據(jù)存儲這樣的寫入密集型服務(wù)時,如果磁盤空間耗盡,那將是災(zāi)難性的問題。不能寫入數(shù)據(jù)會出現(xiàn)崩潰,而這種崩潰會轉(zhuǎn)化為真實世界的損失。有了像LVM這樣的技術(shù),就能很容易地根據(jù)需要增加磁盤空間,但是盡管如此還是要監(jiān)控它。
網(wǎng)絡(luò)帶寬。在當(dāng)今千兆接口的時代,似乎帶寬永遠都不會耗盡。然而,僅僅是出現(xiàn)一些異常的服務(wù)、數(shù)據(jù)泄漏、系統(tǒng)損壞或者DOS***,就可能耗盡所有的帶寬導(dǎo)致停機。如果了解自己的正常數(shù)據(jù)使用情況和應(yīng)用程序的模式,就能有效降低成本,有助于規(guī)劃容量。
Pod資源。如果能知道pod需要什么資源的話,Kubernetes調(diào)度器就能大化發(fā)揮作用。它可以確保在可用的節(jié)點上放置pod。在設(shè)計網(wǎng)絡(luò)時,為了避免剩余節(jié)點無法運行所有所需的資源的情況,需要預(yù)先考慮有多少節(jié)點可能會失敗。使用云自動伸縮組之類的服務(wù)可以快速恢復(fù),但要確保其余節(jié)點在失敗節(jié)點恢復(fù)回來之前,能夠處理增加的負載。
Kubernetes服務(wù)
組成Kubernetes Master或者Worker的所有組件(包括etcd)都對應(yīng)用程序的健康運行至關(guān)重要。如果其中任何一個出現(xiàn)失敗,監(jiān)控系統(tǒng)就需要檢測失敗,修復(fù)它并且發(fā)送警告。
內(nèi)部服務(wù)
最后一層是Kubernetes資源本身。Kubernetes公開了關(guān)于資源的度量,我們還可以直接監(jiān)控應(yīng)用程序。雖然Kubernetes會盡力維持理想的狀態(tài),但如果它無能為力的話,我們就需要一種由人類干預(yù)和解決問題的方法了。
用Rancher來監(jiān)控
除了管理運行在任何提供者上、任何位置的Kubernetes集群外,Rancher還會監(jiān)控這些集群中運行的資源,并在資源超過定義的閾值時發(fā)送警報。
現(xiàn)在已經(jīng)有許多關(guān)于如何部署Rancher的教程。如果你還沒有正在運行的集群,請先在這里暫停,進入我們的快速上手指南:https://rancher.com/quick-start/。等到集群正在運行了再返回到這里開始監(jiān)控。
集群概述可以讓你了解正在使用的資源和Kubernetes組件的狀態(tài)。在我們的例子中,我們使用了78%的CPU、26%的RAM和11%的大pod數(shù)量。
點擊Nodes選項卡,你可以看到關(guān)于運行在集群上每個節(jié)點的附加信息,點擊具體節(jié)點時,可以看到關(guān)于該成員的健康狀況。
Workloads選項卡顯示了運行在集群上的pods。如果你還沒有任何運行的pod,先發(fā)布一個運行nginx鏡像的工作負載,把它擴展成多個副本。
當(dāng)需要選擇工作負載名稱時,Rancher會彈出一個顯示有關(guān)該工作負載的信息頁面。在頁面頂部,它展示了每個pod所運行的節(jié)點,pod的IP地址以及它們的狀態(tài)。點擊任何一個pod會看到更多內(nèi)容,現(xiàn)在我們看到了關(guān)于該pod的詳細信息。右上角的漢堡菜單圖標能讓我們和pod交互,通過該圖標,我們可以執(zhí)行shell、查看日志或者刪除pod。
Other選項卡展示了不同Kubernetes資源的信息,包括ingress或LoadBalancer類型的服務(wù)的Load Balancing,其他服務(wù)類型的Service Discovery以及在集群中配置卷的Volumes。
使用Prometheus監(jiān)控
Rancher UI中可以看到的信息對故障排除非常有幫助,不過這并不是在集群生命周期的每一時刻積極追蹤集群狀態(tài)的最佳方法。我們將使用Prometheus,它是Kubernetes公司的一個兄弟項目,由Cloud Native Computing Foundation負責(zé)維護和運營。我們還將使用到Grafana工具,它能把時間序列數(shù)據(jù)轉(zhuǎn)換成漂亮的圖形和儀表板顯示。
Prometheus是一個用來監(jiān)控系統(tǒng)和生成警報的開源應(yīng)用程序。從服務(wù)器到應(yīng)用程序、數(shù)據(jù)庫、甚至單個進程,它幾乎可以監(jiān)控任何東西。在Prometheus的詞表中,它監(jiān)控targets,目標的每個單位稱為metric。檢索關(guān)于目標信息的行為稱為scraping(抓?。?。Prometheus將在指定的時間間隔內(nèi)采集目標,并把信息存儲在時間序列數(shù)據(jù)庫中。Prometheus擁有自己的腳本語言PromQL。
Grafana也是開源的,可以作為Web應(yīng)用程序運行。雖然它經(jīng)常和Prometheus一起使用,但也支持后端數(shù)據(jù)存儲,如fluxDB、Graphite、Elasticsearch等等。Grafana可以很容易地創(chuàng)建圖形,并且把它們合并稱儀表板,而這些儀表板由一個強大的身份驗證和授權(quán)層保護,它們還可以和其他儀表板進行共享而不需要訪問服務(wù)器本身。Grafana在其對象定義中大量使用JSON,這樣它的圖形和儀表板都非常容易移植,并且版本控制非常方便。
在Rancher的應(yīng)用程序目錄中已經(jīng)同時包含了Prometheus和Grafana,我們只需點擊幾下鼠標就能部署它們了。
安裝Prometheus和Grafana
訪問集群的Catalog Apps頁面,搜索Prometheus。安裝它的同時還會安裝Grafana和AlertManager。對本文來說,所有內(nèi)容都使用默認值就可以了,但如果考慮到生產(chǎn)部署,請閱讀Detailed Descriptions下的信息,看看圖表中有多少配置可供使用。
單擊Launch,Rancher將把應(yīng)用程序部署到集群中,幾分鐘之后,你就能看到prometheus命名空間下所有工作負載處于Active狀態(tài)。
默認情況下使用了xip.io設(shè)置Layer7 ingress,我們可以在Load Balancing選項卡上看到它,單擊鏈接打開Grafana儀表板。
Prometheus的安裝還在Grafana中部署了幾個儀表板,因此我們可以馬上看到關(guān)于集群的信息,查看它的性能。
總 結(jié)
Kubernetes能盡可能保持應(yīng)用程序的運行,但這并不說明我們就不需要了解應(yīng)用程序運行的情況。當(dāng)你開始使用Kubernetes工作時,還需要去部署監(jiān)控系統(tǒng),幫助你了解情況并作出決策。
Prometheus和Grafana將幫助你完成這一項工作,如果你使用了Rancher,那部署這兩個應(yīng)用程序只需要短短幾分鐘。而在即將發(fā)布的Rancher 2.2中,配備了完全集成的Prometheus和Grafana,增強所有Kubernetes集群的可見性,同時確保不同項目與用戶之間的隔離。Rancher也因此成為唯一一個在多集群、多租戶環(huán)境中支持Prometheus的解決方案。
使用Prometheus監(jiān)控Rancher管理的Kubernetes環(huán)境,只需要兩個步驟:
選擇集群
你可以在此了解如何更加簡單快速地在多Kubernetes集群和多租戶環(huán)境中使用Prometheus監(jiān)控!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
名稱欄目:Kubernetes集群監(jiān)控詳解-創(chuàng)新互聯(lián)
瀏覽路徑:http://sd-ha.com/article42/dcioec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、商城網(wǎng)站、網(wǎng)頁設(shè)計公司、動態(tài)網(wǎng)站、小程序開發(fā)、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容