2021年6月,中軟國際簽署CLA(公司貢獻(xiàn)者許可協(xié)議),正式加入openGauss社區(qū)。 在還沒有加入社區(qū)之前,中軟國際就已經(jīng)深度參與社區(qū)開發(fā),并成功為openGauss社區(qū)貢獻(xiàn)集群管理工具-openGauss Housekeeper。
關(guān)于openGauss Housekeeper
openGauss Housekeeper不僅為openGauss集群實(shí)現(xiàn)自動(dòng)化的高可用主備管理,而且還通過實(shí)現(xiàn)浮動(dòng)IP,為openGauss集群對外呈現(xiàn)統(tǒng)一的浮動(dòng)IP服務(wù),用戶只需要通過統(tǒng)一的浮動(dòng)IP訪問數(shù)據(jù)庫,而無需了解集群內(nèi)部組網(wǎng)細(xì)節(jié)與主備節(jié)點(diǎn)切換,從而大大簡化了用戶對集群的使用。
openGauss Housekeeper是開源版本,目前是第一個(gè)版本,提供了基礎(chǔ)服務(wù)功能,后續(xù)版本將不斷進(jìn)行功能增強(qiáng)。
openGauss Housekeeper系統(tǒng)架構(gòu)
openGauss Housekeeper支持openGauss數(shù)據(jù)庫一主多備組網(wǎng),備節(jié)點(diǎn)數(shù)量大于或等于二個(gè)。
openGauss Housekeeper包含三個(gè)模塊,其部署與模塊間SSH信任關(guān)系如下圖所示:
GGHC:openGauss集群管理端,它運(yùn)行在獨(dú)立主機(jī)上,定時(shí)發(fā)起數(shù)據(jù)庫集群健康檢測,在發(fā)現(xiàn)節(jié)點(diǎn)故障時(shí)發(fā)起自動(dòng)恢復(fù)處理,并在主節(jié)點(diǎn)故障需要主備切換時(shí),發(fā)起對浮動(dòng)IP漂移的處理。
GGHS:它是GGHC的遠(yuǎn)端處理代理,部署在高斯集群omm賬號下。它接受GGHC調(diào)用,完成集群健康檢測操作、節(jié)點(diǎn)狀態(tài)恢復(fù)操作、主備切換操作以及浮動(dòng)IP漂移處理。
floatip:它是一個(gè)floatip.sh腳本,實(shí)現(xiàn)浮動(dòng)IP啟停處理。因?yàn)樵撁钚枰猺oot權(quán)限才能執(zhí)行,因此還需要在sudo文件中配置權(quán)限。
圖1 GGHK系統(tǒng)架構(gòu)圖
說明:開源版本只有openGauss Housekeeper核心代碼,沒有考慮GGHC進(jìn)程可靠性與主機(jī)節(jié)點(diǎn)的可靠性。實(shí)際應(yīng)用時(shí),建議用戶增加對GGHC進(jìn)程的監(jiān)控,在其出現(xiàn)故障后對其進(jìn)行拉起,還可以對GGHC實(shí)現(xiàn)主/備組網(wǎng),避免單點(diǎn)故障。
openGauss Housekeeper技術(shù)指標(biāo)
openGauss Housekeeper支持openGauss一主N備,N的數(shù)量大于等于2
openGauss Housekeeper定時(shí)對數(shù)據(jù)庫集群進(jìn)行健康檢測,檢測周期可配,默認(rèn)值10秒。若實(shí)際檢測花費(fèi)時(shí)間小于檢測周期,則繼續(xù)sleep到檢測周期值后進(jìn)入下一輪檢測,否則立即進(jìn)行下一輪檢測。實(shí)際檢測花費(fèi)時(shí)間與網(wǎng)絡(luò)和openGauss集群節(jié)點(diǎn)負(fù)荷有關(guān)。
openGauss Housekeeper基本功能和特性
支持GGHC通過定時(shí)對數(shù)據(jù)庫集群狀態(tài)進(jìn)行健康檢測,在發(fā)現(xiàn)故障Standby節(jié)點(diǎn)時(shí)對其進(jìn)行恢復(fù)。在發(fā)現(xiàn)Primary節(jié)點(diǎn)故障,優(yōu)先進(jìn)行恢復(fù)處理;若不可恢復(fù),按照高斯集群選擇候選Primary節(jié)點(diǎn)算法選擇候選Primary節(jié)點(diǎn),并進(jìn)行主備切換,同時(shí)將浮動(dòng)IP隨漂移到當(dāng)前Primary節(jié)點(diǎn)。
支持檢測的故障類型包括:openGauss進(jìn)程被kill,被stop,主機(jī)被重啟、被關(guān)機(jī),網(wǎng)卡故障。
支持openGauss數(shù)據(jù)庫集群對外呈現(xiàn)統(tǒng)一的浮動(dòng)IP服務(wù)。在系統(tǒng)啟動(dòng)時(shí)自動(dòng)檢測Primary節(jié)點(diǎn)是否綁定浮動(dòng)IP,未綁定時(shí)幫助其綁定。
支持主機(jī)或網(wǎng)卡故障情況,發(fā)生主備故障切換后,gghc無法通過openGauss執(zhí)行g(shù)s_om -t refreshconf命令,以及無法通過gghs清理故障主節(jié)點(diǎn)postgresql.conf中的浮動(dòng)ip,gghc能夠記錄這些狀態(tài),并每輪健康檢測時(shí)檢測主機(jī)或網(wǎng)卡是否故障恢復(fù),一旦發(fā)現(xiàn)恢復(fù),則繼續(xù)完成之前未完成處理。
支持對無法自動(dòng)修復(fù)的故障場景打印CRITICAL日志信息,以期人工參與處理。
支持openGauss單網(wǎng)絡(luò)和雙網(wǎng)絡(luò)平面(對外監(jiān)聽網(wǎng)絡(luò)平面和內(nèi)部SSH互信及內(nèi)部主備數(shù)據(jù)同步網(wǎng)絡(luò)平面)。
特別說明
因?yàn)镚GHC會根據(jù)openGauss集群當(dāng)前狀態(tài)和工作狀態(tài)的上下文進(jìn)行切換處理,因此如果需要人工進(jìn)行集群維護(hù),務(wù)必停止GGHC進(jìn)程。待集群狀態(tài)正常,并且與GGHC記錄的狀態(tài)一致時(shí),才啟動(dòng)GGHC重新委托其進(jìn)行維護(hù),否則可能導(dǎo)致openGauss集群狀態(tài)混亂。
中軟國際有限公司簡介: 中軟國際有限公司是行業(yè)領(lǐng)先的全球化軟件與信息技術(shù)服務(wù)企業(yè)之一,成立于2000年,為香港主板上市公司,致力于使能軟件企業(yè)引領(lǐng)發(fā)展,服務(wù)制造企業(yè)轉(zhuǎn)型升級。2020年,中軟國際蟬聯(lián)Gartner全球IT服務(wù)市場份額TOP100,已是國內(nèi)最大的軟件與信息技術(shù)服務(wù)企業(yè)之一。
文章出處:【微信公眾號:華為計(jì)算】
責(zé)任編輯:gt
-
主機(jī)
+關(guān)注
關(guān)注
0文章
1038瀏覽量
35981 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3926瀏覽量
66198
原文標(biāo)題:中軟國際正式加入openGauss社區(qū)
文章出處:【微信號:gh_3a181fa836b6,微信公眾號:華為計(jì)算】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
中軟國際助力打造黑龍江省首個(gè)鴻蒙生態(tài)智慧文旅平臺

華為開發(fā)者大會HDC亮點(diǎn) 2025中軟國際與硅基流動(dòng)達(dá)成戰(zhàn)略合作協(xié)議

中軟國際教育與重慶第二師范學(xué)院簽署戰(zhàn)略合作協(xié)議
中軟國際加入貴州移動(dòng)AI生態(tài)聯(lián)盟
中軟國際打造企業(yè)上云服務(wù)解決方案
中軟國際加入中國電信AI+生態(tài)出海聯(lián)盟
軟通動(dòng)力正式加入“AI+出海合作生態(tài)聯(lián)盟”

中軟國際亮相華為HarmonyOS Connect伙伴峰會
矚目!海量數(shù)據(jù)再獲2024年度openGauss社區(qū)突出貢獻(xiàn)單位

評論