服務(wù)治理定義
服務(wù)治理通常是指通過限流、熔斷等手段,保障微服務(wù)的可靠運(yùn)行,即運(yùn)行時(shí)治理。更加寬泛的服務(wù)治理還包括微服務(wù)持續(xù)集成(開源軟件管理、自動(dòng)化測(cè)試等),微服務(wù)部署最佳實(shí)踐(滾動(dòng)升級(jí)、灰度發(fā)布等),微服務(wù)可觀測(cè)性能力(日志、監(jiān)控、告警等)構(gòu)建等。
華為云微服務(wù)治理專題主要探討運(yùn)行時(shí)治理。我們首先從常見的故障模式開始。
擴(kuò)容縮容
在擴(kuò)容場(chǎng)景下,新啟動(dòng)的微服務(wù)實(shí)例需要初始化數(shù)據(jù)庫連接、初始化緩存等,處理能力一定時(shí)間才能夠達(dá)到峰值。消費(fèi)者調(diào)用新啟動(dòng)的微服務(wù)實(shí)例,也需要新建立網(wǎng)絡(luò)連接,這個(gè)過程通常是非常消耗CPU并且耗時(shí)的操作。在高并發(fā)或者高TPS場(chǎng)景下,新啟動(dòng)的實(shí)例處理緩慢,很容易導(dǎo)致調(diào)用鏈路雪崩,引起故障。
在縮容場(chǎng)景下,一般會(huì)采用優(yōu)雅停機(jī)等策略,將下線的實(shí)例先從注冊(cè)中心摘除,然后再停止進(jìn)程,防止正在處理的請(qǐng)求失敗或者消費(fèi)者將新請(qǐng)求轉(zhuǎn)發(fā)到下線實(shí)例。但是現(xiàn)實(shí)環(huán)境中,優(yōu)雅停機(jī)沒有正確實(shí)現(xiàn)的情況非常普遍,下線實(shí)例被異常終止沒有執(zhí)行優(yōu)雅停機(jī)邏輯的情況也非常普遍。
實(shí)例不對(duì)等
實(shí)例不對(duì)等通常有很多原因。在資源受限的場(chǎng)景,可能部分實(shí)例使用處理能力相對(duì)比較弱的資源。在高可用場(chǎng)景,不同的AZ的時(shí)延也存在差異。資源不對(duì)等場(chǎng)景觸發(fā)故障的主要原因是處理能力比較弱的實(shí)例會(huì)拖慢系統(tǒng)總體的處理能力,需要有合理的機(jī)制在實(shí)例之間調(diào)度請(qǐng)求的執(zhí)行。
業(yè)務(wù)邏輯差異
提供者通常存在非常多的業(yè)務(wù)接口,每個(gè)業(yè)務(wù)接口處理的邏輯不同,這些接口的處理時(shí)延也是不一樣的。部分訪問頻率很低的接口,可能非常耗時(shí),甚至觸發(fā)故障、內(nèi)存泄漏等問題。當(dāng)這些耗時(shí)接口被頻繁訪問的時(shí)候,會(huì)搶占其他接口的處理資源,導(dǎo)致其他接口的處理也變得緩慢。
超出系統(tǒng)處理能力的流量
秒殺、大促和熱點(diǎn)事件等場(chǎng)景,會(huì)產(chǎn)生超出系統(tǒng)處理能力的流量,這些流量如果沒有被快速丟棄,就會(huì)占用大量的處理資源,并觸發(fā)系統(tǒng)處理鏈路的大量超時(shí)甚至系統(tǒng)癱瘓。有機(jī)器人參與的情況下,資源容易被機(jī)器人全部搶走,正常用戶得不到公平合理的處理資源。
審核編輯 黃宇
-
華為云
+關(guān)注
關(guān)注
3文章
2797瀏覽量
18930
發(fā)布評(píng)論請(qǐng)先 登錄
華納云VPS容器服務(wù)網(wǎng)格流量管理:實(shí)現(xiàn)微服務(wù)高效路由
服務(wù)器數(shù)據(jù)恢復(fù)—如何預(yù)防服務(wù)器故障與恢復(fù)服務(wù)器數(shù)據(jù)!
微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?
華為云 Flexus 云服務(wù)器 X 實(shí)例全面使用操作指南

微服務(wù)容器化部署好處多嗎?
新加坡云服務(wù)器網(wǎng)絡(luò)中斷的常見原因有哪些
常見的容器云服務(wù)引擎有哪些?
基于華為云 Flexus 云服務(wù)器 X 搭建 jumpserver 堡壘機(jī)軟件

華為云 Flexus 云服務(wù)器 X 實(shí)例的使用教程

華為云 Flexus 云服務(wù)器 X 實(shí)例的購(gòu)買及使用體驗(yàn)

評(píng)論