摘要:?從用戶的聲音中,我們聽到用戶對穩(wěn)定、彈性、透明的訴求,我們也在不斷升級ECS的運維能力和體驗,助力用戶建立主動運維體系,賦能業(yè)務(wù)永續(xù)運行。為了讓大家更好的了解和用好ECS彈性計算服務(wù),從本期開始,我們會以專欄的形式不斷更新ECS運維方面的內(nèi)容,也歡迎大家多提寶貴建議和意見,幫助我們打造更好的彈性計算服務(wù)。
阿里云經(jīng)過9年多的發(fā)展,成長為中國第一全球前三的云服務(wù)提供商,為上百萬用戶提供IT基礎(chǔ)設(shè)施云服務(wù)。這些用戶幾乎都會使用ECS彈性計算服務(wù),這其中既有面向消費者(to C)、企業(yè)(to B)提供服務(wù)的互聯(lián)網(wǎng)應(yīng)用、電商、娛樂等類型的用戶,也有面向企業(yè)內(nèi)部效率提升搭建信息化數(shù)字化平臺和應(yīng)用的用戶,還有廣泛的個人網(wǎng)站、開發(fā)者等,不論哪種類型的用戶,從購買創(chuàng)建第一臺ECS云服務(wù)器開始,就已經(jīng)進入了云上使用和運維的階段。
與傳統(tǒng)IDC環(huán)境相比,云上運維有哪些差異?大量的計算資源怎樣方便快捷地部署、管理?如何發(fā)揮彈性響應(yīng)業(yè)務(wù)負載變化的同時保持較低TCO總擁有成本?ECS出現(xiàn)異常是什么原因,如何保持業(yè)務(wù)連續(xù)性?……等等這些,是很多用戶在使用和運維ECS過程中提出的問題。從用戶的聲音中,我們聽到用戶對穩(wěn)定、彈性、透明的訴求,我們也在不斷升級ECS的運維能力和體驗,助力用戶建立主動運維體系,賦能業(yè)務(wù)永續(xù)運行。為了讓大家更好的了解和用好ECS彈性計算服務(wù),從本期開始,我們會以專欄的形式不斷更新ECS運維方面的內(nèi)容,也歡迎大家多提寶貴建議和意見,幫助我們打造更好的彈性計算服務(wù)。

今天,我們先來聊聊從On-Premise本地化運維到On-Cloud云上運維的演進歷程。
On-Premise本地運維
在互聯(lián)網(wǎng)服務(wù)和云計算興起之前,IT技術(shù)多是為企業(yè)內(nèi)部的信息化服務(wù),而企業(yè)的IT能力多建設(shè)在On-Premise本地部署基礎(chǔ)之上。企業(yè)基于其公司戰(zhàn)略、運營模式、流程體系、組織架構(gòu)等業(yè)務(wù)發(fā)展需要和特點設(shè)計對應(yīng)的IT架構(gòu),通過建設(shè)自有數(shù)據(jù)中心或租用第三方IDC構(gòu)建IT基礎(chǔ)設(shè)施資源,在此基礎(chǔ)上搭建應(yīng)用系統(tǒng),支持企業(yè)的發(fā)展。相應(yīng)地,企業(yè)IT組織會設(shè)立開發(fā)、運維等職能的團隊,以滿足業(yè)務(wù)發(fā)展變化的需求和業(yè)務(wù)連續(xù)性的保障。
早期的IT設(shè)計多為企業(yè)內(nèi)部信息化的需要服務(wù),通過引入ERP、MRP、MES、PLM、CRM等商業(yè)軟件,優(yōu)化企業(yè)業(yè)務(wù)流程,提升企業(yè)運營效率。由這些商業(yè)軟件解決方案的技術(shù)架構(gòu)所決定,對應(yīng)的基礎(chǔ)架構(gòu)多以商業(yè)數(shù)據(jù)庫、小型機等專有服務(wù)器、光纖連接的存儲區(qū)域網(wǎng)絡(luò)(SAN)、存儲陣列、磁帶庫等為主,這類基礎(chǔ)架構(gòu)組件以集中度高、單體穩(wěn)定性強、縱向擴展為顯著特點,通過單機擴展提升處理能力,實施技術(shù)難度較大,周期較長,管理復(fù)雜度較高,因而逐漸形成了以ITIL為最佳實踐的運維管理體系,注重流程規(guī)范和控制風(fēng)險。
隨著互聯(lián)網(wǎng)的發(fā)展和企業(yè)通過互聯(lián)網(wǎng)與其客戶緊密連接的需要,支撐企業(yè)對外服務(wù)客戶的IT設(shè)計也逐漸發(fā)展和成熟,通過廣泛應(yīng)用開源軟件,建立企業(yè)對客戶的電子商務(wù)、社交網(wǎng)絡(luò)、數(shù)據(jù)分析等能力,優(yōu)化用戶體驗,提升客戶價值。由這些開源軟件解決方案的技術(shù)架構(gòu)所決定,對應(yīng)的基礎(chǔ)架構(gòu)多以開源數(shù)據(jù)庫、X86通用服務(wù)器、本地塊存儲、對象存儲、數(shù)據(jù)以太網(wǎng)絡(luò)為主,這類基礎(chǔ)架構(gòu)組件以分布式部署、集群架構(gòu)、橫向擴展為顯著特點,通過向集群增加節(jié)點擴展處理能力,實施隨業(yè)務(wù)的快速變化而定,周期較短,方案組合靈活,因而逐漸形成了以DevOps為最佳實踐的運維管理體系,注重效率敏捷和快速響應(yīng)業(yè)務(wù)需求。
兩種典型運維管理體系都會建立基礎(chǔ)運維和應(yīng)用運維團隊,且由于初始投資較大,影響范圍廣泛,企業(yè)會格外重視硬件投資和基礎(chǔ)運維工作,并安排經(jīng)驗豐富的基礎(chǔ)運維工程師維護數(shù)據(jù)中心、服務(wù)器、存儲、網(wǎng)絡(luò)等硬件和軟件工作。由于基礎(chǔ)設(shè)施資源有限,設(shè)備采購、部署實施和調(diào)整周期較長,因而運維團隊會設(shè)立一系列制度和流程,管理和控制資源的使用以及容量規(guī)劃。
On-Cloud云上運維
云計算的興起,為企業(yè)建立有競爭優(yōu)勢的IT能力提供了更強的支撐。企業(yè)IT組織利用云計算提供的按需自助服務(wù)、資源池化、彈性擴展伸縮、廣泛網(wǎng)絡(luò)連接等服務(wù)特性,進一步提升企業(yè)信息化和數(shù)字化能力,在快速變化的行業(yè)環(huán)境和日趨激烈的市場競爭中脫穎而出。
在企業(yè)IT組織中,不論其運維體系是以注重流程和管控的ITIL理念還是以注重效率和敏捷的DevOps理念為核心,面對On-Cloud的趨勢,不變的始終是保持對業(yè)務(wù)需求的響應(yīng)和對系統(tǒng)可靠性業(yè)務(wù)連續(xù)性的保障。而借助云計算的諸多特性和優(yōu)勢,企業(yè)運維的重心從重視面向基礎(chǔ)環(huán)境的運維轉(zhuǎn)向重視面向業(yè)務(wù)應(yīng)用的運維,更有效地支撐企業(yè)戰(zhàn)略和業(yè)務(wù)發(fā)展。在架構(gòu)層面,借助云計算廣泛多樣的產(chǎn)品和服務(wù),企業(yè)IT架構(gòu)從豎井式向共享服務(wù)式發(fā)展,通過水平分布的系統(tǒng)架構(gòu)實現(xiàn)對可用性的保障,并提升彈性擴展的能力,數(shù)據(jù)的流轉(zhuǎn)提升對業(yè)務(wù)的洞察。同時,借助云計算資源池化、監(jiān)控和編排等能力,IT運維組織對資源的使用和容量規(guī)劃可以與業(yè)務(wù)變化及研發(fā)需求更緊密靈活地結(jié)合,從管控模式向服務(wù)模式轉(zhuǎn)變;API、SDK的廣泛使用使基礎(chǔ)設(shè)施可編程,自動化的部署和編排進一步促進環(huán)境準備、灰度發(fā)布、在線變更的效率。
在互聯(lián)網(wǎng)企業(yè)中,由于天生就需要面對大流量高并發(fā)的業(yè)務(wù)需求,往往從第一天搭建開始就已經(jīng)采用了Cloud Native或Cloud Friendly的系統(tǒng)架構(gòu)和運維方式。隨著公有云服務(wù)的發(fā)展和成熟,互聯(lián)網(wǎng)服務(wù)普遍采用All on 公有云或混合云的部署結(jié)構(gòu),會更適應(yīng)On-Cloud云上運維形態(tài),運維的重心保持在如何支撐快速發(fā)展變化的業(yè)務(wù)規(guī)模,彈性響應(yīng)業(yè)務(wù)波動,快速高效地管理大規(guī)模海量資源等方面。
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
電子發(fā)燒友App















































評論