chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)代碼拼寫錯(cuò)誤引發(fā)微軟Azure故障,17個(gè)生產(chǎn)級(jí)數(shù)據(jù)庫(kù)被刪

OSC開源社區(qū) ? 來(lái)源:OSC開源社區(qū) ? 2023-06-12 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5 月 24 日,微軟 Azure DevOps 在巴西南部地區(qū)的一處 scale-unit 發(fā)生故障,導(dǎo)致宕機(jī)約 10.5 個(gè)小時(shí)。近日,微軟首席軟件工程經(jīng)理 Eric Mattingly 出面針對(duì)此次故障事件道歉,并透露了導(dǎo)致中斷的原因:即,一個(gè)簡(jiǎn)單的拼寫錯(cuò)誤致使 17 個(gè)生產(chǎn)級(jí)數(shù)據(jù)庫(kù)被刪除。

事件背景起源于,Azure DevOps 工程師有時(shí)需要對(duì)生產(chǎn)數(shù)據(jù)庫(kù)的快照進(jìn)行保存,以調(diào)查報(bào)告的問(wèn)題或測(cè)試性能改進(jìn)。為了確保這些快照數(shù)據(jù)庫(kù)得到清理,會(huì)有一個(gè)專門的后臺(tái)每天運(yùn)行,系統(tǒng)會(huì)在設(shè)定的時(shí)間段后刪除舊快照。

在 Sprint 222 期間,Azure DevOps 工程師升級(jí)了代碼庫(kù),將已棄用的 Microsoft.Azure.Managment.* 包替換為受支持的 Azure.ResourceManager.* NuGet 包。此舉連帶了大量的 pull request 變更請(qǐng)求,以尋求將舊包中的 API 調(diào)用替換為新包中的 API 調(diào)用。而其中就隱藏了有關(guān)快照刪除作業(yè)中的一個(gè)拼寫錯(cuò)誤,它將刪除 Azure SQL 數(shù)據(jù)庫(kù)的調(diào)用換成了刪除托管數(shù)據(jù)庫(kù)的 Azure SQL Server 的調(diào)用。

Eric 稱,運(yùn)行此代碼的條件很少見(jiàn),因此測(cè)試機(jī)制沒(méi)有很好地覆蓋。

我們使用我們的安全部署實(shí)踐 (SDP) 將 Sprint 222 部署到 Ring 0(我們的內(nèi)部 Azure DevOps 組織),其中不存在快照數(shù)據(jù)庫(kù),因此作業(yè)沒(méi)有執(zhí)行。在 Ring 0 部署了幾天之后,我們接下來(lái)部署到 Ring 1,那里是受影響的巴西南部 scale-unit 所在的地方。其中快照數(shù)據(jù)庫(kù)的存在時(shí)間足以觸發(fā)錯(cuò)誤代碼,當(dāng)作業(yè)刪除 Azure SQL Server 時(shí),它還刪除了 scale-unit 中的所有 17 個(gè)生產(chǎn)數(shù)據(jù)庫(kù)。從那時(shí)起,該 scale unit 就無(wú)法處理任何客戶流量。

1f53ffb0-0858-11ee-962d-dac502259ad0.png

Azure DevOps 工程師在數(shù)據(jù)庫(kù)刪除開始后 20 分鐘內(nèi)檢測(cè)到中斷,并開始著手修復(fù)。目前數(shù)據(jù)已經(jīng)全部恢復(fù),但卻花費(fèi)了長(zhǎng)達(dá)十個(gè)小時(shí)。對(duì)此 Mattingly 則解釋了幾個(gè)原因:

首先,客戶無(wú)法自己恢復(fù) Azure SQL Server,因此必須由 Azure SQL 團(tuán)隊(duì)來(lái)恢復(fù) Azure SQL Server。“確定我們需要 Azure SQL 的值班工程師,讓他們參與進(jìn)來(lái)并恢復(fù)服務(wù)器,這個(gè)過(guò)程大約需要一個(gè)小時(shí)。”

其次,數(shù)據(jù)庫(kù)有不同的備份配置,一些被配置為 Zone 冗余備份,另一些則被配置為較新的 Geo-zone 冗余備份。協(xié)調(diào)這種不匹配情況給恢復(fù)過(guò)程增添了不少時(shí)間。

最后,在數(shù)據(jù)庫(kù)開始重新上線后,由于 Web 服務(wù)器出現(xiàn)了一系列復(fù)雜的問(wèn)題,即使是數(shù)據(jù)位于這些數(shù)據(jù)庫(kù)中的客戶,也無(wú)法訪問(wèn)整個(gè) scale-unit。

根據(jù)介紹,這些問(wèn)題源于服務(wù)器預(yù)熱任務(wù),該任務(wù)通過(guò)測(cè)試調(diào)用遍歷可用數(shù)據(jù)庫(kù)列表。在恢復(fù)過(guò)程中的數(shù)據(jù)庫(kù)出現(xiàn)了一個(gè)錯(cuò)誤,導(dǎo)致預(yù)熱測(cè)試 “執(zhí)行指數(shù)級(jí)的 backoff retry,使得正常情況下只需不到 1 秒的預(yù)熱平均耗時(shí)了 90 分鐘?!?/p>

更復(fù)雜的是,這個(gè)恢復(fù)過(guò)程是交錯(cuò)進(jìn)行的,一旦有一兩臺(tái)服務(wù)器開始重新接受客戶的流量,它們就會(huì)過(guò)載并出現(xiàn)故障。最終,恢復(fù)服務(wù)需要工程師阻斷所有流向巴西南部 scale-unit 的流量,直到一切都準(zhǔn)備就緒后再重新加入負(fù)載平衡器和處理流量。

微軟方面表示,已經(jīng)實(shí)施各種修復(fù)和重新配置,以防止問(wèn)題再次發(fā)生。

已經(jīng)修復(fù)了快照刪除作業(yè)中的錯(cuò)誤。

為快照刪除作業(yè)創(chuàng)建了一個(gè)新測(cè)試,它針對(duì)真實(shí)的 Azure 資源充分執(zhí)行快照數(shù)據(jù)庫(kù)刪除方案。

正在為關(guān)鍵資源添加 Azure 資源管理器鎖,以防止意外刪除。

確保所有的 Azure SQL 數(shù)據(jù)庫(kù)備份都配置為 Geo-zone-redundant。

確保所有未來(lái)的快照數(shù)據(jù)庫(kù)都在生產(chǎn)數(shù)據(jù)庫(kù)的不同 Azure SQL Server 實(shí)例上創(chuàng)建。

正在修復(fù) Web 服務(wù)器預(yù)熱任務(wù)中的邏輯,以便即使數(shù)據(jù)庫(kù)處于 offline 狀態(tài)也能成功啟動(dòng)。

正在創(chuàng)建一個(gè)新的 cmdlet 來(lái)恢復(fù)已刪除的數(shù)據(jù)庫(kù),以確?;謴?fù)使用與刪除之前相同的設(shè)置(包括備份冗余)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)庫(kù)
    +關(guān)注

    關(guān)注

    7

    文章

    3994

    瀏覽量

    67952
  • 資源管理
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    8026
  • 微軟Azure
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    4723

原文標(biāo)題:一個(gè)代碼拼寫錯(cuò)誤引發(fā)微軟Azure故障,17 個(gè)生產(chǎn)級(jí)數(shù)據(jù)庫(kù)被刪

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    C語(yǔ)言中除數(shù)為0屬于什么錯(cuò)誤

    0 的錯(cuò)誤,以及援引數(shù)組元素時(shí)下標(biāo)溢出等。 靜態(tài)錯(cuò)誤又可以分為語(yǔ)法錯(cuò)誤和靜態(tài)語(yǔ)義錯(cuò)誤。語(yǔ)法錯(cuò)誤指有關(guān)語(yǔ)言結(jié)構(gòu)上的
    發(fā)表于 12-08 06:38

    mysql數(shù)據(jù)恢復(fù)—mysql數(shù)據(jù)庫(kù)表被truncate的數(shù)據(jù)恢復(fù)案例

    某云ECS網(wǎng)站服務(wù)器,linux操作系統(tǒng),部署了mysql數(shù)據(jù)庫(kù)。工作人員在執(zhí)行數(shù)據(jù)庫(kù)版本更新測(cè)試時(shí),錯(cuò)誤地將本應(yīng)在測(cè)試庫(kù)執(zhí)行的sql腳本在生產(chǎn)
    的頭像 發(fā)表于 09-11 09:28 ?613次閱讀
    mysql<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—mysql<b class='flag-5'>數(shù)據(jù)庫(kù)</b>表被truncate的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫(kù)故障數(shù)據(jù)恢復(fù)案例

    Oracle數(shù)據(jù)庫(kù)故障: 某公司臺(tái)服務(wù)器上部署Oracle數(shù)據(jù)庫(kù)。服務(wù)器意外斷電導(dǎo)致數(shù)據(jù)庫(kù)報(bào)錯(cuò),報(bào)錯(cuò)內(nèi)容為“system01.dbf需要
    的頭像 發(fā)表于 07-24 11:12 ?467次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>故障</b>的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境: 臺(tái)操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫(kù)。 MongoDB數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 07-01 11:13 ?486次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫(kù)</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫(kù)故障: SQL Server數(shù)據(jù)庫(kù)被加密,無(wú)法使用。 數(shù)據(jù)庫(kù)MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?524次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫(kù)</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    oracle數(shù)據(jù)恢復(fù)—oracle數(shù)據(jù)庫(kù)誤執(zhí)行錯(cuò)誤truncate命令如何恢復(fù)數(shù)據(jù)?

    oracle數(shù)據(jù)庫(kù)誤執(zhí)行truncate命令導(dǎo)致數(shù)據(jù)丟失是種常見(jiàn)情況。通常情況下,oracle數(shù)據(jù)庫(kù)誤操作刪除數(shù)據(jù)只需要通過(guò)備份恢復(fù)
    的頭像 發(fā)表于 06-05 16:01 ?631次閱讀
    oracle<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—oracle<b class='flag-5'>數(shù)據(jù)庫(kù)</b>誤執(zhí)行<b class='flag-5'>錯(cuò)誤</b>truncate命令如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    SQLSERVER數(shù)據(jù)庫(kù)是什么

    SQL Server 是由微軟公司開發(fā)的款 關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) ,用于存儲(chǔ)、管理和檢索結(jié)構(gòu)化數(shù)據(jù)。它是企業(yè)級(jí)應(yīng)用中廣泛使用的數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 05-26 09:19 ?1009次閱讀

    SEGGER emFile支持大型數(shù)據(jù)庫(kù)

    SEGGER宣布emFile對(duì)大型數(shù)據(jù)庫(kù)的支持,集成了SQLite,方便與SEGGER的BigFAT和微軟的exFAT起使用。
    的頭像 發(fā)表于 04-23 15:51 ?595次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫(kù)文件拷貝后服務(wù)無(wú)法啟動(dòng)的數(shù)據(jù)恢復(fù)

    MongoDB數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境: 臺(tái)Windows Server操作系統(tǒng)虛擬機(jī)上部署MongoDB數(shù)據(jù)庫(kù)。 MongoDB數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 04-09 11:34 ?682次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫(kù)</b>文件拷貝后服務(wù)無(wú)法啟動(dòng)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server附加數(shù)據(jù)庫(kù)提示“錯(cuò)誤 823”的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫(kù)附加數(shù)據(jù)庫(kù)過(guò)程中比較常見(jiàn)的報(bào)錯(cuò)是“錯(cuò)誤 823”,附加數(shù)據(jù)庫(kù)失敗。 如果數(shù)據(jù)庫(kù)有備份則只需還原備份即可。但是如果
    的頭像 發(fā)表于 02-28 11:38 ?862次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server附加<b class='flag-5'>數(shù)據(jù)庫(kù)</b>提示“<b class='flag-5'>錯(cuò)誤</b> 823”的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)——MySQL數(shù)據(jù)庫(kù)誤刪除表記錄的數(shù)據(jù)恢復(fù)案例

    本地服務(wù)器,安裝的windows server操作系統(tǒng)。 操作系統(tǒng)上部署MySQL單實(shí)例,引擎類型為innodb,表空間類型為獨(dú)立表空間。該MySQL數(shù)據(jù)庫(kù)沒(méi)有備份,未開啟binlog。 人為
    的頭像 發(fā)表于 02-22 09:44 ?1233次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MySQL<b class='flag-5'>數(shù)據(jù)庫(kù)</b>誤刪除表記錄的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Windows無(wú)法啟動(dòng)MongoDB服務(wù)的數(shù)據(jù)恢復(fù)案例

    某單位臺(tái)MongoDB數(shù)據(jù)庫(kù)由于業(yè)務(wù)需求進(jìn)行了數(shù)據(jù)遷移,數(shù)據(jù)庫(kù)遷移后提示:“Windows無(wú)法啟動(dòng)MongoDB服務(wù)(位于 本地計(jì)算機(jī) 上)錯(cuò)誤
    的頭像 發(fā)表于 02-13 12:44 ?658次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Windows無(wú)法啟動(dòng)MongoDB服務(wù)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    MySQL數(shù)據(jù)庫(kù)的安裝

    MySQL是個(gè)開源免費(fèi)的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),由瑞典MySQL AB 公司開發(fā),目前屬于 Oracle 旗下公司。 MySQL 最流行的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),在 WEB 應(yīng)用方面M
    的頭像 發(fā)表于 01-14 11:25 ?892次閱讀
    MySQL<b class='flag-5'>數(shù)據(jù)庫(kù)</b>的安裝

    Devart::dbForge SQL Complete讓生產(chǎn)力上一個(gè)臺(tái)階

    SQL編碼助手,適用于SSMS 和VS 該工具提供上下文感知的代碼補(bǔ)全,使SQL開發(fā)人員和數(shù)據(jù)庫(kù)管理員能夠更快地編寫代碼。 SQL Complet包含許多實(shí)用的功能,這些功能是專門為提高開發(fā)團(tuán)隊(duì)
    的頭像 發(fā)表于 01-14 11:09 ?983次閱讀
    Devart::dbForge SQL Complete讓<b class='flag-5'>生產(chǎn)</b>力上<b class='flag-5'>一個(gè)</b>臺(tái)階

    數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類型?

    數(shù)據(jù)庫(kù)種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫(kù),它融合了云計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫(kù)服務(wù)。云數(shù)據(jù)庫(kù)主要分為兩大類:關(guān)系型
    的頭像 發(fā)表于 01-07 10:22 ?828次閱讀