chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SSD的可靠性可靠性量化指標(biāo)MTBF

SSDFans ? 來源:Memblaze ? 作者:Memblaze ? 2021-10-11 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

企業(yè)環(huán)境復(fù)雜多變,快速增長的業(yè)務(wù)需求使得企業(yè)在數(shù)據(jù)存儲規(guī)模、存儲性能和可靠性等多方面提出了越來越高的要求。SSD固態(tài)硬盤憑借極高的讀寫性能、極低延遲成為越來越多企業(yè)的首選解決方案,并在數(shù)據(jù)庫、虛擬化、應(yīng)用加速、大數(shù)據(jù)、云計(jì)算乃至人工智能等領(lǐng)域發(fā)揮重要作用。企業(yè)級SSD往往需要在高并發(fā)、大壓力、24小時全天候運(yùn)行的嚴(yán)苛環(huán)境下運(yùn)行,其可靠性是企業(yè)級用戶的重點(diǎn)關(guān)注之一。

可靠性指的是一個部件或系統(tǒng)在規(guī)定的操作條件下,在特定的時間內(nèi)繼續(xù)執(zhí)行其預(yù)定功能的能力。對企業(yè)級SSD而言,它是非常重要的一項(xiàng)指標(biāo),不僅直接決定產(chǎn)品出貨的良率、故障率等核心指標(biāo),而且對數(shù)據(jù)可用性、一致性的保護(hù),也起著關(guān)鍵作用。

01

可靠性量化指標(biāo) —— MTBF

SSD的“可靠性”通常以MTBF量化衡量。MTBF全稱Mean Time between Failures,平均故障間隔時間,即產(chǎn)品在總的使用階段累計(jì)工作時間與故障次數(shù)的比值。它反映了產(chǎn)品的時間質(zhì)量,產(chǎn)品故障越少,MTBF越高,產(chǎn)品可靠性也就越高。

與消費(fèi)級SSD產(chǎn)品相比,企業(yè)級SSD在可靠性方面面臨更高挑戰(zhàn)。根據(jù)OCP(Open Compute Project)給出的建議,部署于數(shù)據(jù)中心的企業(yè)級SSD MTBF平均故障間隔時間要在2,000,000小時,也是目前企業(yè)級SSD奉行的標(biāo)準(zhǔn)。但是,MTBF是需要實(shí)際跑測驗(yàn)證的,不能憑空而來。按照傳統(tǒng)方法,要完成多次200萬小時的驗(yàn)證顯然不可能。那么,這長達(dá)200萬小時的平均故障間隔時間,又是如何得到的呢?

答案是基于一定樣本量,在一定時間段內(nèi)通過加速因子加速(如寫入量加速、運(yùn)行環(huán)境溫度加速)進(jìn)行統(tǒng)計(jì)推斷。過程模擬典型用戶場景,通過實(shí)測驗(yàn)證理論值,提前驗(yàn)收產(chǎn)品質(zhì)量。嚴(yán)謹(jǐn)?shù)呐軠y驗(yàn)證將直接決定MTBF“可靠性指標(biāo)”是否真的可靠。

02

MTBF 的表征時期

和大部分電子產(chǎn)品一樣,SSD同樣符合浴盆曲線(失效率曲線)特性,它分為三個關(guān)鍵時期:

早期失效期(Infant Mortality)

產(chǎn)品在剛生產(chǎn)好并加電使用時,因良率等因素會導(dǎo)致其失效率較高。為保證交付到客戶手上的SSD符合企業(yè)級可靠性標(biāo)準(zhǔn),企業(yè)級SSD廠商會對所有生產(chǎn)線上的產(chǎn)品進(jìn)行一定時長的老化跑測,以最大程度暴露產(chǎn)品可能的早期失效,保證客戶拿到的產(chǎn)品不存在早期失效問題。

偶然失效期(Random Failures or Normal Life)

這一階段對應(yīng)正式出貨產(chǎn)品,產(chǎn)品失效率較低,且較穩(wěn)定。產(chǎn)品可靠性指標(biāo)MTBF所描述的就是這個時期,即產(chǎn)品的穩(wěn)定使用階段。

磨損期(Wearout Phase)

該階段因產(chǎn)品磨損、老化等因素,其失效率會隨時間的延長而呈指數(shù)級增加。此時SSD宣稱壽命已經(jīng)結(jié)束,雖可繼續(xù)使用,但壞塊會隨著PE的增加而加速上升,SSD的有效預(yù)留空間(OP)逐漸消耗殆盡,設(shè)備失效率提高。對企業(yè)級SSD而言,進(jìn)入磨損期的產(chǎn)品已不建議繼續(xù)使用。

03

MTBF = MTTF?

在MTBF之外,你可能還聽過另外一個可靠性描述的詞——MTTF。對于一個可維護(hù)的設(shè)備來說,MTBF = MTTF + MTTR,三者關(guān)系如下:

MTTF (Mean Time To Failure,平均失效時間):指系統(tǒng)兩次失效的平均時間,取所有從系統(tǒng)開始正常運(yùn)行到發(fā)生故障之間的時間段的平均值。MTTF =∑T1/ N;

MTTR (Mean Time To Repair,平均修復(fù)時間):指系統(tǒng)從發(fā)生故障到維修結(jié)束之間時間段的平均值。MTTR =∑(T2+T3)/ N;

MTBF (Mean Time Between Failure,平均無故障時間):指系統(tǒng)兩次故障發(fā)生之間(包括故障維修)時間段的平均值。MTBF =∑(T2+T3+T1)/ N。

因?yàn)镸TTR通常遠(yuǎn)遠(yuǎn)小于MTTF,所以MTBF近似等于MTTF。

04

MTTF理論計(jì)算公式,2,000,000小時如何而來?

最簡單的情況下,MTTF計(jì)算遵循如下公式:

其中:

Ai 為 SSD i 的加速因子;

ti 為 SSD i 的測試時間;

nf 為出現(xiàn)故障 SSD 的數(shù)量;

a 為置信度(confidence limit,60%);

x2 為卡方分布(chi-squared distribution)。

上述等式中的加速因子通常分為3類:

未加速因子:A=1,通常用于固件故障;

TBW(Total Bytes Written)加速因子 :通過增加數(shù)據(jù)寫入強(qiáng)度進(jìn)行壽命加速;

溫度加速因子 :通過升高測試環(huán)境溫度進(jìn)行故障出現(xiàn)加速。

TBW (Total Bytes Written) 加速因子

TBW是SSD壽命單位,以壽命為1.5 DWPD,用戶容量3.84TB PBlaze6 SSD為例,其5年總的數(shù)據(jù)寫入量(也就是現(xiàn)場部署寫入量field)為10.5 PB,對應(yīng)每天數(shù)據(jù)寫入量為5.76 TB。如果增加每天的數(shù)據(jù)寫入量(加速寫入量stress),相當(dāng)于加快消耗SSD壽命,可以加速故障出現(xiàn)。TBW加速因子計(jì)算方法如下:

假設(shè)一個用戶容量為100G的SSD,其產(chǎn)品規(guī)格書定義SSD壽命為175TBW,典型使用場景下可使用5年(43800個小時)。其在1008小時內(nèi)寫入130TB的數(shù)據(jù),寫放大為1.2,則TBW加速因子為32,如果短時間內(nèi)寫入更多數(shù)據(jù),則TBW加速因子也會相應(yīng)提升。

溫度加速因子

NAND因其固有特性,數(shù)據(jù)保持力會隨著溫度的升高而降低。阿倫尼烏斯公式(Arrhenius Equation)指出,在室溫 40℃ 下SSD放置 1 年(8670個小時),相當(dāng)于在 85℃ 的老化室中放置 52 個小時。

JESD 22-A108定義了溫度隨時間對SSD的影響,執(zhí)行高溫運(yùn)行壽命(HTOL,High Temperature Operating Life)測試,可確定長時間高溫條件下SSD運(yùn)行的可靠性。協(xié)議規(guī)定,如果沒有特殊要求,SSD需在 125 °C 的結(jié)溫壓力下測試。但企業(yè)級SSD一般會設(shè)計(jì)高溫保護(hù)邏輯,防止溫度過高造成NAND數(shù)據(jù)保持力下降和元器件的損壞,所以SSD的實(shí)際工作溫度不會達(dá)到125℃。

對于溫度加速因子,計(jì)算方法如下:

其中:

Ea 為失效模型的活化能 ,一般為0.7 eV;

k 為玻爾茲曼常數(shù),8.617 x 10-5 eV/°K;

T? 為工作溫度 (標(biāo)準(zhǔn)取值為 55°C 或者 328°K);

T? 為測試加速溫度。

MTTF計(jì)算示例

假設(shè)樣本量為 400,測試時間為 1008 小時,加速因子Ai = A(TBW) * A(T) 為10,失敗的數(shù)量為0,置信度為60%,則 MTTF = MTBF = 4,400,000小時。

d48aa190-29cf-11ec-82a8-dac502259ad0.png

注意,MTBF是和溫度嚴(yán)格相關(guān)的。這一點(diǎn)在OCP Datacenter NVMe SSD Specification中也有提到:

MTBF 2,500,000小時(AFR≤0.35%),對應(yīng)的SSD運(yùn)行溫度為0℃~50℃;

MTBF 2,000,000小時(AFR≤0.44%),對應(yīng)的SSD運(yùn)行溫度為0℃~55℃。

但理論和現(xiàn)實(shí)總是有差距的?,F(xiàn)實(shí)中產(chǎn)品意義上的MTBF測試,很難達(dá)到10倍的加速因子,TBW加速因子僅能用于測試NAND顆粒的壽命,實(shí)際測試中還需要考慮電路和物理接口等硬件部分的可靠性。而這部分,只能靠溫度來加速。實(shí)際操作中,MTBF=200萬小時的測試,需要至少用2000片樣品在加速因子作用下,跑滿1000小時以上。

05

MTBF 和 AFR 又是什么關(guān)系?

除了MTBF指標(biāo),還有其他可靠性量化表征指標(biāo),如故障率λ(Failure Rate)和年化故障率AFR(Annualized Failure Rate),其中AFR和MTBF又可以相互轉(zhuǎn)化。

故障率λ:SSD關(guān)鍵元器件選型時,需要確保每個元器件的故障率 λ 達(dá)標(biāo)。相比故障率指標(biāo),MTBF的定義更加直接,也更適用于表現(xiàn)系統(tǒng)級的可靠性;

AFR:年化故障率,可以更好地了解在任何一年中發(fā)生硬盤故障的幾率。

MTBF 和 AFR轉(zhuǎn)化公式如下:

MTBFhours = 1/λhours

MTBFyears = 1/(λhours*24*365)

AFR = 365*24hours*λhours = 8760hours/MTBFhours

MTBF 和 AFR 的數(shù)值對應(yīng)關(guān)系如下:

d4f7e25a-29cf-11ec-82a8-dac502259ad0.png

企業(yè)級SSD產(chǎn)品可靠性MTBF ≥ 2,000,000小時(@55℃),換算為年化失效率AFR ≤ 0.44%,對應(yīng)FFR(Functional Failure Requirement,SSD在整個磨損壽命時間范圍內(nèi)累積的功能失效率,以5年保修期為參考)≤2.2%。

Memblaze全系列企業(yè)級SSD均按照2,000,000小時MTBF @55℃ /2,500,000小時MTBF@50℃為標(biāo)準(zhǔn),滿足55℃/50℃環(huán)境下7×24小時穩(wěn)定不間斷運(yùn)行要求、40℃環(huán)境下數(shù)據(jù)至少3個月斷電保持能力以及低于1E-17的UBER不可修復(fù)錯誤率。

06

MTBF的驗(yàn)證

Memblaze自研測試平臺Whale系統(tǒng)

在數(shù)據(jù)可靠性技術(shù)領(lǐng)域,Memblaze自研了MemSolid 技術(shù)集,以保證企業(yè)級數(shù)據(jù)的一致性和可靠性。通過全路徑數(shù)據(jù)保護(hù)、LDPC軟判決解碼糾錯技術(shù)、元數(shù)據(jù)跨Channel備份保護(hù)、Die間動態(tài)RAID5恢復(fù)壞塊數(shù)據(jù)機(jī)制,以及重讀保護(hù)和過溫保護(hù)等技術(shù),實(shí)現(xiàn)了PBlaze可持續(xù)的數(shù)據(jù)一致性保護(hù),保障企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)資產(chǎn)始終處于安全可靠的存儲環(huán)境中。

為確保出廠的SSD產(chǎn)品能夠滿足MTBF的標(biāo)準(zhǔn),Memblaze運(yùn)用十余年在固態(tài)硬盤領(lǐng)域的經(jīng)驗(yàn)積累,以及對用戶實(shí)際應(yīng)用的理解,自主研發(fā)出MTBF測試平臺 —— Whale系統(tǒng)。

它參照J(rèn)EDEC標(biāo)準(zhǔn)打造,適用于PCIe SSD的研發(fā)(DVT)、環(huán)境應(yīng)力(EST,Environmental Stress Test)、數(shù)據(jù)保持力、生產(chǎn)(老化,ORT,Ongoing Reliability Testing)、RDT等測試。Whale系統(tǒng)預(yù)置了最接近客戶真實(shí)使用場景的測試案例,采用合理的加速因子對RDT階段產(chǎn)品進(jìn)行長時間跑測,成為產(chǎn)品量產(chǎn)前的質(zhì)量保障。

根據(jù)Memblaze的出貨量和實(shí)際故障率統(tǒng)計(jì),PBlaze系列SSD的實(shí)際累計(jì)產(chǎn)品失效率(CFR,Cumulative Failure Rate)遠(yuǎn)低于標(biāo)稱的年化故障率。

經(jīng)過十幾年在SSD行業(yè)的深耕打磨,Memblaze 已經(jīng)形成從芯片、軟件、硬件、生產(chǎn)、出貨等各個環(huán)節(jié)的嚴(yán)密設(shè)計(jì)和嚴(yán)格的質(zhì)量管控體系,能夠保證PBlaze系列企業(yè)級固態(tài)硬盤為客戶提供卓越的可靠性,也極大降低了客戶系統(tǒng)運(yùn)行開銷(OPEX)和總體擁有成本(TCO),而Memblaze也將繼續(xù)以匠心精神,不斷打磨,不負(fù)所期!

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    39

    文章

    7724

    瀏覽量

    171270
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3080

    瀏覽量

    122073

原文標(biāo)題:揭秘:SSD的“可靠性”到底可不可靠

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯片可靠性(RE)性能測試與失效機(jī)理分析

    2025年9月,國家市場監(jiān)督管理總局發(fā)布了六項(xiàng)半導(dǎo)體可靠性測試國家標(biāo)準(zhǔn),為中國芯片產(chǎn)業(yè)的質(zhì)量基石奠定了技術(shù)規(guī)范。在全球芯片競爭進(jìn)入白熱化的今天,可靠性已成為衡量半導(dǎo)體產(chǎn)品核心價值的關(guān)鍵指標(biāo)。01芯片
    的頭像 發(fā)表于 01-09 10:02 ?295次閱讀
    芯片<b class='flag-5'>可靠性</b>(RE)性能測試與失效機(jī)理分析

    如何測試單片機(jī)MCU系統(tǒng)的可靠性

    用什么方法來測試單片機(jī)系統(tǒng)的可靠性,當(dāng)一個單片機(jī)系統(tǒng)設(shè)計(jì)完成,對于不同的單片機(jī)系統(tǒng)產(chǎn)品會有不同的測試項(xiàng)目和方法,但是有一些是必須測試的。 下面分享我的一些經(jīng)驗(yàn): 1、測試單片機(jī)軟件功能的完善
    發(fā)表于 01-08 07:50

    可靠性設(shè)計(jì)的十個重點(diǎn)

    保障。規(guī)定定性定量的可靠性要求規(guī)定定性定量的可靠性要求。有了可靠性指標(biāo),開展可靠性設(shè)計(jì)才有目標(biāo),才能對開發(fā)的產(chǎn)品
    的頭像 發(fā)表于 08-01 22:55 ?943次閱讀
    <b class='flag-5'>可靠性</b>設(shè)計(jì)的十個重點(diǎn)

    影響電源模塊可靠性和性能的挑戰(zhàn)

    在早前Flex Power Modules的一篇博客文章中,我們探討了電源模塊平均故障間隔時間(MTBF)計(jì)算值的可靠性。我們當(dāng)時的結(jié)論是,只有在完全相同、靜態(tài)的條件下比較產(chǎn)品時,數(shù)據(jù)表上的數(shù)值才有
    的頭像 發(fā)表于 07-07 15:33 ?904次閱讀
    影響電源模塊<b class='flag-5'>可靠性</b>和性能的挑戰(zhàn)

    關(guān)于LED燈具的9種可靠性測試方案

    LED燈具的可靠性試驗(yàn),與傳統(tǒng)燈具有顯著區(qū)別。作為新一代光源,LED燈具正在逐漸取代傳統(tǒng)節(jié)能燈的市場,因此無法簡單地沿用傳統(tǒng)燈具的測試方法。那么,LED燈具需要進(jìn)行哪些可靠性試驗(yàn)?zāi)兀繕?biāo)準(zhǔn)名稱:LED
    的頭像 發(fā)表于 06-18 14:48 ?908次閱讀
    關(guān)于LED燈具的9種<b class='flag-5'>可靠性</b>測試方案

    可靠性測試包括哪些測試和設(shè)備?

    在當(dāng)今競爭激烈的市場環(huán)境中,產(chǎn)品質(zhì)量的可靠性成為了企業(yè)立足的根本。無論是電子產(chǎn)品、汽車零部件,還是智能家居設(shè)備,都需要經(jīng)過嚴(yán)格的可靠性測試,以確保在各種復(fù)雜環(huán)境下都能穩(wěn)定運(yùn)行,為用戶提供可靠的使用體驗(yàn)。那么,
    的頭像 發(fā)表于 06-03 10:52 ?1352次閱讀
    <b class='flag-5'>可靠性</b>測試包括哪些測試和設(shè)備?

    提供半導(dǎo)體工藝可靠性測試-WLR晶圓可靠性測試

    隨著半導(dǎo)體工藝復(fù)雜度提升,可靠性要求與測試成本及時間之間的矛盾日益凸顯。晶圓級可靠性(Wafer Level Reliability, WLR)技術(shù)通過直接在未封裝晶圓上施加加速應(yīng)力,實(shí)現(xiàn)快速
    發(fā)表于 05-07 20:34

    電機(jī)微機(jī)控制系統(tǒng)可靠性分析

    可靠性是電機(jī)微機(jī)控制系統(tǒng)的重要指標(biāo),延長電機(jī)平均故障間隔時間(MTBF),縮短平均修復(fù)時間(MTTR)是可靠性研究的目標(biāo)。電機(jī)微機(jī)控制系統(tǒng)的故障分為硬件故障和軟件故障,分析故障的性質(zhì)和
    發(fā)表于 04-29 16:14

    IGBT的應(yīng)用可靠性與失效分析

    包括器件固有可靠性和使用可靠性。固有可靠性問題包括安全工作區(qū)、閂鎖效應(yīng)、雪崩耐量、短路能力及功耗等,使用可靠性問題包括并聯(lián)均流、軟關(guān)斷、電磁干擾及散熱等。
    的頭像 發(fā)表于 04-25 09:38 ?2732次閱讀
    IGBT的應(yīng)用<b class='flag-5'>可靠性</b>與失效分析

    產(chǎn)品可靠性的關(guān)鍵指標(biāo)

    平均故障間隔時間 (MTBF) 是您在產(chǎn)品數(shù)據(jù)表中看到的常見指標(biāo),通常作為可靠性和耐用的標(biāo)志。但是,盡管 MTBF 被廣泛使用,也是工程學(xué)
    的頭像 發(fā)表于 03-13 14:19 ?1155次閱讀
    產(chǎn)品<b class='flag-5'>可靠性</b>的關(guān)鍵<b class='flag-5'>指標(biāo)</b>

    半導(dǎo)體集成電路的可靠性評價

    半導(dǎo)體集成電路的可靠性評價是一個綜合的過程,涉及多個關(guān)鍵技術(shù)和層面,本文分述如下:可靠性評價技術(shù)概述、可靠性評價的技術(shù)特點(diǎn)、可靠性評價的測
    的頭像 發(fā)表于 03-04 09:17 ?1563次閱讀
    半導(dǎo)體集成電路的<b class='flag-5'>可靠性</b>評價

    深度解析SSD2351核心板:硬核視頻處理+工業(yè)級可靠性設(shè)計(jì)

    明遠(yuǎn)智睿SSD2351核心板基于SigmaStar SSD2351芯片打造,專為高可靠性工業(yè)場景設(shè)計(jì),其硬件配置與接口能力充分滿足復(fù)雜環(huán)境下的多模態(tài)數(shù)據(jù)處理需求。 芯片技術(shù)細(xì)節(jié) : 視頻處理能力
    發(fā)表于 02-21 17:19

    芯片封裝可靠性測試詳解

    可靠性,作為衡量芯片封裝組件在特定使用環(huán)境下及一定時間內(nèi)損壞概率的指標(biāo),直接反映了組件的質(zhì)量狀況。
    的頭像 發(fā)表于 02-21 16:21 ?3503次閱讀
    芯片封裝<b class='flag-5'>可靠性</b>測試詳解

    一文讀懂芯片可靠性試驗(yàn)項(xiàng)目

    可靠性試驗(yàn)的定義與重要可靠性試驗(yàn)是一種系統(tǒng)化的測試流程,通過模擬芯片在實(shí)際應(yīng)用中可能遇到的各種環(huán)境條件和工作狀態(tài),對芯片的性能、穩(wěn)定性和壽命進(jìn)行全面評估。在芯片研發(fā)和生產(chǎn)過程中,可靠性
    的頭像 發(fā)表于 02-21 14:50 ?2174次閱讀
    一文讀懂芯片<b class='flag-5'>可靠性</b>試驗(yàn)項(xiàng)目

    霍爾元件的可靠性測試步驟

    霍爾元件是一種利用霍爾效應(yīng)來測量磁場的傳感器,廣泛應(yīng)用于電機(jī)控制、位置檢測、速度測量以及電流監(jiān)測、變頻控制測試、交直流電源、電源逆變器和電子開關(guān)等領(lǐng)域。為了確?;魻栐男阅芎?b class='flag-5'>可靠性,進(jìn)行全面
    的頭像 發(fā)表于 02-11 15:41 ?1437次閱讀