chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

技術(shù)干貨 | AI浪潮下的光模塊可靠性

廣電計(jì)量 ? 2024-08-13 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI)技術(shù)的快速發(fā)展對(duì)數(shù)據(jù)處理和傳輸提出了前所未有的挑戰(zhàn)。在深度學(xué)習(xí)、自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)等AI應(yīng)用中,訓(xùn)練和學(xué)習(xí)需要巨大的數(shù)據(jù)量傳遞和交互。2023年GPT-4模型所需訓(xùn)練的參數(shù)量有1.8萬(wàn)億,要完成這么大的數(shù)據(jù)量的運(yùn)算,需要上萬(wàn)個(gè)GPU同時(shí)工作。如此龐大的數(shù)據(jù)傳輸對(duì)于傳統(tǒng)銅纜而言是個(gè)巨大的挑戰(zhàn),因此光模塊在數(shù)據(jù)傳輸中發(fā)揮著非常重要的作用。光模塊在AI和數(shù)據(jù)中心中負(fù)責(zé)數(shù)據(jù)的轉(zhuǎn)換,將1bit的電信號(hào)轉(zhuǎn)為光信號(hào),把1bit的光信號(hào)轉(zhuǎn)為電信號(hào)。400G模塊,能轉(zhuǎn)換0.4T bit,800G光模塊,轉(zhuǎn)換0.8T bit,以GPT-4的訓(xùn)練參數(shù)計(jì)算,完成一次計(jì)算所需要調(diào)用的光模塊數(shù)量就可能多達(dá)數(shù)萬(wàn)。而隨著大模型的不斷進(jìn)化和訓(xùn)練參數(shù)的急速增加,對(duì)光模塊的需求量只多不少。

AI場(chǎng)景對(duì)光模塊的故障率要求

因?yàn)橛?xùn)練數(shù)據(jù)量大,所以AI場(chǎng)景架構(gòu)采用GPU運(yùn)算更合適,這與傳統(tǒng)的數(shù)據(jù)中心的服務(wù)器類(lèi)型有所區(qū)別。CPU是串行運(yùn)算,通常有較少的核心(一般在2到32個(gè)核心之間),每個(gè)核心都非常強(qiáng)大,適合執(zhí)行復(fù)雜的單線程任務(wù),適用于傳統(tǒng)數(shù)據(jù)中心的串行結(jié)構(gòu)。GPU是并行運(yùn)算,擁有大量的核心(數(shù)百到數(shù)千個(gè)),每個(gè)核心較簡(jiǎn)單,適合執(zhí)行大量的并行任務(wù),因此更適用數(shù)據(jù)量超大的AI場(chǎng)景。傳統(tǒng)的數(shù)據(jù)中心結(jié)構(gòu),是基于串行方式的,對(duì)時(shí)延的要求雖然很看重,但不像AI場(chǎng)景中對(duì)時(shí)延的苛刻要求。并行任務(wù)的結(jié)果就是成千上萬(wàn)的并行數(shù)據(jù)要傳輸,整個(gè)數(shù)據(jù)的完成是以時(shí)延最大,最慢的那個(gè)bit為準(zhǔn)的。其他再快也不行。

光模塊的故障率比傳統(tǒng)的電學(xué)芯片的要高很多很多,光模塊選擇熱插拔,也是因?yàn)?a target="_blank">光學(xué)器件的故障率很高,用熱插拔方便維修和更換。傳統(tǒng)的數(shù)據(jù)中心,光模塊對(duì)于故障率的要求比傳統(tǒng)通信更寬松,少量的故障并不會(huì)影響到整體的運(yùn)行傳輸,所以遇到光模塊故障后及時(shí)更換就可以了。但對(duì)于基于AI的這種場(chǎng)景就不適用,大數(shù)據(jù)量的并行計(jì)算,而且不是實(shí)時(shí)保存的。如果有任何一個(gè)數(shù)據(jù)傳錯(cuò)了,那么整體要重來(lái),重新計(jì)算一遍。中國(guó)移動(dòng)也曾提到當(dāng)前人工智能中主流萬(wàn)卡集群的GPU網(wǎng)絡(luò)每月最大會(huì)發(fā)生上千次閃斷,其中34%是與網(wǎng)絡(luò)相關(guān)。其中每年大概會(huì)有60次左右的光模塊故障導(dǎo)致的訓(xùn)練中斷,而且故障定位也通常會(huì)需要數(shù)天到數(shù)十天之久。所以光模塊失效率高會(huì)導(dǎo)致大的丟包率和維護(hù)成本,從而給設(shè)備服務(wù)商帶來(lái)巨大的運(yùn)營(yíng)壓力。因此在AI場(chǎng)景中對(duì)光模塊可靠性的要求非??量?。

AI大模型中丟包率導(dǎo)致訓(xùn)練所需時(shí)間增長(zhǎng)

圖1 AI大模型中丟包率導(dǎo)致訓(xùn)練所需時(shí)間增長(zhǎng)

AI場(chǎng)景光模塊的可靠性問(wèn)題

綜上所述,對(duì)于傳統(tǒng)數(shù)據(jù)中心而言,一般會(huì)把可靠性的要求放寬,是因?yàn)橥ǔT趯?shí)際部署中,數(shù)據(jù)中心的樹(shù)形網(wǎng)絡(luò)結(jié)構(gòu)是配置了冗余的,從而這此前提下放寬了對(duì)模塊故障率的要求。冗余越大,有更多的節(jié)點(diǎn)可以實(shí)現(xiàn)業(yè)務(wù)傳輸,光模塊的失效率略大一些是不影響整體通信的。因此傳統(tǒng)數(shù)據(jù)中心的光模塊,有很長(zhǎng)一段時(shí)間,是非氣密封裝,因?yàn)榉菤饷芊庋b,故障率會(huì)高一些,但成本也會(huì)下降很多。

但AI大模型與傳統(tǒng)數(shù)據(jù)中心不同,AI場(chǎng)景所采用的并行計(jì)算,如上一節(jié)所講,對(duì)故障零容忍,對(duì)光模塊的穩(wěn)定性要求極高。因此,非氣密封裝已經(jīng)不能滿足可靠性要求了,各家廠商又開(kāi)始使用氣密封裝降低失效率。光模塊中產(chǎn)生的可靠性問(wèn)題主要是光器件失效引起的,包括激光器、探測(cè)器和其他元器件,其中激光器失效最高。阿里曾經(jīng)做過(guò)統(tǒng)計(jì),在光模塊眾多的元器件中,超過(guò)90%以上的失效是與激光器相關(guān)的。

wKgaoma6uNSAfvtSAABrvbSmEgA777.png

圖2 阿里統(tǒng)計(jì)的光模塊各元件失效占比統(tǒng)計(jì)

光模塊自身已經(jīng)面臨非常高的可靠性風(fēng)險(xiǎn)了,然而光模塊從400G、800G發(fā)展到1.6T,模塊功耗隨著芯片功率、射頻損耗,DSP補(bǔ)償?shù)妊杆僭黾?,功耗增加提高了光模塊實(shí)際的工作溫度,同樣也使得光模塊壽命急速縮短,可靠性急劇下降。光模塊溫度升高,激光器芯片的發(fā)光效率降低,廢熱更大,也會(huì)帶來(lái)可靠性風(fēng)險(xiǎn)。

功耗增加機(jī)柜溫度升高可靠性下降

圖3 功耗增加機(jī)柜溫度升高可靠性下降

現(xiàn)行可供參考的可靠性標(biāo)準(zhǔn)如GR-468,一方面從標(biāo)準(zhǔn)提出到現(xiàn)在已有二十余年時(shí)間,另一方面該標(biāo)準(zhǔn)是作為通信用光電子器件的可靠性標(biāo)準(zhǔn),對(duì)AI場(chǎng)景并不適用。近年來(lái),大模型使用方以及光模塊廠商都對(duì)光器件提出了更嚴(yán)格的可靠性要求。在2023年CIOE上,阿里提出了自身對(duì)于光芯片可靠性的認(rèn)證要求,要求光模塊FIT小于125,即有1000個(gè)光模塊在工作,5年后,只允許5個(gè)出現(xiàn)故障。同時(shí)也對(duì)激活能Ea,和n做了限定,限定激活能 Ea=0.35,n=0。老化公式的n,是加速壓力的指數(shù),可以是電流,溫度,或者濕度,關(guān)鍵取決于芯片設(shè)計(jì)里哪個(gè)因素的影響最大。以電流為例,如果n按照3取值,老化電流是工作電流的1.5倍,得出激光器工作壽命是10年。如果相同條件下n取為0,那么壽命就只有3年了。Ea和n都取最小值,會(huì)得到很小的加速系數(shù),最終會(huì)計(jì)算出很大的FIT值,這樣一來(lái)對(duì)可靠性的要求就更為苛刻了。

wKgZoma6uNSAeTRlAAA_SKky0L0632.png

圖4 可靠性中加速系數(shù)計(jì)算公式

如何提升光模塊可靠性

光模塊的可靠性重點(diǎn)關(guān)注的就是激光器。激光器從發(fā)光原理、制造工藝來(lái)看,降低優(yōu)化的程度有限,并不能完全達(dá)到電芯片的尺度,近期內(nèi)也不會(huì)有顛覆性的技術(shù)改良大幅提高可靠性。對(duì)于光模塊的可靠性控制重點(diǎn)還是在實(shí)際使用時(shí)的早期失效和隨機(jī)失效,早期失效可以通過(guò)選用一定參數(shù)的加速老化進(jìn)行剔除,老化的條件,時(shí)間都需要通過(guò)科學(xué)的計(jì)算,避免老化時(shí)間過(guò)短剔除不到位或者時(shí)間過(guò)長(zhǎng)降低產(chǎn)品壽命。對(duì)于隨機(jī)失效,目前有些方案如finisar等公司采用的備份激光器,通過(guò)增加多組激光器作為備用降低失效率,一個(gè)壞了立刻切到另一個(gè)好的激光器去工作,但是增加一組備份,成本、空間、功耗,又增加了很多難度。海思設(shè)計(jì)過(guò)一種智能光模塊,通過(guò)實(shí)時(shí)監(jiān)控光模塊多種參數(shù)狀態(tài),采用大數(shù)據(jù)訓(xùn)練主動(dòng)對(duì)光模塊做預(yù)警,提前判斷光模塊即將失效,這要求廠家對(duì)自身產(chǎn)品數(shù)據(jù)要有十分全面的掌握。

廣電計(jì)量光電器件可靠性分析

光模塊市場(chǎng)近兩年隨著AI浪潮的出現(xiàn)展現(xiàn)出了廣闊的想象空間,但也給光模塊的可靠性帶來(lái)了更高的挑戰(zhàn)。過(guò)去廠家不重視模塊的可靠性,缺乏對(duì)產(chǎn)品的失效評(píng)估,而現(xiàn)在解決產(chǎn)品可靠性問(wèn)題,將會(huì)是占領(lǐng)用戶市場(chǎng),打通產(chǎn)品從送樣到批量供貨的關(guān)鍵。

廣電計(jì)量是國(guó)內(nèi)第一家完成激光發(fā)射器、探測(cè)器全套AEC-Q102車(chē)規(guī)認(rèn)證的國(guó)有第三方上市檢測(cè)機(jī)構(gòu),具備VCSEL、LED、APD、SPAD等激光器和探測(cè)器批次性驗(yàn)證試驗(yàn)?zāi)芰?,具有豐富的光電器件可靠性驗(yàn)證經(jīng)驗(yàn)。在人才隊(duì)伍上,形成以博士、專(zhuān)家為核心的光電器件測(cè)試分析團(tuán)隊(duì),可以協(xié)助客戶定制可靠性評(píng)估方案,建立準(zhǔn)確的產(chǎn)品失效模型,滿足客戶在可靠性、失效分析領(lǐng)域的認(rèn)證檢測(cè)需求。

廣電計(jì)量半導(dǎo)體服務(wù)優(yōu)勢(shì)

  • 工業(yè)和信息化部“面向集成電路、芯片產(chǎn)業(yè)的公共服務(wù)平臺(tái)”
  • 工業(yè)和信息化部“面向制造業(yè)的傳感器等關(guān)鍵元器件創(chuàng)新成果產(chǎn)業(yè)化公共服務(wù)平臺(tái)”
  • 國(guó)家發(fā)展和改革委員會(huì)“導(dǎo)航產(chǎn)品板級(jí)組件質(zhì)量檢測(cè)公共服務(wù)平臺(tái)”
  • 廣東省工業(yè)和信息化廳“汽車(chē)芯片檢測(cè)公共服務(wù)平臺(tái)”
  • 江蘇省發(fā)展和改革委員會(huì)“第三代半導(dǎo)體器件性能測(cè)試與材料分析工程研究中心”
  • 上海市科學(xué)技術(shù)委員會(huì)“大規(guī)模集成電路分析測(cè)試平臺(tái)”

在集成電路及SiC領(lǐng)域是技術(shù)能力最全面、知名度最高的第三方檢測(cè)機(jī)構(gòu)之一,已完成MCU、AI芯片、安全芯片等上百個(gè)型號(hào)的芯片驗(yàn)證,并支持完成多款型號(hào)芯片的工程化和量產(chǎn)。

在車(chē)規(guī)領(lǐng)域擁有AEC-Q及AQG324全套服務(wù)能力,獲得了近50家車(chē)廠的認(rèn)可,出具近400份AEC-Q及AQG324報(bào)告,助力100多款車(chē)規(guī)元器件量產(chǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37016

    瀏覽量

    290050
  • SiC
    SiC
    +關(guān)注

    關(guān)注

    32

    文章

    3390

    瀏覽量

    67214
  • 光模塊
    +關(guān)注

    關(guān)注

    81

    文章

    1545

    瀏覽量

    61374
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI 芯片浪潮,職場(chǎng)晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評(píng)審中的競(jìng)爭(zhēng)力。例如,在芯片設(shè)計(jì)中引入新的計(jì)算范式,如存算一體技術(shù),有效解決傳統(tǒng)馮?諾
    發(fā)表于 08-19 08:58

    睿海光電800G模塊助力全球AI基建升級(jí)

    在全球數(shù)字化轉(zhuǎn)型加速的背景,超高速模塊作為數(shù)據(jù)中心與AI算力網(wǎng)絡(luò)的核心部件,正經(jīng)歷從400G向800G、1.6T的迭代浪潮。在這一賽道中
    發(fā)表于 08-13 19:05

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G模塊升級(jí)

    租戶環(huán)境提供推理服務(wù),需實(shí)現(xiàn)性能隔離與穩(wěn)定擴(kuò)展。面對(duì)這一技術(shù)浪潮,深圳市睿海光電科技有限公司(簡(jiǎn)稱“睿海光電”)憑借其創(chuàng)新的800G模塊解決方案,以交付速度比同行快2-3天的硬核實(shí)力
    發(fā)表于 08-13 19:01

    影響電源模塊可靠性和性能的挑戰(zhàn)

    在早前Flex Power Modules的一篇博客文章中,我們探討了電源模塊平均故障間隔時(shí)間(MTBF)計(jì)算值的可靠性。我們當(dāng)時(shí)的結(jié)論是,只有在完全相同、靜態(tài)的條件比較產(chǎn)品時(shí),數(shù)據(jù)表上的數(shù)值才有
    的頭像 發(fā)表于 07-07 15:33 ?609次閱讀
    影響電源<b class='flag-5'>模塊</b><b class='flag-5'>可靠性</b>和性能的挑戰(zhàn)

    元器件可靠性領(lǐng)域中的 FIB 技術(shù)

    元器件可靠性領(lǐng)域中的FIB技術(shù)在當(dāng)今的科技時(shí)代,元器件的可靠性至關(guān)重要。當(dāng)前,國(guó)內(nèi)外元器件級(jí)可靠性質(zhì)量保證技術(shù)涵蓋了眾多方面,包括元器件補(bǔ)充
    的頭像 發(fā)表于 06-30 14:51 ?401次閱讀
    元器件<b class='flag-5'>可靠性</b>領(lǐng)域中的 FIB <b class='flag-5'>技術(shù)</b>

    可靠性測(cè)試包括哪些測(cè)試和設(shè)備?

    在當(dāng)今競(jìng)爭(zhēng)激烈的市場(chǎng)環(huán)境中,產(chǎn)品質(zhì)量的可靠性成為了企業(yè)立足的根本。無(wú)論是電子產(chǎn)品、汽車(chē)零部件,還是智能家居設(shè)備,都需要經(jīng)過(guò)嚴(yán)格的可靠性測(cè)試,以確保在各種復(fù)雜環(huán)境都能穩(wěn)定運(yùn)行,為用戶提供可靠
    的頭像 發(fā)表于 06-03 10:52 ?900次閱讀
    <b class='flag-5'>可靠性</b>測(cè)試包括哪些測(cè)試和設(shè)備?

    提供半導(dǎo)體工藝可靠性測(cè)試-WLR晶圓可靠性測(cè)試

    隨著半導(dǎo)體工藝復(fù)雜度提升,可靠性要求與測(cè)試成本及時(shí)間之間的矛盾日益凸顯。晶圓級(jí)可靠性(Wafer Level Reliability, WLR)技術(shù)通過(guò)直接在未封裝晶圓上施加加速應(yīng)力,實(shí)現(xiàn)快速
    發(fā)表于 05-07 20:34

    電機(jī)微機(jī)控制系統(tǒng)可靠性分析

    針對(duì)性地研究提高電機(jī)微機(jī)控制系統(tǒng)可靠性的途徑及技術(shù)措施:硬件上,方法包括合理選擇篩選元器件、選擇合適的電源、采用保護(hù)電路以及制作可靠的印制電路板等;軟件上,則采用了固化程序和保護(hù) RAM 區(qū)重要數(shù)據(jù)等
    發(fā)表于 04-29 16:14

    頡晶圓電阻:高可靠性和耐久助力電子設(shè)備穩(wěn)定運(yùn)行

    頡科技(Viking)作為行業(yè)領(lǐng)先的電子元器件制造商,憑借其先進(jìn)的制造技術(shù)和嚴(yán)格的質(zhì)量控制標(biāo)準(zhǔn),推出了高性能的晶圓電阻。這些電阻不僅在精度和穩(wěn)定性上表現(xiàn)出色,還在可靠性和耐久方面展
    的頭像 發(fā)表于 04-10 17:52 ?491次閱讀
    <b class='flag-5'>光</b>頡晶圓電阻:高<b class='flag-5'>可靠性</b>和耐久<b class='flag-5'>性</b>助力電子設(shè)備穩(wěn)定運(yùn)行

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問(wèn)題與解答,帶你快速掌握如何在nRF
    發(fā)表于 04-01 00:00

    從IGBT模塊大規(guī)模失效爆雷看國(guó)產(chǎn)SiC模塊可靠性實(shí)驗(yàn)的重要

    深度分析:從IGBT模塊可靠性問(wèn)題看國(guó)產(chǎn)SiC模塊可靠性實(shí)驗(yàn)的重要 某廠商IGBT模塊曾因
    的頭像 發(fā)表于 03-31 07:04 ?835次閱讀

    DeepSeek推動(dòng)AI算力需求:800G模塊的關(guān)鍵作用

    和性能方面展現(xiàn)了出色的優(yōu)勢(shì),滿足當(dāng)前AI算力需求的快速增長(zhǎng)。 高可靠性模塊經(jīng)過(guò)溫度、靜電放電及機(jī)械耐久等嚴(yán)格測(cè)試,確保在數(shù)據(jù)中
    發(fā)表于 03-25 12:00

    半導(dǎo)體集成電路的可靠性評(píng)價(jià)

    半導(dǎo)體集成電路的可靠性評(píng)價(jià)是一個(gè)綜合的過(guò)程,涉及多個(gè)關(guān)鍵技術(shù)和層面,本文分述如下:可靠性評(píng)價(jià)技術(shù)概述、
    的頭像 發(fā)表于 03-04 09:17 ?926次閱讀
    半導(dǎo)體集成電路的<b class='flag-5'>可靠性</b>評(píng)價(jià)

    如何測(cè)試耦的性能與可靠性

    耦作為電氣隔離的關(guān)鍵組件,其性能和可靠性直接影響到整個(gè)系統(tǒng)的穩(wěn)定性和安全。因此,對(duì)光耦進(jìn)行嚴(yán)格的性能測(cè)試和可靠性評(píng)估是必不可少的。
    的頭像 發(fā)表于 01-14 16:13 ?2093次閱讀

    不同制造商TOPCon伏組件的老化測(cè)試:性能、穩(wěn)定性與可靠性

    隨著TOPCon技術(shù)市場(chǎng)份額的快速增長(zhǎng),對(duì)其可靠性評(píng)估需求迫切。盡管早期報(bào)告認(rèn)為T(mén)OPCon比PERC更可靠,但該技術(shù)伏組件
    的頭像 發(fā)表于 12-05 01:06 ?1981次閱讀
    不同制造商TOPCon<b class='flag-5'>光</b>伏組件的老化測(cè)試:性能、穩(wěn)定性與<b class='flag-5'>可靠性</b>