chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

稀疏化應(yīng)對(duì)算力瓶頸,助力云服務(wù)商大幅降低成本

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-09-02 08:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI、5G等新興產(chǎn)業(yè)的蓬勃發(fā)展催生了海量數(shù)據(jù)計(jì)算需求,同時(shí)AI算法模型持續(xù)迭代,復(fù)雜化日益凸顯,數(shù)字經(jīng)濟(jì)時(shí)代下市場(chǎng)需要強(qiáng)大、普惠的算力引擎。而從供給端來(lái)看,先進(jìn)制程的迭代周期變長(zhǎng),使得芯片能效比的提升并不顯著。

針對(duì)AI應(yīng)用特點(diǎn)實(shí)現(xiàn)硬件架構(gòu)創(chuàng)新是必然趨勢(shì),墨芯人工智能CEO王維在某論壇上談到,依托對(duì)AI的理解用軟硬一體解決算力瓶頸問(wèn)題是行業(yè)公認(rèn)的發(fā)展方向。他認(rèn)為,稀疏化能夠有效應(yīng)對(duì)算力瓶頸,實(shí)現(xiàn)原理是,不存儲(chǔ)和不處理零值,從而得到更小且更快的模型。

軟硬一體化稀疏路徑符合AI計(jì)算核心訴求

軟硬一體化稀疏路徑符合AI計(jì)算高吞吐、低功耗、低延時(shí)的核心需求。AI稀疏產(chǎn)業(yè)化的成功要素包括:1、跨算法、軟件、硬件領(lǐng)域的協(xié)同開(kāi)發(fā);2、擁有持續(xù)多層次優(yōu)化稀疏運(yùn)算的底層算法能力;3、架構(gòu)需保證可編程性、高度可拓展屬性及快速迭代能力。

稀疏化路徑已具備批量化工程應(yīng)用能力。英偉達(dá)在2020年推出的A100產(chǎn)品中,就率先引入稀疏Tensor Core實(shí)現(xiàn)4:2結(jié)構(gòu)化稀疏,稀疏是神經(jīng)網(wǎng)絡(luò)輕量化的重要手段,英偉達(dá)稀疏化產(chǎn)品有效引領(lǐng)市場(chǎng)應(yīng)用趨勢(shì)。稀疏化架構(gòu)可與現(xiàn)有AI軟件生態(tài)深度適配,例如英偉達(dá)直接使用Tensor Core進(jìn)行稀疏矩陣乘累加操作,無(wú)需進(jìn)行底層編程。
圖片1
墨芯人工智能CEO王維演講(電子發(fā)燒友拍攝)

基于雙稀疏特點(diǎn),自研核心AI架構(gòu)

墨芯是全球最早研發(fā)稀疏化算法及架構(gòu)的企業(yè),并在2018年開(kāi)始稀疏化的全球?qū)@季?,該公司也是最早商用稀疏化產(chǎn)品實(shí)現(xiàn)銷(xiāo)售的,第一款FPGA產(chǎn)品在2019年Q4開(kāi)始產(chǎn)生銷(xiāo)售。

王維表示,現(xiàn)有芯片架構(gòu)設(shè)計(jì)在稀疏化支持中面臨較大局限,比如CPU架構(gòu),可支持跳點(diǎn)運(yùn)算,但因其算力限制,僅能夠支持邊緣端應(yīng)用,無(wú)法支持更大的模型,再比如GPU架構(gòu),只能進(jìn)行并行計(jì)算,所有元素(包括0元素)均參與運(yùn)算,無(wú)法實(shí)現(xiàn)高倍數(shù)加速。

基于雙稀疏特點(diǎn),墨芯自研核心AI架構(gòu)。其雙稀疏架構(gòu)設(shè)計(jì)理念:平衡的權(quán)重和激活張量剪枝技術(shù),可將精度損失降至最低的前提下保持對(duì)硬件的友好度;墨芯獨(dú)有的剪枝和壓縮技術(shù)可以再許多網(wǎng)絡(luò)和應(yīng)用中實(shí)現(xiàn)最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已經(jīng)回片,實(shí)測(cè)性能ResNet 50超33000SPS;墨芯板卡S4(單顆Antoum-1)僅30W功耗,實(shí)測(cè)性能實(shí)現(xiàn)英偉達(dá)主流產(chǎn)品T4近16倍能效比;墨芯板卡S4對(duì)比英偉達(dá)主流產(chǎn)品Latency可以做到1/4-1/5。
圖片2
墨芯人工智能CEO王維演講(電子發(fā)燒友拍攝)

稀疏化計(jì)算產(chǎn)品商業(yè)落地,將賦能AI產(chǎn)業(yè)變革。一、助力云服務(wù)商降低單位算力擁有成本,2021年,Nvidia在中國(guó)營(yíng)收超過(guò)38億美金,其中阿里,騰訊等頭部互聯(lián)網(wǎng)公司采購(gòu)金額基本超過(guò)1億美金。隨著AI持續(xù)發(fā)展,數(shù)據(jù)量的指數(shù)上升導(dǎo)致AI芯片的需求會(huì)持續(xù)上升,云服務(wù)商采購(gòu)額將逐年增加,因此他們對(duì)降低成本的訴求非常強(qiáng)勁,基于Antoum-1的推理卡S4相較于英偉達(dá)對(duì)標(biāo)推理卡T4,ResNest50及BERT每FPS/SPS成本降低約85%。

二、助力云服務(wù)商縮減能耗成本,電費(fèi)支出是數(shù)據(jù)中心最大的營(yíng)業(yè)成本,平均數(shù)據(jù)中心近60%的營(yíng)業(yè)成本是電力成本,降低能耗是數(shù)據(jù)中心和云服務(wù)商的最大痛點(diǎn),2021年全國(guó)數(shù)據(jù)中心的耗電量占社會(huì)總用電的近3%,且增長(zhǎng)率已連續(xù)8年超過(guò)12%,基于Antoum-1的推理卡S4相較于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低約90%。

小結(jié)

目前基于稀疏化的AI架構(gòu)主要面向云端訓(xùn)練場(chǎng)景,不過(guò)理論上來(lái)說(shuō),稀疏化訓(xùn)練由于能大幅降低對(duì)內(nèi)存、帶寬與計(jì)算的需求,十分適合訓(xùn)練,未來(lái)墨芯在滿(mǎn)足推理市場(chǎng)的需求后,將切入訓(xùn)練市場(chǎng),建立稀疏訓(xùn)練生態(tài),產(chǎn)品在軟件層面對(duì)訓(xùn)練做更多的開(kāi)發(fā),支持訓(xùn)練專(zhuān)用的算子,同時(shí)硬件上也會(huì)為訓(xùn)練定義架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1532

    瀏覽量

    16747
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里全光互聯(lián)架構(gòu),突破AI瓶頸

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)全球基建敘事生變,正從GPU時(shí)代邁向連接為王的通信時(shí)代。Scaling-law邊際效益放緩,芯片間連接通信成系統(tǒng)
    的頭像 發(fā)表于 02-27 09:19 ?1348次閱讀
    阿里<b class='flag-5'>云</b>全光互聯(lián)架構(gòu),突破AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>瓶頸</b>

    告別“硬件軍備競(jìng)賽”!華為如何讓企業(yè)效率翻倍,成本減半?

    的技術(shù)迭代周期卻在縮短。在此背景下,繼續(xù)沿用傳統(tǒng)的重資產(chǎn)IT模式已不合時(shí)宜。 華為憑借Flexus X實(shí)例的柔性、彈性服務(wù)器ECS的
    的頭像 發(fā)表于 12-31 13:02 ?168次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨(dú)有的柔性黑科技與智能調(diào)度能力,助力企業(yè)實(shí)現(xiàn)核心應(yīng)用性能最
    的頭像 發(fā)表于 12-31 13:00 ?257次閱讀

    華為榮獲服務(wù)商互聯(lián)能力成熟度模型參編證書(shū)

    在2025互聯(lián)網(wǎng)大會(huì)期間,互聯(lián)網(wǎng)服務(wù)論壇在成都成功舉辦。論壇現(xiàn)場(chǎng)舉行了《
    的頭像 發(fā)表于 12-31 11:50 ?658次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    2025 國(guó)內(nèi)比較成熟的 SD-WAN 服務(wù)商有哪些?

    當(dāng)前國(guó)內(nèi)能夠提供成熟 SD-WAN 解決方案的廠商,主要集中在三類(lèi):傳統(tǒng)通信運(yùn)營(yíng)、計(jì)算平臺(tái)服務(wù)商、以及專(zhuān)注網(wǎng)絡(luò)優(yōu)化與中小企業(yè)接入服務(wù)的技術(shù)公司。本文將從技術(shù)能力、
    的頭像 發(fā)表于 11-20 10:17 ?590次閱讀

    上海SD-WAN服務(wù)商怎么選?3步驟挑對(duì)服務(wù)商,附服務(wù)商排名!

    前言數(shù)字轉(zhuǎn)型浪潮下,一條軟件定義的網(wǎng)絡(luò)高速公路正成為企業(yè)競(jìng)爭(zhēng)的關(guān)鍵籌碼,選對(duì)服務(wù)商能讓網(wǎng)絡(luò)成本降低60%,業(yè)務(wù)部署速度提升10倍。隨著企業(yè)數(shù)字
    的頭像 發(fā)表于 09-23 11:47 ?1758次閱讀
    上海SD-WAN<b class='flag-5'>服務(wù)商</b>怎么選?3步驟挑對(duì)<b class='flag-5'>服務(wù)商</b>,附<b class='flag-5'>服務(wù)商</b>排名!

    睿海光電800G光模塊助力全球AI基建升級(jí)

    測(cè)試。 四、合作案例:賦能全球頭部客戶(hù)AI與計(jì)算升級(jí) 睿海光電的解決方案已深入多個(gè)行業(yè)標(biāo)桿場(chǎng)景: 數(shù)據(jù)中心互聯(lián):為東南亞某頂級(jí)IDC服務(wù)商部署800G SR8硅光模塊,單機(jī)架帶寬提升4倍,功耗降低
    發(fā)表于 08-13 19:05

    睿海光電領(lǐng)航AI光模塊:超快交付與全場(chǎng)景兼容賦能智時(shí)代——以創(chuàng)新實(shí)力助力全球客戶(hù)構(gòu)建高效底座

    計(jì)算巨頭800G FR4項(xiàng)目 2024年第四季度,睿海光電與某頭部服務(wù)商達(dá)成戰(zhàn)略合作,為其新一代智中心定制800G FR4光模塊。依托敏捷交付體系,睿海光電在合同簽署后30天內(nèi)完成設(shè)計(jì)驗(yàn)證并交付首批
    發(fā)表于 08-13 19:03

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    器件敏捷調(diào)配。 定制服務(wù):支持OEM/ODM/JDM模式,滿(mǎn)足客戶(hù)從標(biāo)準(zhǔn)品到液冷模塊的多元需求。 這一優(yōu)勢(shì)已助力多家頭部
    發(fā)表于 08-13 19:01

    2025年國(guó)內(nèi)SD-WAN服務(wù)商推薦

    服務(wù)商,如何篩選出既能提供定制方案,又能確保響應(yīng)時(shí)效和服務(wù)質(zhì)量的合作伙伴?一、企業(yè)選擇SD-WAN服務(wù)商的三大關(guān)鍵需求方案定制:摒棄“通用模板”Flexera《2
    的頭像 發(fā)表于 08-04 10:20 ?1723次閱讀
    2025年國(guó)內(nèi)SD-WAN<b class='flag-5'>服務(wù)商</b>推薦

    迅為RK3576開(kāi)發(fā)板高低成本工業(yè)級(jí)核心板卡開(kāi)發(fā)平臺(tái)

    迅為RK3576開(kāi)發(fā)板高低成本工業(yè)級(jí)核心板卡開(kāi)發(fā)平臺(tái)
    的頭像 發(fā)表于 06-09 15:13 ?1817次閱讀
    迅為RK3576開(kāi)發(fā)板高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>低成本</b>工業(yè)級(jí)核心板卡開(kāi)發(fā)平臺(tái)

    智能服務(wù)器應(yīng)用領(lǐng)域

    加速金融模型訓(xùn)練與實(shí)時(shí)交易決策,頭部機(jī)構(gòu)平臺(tái)規(guī)模超3.8萬(wàn)臺(tái)服務(wù)器?。 二、?醫(yī)療健康? 藥物研發(fā)與基因測(cè)序?:AI
    的頭像 發(fā)表于 04-21 09:09 ?1581次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)</b>器應(yīng)用領(lǐng)域

    Arm架構(gòu)將占據(jù)半數(shù) 2025年出貨到頭部服務(wù)提供

    Neoverse 技術(shù)的部署已達(dá)到了新的高度:2025 年出貨到頭部超大規(guī)模服務(wù)提供中,將有近 50% 是基于 Arm 架構(gòu)。
    的頭像 發(fā)表于 04-09 17:31 ?1251次閱讀

    工業(yè)4.0革命利器!明遠(yuǎn)智睿SSD2351核心板:低成本+高,破解產(chǎn)線(xiàn)智能難題

    行業(yè)痛點(diǎn):傳統(tǒng)工業(yè)設(shè)備智能改造面臨三大瓶頸——不足導(dǎo)致實(shí)時(shí)性差、接口資源有限難以擴(kuò)展多設(shè)備、進(jìn)口方案成本高昂且供貨不穩(wěn)定。 核心板方案
    發(fā)表于 03-21 14:22