chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾四大層面,提升DeepRec訓(xùn)練和推理能力

英特爾中國(guó) ? 來(lái)源:英特爾中國(guó) ? 作者:英特爾中國(guó) ? 2022-07-10 10:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從淘寶到天貓應(yīng)用,從搜索、推薦到廣告等場(chǎng)景,對(duì)井噴式的數(shù)據(jù)進(jìn)行超大規(guī)模訓(xùn)練推理的應(yīng)用,已經(jīng)在我們身邊落地開(kāi)花。阿里巴巴集團(tuán)的開(kāi)源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓(xùn)練和預(yù)測(cè),可支撐千億特征、萬(wàn)億樣本的超大規(guī)模稀疏訓(xùn)練。

從2019 年開(kāi)始,英特爾就與阿里巴巴PAI團(tuán)隊(duì)緊密合作,將英特爾 AI 技術(shù)應(yīng)用到 DeepRec 中。特別是英特爾處理器內(nèi)置的英特爾DL Boost (英特爾深度學(xué)習(xí)加速),為 DeepRec 實(shí)現(xiàn)了四個(gè)層面上的優(yōu)化:框架優(yōu)化、算子優(yōu)化、子圖優(yōu)化和模型優(yōu)化。

四大層面,提升DeepRec 訓(xùn)練和推理能力

自英特爾 至強(qiáng) 可擴(kuò)展處理器問(wèn)世以來(lái),通過(guò)從 AVX-256 升級(jí)到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學(xué)習(xí)訓(xùn)練和推理能力。第三代英特爾 至強(qiáng) 可擴(kuò)展處理器之后,英特爾推出支持 BFloat16 (BF16) 數(shù)據(jù)類型的指令集,也應(yīng)用到 DeepRec 的優(yōu)化中。

框架優(yōu)化:DeepRec 集成了英特爾開(kāi)源的跨平臺(tái)深度學(xué)習(xí)性能加速庫(kù)oneDNN (oneAPI Deep Neural Network Library),該程序庫(kù)已經(jīng)針對(duì)大量主流算子實(shí)現(xiàn)了性能優(yōu)化。與搭載 BF16 指令的第三代英特爾至強(qiáng)可擴(kuò)展處理器同時(shí)使用,可顯著提高模型訓(xùn)練和推理性能。

算子優(yōu)化:搜索廣告推薦模型中存在著大量稀疏算子,調(diào)用 AVX-512 指令加以優(yōu)化后,大幅提升了數(shù)據(jù)讀寫(xiě)效率和性能。

子圖優(yōu)化:圖優(yōu)化是 AI 性能優(yōu)化的主要有效手段之一。在大規(guī)模稀疏場(chǎng)景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實(shí)現(xiàn)了子圖性能的明顯提升。

模型優(yōu)化:基于CPU 平臺(tái),英特爾在 DeepRec 構(gòu)建了涵蓋多個(gè)主流模型的獨(dú)有推薦模型集合,涉及召回、排序、多目標(biāo)等多種常見(jiàn)場(chǎng)景;并針對(duì)硬件平臺(tái)進(jìn)行性能優(yōu)化,相較于其他框架在 CPU 平臺(tái)上帶來(lái)跨越式性能提升。

阿里巴巴 PAI 團(tuán)隊(duì)的測(cè)試結(jié)果證明:基于 Criteo 數(shù)據(jù)集,使用BF16優(yōu)化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓(xùn)練性能提升達(dá)1.4倍,效果顯著。

未來(lái),英特爾還會(huì)從優(yōu)化器算子、attention 子圖、添加多目標(biāo)模型等多個(gè)角度進(jìn)一步實(shí)施優(yōu)化,更大程度地發(fā)揮 CPU 平臺(tái)硬件優(yōu)勢(shì)、尤其是新硬件特征的效果最大化,從而為稀疏場(chǎng)景打造更高性能的 CPU 解決方案。

當(dāng)然,英特爾為 DeepRec 的優(yōu)化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10275

    瀏覽量

    179345
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11221

    瀏覽量

    222990

原文標(biāo)題:發(fā)揮CPU平臺(tái)硬件優(yōu)勢(shì),英特爾助力DeepRec優(yōu)化超大規(guī)模稀疏訓(xùn)練

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    發(fā)力圖形工作站和AI推理市場(chǎng),英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢(shì)?在支持AI推理工作站和大模型部署上,B60有哪些獨(dú)到之處?10月16日,在深圳舉行的灣區(qū)半導(dǎo)體大會(huì)上,英特爾中國(guó)區(qū)
    的頭像 發(fā)表于 10-22 13:40 ?1.1w次閱讀
    發(fā)力圖形工作站和AI<b class='flag-5'>推理</b>市場(chǎng),<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實(shí)現(xiàn)從模型訓(xùn)練的深度突破到推理
    的頭像 發(fā)表于 08-26 19:18 ?2592次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    美國(guó)政府將入股英特爾?

    據(jù)彭博社報(bào)道稱,特朗普政府正在與芯片制造商英特爾進(jìn)行談判,希望美國(guó)政府入股這家陷入困境的公司,隨后該公司股價(jià)周上漲 7% 。 英特爾是唯一一家有能力在美國(guó)本土生產(chǎn)最快芯片的美國(guó)公司,
    的頭像 發(fā)表于 08-17 09:52 ?926次閱讀

    英特爾發(fā)布全新GPU,AI和工作站迎來(lái)新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴(kuò)展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速器: 英特爾Gaud
    發(fā)表于 05-20 11:03 ?1678次閱讀

    1.9倍性能提升英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測(cè)試結(jié)果,其中,英特爾??至強(qiáng)??6性能核處理器在本次測(cè)試的六個(gè)
    的頭像 發(fā)表于 04-07 10:58 ?518次閱讀

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對(duì)比上代Meteor Lake,升級(jí)了模塊化結(jié)構(gòu)、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調(diào)度器、Xe2微架構(gòu)銳炫GPU、第代NPU等,由此也帶來(lái)了CPU性能
    的頭像 發(fā)表于 04-02 15:47 ?1154次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra AI PC上部署多種圖像生成模型

    請(qǐng)問(wèn)OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯(lián)網(wǎng)企業(yè)版兼容?

    無(wú)法在基于 Windows? 10 物聯(lián)網(wǎng)企業(yè)版的目標(biāo)系統(tǒng)上使用 英特爾? Distribution OpenVINO? 2021* 版本推斷模型。
    發(fā)表于 03-05 08:32

    英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無(wú)法運(yùn)行推理怎么解決?

    使用英特爾?獨(dú)立顯卡與OpenVINO?工具套件時(shí)無(wú)法運(yùn)行推理
    發(fā)表于 03-05 06:56

    英特爾任命王稚聰擔(dān)任中國(guó)區(qū)副董事長(zhǎng)

    英特爾公司宣布,任命王稚聰先生擔(dān)任新設(shè)立的英特爾中國(guó)區(qū)副董事長(zhǎng)一職。王稚聰將全面負(fù)責(zé)管理英特爾中國(guó)的業(yè)務(wù)運(yùn)營(yíng),直接向英特爾公司高級(jí)副總裁、英特爾
    的頭像 發(fā)表于 03-03 10:54 ?884次閱讀

    英特爾代工或引入多家外部股東

    英特爾的合作模式為“出錢(qián)拿產(chǎn)能”。這兩家ASIC設(shè)計(jì)大廠將通過(guò)股權(quán)投資的方式,確保自身能夠獲得英特爾的先進(jìn)制程生產(chǎn)能力。同時(shí),高通和博通的訂單也將有助于提升
    的頭像 發(fā)表于 02-18 10:45 ?998次閱讀

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型進(jìn)行了深度優(yōu)化。 這一優(yōu)化舉措使得AI開(kāi)發(fā)者能夠以更低的成本和更高的效率實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化。英特爾Gaudi 2D AI加速器通過(guò)其卓越的計(jì)算能力和高度優(yōu)化的軟件棧,為Janus Pro模型提供了強(qiáng)大的推理算力
    的頭像 發(fā)表于 02-10 11:10 ?929次閱讀

    英特爾酷睿Ultra 200V系列移動(dòng)處理器亮相CES 2025

    基于英特爾 vPro 平臺(tái)的全新英特爾 酷睿 Ultra 200V系列移動(dòng)處理器,為企業(yè)提供 AI 驅(qū)動(dòng)的生產(chǎn)力和提升的IT管理能力1。該產(chǎn)品不僅擁有卓越的性能、效率和非凡的商務(wù)計(jì)算
    的頭像 發(fā)表于 01-20 09:21 ?1710次閱讀

    英特爾與扣子云平臺(tái)合作推出AI PC Bot專區(qū)與端側(cè)插件商店

    。 Coze-AIPC是扣子云平臺(tái)與英特爾聯(lián)合發(fā)布的增強(qiáng)版智能體開(kāi)發(fā)平臺(tái),它深度整合了英特爾AI PC的端側(cè)能力與扣子云平臺(tái)的優(yōu)勢(shì)。通過(guò)扣子云平臺(tái)創(chuàng)新的“端插件”機(jī)制,英特爾AI PC
    的頭像 發(fā)表于 12-27 14:11 ?1403次閱讀

    英特爾與火山引擎等合作,夯實(shí)AI應(yīng)用智能底座

    性能核處理器的第代通用計(jì)算型實(shí)例g4il。這款實(shí)例憑借其卓越的計(jì)算性能和效率,為傳統(tǒng)企業(yè)級(jí)應(yīng)用、AI應(yīng)用以及未來(lái)更復(fù)雜的應(yīng)用場(chǎng)景提供了堅(jiān)實(shí)的算力基石。 在應(yīng)用層面英特爾與扣子Coze合作推出了支持端云協(xié)同的智能體開(kāi)發(fā)平臺(tái)——
    的頭像 發(fā)表于 12-25 11:47 ?1276次閱讀

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動(dòng)力大會(huì)上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的第代服務(wù)器實(shí)例,以打造彈性算力底座的產(chǎn)品化實(shí)踐。同時(shí),英特爾也攜手扣子
    的頭像 發(fā)表于 12-23 14:05 ?1235次閱讀