chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾四大層面,提升DeepRec訓練和推理能力

英特爾中國 ? 來源:英特爾中國 ? 作者:英特爾中國 ? 2022-07-10 10:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從淘寶到天貓應用,從搜索、推薦到廣告等場景,對井噴式的數(shù)據(jù)進行超大規(guī)模訓練推理的應用,已經(jīng)在我們身邊落地開花。阿里巴巴集團的開源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓練和預測,可支撐千億特征、萬億樣本的超大規(guī)模稀疏訓練。

從2019 年開始,英特爾就與阿里巴巴PAI團隊緊密合作,將英特爾 AI 技術應用到 DeepRec 中。特別是英特爾處理器內(nèi)置的英特爾DL Boost (英特爾深度學習加速),為 DeepRec 實現(xiàn)了四個層面上的優(yōu)化:框架優(yōu)化、算子優(yōu)化、子圖優(yōu)化和模型優(yōu)化。

四大層面,提升DeepRec 訓練和推理能力

自英特爾 至強 可擴展處理器問世以來,通過從 AVX-256 升級到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學習訓練和推理能力。第三代英特爾 至強 可擴展處理器之后,英特爾推出支持 BFloat16 (BF16) 數(shù)據(jù)類型的指令集,也應用到 DeepRec 的優(yōu)化中。

框架優(yōu)化:DeepRec 集成了英特爾開源的跨平臺深度學習性能加速庫oneDNN (oneAPI Deep Neural Network Library),該程序庫已經(jīng)針對大量主流算子實現(xiàn)了性能優(yōu)化。與搭載 BF16 指令的第三代英特爾至強可擴展處理器同時使用,可顯著提高模型訓練和推理性能。

算子優(yōu)化:搜索廣告推薦模型中存在著大量稀疏算子,調(diào)用 AVX-512 指令加以優(yōu)化后,大幅提升了數(shù)據(jù)讀寫效率和性能。

子圖優(yōu)化:圖優(yōu)化是 AI 性能優(yōu)化的主要有效手段之一。在大規(guī)模稀疏場景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實現(xiàn)了子圖性能的明顯提升。

模型優(yōu)化:基于CPU 平臺,英特爾在 DeepRec 構建了涵蓋多個主流模型的獨有推薦模型集合,涉及召回、排序、多目標等多種常見場景;并針對硬件平臺進行性能優(yōu)化,相較于其他框架在 CPU 平臺上帶來跨越式性能提升。

阿里巴巴 PAI 團隊的測試結(jié)果證明:基于 Criteo 數(shù)據(jù)集,使用BF16優(yōu)化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓練性能提升達1.4倍,效果顯著。

未來,英特爾還會從優(yōu)化器算子、attention 子圖、添加多目標模型等多個角度進一步實施優(yōu)化,更大程度地發(fā)揮 CPU 平臺硬件優(yōu)勢、尤其是新硬件特征的效果最大化,從而為稀疏場景打造更高性能的 CPU 解決方案。

當然,英特爾為 DeepRec 的優(yōu)化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10245

    瀏覽量

    178196
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11189

    瀏覽量

    221375

原文標題:發(fā)揮CPU平臺硬件優(yōu)勢,英特爾助力DeepRec優(yōu)化超大規(guī)模稀疏訓練

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實現(xiàn)從模型訓練的深度突破到推理
    的頭像 發(fā)表于 08-26 19:18 ?2317次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    美國政府將入股英特爾?

    據(jù)彭博社報道稱,特朗普政府正在與芯片制造商英特爾進行談判,希望美國政府入股這家陷入困境的公司,隨后該公司股價周上漲 7% 。 英特爾是唯一一家有能力在美國本土生產(chǎn)最快芯片的美國公司,
    的頭像 發(fā)表于 08-17 09:52 ?754次閱讀

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速器: 英特爾Gaud
    發(fā)表于 05-20 11:03 ?1596次閱讀

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結(jié)果,其中,英特爾??至強??6性能核處理器在本次測試的六個
    的頭像 發(fā)表于 04-07 10:58 ?412次閱讀

    請問OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯(lián)網(wǎng)企業(yè)版兼容?

    無法在基于 Windows? 10 物聯(lián)網(wǎng)企業(yè)版的目標系統(tǒng)上使用 英特爾? Distribution OpenVINO? 2021* 版本推斷模型。
    發(fā)表于 03-05 08:32

    英特爾?獨立顯卡與OpenVINO?工具套件結(jié)合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發(fā)表于 03-05 06:56

    英特爾代工或引入多家外部股東

    英特爾的合作模式為“出錢拿產(chǎn)能”。這兩家ASIC設計大廠將通過股權投資的方式,確保自身能夠獲得英特爾的先進制程生產(chǎn)能力。同時,高通和博通的訂單也將有助于提升
    的頭像 發(fā)表于 02-18 10:45 ?892次閱讀

    英特爾與扣子云平臺合作推出AI PC Bot專區(qū)與端側(cè)插件商店

    。 Coze-AIPC是扣子云平臺與英特爾聯(lián)合發(fā)布的增強版智能體開發(fā)平臺,它深度整合了英特爾AI PC的端側(cè)能力與扣子云平臺的優(yōu)勢。通過扣子云平臺創(chuàng)新的“端插件”機制,英特爾AI PC
    的頭像 發(fā)表于 12-27 14:11 ?1291次閱讀

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動力大會上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強 6 性能核處理器的第代服務器實例,以打造彈性算力底座的產(chǎn)品化實踐。同時,英特爾也攜手扣子
    的頭像 發(fā)表于 12-23 14:05 ?1131次閱讀

    使用英特爾AI PC為YOLO模型訓練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進行模型訓練了。
    的頭像 發(fā)表于 12-09 16:14 ?1932次閱讀
    使用<b class='flag-5'>英特爾</b>AI PC為YOLO模型<b class='flag-5'>訓練</b>加速

    英特爾推出全新英特爾銳炫B系列顯卡

    英特爾銳炫B580和B570 GPU以卓越價值為時新游戲帶來超凡表現(xiàn)。 ? > 今日,英特爾發(fā)布全新英特爾銳炫 B系列顯卡(代號Battlemage)。英特爾銳炫 B580和B570
    的頭像 發(fā)表于 12-07 10:16 ?1744次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾Panther Lake處理器內(nèi)部制造比例提升至70%

    英特爾即將推出的Panther Lake處理器將顯著提升內(nèi)部制造硅芯片的比例,達到70%以上,這一變化預計將對公司的利潤產(chǎn)生積極影響。英特爾首席執(zhí)行官帕特·基辛格在財報電話會議上透露,盡管
    的頭像 發(fā)表于 11-04 14:47 ?1088次閱讀

    使用PyTorch在英特爾獨立顯卡上訓練模型

    《PyTorch 2.5重磅更新:性能優(yōu)化+新特性》中的一個新特性就是:正式支持在英特爾獨立顯卡上訓練模型!
    的頭像 發(fā)表于 11-01 14:21 ?2653次閱讀
    使用PyTorch在<b class='flag-5'>英特爾</b>獨立顯卡上<b class='flag-5'>訓練</b>模型

    英特爾宣布擴容成都封裝測試基地

    英特爾宣布擴容英特爾成都封裝測試基地。在現(xiàn)有的客戶端產(chǎn)品封裝測試的基礎上,增加為服務器芯片提供封裝測試服務,并設立一個客戶解決方案中心,以提高本土供應鏈的效率,加大對中國客戶支持的力度,提升響應速度。該擴容計劃體現(xiàn)了
    的頭像 發(fā)表于 10-29 13:58 ?715次閱讀

    英特爾考慮出售Altera股權

    近日,英特爾(Intel)正積極尋求出售其可編程芯片制造子公司Altera的股權,并考慮引入戰(zhàn)略投資或PE投資。據(jù)悉,英特爾對Altera的估值約為170億美元,而英特爾于2015年以167億美元的價格收購了這家公司。
    的頭像 發(fā)表于 10-21 15:42 ?1054次閱讀