chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

looger123 ? 來源:looger123 ? 作者:looger123 ? 2024-09-06 15:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,第五代英特爾?至強?可擴展處理器通過了中國電子技術標準化研究院組織的人工智能服務器系統(tǒng)性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業(yè)。

中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統(tǒng)性能測試規(guī)范》(征求意見稿)相關要求,使用AISBench2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI大模型推理性能和精度測試。測試中,第五代英特爾至強在ChatGLM V2-6B(60億參數(shù))以及 Llama2-13B(130億參數(shù))兩個模型上均展現(xiàn)出卓越推理性能,能夠滿足輕量級大語言模型的實時推理要求。

wKgZombasFCAOb28AAQWiisN-UI496.png

測試結果:此次單機性能測試中,在滿足人類正常閱讀速度要求(生成延遲小于100毫秒)的情況下,在封閉測試場景中構造數(shù)據集,基于第五代英特爾至強的服務器可實現(xiàn):

?在60億參數(shù)的ChatGLM V2模型通用推理中,當輸入輸出序列為256時可達每秒2493 token的性能,當輸入輸出序列為2048時可達每秒926 token。

?在130億參數(shù)的Llama2模型通用推理中,當輸入輸出為256時可達每秒513 token,當輸入輸出序列為2048時可達每秒132 token1。


作為通用處理器,第五代英特爾至強在人工智能、網絡、存儲、數(shù)據庫等關鍵工作負載均能提供出色性能。AISBench2.0的測試結果驗證了英特爾至強在運行輕量級大語言模型時展現(xiàn)出的優(yōu)異推理性能,使得客戶可以使用基于至強的服務器,構建一個通用AI系統(tǒng)進行數(shù)據預處理、模型推理和部署,從而獲得兼具AI性能、效率、準確性和可擴展性的組合。這也彰顯了英特爾至強可以為企業(yè)提供“開箱即用”的功能,即可以在通用系統(tǒng)上部署一部分AI工作負載,從而為客戶帶來更佳的總體擁有成本(TCO)優(yōu)勢。

軟硬結合,至強展現(xiàn)AI優(yōu)勢

英特爾至強的內置AI加速器使其成為在通用處理器上運行部分AI工作負載的理想解決方案,不僅如此,英特爾還配備了經過優(yōu)化的、易于編程的開放軟件,可降低客戶和生態(tài)伙伴在數(shù)據中心部署從云到智能邊緣各種基于AI的解決方案的門檻。

?第五代英特爾至強可擴展處理器充分發(fā)揮了系統(tǒng)級優(yōu)勢(包括緩存、內存等),因此推理速度實現(xiàn)了大幅提升。

?其內置的AI加速器——英特爾?高級矩陣擴展(AMX),通過提供專用的矩陣運算加速模塊(TMUL),以及支持INT8和BF16這類低精度數(shù)據類型,可實現(xiàn)對計算資源的充分利用,從而大幅提升運算效率。

?xFasterTransformer(簡稱xFT)是英特爾提供的在CPU平臺上部署大語言模型的深度優(yōu)化開放解決方案,通過C++Python兩種API接口,更易于用戶使用和將其集成到自有業(yè)務框架中。

關于AISBench

AISBench基準是一套應用于人工智能計算產品的性能測試基準,由中國電子技術標準化研究院牽頭研制。與MLPerf等國際先進計算基準類似,該基準用于測試多種人工智能計算產品形態(tài),并支持豐富的測試場景、模式、類型和指標。

產品與性能信息

1.服務器:在搭載第五代英特爾?至強?處理器的Quanta Cloud Technology 服務器 QuantaGrid D54Q-2U上測量,CPU:英特爾至強鉑金8592+、64核,超線程開啟、睿頻開啟、NUMA 4,內存:1.5 TB、硬盤:Intel P5800X 3.2TB NVME ,、操作系統(tǒng):Ubuntu 22.04、測試軟件:AISBench、深度學習框架:PyTorch 2.3.1、模型數(shù)據精度:BF16。英特爾于2024年6月26日至7月26日進行測試。

客戶端:第十一代英特爾?酷睿?i7-1185G7:在戴爾Latitude 7420上測量,內存:16.0 GB、硬盤:256 GB、操作系統(tǒng):Microsoft Windows 11Enterprise、測試軟件:MobaXtermPersonalEdition v22.0 Build 4858。英特爾于2024年6月26日至7月26日進行測試。

測試工具:性能測試工具AISBench 2.0。

免責聲明

性能因使用情況、配置和其他因素而異。欲了解更多信息,請訪問性能指數(shù)網站。性能結果基于截至所示日期的測試,可能無法反映所有公開可用的更新。請參閱備份以了解配置詳情。沒有任何產品或組件是絕對安全的。您的成本和結果可能會有所不同。英特爾技術可能需要啟用硬件、軟件或激活服務。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10245

    瀏覽量

    178167
  • 至強處理器
    +關注

    關注

    0

    文章

    23

    瀏覽量

    9316
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉

    2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能處理器,其中一款677
    的頭像 發(fā)表于 06-27 11:44 ?426次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>6助力AI系統(tǒng)高效運轉

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公
    的頭像 發(fā)表于 04-07 10:58 ?412次閱讀

    英特爾至強6處理器助力數(shù)據中心整合升級

    繼去年9月重磅推出英特爾 至強 6900性能處理器后,英特爾進一步擴充至強6產品家族,于近期發(fā)
    的頭像 發(fā)表于 03-13 17:36 ?1096次閱讀

    英特爾至強6:如何煉就數(shù)據中心“全能型選手”

    面對數(shù)據中心領域日益激烈的競爭,英特爾緊抓核心產品,繼去年推出128核的至強6900P之后,近期又添“新兵”——至強6700P和至強6500P,進一步豐富了
    的頭像 發(fā)表于 03-13 14:57 ?469次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>6:如何煉就數(shù)據中心“全能型選手”

    英特爾至強6再推新品!打造最強AI“機頭引擎”

    的產品矩陣,很好地滿足市場的多樣化需求;另一方面,憑借卓越的 AI 性能提升,英特爾為數(shù)據中心提供了性能強勁的機頭節(jié)點 CPU,助力企業(yè)在數(shù)字時代的浪潮中穩(wěn)步前行。 事實上,去年9月,
    的頭像 發(fā)表于 03-13 14:57 ?481次閱讀

    英特爾展示基于至強6處理器的基礎網絡設施

    ; 與5G核心網解決方案合作伙伴的深度合作,加快了英特爾至強6能效核處理器在整個生態(tài)系統(tǒng)中的應用; 基于5G核心網工作負載的獨立驗證確認了英特爾至強
    的頭像 發(fā)表于 03-08 09:24 ?687次閱讀

    英特爾?獨立顯卡與OpenVINO?工具套件結合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發(fā)表于 03-05 06:56

    MWC 2025:英特爾展示基于至強6處理器的基礎網絡設施

    3.2倍3; 與5G核心網解決方案合作伙伴的深度合作,加快了英特爾?至強?6能效核處理器在整個生態(tài)系統(tǒng)中的應用; 基于5G核心網工作負載的獨立驗證確認了英特爾?
    發(fā)表于 03-03 15:52 ?634次閱讀
    MWC 2025:<b class='flag-5'>英特爾</b><b class='flag-5'>展示</b>基于<b class='flag-5'>至強</b>6<b class='flag-5'>處理器</b>的基礎網絡設施

    英特爾推出全新至強6性能處理器

    至強6性能處理器,為廣泛的數(shù)據中心和網絡基礎設施工作負載提供卓越性能,并以出色的能效,為數(shù)據中心的整合升級創(chuàng)造新機會。
    的頭像 發(fā)表于 03-03 10:57 ?803次閱讀

    全新英特爾至強6處理器來襲,現(xiàn)代數(shù)據中心的性能與能效平衡“大師”

    英特爾進一步豐富至強6處理器產品組合,為行業(yè)提供多款滿足廣泛工作負載的CPU選擇。 新聞亮點 ·?英特爾推出全新英特爾??
    的頭像 發(fā)表于 02-25 17:39 ?554次閱讀

    英特爾至強6助力HPE Gen12,AI推理性能提升3倍!

    ,CPU處理器永遠都是C位的存在,沒有它的基礎性支撐,其他一切都是空中樓閣。 當然,CPU處理器也在積極適應新的時代趨勢,既要不斷增強計算性能,也要低碳環(huán)保提高能效,但它們倆如同硬幣的正反面,不可能完美兼顧,那該怎么辦呢? 對此
    的頭像 發(fā)表于 02-18 14:18 ?448次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>6助力HPE Gen12,AI<b class='flag-5'>推理性能</b>提升3倍!

    HPE攜手英特爾至強6,打造新一代服務性能巔峰

    前所未有的性能與能效水平。 HPE ProLiant Compute Gen12服務專為應對日益增長的數(shù)據密集型工作負載挑戰(zhàn)而設計,無論是數(shù)據中心還是邊緣環(huán)境,都能輕松勝任。英特爾至強
    的頭像 發(fā)表于 02-18 10:38 ?594次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1065次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理性能</b>

    英特爾酷睿Ultra 200V系列移動處理器亮相CES 2025

    基于英特爾 vPro 平臺的全新英特爾 酷睿 Ultra 200V系列移動處理器,為企業(yè)提供 AI 驅動的生產力和提升的IT管理能力1。該產品不僅擁有卓越
    的頭像 發(fā)表于 01-20 09:21 ?1410次閱讀

    英特爾推出全新MRDIMM高速內存

    英特爾攜手行業(yè)伙伴,以創(chuàng)新方法實現(xiàn)標準DRAM模塊內存帶寬翻倍,該即插即用的解決方案可釋放至強6性能處理器潛力。
    的頭像 發(fā)表于 11-25 17:03 ?1131次閱讀