chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾通過軟硬件為L(zhǎng)Iama 2大模型提供加速,持續(xù)發(fā)力推動(dòng)AI發(fā)展

英特爾中國(guó) ? 來源:未知 ? 2023-07-21 18:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英特爾廣泛的AI硬件組合及開放的軟件環(huán)境,為Meta發(fā)布的Llama 2模型提供了極具競(jìng)爭(zhēng)力的選擇,進(jìn)一步助力大語言模型的普及,推動(dòng)AI發(fā)展惠及各行各業(yè)。

大語言模型(LLM)在生成文本、總結(jié)和翻譯內(nèi)容、回答問題、參與對(duì)話以及執(zhí)行復(fù)雜任務(wù)(如解決數(shù)學(xué)問題或推理)方面表現(xiàn)出的卓越能力,使其成為最有希望規(guī)?;旄I鐣?huì)的AI技術(shù)之一。大語言模型有望解鎖更豐富的創(chuàng)意和洞察,并激發(fā)AI社區(qū)推進(jìn)技術(shù)發(fā)展的熱情。

Llama 2旨在幫助開發(fā)者、研究人員和組織構(gòu)建基于生成式AI的工具和體驗(yàn)。Meta發(fā)布了多個(gè)Llama 2的預(yù)訓(xùn)練和微調(diào)版本,擁有70億、130億和700億三種參數(shù)。通過Llama 2,Meta在公司的各個(gè)微調(diào)模型中采用了三項(xiàng)以安全為導(dǎo)向的核心技術(shù):安全的有監(jiān)督微調(diào)、安全的目標(biāo)文本提取以及安全的人類反饋強(qiáng)化學(xué)習(xí)(RLHF)。這些技術(shù)相結(jié)合,使Meta得以提高安全性能。隨著越來越廣泛的使用,人們將能夠以透明、公開的方式不斷識(shí)別并降低生成有害內(nèi)容的風(fēng)險(xiǎn)。

英特爾致力于通過提供廣泛的硬件選擇和開放的軟件環(huán)境,推動(dòng)AI的發(fā)展與普及。英特爾提供了一系列AI解決方案,為AI社區(qū)開發(fā)和運(yùn)行Llama 2等模型提供了極具競(jìng)爭(zhēng)力和極具吸引力的選擇。英特爾豐富的AI硬件產(chǎn)品組合與優(yōu)化開放的軟件相結(jié)合,為應(yīng)對(duì)算力挑戰(zhàn)提供了可行的方案。

英特爾提供了滿足模型的開發(fā)和部署的AI優(yōu)化軟件。開放生態(tài)系統(tǒng)是英特爾得天獨(dú)厚的戰(zhàn)略優(yōu)勢(shì),在AI領(lǐng)域亦是如此。我們致力于培育一個(gè)充滿活力的開放生態(tài)系統(tǒng)來推動(dòng)AI創(chuàng)新,其安全、可追溯、負(fù)責(zé)任以及遵循道德,這對(duì)整個(gè)行業(yè)至關(guān)重要。此次發(fā)布的大模型進(jìn)一步彰顯了我們的核心價(jià)值觀——開放,為開發(fā)人員提供了一個(gè)值得信賴的選擇。Llama 2模型的發(fā)布是我們行業(yè)向開放式AI發(fā)展轉(zhuǎn)型邁出的重要一步,即以公開透明的方式推動(dòng)創(chuàng)新并助力其蓬勃發(fā)展。

--李煒

英特爾軟件與先進(jìn)技術(shù)副總裁

人工智能和分析部門總經(jīng)理

-- Melissa Evers

英特爾軟件與先進(jìn)技術(shù)副總裁

兼執(zhí)行戰(zhàn)略部總經(jīng)理

在Llama 2發(fā)布之際,我們很高興地分享70億和130億參數(shù)模型的初始推理性能測(cè)試結(jié)果。這些模型在英特爾AI產(chǎn)品組合上運(yùn)行,包括HabanaGaudi2 深度學(xué)習(xí)加速器、第四代英特爾至強(qiáng)可擴(kuò)展處理器、英特爾至強(qiáng)CPU Max系列和英特爾數(shù)據(jù)中心GPU Max系列。我們?cè)诒疚闹蟹窒淼男阅苤笜?biāo)是我們當(dāng)前軟件提供的“開箱即用”的性能,并有望在未來的軟件中進(jìn)一步提升。我們還支持700億參數(shù)模型,并將很快分享最新相關(guān)信息。

HabanaGaudi2 深度學(xué)習(xí)加速器

Habana Gaudi2旨在為用戶提供高性能、高能效的訓(xùn)練與推理,尤其適用于諸如Llama和Llama 2的大語言模型。Gaudi2加速器具備96GB HBM2E的內(nèi)存容量,可滿足大語言模型的內(nèi)存需求并提高推理性能。Gaudi2配備HabanaSynapseAI軟件套件,該套件集成了對(duì)PyTorch和DeepSpeed的支持,以用于大語言模型的訓(xùn)練和推理。此外,SynapseAI近期開始支持HPU Graphs和DeepSpeed推理,專門針對(duì)時(shí)延敏感度高的推理應(yīng)用。Gaudi2還將進(jìn)行進(jìn)一步的軟件優(yōu)化,包括計(jì)劃在2023年第三季度支持FP8數(shù)據(jù)類型。此優(yōu)化預(yù)計(jì)將在執(zhí)行大語言模型時(shí)大幅提高性能、吞吐量,并有效降低延遲。

大語言模型的性能需要靈活敏捷的可擴(kuò)展性,來突破服務(wù)器內(nèi)以及跨節(jié)點(diǎn)間的網(wǎng)絡(luò)瓶頸。每張Gaudi2芯片集成了21個(gè)100Gbps以太網(wǎng)接口,21個(gè)接口專用于連接服務(wù)器內(nèi)的8顆Gaudi2,該網(wǎng)絡(luò)配置有助于提升服務(wù)器內(nèi)外的擴(kuò)展性能。

在近期發(fā)布的MLPerf基準(zhǔn)測(cè)試中,Gaudi2在大語言模型上展現(xiàn)了出色的訓(xùn)練性能,包括在384個(gè)Gaudi2加速器上訓(xùn)練1750億參數(shù)的GPT-3模型所展現(xiàn)的結(jié)果。Gaudi2經(jīng)過驗(yàn)證的高性能使其成為L(zhǎng)lama和Llama 2模型訓(xùn)練和推理的高能效解決方案。

圖1顯示了70億參數(shù)和130億參數(shù)Llama 2模型的推理性能。模型分別在一臺(tái)Habana Gaudi2設(shè)備上運(yùn)行,batch size=1,輸出token長(zhǎng)度256,輸入token長(zhǎng)度不定,使用BF16精度。報(bào)告的性能指標(biāo)為每個(gè)token的延遲(不含第一個(gè))。該測(cè)試使用optimum-habana文本生成腳本在Llama模型上運(yùn)行推理。optimum-habana庫能夠幫助簡(jiǎn)化在Gaudi加速器上部署此類模型的流程,僅需極少的代碼更改即可實(shí)現(xiàn)。如圖1所示,對(duì)于128至2000輸入token,在70億參數(shù)模型上Gaudi2的推理延遲范圍為每token 9.0-12.2毫秒,而對(duì)于130億參數(shù)模型,范圍為每token 15.5-20.4毫秒1。

wKgZomToEiGAUXfFAAGHaOrFSeA660.png

圖1基于Habana Gaudi2,70億和130億參數(shù)Llama 2模型的推理性能

若想訪問Gaudi2,可按照此處(https://developer.habana.ai/intel-developer-cloud/)在英特爾開發(fā)者云平臺(tái)上注冊(cè)一個(gè)實(shí)例,或聯(lián)系超微(Supermicro)了解Gaudi2服務(wù)器基礎(chǔ)設(shè)施。

英特爾至強(qiáng)可擴(kuò)展處理器

第四代英特爾至強(qiáng)可擴(kuò)展處理器是一款通用計(jì)算處理器,具有英特爾高級(jí)矩陣擴(kuò)展(英特爾AMX)的AI加速功能。具體而言,該處理器的每個(gè)核心內(nèi)置了BF16和INT8通用矩陣乘(GEMM)加速器,以加速深度學(xué)習(xí)訓(xùn)練和推理工作負(fù)載。此外,英特爾至強(qiáng)CPU Max系列,每顆CPU提供64GB的高帶寬內(nèi)存(HBM2E),兩顆共128GB,由于大語言模型的工作負(fù)載通常受到內(nèi)存帶寬的限制,因此,該性能對(duì)于大模型來說極為重要。

目前,針對(duì)英特爾至強(qiáng)處理器的軟件優(yōu)化已升級(jí)到深度學(xué)習(xí)框架中,并可用于PyTorch*、TensorFlow*、DeepSpeed*和其它AI庫的默認(rèn)發(fā)行版。英特爾主導(dǎo)了torch.compile CPU后端的開發(fā)和優(yōu)化,這是PyTorch 2.0的旗艦功能。與此同時(shí),英特爾還提供英特爾PyTorch擴(kuò)展包*(IntelExtension for PyTorch*),旨在PyTorch官方發(fā)行版之前,盡早、及時(shí)地為客戶提供英特爾CPU的優(yōu)化。

第四代英特爾至強(qiáng)可擴(kuò)展處理器擁有更高的內(nèi)存容量,支持在單個(gè)插槽內(nèi)實(shí)現(xiàn)適用于對(duì)話式AI和文本摘要應(yīng)用的、低延遲的大語言模型執(zhí)行。對(duì)于BF16和INT8,該結(jié)果展示了單個(gè)插槽內(nèi)執(zhí)行1個(gè)模型時(shí)的延遲。英特爾PyTorch擴(kuò)展包*支持SmoothQuant,以確保INT8精度模型具有良好的準(zhǔn)確度。

考慮到大語言模型應(yīng)用需要以足夠快的速度生成token,以滿足讀者較快的閱讀速度,我們選擇token延遲,即生成每個(gè)token所需的時(shí)間作為主要的性能指標(biāo),并以快速人類讀者的閱讀速度(約為每個(gè)token 100毫秒)作為參考。如圖2、3所示,對(duì)于70億參數(shù)的Llama2 BF16模型和130億參數(shù)的Llama 2 INT8模型,第四代英特爾至強(qiáng)單插槽的延遲均低于100毫秒2。

得益于更高的HBM2E帶寬,英特爾至強(qiáng)CPU Max系列為以上兩個(gè)模型提供了更低的延遲。而憑借英特爾AMX加速器,用戶可以通過更高的批量尺寸(batch size)來提高吞吐量。

wKgZomToEiKACI8YAAH9J10fRew832.png

圖2 基于英特爾至強(qiáng)可擴(kuò)展處理器,70億參數(shù)和130億參數(shù)Llama 2模型(BFloat16)的推理性能

wKgZomToEiKAW4KxAAH4BE-DLCg438.png

圖3 基于英特爾至強(qiáng)可擴(kuò)展處理器,70億參數(shù)和130億參數(shù)Llama 2模型(INT8)的推理性能

對(duì)于70億和130億參數(shù)的模型,每個(gè)第四代至強(qiáng)插槽可提供低于100毫秒的延遲。用戶可以分別在兩個(gè)插槽上同時(shí)運(yùn)行兩個(gè)并行實(shí)例,從而獲得更高的吞吐量,并獨(dú)立地服務(wù)客戶端。亦或者,用戶可以通過英特爾PyTorch擴(kuò)展包*和DeepSpeed* CPU,使用張量并行的方式在兩個(gè)第四代至強(qiáng)插槽上運(yùn)行推理,從而進(jìn)一步降低延遲或支持更大的模型。

關(guān)于在至強(qiáng)平臺(tái)上運(yùn)行大語言模型和Llama 2,開發(fā)者可以點(diǎn)擊此處(https://intel.github.io/intel-extension-for-pytorch/llm/cpu/)了解更多詳細(xì)信息。第四代英特爾至強(qiáng)可擴(kuò)展處理器的云實(shí)例可在AWS和Microsoft Azure上預(yù)覽,目前已在谷歌云平臺(tái)和阿里云全面上線。英特爾將持續(xù)在PyTorch*和DeepSpeed*進(jìn)行軟件優(yōu)化,以進(jìn)一步加速Llama 2和其它大語言模型。

英特爾數(shù)據(jù)中心GPU Max系列

英特爾數(shù)據(jù)中心GPU Max系列提供并行計(jì)算、科學(xué)計(jì)算和適用于科學(xué)計(jì)算的AI加速。作為英特爾性能最為出色、密度最高的獨(dú)立顯卡,英特爾數(shù)據(jù)中心GPU Max系列產(chǎn)品中封裝超過1000億個(gè)晶體管,并包含多達(dá)128個(gè)Xe內(nèi)核,Xe是英特爾GPU的計(jì)算構(gòu)建模塊。

英特爾數(shù)據(jù)中心GPU Max系列旨在為AI和科學(xué)計(jì)算中使用的數(shù)據(jù)密集型計(jì)算模型提供突破性的性能,包括:

●408 MB基于獨(dú)立SRAM技術(shù)的L2緩存、64MB L1緩存以及高達(dá)128GB的高帶寬內(nèi)存(HBM2E)。

●AI增強(qiáng)型的Xe英特爾矩陣擴(kuò)展(英特爾XMX)搭載脈動(dòng)陣列,在單臺(tái)設(shè)備中可實(shí)現(xiàn)矢量和矩陣功能。

英特爾Max系列產(chǎn)品統(tǒng)一支持oneAPI,并基于此實(shí)現(xiàn)通用、開放、基于標(biāo)準(zhǔn)的編程模型,釋放生產(chǎn)力和性能。英特爾oneAPI工具包括高級(jí)編譯器、庫、分析工具和代碼遷移工具,可使用SYCL輕松將CUDA代碼遷移到開放的C++。

英特爾數(shù)據(jù)中心Max系列GPU通過當(dāng)今框架的開源擴(kuò)展來實(shí)現(xiàn)軟件支持和優(yōu)化,例如面向PyTorch*的英特爾擴(kuò)展、面向TensorFlow*的英特爾擴(kuò)展和面向DeepSpeed*的英特爾擴(kuò)展。通過將這些擴(kuò)展與上游框架版本一起使用,用戶將能夠在機(jī)器學(xué)習(xí)工作流中實(shí)現(xiàn)快速整合。

我們?cè)谝粋€(gè)600瓦OAM形態(tài)的GPU上評(píng)估了Llama 2的70億參數(shù)模型和Llama 2的130億參數(shù)模型推理性能,這個(gè)GPU上封裝了兩個(gè)tile,而我們只使用其中一個(gè)tile來運(yùn)行推理。圖4顯示,對(duì)于輸入長(zhǎng)度為32到2000的token,英特爾數(shù)據(jù)中心GPU Max系列的一個(gè)tile可以為70億參數(shù)模型的推理提供低于20毫秒的單token延遲,130億參數(shù)模型的單token延遲為29.2-33.8毫秒3。因?yàn)樵揋PU上封裝了兩個(gè)tile,用戶可以同時(shí)并行運(yùn)行兩個(gè)獨(dú)立的實(shí)例,每個(gè)tile上運(yùn)行一個(gè),以獲得更高的吞吐量并獨(dú)立地服務(wù)客戶端。

wKgZomToEiKAd_RoAAG1kNPZfKk365.png

圖4英特爾數(shù)據(jù)中心GPUMax1550上的Llama2的70億和130億參數(shù)模型的推理性能

關(guān)于在英特爾GPU平臺(tái)上運(yùn)行大語言模型和Llama 2,可以點(diǎn)擊此處(https://intel.github.io/intel-extension-for-pytorch/llm/xpu/)獲取詳細(xì)信息。目前英特爾開發(fā)者云平臺(tái)上已發(fā)布英特爾GPU Max云實(shí)例測(cè)試版。

英特爾平臺(tái)上的大語言模型微調(diào)

除了推理之外,英特爾一直在積極地推進(jìn)微調(diào)加速,通過向Hugging Face Transformers、PEFT、Accelerate和Optimum庫提供優(yōu)化,并在面向Transformers的英特爾擴(kuò)展中提供參考工作流。這些工作流支持在相關(guān)英特爾平臺(tái)上高效地部署典型的大語言模型任務(wù),如文本生成、代碼生成、完成和摘要。

總結(jié)

上述內(nèi)容介紹了在英特爾AI硬件產(chǎn)品組合上運(yùn)行Llama 2的70億和130億參數(shù)模型推理性能的初始評(píng)估,包括Habana Gaudi2深度學(xué)習(xí)加速器、第四代英特爾至強(qiáng)可擴(kuò)展處理器、英特爾至強(qiáng)CPU Max系列和英特爾數(shù)據(jù)中心GPU Max系列。我們將繼續(xù)通過軟件發(fā)布提供優(yōu)化,后續(xù)會(huì)再分享更多關(guān)于大語言模型和更大的Llama 2模型的評(píng)估。

參考資料

Intel / intel-extension-for-pytorch:一個(gè)用于擴(kuò)展官方PyTorch的PyTorch軟件包,可以輕松地獲取英特爾平臺(tái)的性能(github.com)

使用英特爾神經(jīng)壓縮器進(jìn)行模型壓縮:huggingface/optimum-habana:在Habana Gaudi處理器(HPU)上輕松地極速訓(xùn)練Transformers(github.com)

面向英特爾數(shù)據(jù)中心GPU Max系列的開發(fā)工具

Meta Llama2論文:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

Meta Llama2博客:https://ai.meta.com/llama/

產(chǎn)品和性能信息

1HabanaGaudi2深度學(xué)習(xí)加速器:所有測(cè)量使用了一臺(tái)HLS2 Gaudi2服務(wù)器上的Habana SynapseAI 1.10版和optimum-habana 1.6版,該服務(wù)器具有八個(gè)Habana Gaudi2 HL-225H Mezzanine卡和兩個(gè)英特爾至強(qiáng)白金8380 CPU@2.30GHz以及1TB系統(tǒng)內(nèi)存。2023年7月進(jìn)行測(cè)量。

2第四代英特爾至強(qiáng)可擴(kuò)展處理器

·第四代英特爾至強(qiáng)8480:第四代英特爾至強(qiáng)白金8480+2插槽系統(tǒng),112核/224線程,啟用睿頻,啟用超線程,內(nèi)存:16x32GB DDR5 4800MT/s,存儲(chǔ):953.9GB;操作系統(tǒng):CentOS Stream 8;內(nèi)核:5.15.0-spr.bkc.pc.16.4.24.x86_64;批處理大?。?;在1個(gè)插槽上測(cè)量:1;PyTorch nightly build0711;IntelExtensions for PyTorch* tag v2.1.0.dev+cpu.llm;模型:Llama 2 70億和Llama 2 130億參數(shù);數(shù)據(jù)集LAMBADA;令牌長(zhǎng)度:32/128/1024/2016(in),32(out);Beam Width 4;精度:BF16和INT8;英特爾在2023年7月12日測(cè)試。

·英特爾至強(qiáng)Max 9480:英特爾至強(qiáng)Max 9480 2插槽系統(tǒng),112核/224線程,啟用睿頻,啟用超線程,內(nèi)存:16x64GB DDR5 4800MT/s;8x16GB HBM2 3200 MT/s,存儲(chǔ):1.8TB;操作系統(tǒng):CentOS Stream 8;內(nèi)核:5.19.0-0812.intel_next.1.x86_64+server;批處理大?。?;在1個(gè)插槽上測(cè)量;PyTorch nightly build0711;IntelExtensions for PyTorch* llm_feature_branch;模型:Llama 2 70億和Llama 2 130億參數(shù),數(shù)據(jù)集LAMBADA;令牌長(zhǎng)度:32/128/1024/2016(in),32(out);Beam Width 4;精度:BF16和INT8;英特爾在2023年7月12日測(cè)試。

3英特爾數(shù)據(jù)中心GPU Max系列:1節(jié)點(diǎn),2個(gè)英特爾至強(qiáng)白金8480+,56核,啟用超線程,啟用睿頻,NUMA 2,總內(nèi)存1024GB(16x64GB DDR5 4800 MT/s [4800 MT/s]),BIOS:SE5C7411.86B.9525.D19.2303151347,微代碼0x2b0001b0,1個(gè)用于10GBASE-T的以太網(wǎng)控制器X710,1個(gè)1.8T WDC WDS200T2B0B,1個(gè)931.5G英特爾SSDPELKX010T8,Ubuntu 22.04.2 LTS,5.15.0-76-generic,4個(gè)英特爾數(shù)據(jù)中心GPU Max 1550(僅使用單個(gè)OAM GPU卡的一個(gè)區(qū)塊測(cè)量),IFWI PVC 2_1.23166,agama驅(qū)動(dòng)程序:agama-ci-devel-627.7,英特爾oneAPI基礎(chǔ)工具包2023.1,PyTorch* 2.0.1 + IntelExtension for PyTorch* v2.0.110+xpu(dev/LLM分支),AMC固件版本:6.5.0.0,模型:Meta AI Llama 2 70億和Llama 2 130億參數(shù),數(shù)據(jù)集LAMBADA;令牌長(zhǎng)度:32/128/1024/2016(in),32(out);Greedy搜索;精度FP16;英特爾在2023年7月7日測(cè)試。

4性能因用途、配置和其它因素而異。更多信息請(qǐng)見www.Intel.com/PerformanceIndex。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10196

    瀏覽量

    174677
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217060

原文標(biāo)題:英特爾通過軟硬件為L(zhǎng)Iama 2大模型提供加速,持續(xù)發(fā)力推動(dòng)AI發(fā)展

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Computex 2025上,英特爾發(fā)布了專業(yè)人士和開發(fā)者設(shè)計(jì)的全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括: 全新英特爾銳炫 ?
    發(fā)表于 05-20 11:03 ?1514次閱讀

    2025英特爾人工智能創(chuàng)新應(yīng)用大賽正式啟動(dòng)

    近日,2025英特爾人工智能創(chuàng)新應(yīng)用大賽(以下簡(jiǎn)稱“大賽”)正式啟動(dòng)。本屆大賽以“‘碼’上出發(fā),‘芯’創(chuàng)未來”為主題,在賽制、規(guī)模、獎(jiǎng)項(xiàng)和賽事支持上實(shí)現(xiàn)多重升級(jí),開發(fā)者和企業(yè)提供展示創(chuàng)意和成果的廣闊平臺(tái),鼓勵(lì)他們充分利用
    的頭像 發(fā)表于 04-02 15:24 ?550次閱讀

    英特爾軟硬件優(yōu)化重構(gòu)算力效率

    如何與能耗協(xié)同、通用架構(gòu)如何與場(chǎng)景多元化匹配、技術(shù)迭代如何與生態(tài)步伐協(xié)同,構(gòu)成當(dāng)前企業(yè)應(yīng)用算力過程中亟待解決的問題。 ? 深耕數(shù)據(jù)中心領(lǐng)域多年,英特爾始終以技術(shù)創(chuàng)新基石,行業(yè)提供
    的頭像 發(fā)表于 03-08 09:20 ?543次閱讀

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型進(jìn)行了深度優(yōu)化。 這一優(yōu)化舉措使得AI開發(fā)者能夠以更低的成本和更高的效率實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化。英特爾Gaudi 2D AI
    的頭像 發(fā)表于 02-10 11:10 ?624次閱讀

    DeepSeek發(fā)布Janus Pro模型英特爾Gaudi 2D AI加速器優(yōu)化支持

    Gaudi 2D AI加速器現(xiàn)已針對(duì)該模型進(jìn)行了全面優(yōu)化。這一優(yōu)化舉措使得AI開發(fā)者能夠更輕松地實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化,從而有效滿足行業(yè)應(yīng)
    的頭像 發(fā)表于 02-08 14:35 ?621次閱讀

    英特爾2024產(chǎn)品年鑒:AI軟硬件的融合發(fā)展

    在2024年里,英特爾收獲了一系列軟件突破和硬件革新,也收獲了生態(tài)伙伴的支持與陪伴。通過不斷迭代的硬件產(chǎn)品,和持續(xù)開放的軟件生態(tài),從數(shù)據(jù)中心
    的頭像 發(fā)表于 12-31 17:28 ?436次閱讀
    <b class='flag-5'>英特爾</b>2024產(chǎn)品年鑒:<b class='flag-5'>AI</b>與<b class='flag-5'>軟硬件</b>的融合<b class='flag-5'>發(fā)展</b>

    使用英特爾AI PCYOLO模型訓(xùn)練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進(jìn)行模型訓(xùn)練了。
    的頭像 發(fā)表于 12-09 16:14 ?1594次閱讀
    使用<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b> PC<b class='flag-5'>為</b>YOLO<b class='flag-5'>模型</b>訓(xùn)練<b class='flag-5'>加速</b>

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價(jià)格提供卓越的性能與價(jià)值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負(fù)載提供加速。其配備的英特爾Xe矩陣計(jì)算引擎(XMX),
    的頭像 發(fā)表于 12-07 10:16 ?1429次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器和英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?594次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    加速器等先進(jìn)硬件。此外,它還結(jié)合了OPEA開放軟件平臺(tái),確保了方案的靈活性和兼容性。 作為該方案的首個(gè)落地實(shí)踐,英特爾攜手新華三共同發(fā)布了新華三AIGC靈犀一體機(jī)。這款一體機(jī)充分利用了英特爾
    的頭像 發(fā)表于 12-02 10:48 ?919次閱讀

    英特爾助力百度智能云千帆大模型平臺(tái)加速LLM推理

    “大模型在各行業(yè)的廣泛應(yīng)用驅(qū)動(dòng)了新一輪產(chǎn)業(yè)革命,也凸顯了在AI算力方面的瓶頸。通過攜手英特爾釋放英特爾 至強(qiáng) 可擴(kuò)展處理器的算力潛力,我們
    的頭像 發(fā)表于 11-25 16:59 ?950次閱讀
    <b class='flag-5'>英特爾</b>助力百度智能云千帆大<b class='flag-5'>模型</b>平臺(tái)<b class='flag-5'>加速</b>LLM推理

    英特爾攜手百度智能云加速AI落地

    在2024年9月25日-26日舉辦的2024百度云智大會(huì)上,作為大會(huì)的聯(lián)合主辦方,英特爾帶來了AI全棧軟硬件方案,深入講解了如何基于英特爾 至強(qiáng) 處理器和新一代極具性價(jià)比的
    的頭像 發(fā)表于 10-12 10:08 ?854次閱讀

    英特爾IT的發(fā)展現(xiàn)狀和創(chuàng)新動(dòng)向

    AI模型的爆發(fā),客觀上給IT的發(fā)展帶來了巨大的機(jī)會(huì)。作為把IT發(fā)展上升為戰(zhàn)略高度的英特爾,自然在推動(dòng)
    的頭像 發(fā)表于 08-16 15:22 ?957次閱讀

    英特爾軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用

    軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用,在簡(jiǎn)化部署和支持?jǐn)U展的同時(shí),增強(qiáng)其上下文感知能力和實(shí)時(shí)響應(yīng)性能。 1 您的應(yīng)用量身定制GenAI ChatGPT的面世改變了AI發(fā)展格局。企
    的頭像 發(fā)表于 07-24 15:12 ?889次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>軟硬件</b>構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用

    英特爾以生成式AI RAG解決方案,巴黎奧運(yùn)健兒提供便捷體驗(yàn)

    英特爾通過開放、易獲取的AI系統(tǒng)和生態(tài)協(xié)作,以創(chuàng)新的方式運(yùn)動(dòng)員提供支持,并助力企業(yè)客戶創(chuàng)造更多可能。
    的頭像 發(fā)表于 07-19 19:43 ?2066次閱讀
    <b class='flag-5'>英特爾</b>以生成式<b class='flag-5'>AI</b> RAG解決方案,<b class='flag-5'>為</b>巴黎奧運(yùn)健兒<b class='flag-5'>提供</b>便捷體驗(yàn)