chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

攜程攜手英特爾優(yōu)化AI推理性能,提升性能的同時(shí)降低TCO

英特爾中國 ? 來源:未知 ? 2023-06-09 20:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)文化和旅游部數(shù)據(jù)中心測算,2023年“五一”假期全國國內(nèi)旅游出游合計(jì)2.74億人次,同比增長70.83%,按可比口徑恢復(fù)至2019年同期的119.09%1。后疫情時(shí)代,旅游人數(shù)的激增與旅游場景的多元化,給人工智能AI)技術(shù)在旅游行業(yè)的應(yīng)用帶來更多機(jī)遇和挑戰(zhàn)。例如自然語言處理(NLP)、機(jī)器翻譯、計(jì)算機(jī)視覺、搜索排序等 AI 技術(shù)的快速發(fā)展和日臻成熟,可以為游客提供更便捷的服務(wù)和更精準(zhǔn)的內(nèi)容。

作為一站式旅行平臺,攜程旅行已經(jīng)將諸多AI 技術(shù)應(yīng)用于酒店、機(jī)票、自由行、跟團(tuán)游、簽證、玩樂、租車等旅游度假的多個(gè)業(yè)務(wù)線,為全球用戶提供一套完整的旅行產(chǎn)品、服務(wù)及差異化的旅行內(nèi)容等。為了在滿足業(yè)務(wù)需求的同時(shí)降低成本壓力,攜程構(gòu)建了基于英特爾至強(qiáng) 可擴(kuò)展處理器的 AI 推理算力平臺,并通過高性能算子庫、計(jì)算圖優(yōu)化、模型壓縮等方式提升 AI 推理性能。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

采用英特爾 至強(qiáng)解決方案

實(shí)現(xiàn)性能與經(jīng)濟(jì)性的更佳平衡

隨著 AI 應(yīng)用的不斷擴(kuò)展和深入,大型旅行服務(wù)平臺面臨的算力挑戰(zhàn)主要存在于兩個(gè)方面:

一方面,AI 技術(shù)正在日趨多樣化與復(fù)雜化,為了適應(yīng)不同的業(yè)務(wù)場景需求,企業(yè)常常需要融合使用傳統(tǒng)機(jī)器學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、Transformer 等深度學(xué)習(xí)模型結(jié)構(gòu),以及知識圖譜、圖神經(jīng)網(wǎng)絡(luò)等技術(shù)。同時(shí),AI模型的深度、寬度以及結(jié)構(gòu)復(fù)雜度也在不斷提升,增加了企業(yè)的開發(fā)門檻,也使得 AI算力調(diào)度、AI 性能優(yōu)化更具挑戰(zhàn)。

另一方面,智能化應(yīng)用正在迅速擴(kuò)張,需要由 AI 模型處理的數(shù)據(jù)也在不斷增長。例如內(nèi)容與廣告?zhèn)€性化推薦、實(shí)時(shí)風(fēng)控、機(jī)器翻譯、智能客服、圖像處理等領(lǐng)域正在越來越多地使用 AI 技術(shù),以從海量的數(shù)據(jù)中生成高價(jià)值的商業(yè)洞察,從而帶來了較高的算力基礎(chǔ)設(shè)施建設(shè)成本。與此同時(shí),上層應(yīng)用對于 AI 模型推理也有著特定的服務(wù)級別協(xié)議 (SLA) 要求。企業(yè)需要在滿足 SLA 要求的前提下,通過模型優(yōu)化等方式,更好地發(fā)揮硬件的性能潛力,降低算力基礎(chǔ)設(shè)施的總體擁有成本(TCO)。

面對上述挑戰(zhàn),企業(yè)首先要面臨硬件平臺的選擇問題:雖然基于獨(dú)立 GPU 的推理方案能夠提供強(qiáng)大的算力,但未必是一個(gè)經(jīng)濟(jì)的選擇。這是因?yàn)楠?dú)立 GPU 不僅采購或租用成本相對較高,而且通常是以專用服務(wù)器的模式進(jìn)行部署和運(yùn)維,帶來了較高的綜合成本??紤]到旅行服務(wù)中大量的 AI 推理場景所需要的性能經(jīng)過優(yōu)化能夠得到滿足,采用 CPU 的方案將更具成本效益。因此,攜程采用基于英特爾至強(qiáng) 可擴(kuò)展處理器的 AI 推理算力平臺,旨在為算法模型提供更全面易用、穩(wěn)定性更好、使用和維護(hù)成本更低的優(yōu)化解決方案。 英特爾至強(qiáng) 可擴(kuò)展處理器內(nèi)置人工智能加速功能,已針對工作負(fù)載進(jìn)行優(yōu)化,能夠?yàn)楦鞣NAI 應(yīng)用以及高密度基礎(chǔ)設(shè)施帶來一流的性能和內(nèi)存帶寬。同時(shí),采用矢量神經(jīng)網(wǎng)絡(luò)指令(VNNI) 的英特爾 深度學(xué)習(xí)加速(英特爾DL Boost),能夠有效提高 AI 推理的表現(xiàn),使其成為深度學(xué)習(xí)應(yīng)用的卓越基礎(chǔ)設(shè)施。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

構(gòu)建并優(yōu)化AI推理算力平臺

Bert-base推理時(shí)間由15毫秒降至6毫秒

在基于英特爾 至強(qiáng) 可擴(kuò)展處理器的硬件平臺層基礎(chǔ)上,攜程構(gòu)建了 AI 推理算力平臺,該平臺還包括引擎框架層、推理優(yōu)化層、算法模型、應(yīng)用場景。同時(shí),為了盡可能地提升 AI 推理性能,釋放硬件潛力,攜程進(jìn)行了推理優(yōu)化。主要的優(yōu)化思路為兩點(diǎn):一是通過調(diào)整/簡化模型結(jié)構(gòu),或改進(jìn)算法以降低算法復(fù)雜度;二是優(yōu)化軟件執(zhí)行效率,使用硬件優(yōu)勢特征,提升硬件執(zhí)行效率。 2d17463e-06be-11ee-962d-dac502259ad0.png

攜程基于英特爾 至強(qiáng) 可擴(kuò)展處理器的硬件平臺層基礎(chǔ)上

構(gòu)建 AI 推理算力平臺

攜程以機(jī)器翻譯應(yīng)用的 Transformer模型來測試其性能表現(xiàn)。在該測試中,攜程除了使用上述的優(yōu)化方法,還分割模型并使用 jit 跟蹤方法來提高性能。同時(shí),在batchsize 超過 16 個(gè)的情況下,使用 mm op 進(jìn)行優(yōu)化。攜程使用固定算例的平均響應(yīng)時(shí)延作為測試數(shù)據(jù),tokens 為 10,batchsize=1,Bert-base模型推理時(shí)間由優(yōu)化前的15.05毫秒降至優(yōu)化后的6.44毫秒2。 2d238bec-06be-11ee-962d-dac502259ad0.png

Bert-base 模型優(yōu)化前后的性能對比2

基于英特爾 至強(qiáng) 可擴(kuò)展平臺的基礎(chǔ)算力和深度的 AI 模型推理性能優(yōu)化,用戶將獲得的收益包括:在特定的 SLA 要求下,降低 AI 推理應(yīng)用的 TCO

在通過本輪優(yōu)化之后,攜程的 CPU 服務(wù)器 AI 推理性能得到提升,能夠滿足大量 AI 推理場景對于時(shí)延等 SLA 指標(biāo)的要求,避免了在昂貴的專用 AI 加速器方面的支出。

提升基礎(chǔ)設(shè)施的敏捷性與靈活性

通過本輪優(yōu)化,攜程能夠高效利用現(xiàn)有的 CPU 服務(wù)器,根據(jù)實(shí)際負(fù)載需求進(jìn)行靈活調(diào)度,而無需為 AI 推理新增需求部署專用服務(wù)器。

為 AI 推理性能優(yōu)化提供了標(biāo)準(zhǔn)的參考流程

本方案提供了一套標(biāo)準(zhǔn)、可自動(dòng)完成的參考模型優(yōu)化流程,能夠賦能更多的 AI 應(yīng)用。

攜程與英特爾的合作,驗(yàn)證了 AI 模型推理方案在英特爾 至強(qiáng) 可擴(kuò)展處理器上的應(yīng)用潛力,在成本、性能方面實(shí)現(xiàn)了平衡。同時(shí),隨著推理性能優(yōu)化技術(shù)的逐步提高,將極大地降低人工智能應(yīng)用的部署成本,加快AI應(yīng)用的落地速度并擴(kuò)充應(yīng)用場景,推動(dòng)人工智能行業(yè)的整體發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10271

    瀏覽量

    179151
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11213

    瀏覽量

    222730

原文標(biāo)題:攜程攜手英特爾優(yōu)化AI推理性能,提升性能的同時(shí)降低TCO

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實(shí)現(xiàn)從模型訓(xùn)練的深度突破
    的頭像 發(fā)表于 08-26 19:18 ?2542次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E <b class='flag-5'>AI</b>加速器為DeepSeek-V3.1提供加速支持

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5109次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴(kuò)展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速
    發(fā)表于 05-20 11:03 ?1662次閱讀

    1.9倍性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    關(guān)鍵項(xiàng)目中,性能表現(xiàn)卓越。測試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實(shí)現(xiàn)了高達(dá)1.9倍的顯著提升,這也充分顯示了至強(qiáng)6處理器作為現(xiàn)代AI
    的頭像 發(fā)表于 04-07 10:58 ?503次閱讀

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對比上代Meteor Lake,升級了模塊化結(jié)構(gòu)、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調(diào)度器、Xe2微架構(gòu)銳炫GPU、第四代NPU等,由此也帶來了CPU
    的頭像 發(fā)表于 04-02 15:47 ?1104次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多種圖像生成模型

    英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無法運(yùn)行推理怎么解決?

    使用英特爾?獨(dú)立顯卡與OpenVINO?工具套件時(shí)無法運(yùn)行推理
    發(fā)表于 03-05 06:56

    英特爾以太網(wǎng)新品:高性能與能效并重,帶來多樣化選擇

    和網(wǎng)絡(luò)適配器,以及英特爾以太網(wǎng)控制器E610和網(wǎng)絡(luò)適配器,旨在滿足企業(yè)、電信、云、邊緣、科學(xué)計(jì)算(HPC)和AI等領(lǐng)域日益增長的需求。這些新一代解決方案可以提供強(qiáng)勁的高性能連接,同時(shí)
    的頭像 發(fā)表于 02-25 20:17 ?417次閱讀

    英特爾推出具備高性能和能效的以太網(wǎng)解決方案

    和網(wǎng)絡(luò)適配器,以及英特爾以太網(wǎng)控制器E610和網(wǎng)絡(luò)適配器,旨在滿足企業(yè)、電信、云、邊緣、科學(xué)計(jì)算(HPC)和AI等領(lǐng)域日益增長的需求。這些新一代解決方案可以提供強(qiáng)勁的高性能連接,同時(shí)
    發(fā)表于 02-25 11:17 ?339次閱讀
    <b class='flag-5'>英特爾</b>推出具備高<b class='flag-5'>性能</b>和能效的以太網(wǎng)解決方案

    英特爾OpenVINO 2025.0正式發(fā)布

    生成式AI(GenAI)在模型質(zhì)量與應(yīng)用范圍上持續(xù)爆發(fā)式增長,DeepSeek 等頂尖模型已引發(fā)行業(yè)熱議,這種勢頭預(yù)計(jì)將在 2025年延續(xù)。本次更新聚焦性能提升、更多生成式AI 模型的
    的頭像 發(fā)表于 02-21 10:20 ?1656次閱讀
    <b class='flag-5'>英特爾</b>OpenVINO 2025.0正式發(fā)布

    英特爾至強(qiáng)6助力HPE Gen12,AI推理性能提升3倍!

    ,CPU處理器永遠(yuǎn)都是C位的存在,沒有它的基礎(chǔ)性支撐,其他一切都是空中樓閣。 當(dāng)然,CPU處理器也在積極適應(yīng)新的時(shí)代趨勢,既要不斷增強(qiáng)計(jì)算性能,也要低碳環(huán)保提高能效,但它們倆如同硬幣的正反面,不可能完美兼顧,那該怎么辦呢? 對此,英特爾的解決方案是兵分
    的頭像 發(fā)表于 02-18 14:18 ?514次閱讀
    <b class='flag-5'>英特爾</b>至強(qiáng)6助力HPE Gen12,<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b><b class='flag-5'>提升</b>3倍!

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型進(jìn)行了深度優(yōu)化。 這一優(yōu)化舉措使得AI開發(fā)者能夠以更低的成本和更高的效率實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化英特爾Gaudi 2D
    的頭像 發(fā)表于 02-10 11:10 ?918次閱讀

    DeepSeek發(fā)布Janus Pro模型,英特爾Gaudi 2D AI加速器優(yōu)化支持

    近日,DeepSeek公司正式發(fā)布了其最新的Janus Pro模型,該模型憑借其超強(qiáng)性能和高精度,迅速引起了業(yè)界的廣泛關(guān)注。 為了進(jìn)一步提升Janus Pro模型的應(yīng)用效率和降低成本,英特爾
    的頭像 發(fā)表于 02-08 14:35 ?900次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1285次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    英特爾酷睿Ultra 200V系列移動(dòng)處理器亮相CES 2025

    基于英特爾 vPro 平臺的全新英特爾 酷睿 Ultra 200V系列移動(dòng)處理器,為企業(yè)提供 AI 驅(qū)動(dòng)的生產(chǎn)力和提升的IT管理能力1。該產(chǎn)品不僅擁有卓越的
    的頭像 發(fā)表于 01-20 09:21 ?1666次閱讀

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動(dòng)力大會上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的第四代服務(wù)器實(shí)例,以打造彈性算力底座的產(chǎn)品化實(shí)踐。同時(shí),
    的頭像 發(fā)表于 12-23 14:05 ?1213次閱讀