chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何加速實(shí)時(shí)工作負(fù)載

Xilinx賽靈思官微 ? 來(lái)源:Xilinx賽靈思官微 ? 2025-09-10 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)于需要實(shí)時(shí)響應(yīng)的數(shù)據(jù)中心工作負(fù)載,性能不僅是指原始吞吐量或處理能力。挑戰(zhàn)在于:在保持吞吐量和能效的同時(shí),實(shí)現(xiàn)確定性時(shí)延。

CPUGPU 仍將是基礎(chǔ)架構(gòu)。但正如系統(tǒng)架構(gòu)師和數(shù)據(jù)中心運(yùn)營(yíng)商所發(fā)現(xiàn)的,在時(shí)延控制變得至關(guān)重要時(shí),傳統(tǒng)計(jì)算架構(gòu)往往會(huì)遇到困難。對(duì)于那些尋求對(duì)性能、功耗和時(shí)延進(jìn)行精細(xì)控制的用戶(hù)來(lái)說(shuō),采用硬件自適應(yīng)加速卡的自適應(yīng)計(jì)算正在成為一種戰(zhàn)略選項(xiàng)。

如果您正在探索如何加速實(shí)時(shí)工作負(fù)載,以下是一些基本考慮因素,有助于指導(dǎo)該過(guò)程,并著重介紹自適應(yīng)計(jì)算的用武之地。

針對(duì)實(shí)時(shí)(而非只是原始)吞吐量構(gòu)建

對(duì)于許多工作負(fù)載而言,可預(yù)測(cè)的響應(yīng)時(shí)間至關(guān)重要。無(wú)論是在高頻交易中,還是在數(shù)據(jù)流傳感器處理中,僅靠快是不夠的。您必須確??煽壳闆r下的快速性——無(wú)論輸入變化或系統(tǒng)負(fù)載如何。CPU 和 GPU 擁有類(lèi)似的編程模型,但依賴(lài)于線(xiàn)程調(diào)度和固定的存儲(chǔ)器緩存層次結(jié)構(gòu),這可能會(huì)影響低時(shí)延響應(yīng)時(shí)間。在這些架構(gòu)上實(shí)現(xiàn)確定性性能通常需要過(guò)度配置( overprovisioning )資源、微調(diào)( fine-tuning )軟件堆?;蚋綦x工作負(fù)載——這些都無(wú)法保證在不同系統(tǒng)負(fù)載下保持一致的時(shí)延。

由現(xiàn)場(chǎng)可編程門(mén)陣列( FPGA )或自適應(yīng) SoC(集成處理器子系統(tǒng)和專(zhuān)用 IP 的 FPGA)提供支持的加速卡通過(guò)提供硬件并行性和數(shù)據(jù)路徑優(yōu)化來(lái)解決這一問(wèn)題。該架構(gòu)可在電路層面進(jìn)行動(dòng)態(tài)編程,其中數(shù)據(jù)路徑經(jīng)過(guò)定制并“硬連接”至硅片本身,從而避免了不可預(yù)測(cè)的軟件指令周期。這種方法能夠?qū)崿F(xiàn)始終如一的低時(shí)延性能,并對(duì)數(shù)據(jù)的處理及移動(dòng)方式進(jìn)行精細(xì)控制。

內(nèi)存比您認(rèn)為的更重要

在這些性能敏感型環(huán)境中,內(nèi)存往往是隱藏的瓶頸。這不僅關(guān)乎加速器可用的內(nèi)存大小,還關(guān)乎內(nèi)存與計(jì)算的距離有多近,以及運(yùn)行時(shí)的訪(fǎng)問(wèn)速度有多快。這正是自適應(yīng)計(jì)算提供架構(gòu)優(yōu)勢(shì)的地方,尤其是與片上高帶寬存儲(chǔ)器( HBM )結(jié)合使用時(shí)。

HBM 是一種成熟的 3D 封裝 DRAM 技術(shù),具備每秒 TB 級(jí)的帶寬,可滿(mǎn)足數(shù)據(jù)密集型加速卡的需求。但 FPGA 和自適應(yīng) SoC 還為它們帶來(lái)了靈活應(yīng)變的存儲(chǔ)器層次結(jié)構(gòu),其中包括緊鄰處理邏輯、大小各異的嵌入式片上 SRAM。這可以實(shí)現(xiàn)快速、低時(shí)延的緩沖和中間存儲(chǔ),無(wú)需往返外部 DRAM。對(duì)于流式應(yīng)用或?qū)崟r(shí) AI 推理,這種接近性可降低時(shí)延并提升吞吐量,而不會(huì)阻塞流水線(xiàn)。

將您的加速卡直接連接至網(wǎng)絡(luò)

如果您的加速卡會(huì)處理來(lái)自網(wǎng)絡(luò)的流式數(shù)據(jù),為何不將其直接連接至網(wǎng)絡(luò)?傳統(tǒng)的加速卡依靠 PCIe接收傳入數(shù)據(jù)——通常經(jīng)過(guò)網(wǎng)絡(luò)接口卡( NIC )進(jìn)行路由,然后通過(guò)主機(jī) CPU 和系統(tǒng)內(nèi)存,最終到達(dá)加速器。這會(huì)帶來(lái)時(shí)延并消耗資源。

基于 FPGA 的網(wǎng)絡(luò)連接加速卡可直接連接以太網(wǎng),從而實(shí)現(xiàn)在數(shù)據(jù)到達(dá)時(shí)進(jìn)行實(shí)時(shí)處理。這也為高性能計(jì)算( HPC )環(huán)境提供了經(jīng)由以太網(wǎng)的可擴(kuò)展計(jì)算集群。

隨工作負(fù)載演進(jìn)調(diào)整您的加速卡,

而非基礎(chǔ)架構(gòu)

如今推動(dòng)您的基礎(chǔ)設(shè)施發(fā)展的工作負(fù)載與未來(lái)擴(kuò)展基礎(chǔ)架構(gòu)的工作負(fù)載將有所不同,而自適應(yīng)計(jì)算能夠隨著應(yīng)用發(fā)展而演進(jìn)。例如,在網(wǎng)絡(luò)防火墻中,加密協(xié)議和威脅檢測(cè)模型在不斷演進(jìn)。在同一服務(wù)器節(jié)點(diǎn)上部署壓縮、解壓縮和分析功能的存儲(chǔ)機(jī)架中,靈活的硬件可以隨著數(shù)據(jù)量的增長(zhǎng)或壓縮格式的改變而調(diào)整計(jì)算管線(xiàn)。

同一加速卡的架構(gòu)靈活性可以帶來(lái)長(zhǎng)期效益,不僅能實(shí)現(xiàn)實(shí)時(shí)性能,還能在工作負(fù)載需求變化時(shí)保持敏捷性——所有這些都在同一張卡、同一臺(tái)服務(wù)器和同一個(gè)機(jī)架上實(shí)現(xiàn)。

借助適合的硬件專(zhuān)業(yè)技術(shù)加速部署

要最大限度提升基于 FPGA 的加速卡性能,需要獲得 FPGA 開(kāi)發(fā)人員的幫助。無(wú)論是通過(guò)內(nèi)部團(tuán)隊(duì)、設(shè)計(jì)合作伙伴,還是預(yù)構(gòu)建 FPGA IP 的提供商,成功都取決于能否構(gòu)建或集成滿(mǎn)足嚴(yán)格時(shí)延、吞吐量和內(nèi)存訪(fǎng)問(wèn)要求的特定應(yīng)用邏輯。

為了加快部署速度,需要尋找一款可提供強(qiáng)大 FPGA 工具鏈、預(yù)驗(yàn)證 IP 和合作伙伴生態(tài)系統(tǒng)的平臺(tái),該平臺(tái)支持從 RTL 開(kāi)發(fā)到完整解決方案集成的所有環(huán)節(jié)——助力您的團(tuán)隊(duì)滿(mǎn)懷信心地從概念走向量產(chǎn)。

下一步

這些只是低時(shí)延和工作負(fù)載靈活應(yīng)變性至關(guān)重要的幾項(xiàng)考慮因素。盡管 CPU 和 GPU 仍然作為數(shù)據(jù)中心的核心,但它們并非永遠(yuǎn)最適合流式工作負(fù)載。自適應(yīng)平臺(tái)——例如集成 HBM 的 AMD Alveo V80 計(jì)算加速卡——?jiǎng)t提供了另一條途徑。憑借連網(wǎng)連接、自適應(yīng)硬件架構(gòu)和高帶寬存儲(chǔ)器,Alveo V80 計(jì)算加速卡可以在最關(guān)鍵時(shí)刻提供實(shí)時(shí)性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20143

    瀏覽量

    246657
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11213

    瀏覽量

    222777
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5506

    瀏覽量

    74621

原文標(biāo)題:在數(shù)據(jù)中心進(jìn)行實(shí)時(shí)加速

文章出處:【微信號(hào):賽靈思,微信公眾號(hào):Xilinx賽靈思官微】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【產(chǎn)品介紹】Altair PBS Professional HPC工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng)

    AltairPBSProfessional行業(yè)領(lǐng)先的HPC工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng)PBSProfessional是一款快速、強(qiáng)大的工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng),旨在提高生產(chǎn)
    的頭像 發(fā)表于 09-19 17:03 ?369次閱讀
    【產(chǎn)品介紹】Altair PBS Professional HPC<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>管理器和作業(yè)調(diào)度管理系統(tǒng)

    新思科技HAPS技術(shù)助力Skymizer加速HyperThought開(kāi)發(fā)

    隨著人工智能(AI)在各行各業(yè)的應(yīng)用場(chǎng)景日益豐富,半導(dǎo)體廠(chǎng)商面臨巨大壓力,他們需緊跟AI工作負(fù)載復(fù)雜度和專(zhuān)業(yè)化需求的步伐。從實(shí)時(shí)語(yǔ)言處理、視覺(jué)應(yīng)用到指令驅(qū)動(dòng)模型,AI工作
    的頭像 發(fā)表于 08-11 16:10 ?624次閱讀

    通過(guò)NVIDIA RTX PRO服務(wù)器加速企業(yè)工作負(fù)載

    從大語(yǔ)言模型(LLM)到代理式 AI 推理和物理 AI ,隨著 AI 工作負(fù)載的復(fù)雜性和規(guī)模不斷增加,人們對(duì)更快、擴(kuò)展性更高的計(jì)算基礎(chǔ)設(shè)施的需求空前強(qiáng)烈。滿(mǎn)足這些需求就要從基礎(chǔ)開(kāi)始重新思考系統(tǒng)架構(gòu)。
    的頭像 發(fā)表于 06-12 15:31 ?625次閱讀
    通過(guò)NVIDIA RTX PRO服務(wù)器<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>

    為什么要用電子負(fù)載?

    在現(xiàn)代電子設(shè)備的研發(fā)、測(cè)試和生產(chǎn)過(guò)程中,電子負(fù)載作為一種重要的測(cè)試工具,其應(yīng)用范圍廣泛且不可或缺。本文將從電子負(fù)載的定義、工作原理、優(yōu)勢(shì)以及實(shí)際應(yīng)用場(chǎng)景等方面,詳細(xì)探討為何需要使用電子負(fù)載
    的頭像 發(fā)表于 05-26 16:23 ?790次閱讀
    為什么要用電子<b class='flag-5'>負(fù)載</b>?

    動(dòng)力電池測(cè)試中的直流負(fù)載挑戰(zhàn)與應(yīng)對(duì)策略

    電池組(如100kWh以上)的充放電測(cè)試需負(fù)載設(shè)備支持持續(xù)高功率(≥500kW),導(dǎo)致設(shè)備體積龐大且散熱難度高。 動(dòng)態(tài)工況模擬精度不足:車(chē)輛實(shí)際運(yùn)行中,電池負(fù)載加速、制動(dòng)等場(chǎng)景快速變化(斜率≥5A/ms
    發(fā)表于 04-02 16:05

    NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項(xiàng)目,通過(guò)采用 NVIDIA 加速的 Apache Spark 企業(yè)得以自動(dòng)加速其數(shù)據(jù)中心規(guī)模的分析工作負(fù)載,從而節(jié)省數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 03-25 15:09 ?880次閱讀
    NVIDIA<b class='flag-5'>加速</b>的Apache Spark助力企業(yè)節(jié)省大量成本

    程控水冷負(fù)載解析

    程控水冷負(fù)載是一種通過(guò)計(jì)算機(jī)程序控制水冷系統(tǒng)對(duì)特定負(fù)載進(jìn)行冷卻的技術(shù),以下是關(guān)于它的解析: 基本原理 阻性負(fù)載產(chǎn)熱 :許多電氣設(shè)備如變壓器、電機(jī)、變頻器等在工作過(guò)程中,電流通過(guò)導(dǎo)線(xiàn)和線(xiàn)
    發(fā)表于 02-18 16:04

    NetApp革新塊存儲(chǔ),賦能現(xiàn)代工作負(fù)載

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)先企業(yè)NetApp?,近日宣布對(duì)其企業(yè)存儲(chǔ)產(chǎn)品組合進(jìn)行了重大更新,以更好地滿(mǎn)足現(xiàn)代工作負(fù)載的多樣化需求。此次更新重點(diǎn)擴(kuò)充了NetApp ASA A系列,推出了一系列專(zhuān)為加速
    的頭像 發(fā)表于 02-17 10:07 ?640次閱讀

    Arm技術(shù)助力Google Axion處理器加速AI工作負(fù)載推理

    由 Arm Neoverse V2 平臺(tái)賦能的 Google Axion 處理器已在 Google Cloud 上正式上線(xiàn),其中,C4A 是首款基于 Axion 的云虛擬機(jī),為基于 CPU 的人工智能 (AI) 推理和通用云工作負(fù)載實(shí)現(xiàn)了顯著的性能飛躍。
    的頭像 發(fā)表于 02-14 14:11 ?922次閱讀
    Arm技術(shù)助力Google Axion處理器<b class='flag-5'>加速</b>AI<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>推理

    HPC工作負(fù)載管理的關(guān)鍵要素

    HPC工作負(fù)載管理是一個(gè)復(fù)雜而精細(xì)的過(guò)程,涉及資源分配、作業(yè)調(diào)度、性能監(jiān)控與優(yōu)化以及故障處理與恢復(fù)等多個(gè)關(guān)鍵要素。下面,AI部落小編帶您了解HPC工作負(fù)載管理的關(guān)鍵要素。
    的頭像 發(fā)表于 02-08 09:53 ?530次閱讀

    亞馬遜云科技發(fā)布Amazon Q Developer,助力工作負(fù)載轉(zhuǎn)型

    在近日舉行的2024亞馬遜云科技re:Invent全球大會(huì)上,一項(xiàng)旨在加速大規(guī)模傳統(tǒng)工作負(fù)載轉(zhuǎn)型的新功能——Amazon Q Developer,正式亮相。這款功能強(qiáng)大的軟件開(kāi)發(fā)生成式人工智能(AI
    的頭像 發(fā)表于 12-26 11:32 ?882次閱讀

    燃料電池測(cè)試負(fù)載如何進(jìn)行負(fù)載測(cè)試?

    、空氣供應(yīng)系統(tǒng)、冷卻系統(tǒng)、負(fù)載模擬器等。確保所有設(shè)備正常工作,連接正確。 設(shè)定測(cè)試參數(shù):根據(jù)燃料電池的額定工況和實(shí)際應(yīng)用需求,設(shè)定測(cè)試參數(shù),如溫度、壓力、燃料濃度、負(fù)載電流等。這些參數(shù)將對(duì)燃料電池
    發(fā)表于 12-16 15:53

    深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

    ,一個(gè)新的競(jìng)爭(zhēng)力量——LPU(Language Processing Unit,語(yǔ)言處理單元)已悄然登場(chǎng),LPU專(zhuān)注于解決自然語(yǔ)言處理(NLP)任務(wù)中的順序性問(wèn)題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異,并深入分析它們的架構(gòu)
    的頭像 發(fā)表于 12-09 11:01 ?3898次閱讀
    深度學(xué)習(xí)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>中GPU與LPU的主要差異

    燃料電池測(cè)試負(fù)載工作原理是什么?

    ,燃料電池的性能參數(shù)如輸出電壓、電流、功率等需要通過(guò)專(zhuān)門(mén)的測(cè)試設(shè)備進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析。 燃料電池測(cè)試負(fù)載的主要作用是模擬燃料電池在實(shí)際工作過(guò)程中的負(fù)載情況,以便更準(zhǔn)確地評(píng)估其性能。測(cè)試
    發(fā)表于 12-06 16:31

    如何選擇適合的交流負(fù)載箱?

    。不同類(lèi)型的負(fù)載對(duì)設(shè)備的影響不同,因此需要根據(jù)實(shí)際情況進(jìn)行選擇。 負(fù)載容量:負(fù)載容量是指負(fù)載箱能夠承受的最大負(fù)載電流。選擇時(shí)應(yīng)根據(jù)實(shí)際需求確
    發(fā)表于 12-03 10:58