數(shù)字信號處理技術(shù)無處不在。如今的設(shè)備常常配備數(shù)十個傳感器,這些傳感器采集的數(shù)據(jù)要經(jīng)過篩選與聚合處理后,才能為人工智能(AI)模型所用。隨著人工智能工作負載在各行各業(yè)中日益普及,嵌入式系統(tǒng)對強大且高效的信號處理能力的需求也與日俱增。這些計算密集型人工智能算法通??刂拼a量有限,主要在數(shù)據(jù)流上運行,并且要求具備硬實時性能,同時滿足低延遲的嚴格限制。
因此,數(shù)字信號處理器(DSP)成為了解決方案中不可或缺的關(guān)鍵部分。與通用處理器不同,DSP能夠并行執(zhí)行矢量化計算,從而最大限度地減少計算周期數(shù)和延遲。然而,增加矢量大小會占用更多的芯片面積,因此需要在性能與效率之間找到恰當?shù)钠胶狻?/p>
這正是行業(yè)需要更多選擇的原因所在。開發(fā)者在挑選DSP時,不僅要確保其能滿足特定應用的性能要求,還要使其符合給定的芯片面積和功耗預算限制。幸運的是,新思科技的ARC VPX產(chǎn)品系列最近進行了擴展,正好滿足了這一需求。
新型ARC VPX6處理器為該產(chǎn)品系列引入了1024位矢量處理功能,進一步豐富了現(xiàn)有的VPX系列,該系列還包括VPX5(512位)、VPX3(256位)和VPX2(128位)等不同版本。VPX6在將峰值性能提升至原來兩倍的同時,還能與VPX系列的其他成員保持完全的軟件兼容性。開發(fā)者只需對硬件進行升級,而無需重新編寫代碼,就能從一開始便實現(xiàn)性能的顯著提升。
ARC VPX DSP系列
ARC VPX DSP系列是專為低功耗、高吞吐量計算而設(shè)計的高性能矢量DSP。這些處理器廣泛應用于汽車傳感、人工智能視覺系統(tǒng)、雷達/激光雷達和工業(yè)自動化領(lǐng)域,在這些領(lǐng)域,對海量數(shù)據(jù)流進行實時處理至關(guān)重要。
早期的VPX處理器支持128位、256位和512位的矢量長度,這使得開發(fā)者能夠根據(jù)工作負載選擇最高效的處理配置。這些處理器具有魯棒的多核可擴展性,但隨著更高分辨率攝像頭、更密集傳感器陣列以及更復雜人工智能模型的出現(xiàn)導致數(shù)據(jù)量持續(xù)增長,許多應用對并行處理效率提出了更高的要求。
新型ARC VPX6通過引入1024位矢量處理功能,進一步擴充了VPX系列,其數(shù)據(jù)吞吐量相較于VPX5提升了一倍。VPX6在與之前VPX處理器保持向后兼容性的基礎(chǔ)上,提供了一種可擴展的高效解決方案,以滿足新一代人工智能和嵌入式系統(tǒng)的需求。
VPX6的突出優(yōu)勢
ARC VPX6的核心改進在于其引入了1024位矢量單指令多數(shù)據(jù)(SIMD)處理技術(shù),該技術(shù)顯著提高了計算效率。借助SIMD架構(gòu),VPX6能夠同時對多個數(shù)據(jù)點執(zhí)行單一操作,從而減少了所需的計算周期。與VPX5的512位處理能力(每周期可執(zhí)行64次單精度浮點運算)相比,VPX6的運算能力達到了其兩倍,每周期可執(zhí)行128次運算。這使得VPX6在圖像濾波、雷達批量快速傅里葉變換(FFT)、人工智能預處理以及傳感器融合等工作負載中表現(xiàn)出色,性能得到了顯著增強。
除了強大的原始計算能力外,ARC VPX6還配備了先進的直接內(nèi)存訪問(DMA)引擎,該引擎能夠確保數(shù)據(jù)持續(xù)不斷地流向處理器,避免出現(xiàn)空閑周期,從而最大限度地提高數(shù)據(jù)吞吐量。VPX6支持雙緩沖技術(shù),能夠有效地隱藏內(nèi)存延遲,從而最大限度地提高了計算效率。
值得注意的是,矢量處理受阿姆達爾定律的約束。那么,并行化的程度能夠達到多高,以及在哪個階段將任務(wù)分配給多個并行工作的內(nèi)核更為合適呢?這些問題的答案取決于具體的應用工作負載。而VPX6的出現(xiàn)為開發(fā)者提供了更多的選擇。
▲新思科技 ARC VPX 數(shù)字信號處理器 IP
可擴展性、可配置性與易用性
ARC VPX6完全向后兼容VPX2、VPX3和VPX5,能輕松集成到新設(shè)計或現(xiàn)有設(shè)計中。例如,新思科技提供了與矢量長度無關(guān)的庫,確保之前為VPX處理器編寫的遺留軟件無需修改,就能在VPX6上運行。這種兼容性縮短了開發(fā)周期,開發(fā)者不用修改現(xiàn)有代碼庫,就能輕松升級解決方案。與矢量長度無關(guān)的設(shè)計方法,使得基于相同的軟件基礎(chǔ)架構(gòu),能夠開發(fā)出滿足不同性能需求(從低端到高端)的完整產(chǎn)品系列。
與VPX系列的其他成員一樣,VPX6具有高度可配置性。例如,開發(fā)者可以輕松定義寄存器數(shù)量、L1和L2內(nèi)存大小等參數(shù),或者決定是否在架構(gòu)中集成數(shù)學和FFT加速器。這種靈活性使工程師能夠根據(jù)具體的應用需求定制架構(gòu),有效地避免了芯片面積和功耗的不必要開銷。
為了進一步提高可擴展性,VPX6提供了多種配置選項:單核(VPX6)、雙核(VPX6x2)和四核(VPX6x4)。這些完全集成的多核解決方案配備了共享的DMA引擎、內(nèi)存一致性機制、同步支持以及運行時庫。這使得開發(fā)者能夠根據(jù)特定的工作負載需求,對性能和能效進行優(yōu)化。
VPX系列的所有成員均采用ARC處理器擴展(APEX)專利技術(shù),允許開發(fā)者創(chuàng)建用戶自定義的標量和矢量指令。同時,它還支持集成定制的硬件加速器,在提升特定應用性能的同時,降低了功耗和內(nèi)存需求。VPX處理器還有豐富的預優(yōu)化庫,涵蓋DSP、線性代數(shù)和視覺處理領(lǐng)域,其中包括專為OpenCV風格操作定制的視覺內(nèi)核。這些庫提供了現(xiàn)成的軟件功能,如顏色轉(zhuǎn)換、解算器、邊緣檢測、物體跟蹤、矩陣變換和FFT等。
為VPX6設(shè)計的新功能,包括能夠處理長內(nèi)存延遲的增強型DMA,以及對人工智能應用緊湊型數(shù)據(jù)存儲新行業(yè)標準OCP-MX的支持,也將推廣到整個VPX系列。
VPX6具有重大影響力的應用領(lǐng)域
ARC VPX6為開發(fā)者帶來了諸多優(yōu)勢,非常適合用于眾多實時、高性能信號處理應用:
汽車傳感器處理:VPX6為高級駕駛輔助系統(tǒng)(ADAS)提供了有力支持。其高吞吐量的矢量化計算和優(yōu)化的SIMD處理功能,能夠高效地處理來自多個傳感器的攝像頭數(shù)據(jù),實時識別物體、車道標線和行人。同樣,在自動駕駛汽車的雷達和激光雷達數(shù)據(jù)處理方面,VPX6能夠加速物體檢測和距離估算,從而提升基于人工智能的決策能力。
工業(yè)和智能攝像頭:VPX6能夠?qū)崿F(xiàn)高速圖像濾波、降噪和特征增強。這些功能為先進的視覺處理提供了有力支持,減少甚至消除了對專用外部處理器的依賴。
人工智能和機器學習工作負載:VPX6可作為高速預處理器,在將數(shù)據(jù)傳遞給神經(jīng)處理單元(NPU)(如新思科技ARC NPX)之前對數(shù)據(jù)進行優(yōu)化處理。通過處理計算密集型濾波和特征提取任務(wù),VPX6能夠顯著提高推理效率,減少人工智能工作負載中的瓶頸問題。借助集成SDK(內(nèi)含基于ONNX的神經(jīng)網(wǎng)絡(luò)編譯器),人工智能任務(wù)能在VPX和NPX之間自動分配。由VPX和NPX組成的人工智能子系統(tǒng),結(jié)合了人工智能加速器的強勁性能以及強大DSP的前瞻性和靈活性。
安全實現(xiàn):上述許多應用都對信息安全和軟件安全有著嚴格的認證要求。因此,VPX系列的所有成員都提供了功能安全(FS)版本,該版本不僅通過了ISO 26262 ASIL信息安全認證,還符合ISO/SAE 21434網(wǎng)絡(luò)安全標準。經(jīng)過安全認證的硬件,搭配經(jīng)過安全認證的編譯器、運行時環(huán)境和計算庫,確保了系統(tǒng)安全穩(wěn)定。
將數(shù)字信號處理提升到新高度
新思科技的ARC VPX6將數(shù)字信號處理技術(shù)提升至全新的水平。它在將VPX5的性能提升一倍的同時,減少了計算周期和功耗并且保持了軟件的完全兼容性,便于開發(fā)者采用。VPX6具有更高的可擴展性和效率,為開發(fā)者提供了更大的靈活性,使他們能夠根據(jù)特定的工作負載優(yōu)化功耗、性能和面積(PPA)。
展望未來,新思科技將繼續(xù)推進ARC VPX處理器系列的發(fā)展,以滿足人工智能和嵌入式系統(tǒng)不斷變化的需求。通過提供行業(yè)領(lǐng)先的工具、優(yōu)化的庫以及便捷的集成選項,新思科技將助力開發(fā)者突破高性能信號處理的界限,實現(xiàn)更多的創(chuàng)新。
-
處理器
+關(guān)注
關(guān)注
68文章
20069瀏覽量
242797 -
數(shù)字信號
+關(guān)注
關(guān)注
2文章
1008瀏覽量
48834 -
新思科技
+關(guān)注
關(guān)注
5文章
898瀏覽量
52403
原文標題:實時響應“快人一步”,高效低耗“省出境界”: 新思科技ARC VPX6 1024位矢量處理器登場
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【VPX650 】青翼凌云科技基于 VPX 系統(tǒng)架構(gòu)的 VU13P FPGA+ZYNQ SOC 超寬帶信號處理平臺

【VPX315】青翼凌云科技基于 3U VPX 總線架構(gòu)的 JFMQL100TAI + FT-M6678 智能信號處理平臺

【VPX637】青翼凌云科技基于 XCKU115 FPGA+ZU15EG MPSOC 的 6U VPX 雙 FMC 接口通用信號處理平臺

【 VPX638】青翼凌云科技基于KU115 FPGA+C6678 DSP的6U VPX雙FMC接口通用信號處理平臺

Andes晶心科技推出AndesCore 46系列處理器家族
國產(chǎn)化板卡設(shè)計原理圖:2274-基于FMC接口的JFM7VX690T36的3U VPX信號處理板

2025年南京郵電大學與新思科技ARC處理器課程競賽圓滿結(jié)束
VPX處理板設(shè)計原理圖:9-基于DSP TMS320C6678+FPGA XC7V690T的6U VPX信號處理卡 C6678板卡, XC7VX690T板卡, VPX處理板

新思科技攜手上海大學助力嵌入式人才培養(yǎng)
HXS320F28027數(shù)字信號處理器(32位RISC-V DSP)
Cadence推出Tensilica NeuroEdge 130 AI協(xié)處理器
新思科技推出基于Arm服務(wù)器原生運行的Virtualizer虛擬仿真技術(shù)
聆思科技獲得Ceva-Waves Wi-Fi 6 IP授權(quán)
Andes晶心科技推出D45-SE RISC-V處理器
基于DSP TMS320C6678+FPGA XC7V690T的6U VPX信號處理卡

評論