曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

行業(yè)觀察——邊緣AI芯片架構(gòu)的思考:為何可擴展GPU架構(gòu)值得關(guān)注

馬華1 ? 來源:北京華興萬邦管理咨詢有 ? 作者:北京華興萬邦管理 ? 2025-04-18 09:33 ? 次閱讀

作者:北京華興萬邦管理咨詢有限公司 翔煜 商瑞

隨著大模型在不斷演進的同時將推理應(yīng)用大規(guī)模推向邊緣和端點設(shè)備,以及物聯(lián)網(wǎng)智化、具身智能AI智能體(AI Agent)和物理AI等新的AI應(yīng)用場景和模式的快速涌現(xiàn),AI賦能設(shè)備的主控芯片設(shè)計師正面臨著全新的挑戰(zhàn)。尤其是對于邊緣和端點設(shè)備,它們既可能成為大模型的承載設(shè)備,也可能是用智能去為應(yīng)用提供更好的核心功能,新的產(chǎn)品定義方向使主芯片架構(gòu)師不得不去思考,其芯片在如何應(yīng)對大模型快速演進的同時,還能實現(xiàn)用智能手段賦能傳統(tǒng)應(yīng)用和實現(xiàn)新興功能。

因此,在追求極致性能、功耗和面積(PPA)的模式之外,架構(gòu)師們需要富有前瞻性地去選擇高性能、高靈活性、可升級和開發(fā)者(生態(tài))友好的架構(gòu)。我們不妨先回顧AI發(fā)展的歷程,從感知AI到生成式AI,再到智能體AI和物理AI,其應(yīng)用場景不斷拓展。在感知AI階段,Al技術(shù)在語音識別、深度推薦系統(tǒng)和醫(yī)學(xué)影像等領(lǐng)域取得顯著進展;生成式AI在數(shù)字營銷和內(nèi)容創(chuàng)作方面發(fā)揮了重要作用;智能體AI為編程、客戶服務(wù)、患者護理提供助力;物理AI推動了自動駕駛汽車和通用機器人發(fā)展。

wKgZO2gA73OAWmsjAASaugnydGA085.png

伴隨著AI技術(shù)的發(fā)展,在傳統(tǒng)的CPUGPUFPGA等計算技術(shù)之外,諸如TPU、NPU 和DPU等專門針對特定算法或者模型的新型硬件數(shù)據(jù)處理加速器也開始出現(xiàn),它們帶來高效率因而在許多場景中得到了應(yīng)用。與此同時,AI技術(shù)不斷向新的場景和應(yīng)用廣泛滲透,使得面向特定模型和場景的NPU等架構(gòu)難以應(yīng)對模型的變化和場景的多樣化,從而使傳統(tǒng)的 靈活性更高的CPU和GPU架構(gòu)依舊在計算領(lǐng)域占據(jù)重要地位。

但是,AI技術(shù)的進步和新場景的出現(xiàn),正在迫使半導(dǎo)體知識產(chǎn)權(quán)(IP)提供商和芯片設(shè)計公司快速做出變化,無論是采用傳統(tǒng)架構(gòu)的廠商,還是新的xPU提供商都需要尊重產(chǎn)業(yè)規(guī)律。華興萬邦亦認(rèn)為,從技術(shù)經(jīng)濟學(xué)和企業(yè)實際經(jīng)營來看,高額的研發(fā)費用和市場營銷費用是多數(shù)芯片設(shè)計企業(yè)面臨的最重要費用,而靈活可擴展的架構(gòu)可以覆蓋更廣的市場并可以實現(xiàn)更長的產(chǎn)品生命周期,它們是攤銷這些費用以提升盈利能力的重要手段。

架構(gòu)創(chuàng)新迫在眉睫

Imagination Technologies中國業(yè)務(wù)發(fā)展負(fù)責(zé)人黃音在慕尼黑電子展AI技術(shù)創(chuàng)新論壇演講中分析道:“當(dāng)前主芯片設(shè)計不僅需要芯片企業(yè)投入大量研發(fā)資源,更需要協(xié)調(diào)生態(tài)合作伙伴的技術(shù)路線。面對AI算法快速迭代的挑戰(zhàn),行業(yè)在探索創(chuàng)新架構(gòu)的同時,仍需重視經(jīng)過長期驗證的基礎(chǔ)計算架構(gòu)價值。以GPU為例,其架構(gòu)在保持高并行計算優(yōu)勢的同時,新一代設(shè)計正通過模塊化擴展能力(如可配置Shader集群、彈性內(nèi)存子系統(tǒng))來適應(yīng)不同AI工作負(fù)載需求。作為專注圖形計算領(lǐng)域的IP廠商,Imagination觀察到,理想的AI加速架構(gòu)需要在三個維度取得平衡:支持細(xì)粒度并行的計算單元設(shè)計、滿足算法動態(tài)調(diào)整的可配置性,以及維持開發(fā)工具鏈的持續(xù)兼容性?!?/p>

wKgZO2gA73GAeQkGAAiK6llNXSE700.png

“擴展能力是Imagination GPU開發(fā)演進的方向:在具備強大的渲染能力的同時,融合AI并行計算能力,在邊緣AI的場景下能提供靈活又高效的算力。所以,Imagination將幫助芯片設(shè)計人員發(fā)現(xiàn)真正的破局點,幫助他們?nèi)?gòu)建一個可以持續(xù)適配模型和算法演進、以及支持新興應(yīng)用的架構(gòu)平臺——而不是為某個模型做一次性的‘專用硬件定制’,從而避免硬件(處理器)總是費力費錢跟著算法跑的問題?!秉S音補充道。

Imagination正在幫助客戶導(dǎo)入更加靈活的架構(gòu)。以該公司不久前發(fā)布的Imagination DXTP GPU IP為例,它采用了先進的平衡架構(gòu),增加了緩存和系統(tǒng)級帶寬,實現(xiàn)了更高的持續(xù)性能,幾何吞吐量提高50%,不僅能夠輕松同時處理圖形和計算任務(wù),而且其功率效率還較其前序產(chǎn)品提升了20%,為邊緣AI提供了理想的GPU平臺。DXTP GPU已經(jīng)被全球知名科技公司采用,用于對AI 多數(shù)據(jù)類型處理、計算任務(wù)加速和本地內(nèi)存的支持。

wKgZPGgA73CAHuMCAAKIutK_0Zs823.png

三個落地是成功的關(guān)鍵

當(dāng)然,對于芯片設(shè)計師而言,這需要做到三個必須“落地”,即模型算法落地、垂直功能落地和開放生態(tài)落地。針對模型算法落地,Imagination的突破點是堅持構(gòu)建一個通用可編程的并行架構(gòu)平臺,并通過開放的編譯器和推理后端(backend),支持客戶軟硬件協(xié)同設(shè)計和提供適配路徑,幫助其客戶把諸如Transformer、Diffusion類模型和前沿算法快速落地到GPU上。為此該公司將幫助客戶認(rèn)識到在算法不斷演化的時代,架構(gòu)的“適配力”遠(yuǎn)比一時的TOPS值更重要。

在垂直功能落地方面,Imagination在移動、汽車、云和桌面等領(lǐng)域深耕了數(shù)十年,積累了豐富的經(jīng)驗和許多創(chuàng)新的支撐性技術(shù),可以幫助客戶去避開其中的潛在風(fēng)險和快速在領(lǐng)域內(nèi)創(chuàng)造優(yōu)勢,這可以從該公司的D系列GPU IP的產(chǎn)品功能創(chuàng)新上可以看出其垂直領(lǐng)域功能落地能力。例如,DXT GPU是Imagination面向移動應(yīng)用、高端游戲和專業(yè)圖形設(shè)計等應(yīng)用推出的新一代GPU IP,它不僅率先在移動平臺上提供了可擴展的光線追蹤功能,還有2D雙速率紋理映射等多項可以提升處理速度和優(yōu)化內(nèi)存帶寬的技術(shù)。

為了幫助桌面和數(shù)據(jù)中心客戶實現(xiàn)高性能的云端GPU創(chuàng)新解決方案,Imagination推出了DXD GPU IP,首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著提升了DXD與Windows平臺上的應(yīng)用程序和游戲的兼容性。同時,Imagination的硬件虛擬化技術(shù) HyperLane支持在單個GPU上安全且獨立地運行多個操作系統(tǒng),極大地提升了服務(wù)器的使用效率,降低了云游戲的運營成本,并為云游戲行業(yè)的發(fā)展帶來了創(chuàng)新的運營模式。

Imagination為汽車智駕芯片提供的專用IP是該公司支持芯片設(shè)計企業(yè)垂直功能落地的又一個典范,血的教訓(xùn)換來了更加嚴(yán)格的安全法規(guī),使智駕芯片設(shè)計公司在算力、生態(tài)和生命周期之外,必須去認(rèn)真去考慮功能安全性。為了幫助芯片設(shè)計企業(yè)滿足全球汽車智能化需求,Imagination推出了DXS系列GPU,該系列IP不僅為智能駕駛艙和先進駕駛輔助(ADAS)等應(yīng)用所需SoC帶來匹配的算力,而且專為諸如汽車處理器等對功能安全性要求極為嚴(yán)苛的應(yīng)用,開發(fā)了結(jié)合GPU的計算模式特點并大幅降低成本的分布式功能安全機制(DSM)并通過了ASIL-B認(rèn)證。這為汽車和工業(yè)等越來越多需要GPU的圖形處理能力和計算能力的電子系統(tǒng)帶來了巨大的創(chuàng)新。

wKgZO2gA73GAANXqAALQdVGW_JY138.png

Imagination在支持客戶實現(xiàn)產(chǎn)業(yè)生態(tài)落地方面也同樣頗費心機,其GPU IP全面支持OpenCL、SYCL、Vulkan Compute等開放標(biāo)準(zhǔn),與PyTorch、TensorFlow等主流框架完美兼容。如Imagination通過與安卓生態(tài)系統(tǒng)合作,優(yōu)化對LiteRT的支持,為開發(fā)者提供豐富工具和示例,便于開發(fā)高性能AI應(yīng)用,充分展現(xiàn)了其GPU架構(gòu)的適配能力。這種開放生態(tài)簡化了新硬件與設(shè)備的集成流程,避免供應(yīng)商鎖定問題,使客戶能在不同平臺輕松部署。通過整合多方資源,Imagination可幫助客戶實現(xiàn)協(xié)同優(yōu)化,提升資源利用率和執(zhí)行效率,鞏固了其在GPU市場的領(lǐng)先地位,為企業(yè)應(yīng)對AI算法和產(chǎn)品快速迭代提供堅實支持。

總結(jié)與展望

大模型的下沉、算法創(chuàng)新和邊緣及端側(cè)AI的崛起為基于 GPU的主控芯片帶來了新的發(fā)展契機,在AI一體機、新物聯(lián)網(wǎng)、智能安防和自動駕駛等領(lǐng)域已經(jīng)出現(xiàn)了巨大的需求,這些設(shè)備對高性能的圖形處理和AI推理同時都有越來越多的需求,因此更靈活和可擴展的架構(gòu)可以使芯片設(shè)計公司的產(chǎn)品覆蓋更廣泛的市場領(lǐng)域,同時可以擁有更長的產(chǎn)品生命周期,也就有了更高的潛在盈利能力。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4889

    瀏覽量

    130473
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33711

    瀏覽量

    274464
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1961

    瀏覽量

    35639
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    北京市最值得去的十家半導(dǎo)體芯片公司

    代提升2-3倍,廣泛應(yīng)用于云計算與邊緣計算,2021年獨立后估值達(dá)130億元。 5. 奕斯偉(ESWIN) 領(lǐng)域 :RISC-V架構(gòu)與生態(tài)鏈 亮點 :聚焦RISC-V+AI芯片,覆蓋計
    發(fā)表于 03-05 19:37

    AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍(lán)海

    。這一變革不僅帶來了技術(shù)架構(gòu)的革新,更為產(chǎn)業(yè)發(fā)展開辟了新的增長空間。 傳統(tǒng)邊緣網(wǎng)關(guān)受限于計算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡單處理,大量原始數(shù)據(jù)需要回傳云端處理,導(dǎo)致響應(yīng)延遲和帶寬壓力。AI技術(shù)
    發(fā)表于 02-15 11:41

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛
    的頭像 發(fā)表于 12-24 10:55 ?721次閱讀

    芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

    原新一代Vitality GPU架構(gòu)顯著提升了計算性能,并支持多核擴展,以進一步提升性能。該GPU架構(gòu)集成了諸多先進功能,如一個可配置的張量
    的頭像 發(fā)表于 12-19 15:55 ?368次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對GPU架構(gòu)和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關(guān)鍵技術(shù)有了全新認(rèn)識。 GPU
    發(fā)表于 11-24 17:12

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺服務(wù)器配備多個GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對
    的頭像 發(fā)表于 11-05 16:20 ?960次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器<b class='flag-5'>AI</b>網(wǎng)絡(luò)<b class='flag-5'>架構(gòu)</b>設(shè)計

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第二篇閱讀心得:芯片拓?fù)鋵W(xué):并行擴展與CPU設(shè)計的巨頭對決

    更是達(dá)到了令人驚嘆的6GFLOPS/W。 3 處理器性能的未來與思考 隨著閱讀深入,我發(fā)現(xiàn)這兩章內(nèi)容與前4章的CPU微架構(gòu)知識自然銜接,又為后續(xù)GPU和NPU架構(gòu)的學(xué)習(xí)搭建了認(rèn)知框架。
    發(fā)表于 10-29 01:48

    邊緣計算架構(gòu)設(shè)計最佳實踐

    邊緣計算架構(gòu)設(shè)計最佳實踐涉及多個方面,以下是一些關(guān)鍵要素和最佳實踐建議: 一、核心組件與架構(gòu)設(shè)計 邊緣設(shè)備與網(wǎng)關(guān) 邊緣設(shè)備 :包括各種嵌入式
    的頭像 發(fā)表于 10-24 14:17 ?888次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解算力芯片。 全書共11章,
    發(fā)表于 10-15 22:08

    【「大模型時代的基礎(chǔ)架構(gòu)」閱讀體驗】+ 未知領(lǐng)域的感受

    再到大模型云平臺的構(gòu)建,此書都有提及和講解,循序漸進,讓讀者可以由點及面,由面到體的來認(rèn)識大數(shù)據(jù)模型的體系架構(gòu)。 前言中,作者通過提出幾個問題來引導(dǎo)讀者閱讀思考——分布式AI計算依賴哪些硬件特性
    發(fā)表于 10-08 10:40

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    ,即大模型專用AI超級計算機的中樞核心。 作者介紹: 濮元愷,曾就職于中關(guān)村在線核心硬件事業(yè)部,負(fù)責(zé)CPU和GPU類產(chǎn)品評測,長期關(guān)注GPGPU并行計算相關(guān)芯片
    發(fā)表于 09-02 10:09

    AI芯片的混合精度計算與靈活擴展

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)當(dāng)前,AI技術(shù)和應(yīng)用蓬勃發(fā)展,其中離不開AI芯片的支持。AI芯片是一個復(fù)雜而多樣的領(lǐng)域,根據(jù)其設(shè)計目標(biāo)和應(yīng)用場
    的頭像 發(fā)表于 08-23 00:08 ?5627次閱讀

    自動駕駛?cè)笾髁?b class='flag-5'>芯片架構(gòu)分析

    當(dāng)前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片架構(gòu)
    的頭像 發(fā)表于 08-19 17:11 ?2123次閱讀
    自動駕駛?cè)笾髁?b class='flag-5'>芯片</b><b class='flag-5'>架構(gòu)</b>分析

    ai服務(wù)器是什么架構(gòu)類型

    架構(gòu)AI服務(wù)器通常具有較高的通用性,可以運行各種人工智能算法。但是,CPU架構(gòu)AI服務(wù)器在處理大規(guī)模并行計算時,性能可能不如GPU
    的頭像 發(fā)表于 07-02 09:51 ?1624次閱讀

    進一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負(fù)載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型的加速性能,顯著提升大型多GPU系統(tǒng)的擴展性。每個英偉達(dá)Black
    發(fā)表于 05-13 17:16