久久99国产精品,在线观看无码欧美电影

電子發(fā)燒友網(wǎng)報道（文/黃晶晶）在日前舉行的2025集成電路發(fā)展論壇(成渝)暨三十一屆集成電路設(shè)計業(yè)展覽會(ICCAD-Expo2025)上，安謀科技產(chǎn)品總監(jiān)鮑敏祺接受行業(yè)媒體采訪，談及最新發(fā)布的周易X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。

圖：安謀科技產(chǎn)品總監(jiān)鮑敏祺

周易X3 NPU IP正當(dāng)時

安謀科技周易X3 NPU IP面向端側(cè)AI落地需求，基于專為大模型的DSP+DSA架構(gòu)，協(xié)同AI軟件平臺，可應(yīng)用于加速卡、智能座艙、具身智能、ADAS、AI PC等設(shè)備為其提供AI計算核芯。

該產(chǎn)品支持CNN與Transformer模型架構(gòu)，單Cluster最高支持4核配置，可提供8~80 FP8TFLOPS靈活算力范圍。其單核帶寬達(dá)256GB/s，相較于上一代周易產(chǎn)品在同等工藝下FP16算力提升16倍，計算核心帶寬提升4倍，Softmax與LayerNorm性能提升超過10倍，多核算力線性度達(dá)70%~80%。

該產(chǎn)品具備多項核心技術(shù)優(yōu)勢，包括通用與專用計算單元深度融合的DSP+DSA架構(gòu)；支持橫向擴(kuò)展的多核設(shè)計與層級化內(nèi)存互連方案；軟硬件協(xié)同優(yōu)化的任務(wù)調(diào)度機(jī)制；同時面向開發(fā)者提供開放的生態(tài)系統(tǒng)，支持硬件自定義接口與軟件層面的算子擴(kuò)展，增強(qiáng)平臺適配性與應(yīng)用靈活性。

鮑敏祺表示，周易NPU的核心優(yōu)勢根植于研發(fā)階段對軟件生態(tài)的巨大投入，成熟的軟件體系與完善的生態(tài)布局，構(gòu)成了其立足市場的核心競爭力。

在端側(cè) AI 領(lǐng)域，當(dāng)行業(yè)聚焦于同工藝下馮諾依曼架構(gòu)相差無幾的面積與功耗指標(biāo)時，周易NPU走出差異化路線。產(chǎn)品面向大模型重點(diǎn)強(qiáng)化了浮點(diǎn)支持能力。這并非簡單集成 FP8浮點(diǎn)等計算單元，更關(guān)鍵的是攻克特定精度下模型穩(wěn)定運(yùn)行的量化相關(guān)技術(shù)難題。團(tuán)隊融入 W4A16、W4A8等一系列計算范式，通過降低神經(jīng)網(wǎng)絡(luò)模型的數(shù)值表達(dá)位寬來減少計算量、內(nèi)存占用和功耗，同時盡量保持模型性能，從而讓浮點(diǎn)運(yùn)算與大模型適配。

周易NPU 的推出時機(jī)，源于一年半前的產(chǎn)品定義與對市場趨勢的精準(zhǔn)預(yù)判。彼時，端側(cè) AI 的價值尚存在爭議，全球 AI 應(yīng)用還普遍依賴云端算力。而當(dāng)下，端側(cè) AI 的發(fā)展必要性已然凸顯，這既順應(yīng)行業(yè)風(fēng)向，也契合國內(nèi)市場的特殊需求。

從行業(yè)趨勢來看，今年3月起國際大廠紛紛轉(zhuǎn)向端側(cè)AI賽道，釋放出明確的技術(shù)信號。從國內(nèi)市場來看，面臨著與國外不同的發(fā)展環(huán)境，例如在算力卡領(lǐng)域，國外已采用3 納米工藝，而由于工藝限制，國內(nèi)大算力芯片（如 GPU）的單卡性能僅為國際先進(jìn)水平的 1/5。

同時，中國龐大的用戶群體，也對算力供給提出更高要求。從前些年2T、4T 的算力需求，到如今 8T 乃至更高的算力訴求，市場對端側(cè)算力的需求持續(xù)攀升。以運(yùn)行 Llama2 7B 模型為例，僅支撐 256token 的對話功能，算上50%利用率，理論上就需要 3.2TFLOPS 的算力，算力需求的增長可見一斑。正是基于對行業(yè)趨勢的深刻洞察，以及對客戶真實需求的精準(zhǔn)把握，安謀科技認(rèn)為當(dāng)下正是周易NPU 推向市場的最佳時機(jī)。

生態(tài)伙伴協(xié)同

鮑敏祺表示，從生態(tài)上來看不同類型企業(yè)在AI 賽道的側(cè)重點(diǎn)各有不同。算法公司更關(guān)注如何通過高效的 AI 算法，在具體業(yè)務(wù)場景中創(chuàng)造效益、提升效率，底層的算力與芯片并非其關(guān)注的核心；SoC公司則聚焦快速go to market的目標(biāo)，部分企業(yè)選擇自研算法，更多企業(yè)則傾向于挑選適配的 IP 來加速產(chǎn)品市場化進(jìn)程。無論是算法公司的效率訴求，還是SoC公司的市場化需求，最終都指向IP高效交付與快速推向市場的核心能力，而這正是安謀科技踐行 AI Arm China 戰(zhàn)略的發(fā)力點(diǎn)。

從行業(yè)趨勢來看，AI 算法正逐步走向收斂。以往 CNN 等傳統(tǒng)模型遷移過程中，基于cuda編寫的算子往往面臨遷移難題。如今，無論是英偉達(dá)向上層 Python、應(yīng)用層MaaS延伸，還是 OpenAI 等企業(yè)的技術(shù)推動，國內(nèi)廠商都形成較高的適配統(tǒng)一性。大模型的運(yùn)行門檻已大幅降低，僅需支持幾十個左右的算子即可實現(xiàn)大模型部署，所需計算量相較以往大幅減少。與此同時，行業(yè)也正經(jīng)歷從GPGPU 向 ASIC AI 的轉(zhuǎn)型，博通等企業(yè)的快速發(fā)展印證了這一趨勢。專用架構(gòu)能更好地突破GPGPU的能效天花板，實現(xiàn)更優(yōu)的能效與面積表現(xiàn)。

端側(cè)NPU技術(shù)趨勢

伴隨 AI 技術(shù)的深入演進(jìn)，端側(cè) NPU 的發(fā)展方向逐漸清晰，其未來趨勢將圍繞云邊端協(xié)同、通用性提升、專用算力強(qiáng)化三大核心展開，同時在物理工藝與算力功耗的限制下，探尋效率與靈活性的最優(yōu)解。
鮑敏祺談到，以機(jī)器人領(lǐng)域為例，云端負(fù)責(zé)統(tǒng)籌規(guī)劃，邊側(cè)承擔(dān)協(xié)調(diào)部署，端側(cè)聚焦執(zhí)行落地。在這一體系中，國外憑借先進(jìn)算力優(yōu)勢，可通過持續(xù)堆疊硬件提升性能。國內(nèi)則受限于工藝天花板，難以無限突破物理邊界，因此云邊端協(xié)同成為破局關(guān)鍵。

算力與功耗的限制，進(jìn)一步框定端側(cè) NPU 的發(fā)展邊界。在電池技術(shù)未出現(xiàn)革命性突破的前提下，短期之內(nèi)端側(cè) AI難以復(fù)刻云端的超大算力規(guī)模。因此，在有限算力范圍內(nèi)，提升NPU的通用性與綜合能力，成為行業(yè)的核心發(fā)力點(diǎn)。

以安謀科技周易X3 NPU IP為代表，DSP+DSA 的組合架構(gòu)已成為兼顧效率與靈活性的關(guān)鍵選擇。周易NPU已支持270余個公開模型，加上客戶定制模型更是達(dá)到 400 余個，端側(cè) NPU的通用化已成為必然趨勢。未來，NPU不再局限于適配單一類型模型，而是要具備快速對接多元算法、滿足多場景需求的能力。

針對端側(cè)AI不同需求，NPU未來需在專用與通用之間找到平衡。如NPU需要強(qiáng)化Tensor 計算能力，通過增加 Tensor core與帶寬，提升專用算力的效率，但同時也需保留一定的通用 Vector core能力。

總體而言，端側(cè) NPU 的未來發(fā)展，將是在云邊端協(xié)同的大框架下，以通用化適配海量模型，以專用算力保障運(yùn)行效率，最終在有限的物理與功耗約束中，實現(xiàn)性能與靈活性的雙重提升。周易NPU從2018 年發(fā)展至今已迭代至第六代，最新一代重點(diǎn)面向大模型，未來還將不斷拔高端側(cè)NPU IP規(guī)格，持續(xù)迭代升級穩(wěn)步深耕。

端側(cè)AI時代已經(jīng)到來，秉持AI Arm China這一發(fā)展戰(zhàn)略，安謀科技將聚焦AI技術(shù)，依托Arm生態(tài)，全力服務(wù)于中國本土市場的創(chuàng)新。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴