chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

安謀科技:端側(cè)NPU技術(shù)創(chuàng)新,拉動AI算力落地引擎

花茶晶晶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2025-12-09 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)在日前舉行的2025集成電路發(fā)展論壇(成渝)暨三十一屆集成電路設(shè)計業(yè)展覽會(ICCAD-Expo2025)上,安謀科技產(chǎn)品總監(jiān)鮑敏祺接受行業(yè)媒體采訪,談及最新發(fā)布的周易X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。


圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺


周易X3 NPU IP正當(dāng)時

安謀科技周易X3 NPU IP面向端側(cè)AI落地需求,基于專為大模型的DSP+DSA架構(gòu),協(xié)同AI軟件平臺,可應(yīng)用于加速卡、智能座艙、具身智能、ADAS、AI PC等設(shè)備為其提供AI計算核芯。

該產(chǎn)品支持CNN與Transformer模型架構(gòu),單Cluster最高支持4核配置,可提供8~80 FP8TFLOPS靈活算力范圍。其單核帶寬達(dá)256GB/s,相較于上一代周易產(chǎn)品在同等工藝下FP16算力提升16倍,計算核心帶寬提升4倍,Softmax與LayerNorm性能提升超過10倍,多核算力線性度達(dá)70%~80%。

該產(chǎn)品具備多項核心技術(shù)優(yōu)勢,包括通用與專用計算單元深度融合的DSP+DSA架構(gòu);支持橫向擴(kuò)展的多核設(shè)計與層級化內(nèi)存互連方案;軟硬件協(xié)同優(yōu)化的任務(wù)調(diào)度機(jī)制;同時面向開發(fā)者提供開放的生態(tài)系統(tǒng),支持硬件自定義接口與軟件層面的算子擴(kuò)展,增強(qiáng)平臺適配性與應(yīng)用靈活性。

鮑敏祺表示,周易NPU的核心優(yōu)勢根植于研發(fā)階段對軟件生態(tài)的巨大投入,成熟的軟件體系與完善的生態(tài)布局,構(gòu)成了其立足市場的核心競爭力。

在端側(cè) AI 領(lǐng)域,當(dāng)行業(yè)聚焦于同工藝下馮諾依曼架構(gòu)相差無幾的面積與功耗指標(biāo)時,周易NPU走出差異化路線。產(chǎn)品面向大模型重點強(qiáng)化了浮點支持能力。這并非簡單集成 FP8浮點等計算單元,更關(guān)鍵的是攻克特定精度下模型穩(wěn)定運(yùn)行的量化相關(guān)技術(shù)難題。團(tuán)隊融入 W4A16、W4A8等一系列計算范式,通過降低神經(jīng)網(wǎng)絡(luò)模型的數(shù)值表達(dá)位寬來減少計算量、內(nèi)存占用和功耗,同時盡量保持模型性能,從而讓浮點運(yùn)算與大模型適配。

周易NPU 的推出時機(jī),源于一年半前的產(chǎn)品定義與對市場趨勢的精準(zhǔn)預(yù)判。彼時,端側(cè) AI 的價值尚存在爭議,全球 AI 應(yīng)用還普遍依賴云端算力。而當(dāng)下,端側(cè) AI 的發(fā)展必要性已然凸顯,這既順應(yīng)行業(yè)風(fēng)向,也契合國內(nèi)市場的特殊需求。

從行業(yè)趨勢來看,今年3月起國際大廠紛紛轉(zhuǎn)向端側(cè)AI賽道,釋放出明確的技術(shù)信號。從國內(nèi)市場來看,面臨著與國外不同的發(fā)展環(huán)境,例如在算力卡領(lǐng)域,國外已采用3 納米工藝,而由于工藝限制,國內(nèi)大算力芯片(如 GPU)的單卡性能僅為國際先進(jìn)水平的 1/5。

同時,中國龐大的用戶群體,也對算力供給提出更高要求。從前些年2T、4T 的算力需求,到如今 8T 乃至更高的算力訴求,市場對端側(cè)算力的需求持續(xù)攀升。以運(yùn)行 Llama2 7B 模型為例,僅支撐 256token 的對話功能,算上50%利用率,理論上就需要 3.2TFLOPS 的算力,算力需求的增長可見一斑。正是基于對行業(yè)趨勢的深刻洞察,以及對客戶真實需求的精準(zhǔn)把握,安謀科技認(rèn)為當(dāng)下正是周易NPU 推向市場的最佳時機(jī)。

生態(tài)伙伴協(xié)同

鮑敏祺表示,從生態(tài)上來看不同類型企業(yè)在AI 賽道的側(cè)重點各有不同。算法公司更關(guān)注如何通過高效的 AI 算法,在具體業(yè)務(wù)場景中創(chuàng)造效益、提升效率,底層的算力與芯片并非其關(guān)注的核心;SoC公司則聚焦快速go to market的目標(biāo),部分企業(yè)選擇自研算法,更多企業(yè)則傾向于挑選適配的 IP 來加速產(chǎn)品市場化進(jìn)程。無論是算法公司的效率訴求,還是SoC公司的市場化需求,最終都指向IP高效交付與快速推向市場的核心能力,而這正是安謀科技踐行 AI Arm China 戰(zhàn)略的發(fā)力點。

從行業(yè)趨勢來看,AI 算法正逐步走向收斂。以往 CNN 等傳統(tǒng)模型遷移過程中,基于cuda編寫的算子往往面臨遷移難題。如今,無論是英偉達(dá)向上層 Python、應(yīng)用層MaaS延伸,還是 OpenAI 等企業(yè)的技術(shù)推動,國內(nèi)廠商都形成較高的適配統(tǒng)一性。大模型的運(yùn)行門檻已大幅降低,僅需支持幾十個左右的算子即可實現(xiàn)大模型部署,所需計算量相較以往大幅減少。與此同時,行業(yè)也正經(jīng)歷從GPGPU 向 ASIC AI 的轉(zhuǎn)型,博通等企業(yè)的快速發(fā)展印證了這一趨勢。專用架構(gòu)能更好地突破GPGPU的能效天花板,實現(xiàn)更優(yōu)的能效與面積表現(xiàn)。

端側(cè)NPU技術(shù)趨勢

伴隨 AI 技術(shù)的深入演進(jìn),端側(cè) NPU 的發(fā)展方向逐漸清晰,其未來趨勢將圍繞云邊端協(xié)同、通用性提升、專用算力強(qiáng)化三大核心展開,同時在物理工藝與算力功耗的限制下,探尋效率與靈活性的最優(yōu)解。
鮑敏祺談到,以機(jī)器人領(lǐng)域為例,云端負(fù)責(zé)統(tǒng)籌規(guī)劃,邊側(cè)承擔(dān)協(xié)調(diào)部署,端側(cè)聚焦執(zhí)行落地。在這一體系中,國外憑借先進(jìn)算力優(yōu)勢,可通過持續(xù)堆疊硬件提升性能。國內(nèi)則受限于工藝天花板,難以無限突破物理邊界,因此云邊端協(xié)同成為破局關(guān)鍵。

算力與功耗的限制,進(jìn)一步框定端側(cè) NPU 的發(fā)展邊界。在電池技術(shù)未出現(xiàn)革命性突破的前提下,短期之內(nèi)端側(cè) AI難以復(fù)刻云端的超大算力規(guī)模。因此,在有限算力范圍內(nèi),提升NPU的通用性與綜合能力,成為行業(yè)的核心發(fā)力點。

以安謀科技周易X3 NPU IP為代表,DSP+DSA 的組合架構(gòu)已成為兼顧效率與靈活性的關(guān)鍵選擇。周易NPU已支持270余個公開模型,加上客戶定制模型更是達(dá)到 400 余個,端側(cè) NPU的通用化已成為必然趨勢。未來,NPU不再局限于適配單一類型模型,而是要具備快速對接多元算法、滿足多場景需求的能力。

針對端側(cè)AI不同需求,NPU未來需在專用與通用之間找到平衡。如NPU需要強(qiáng)化Tensor 計算能力,通過增加 Tensor core與帶寬,提升專用算力的效率,但同時也需保留一定的通用 Vector core能力。

總體而言,端側(cè) NPU 的未來發(fā)展,將是在云邊端協(xié)同的大框架下,以通用化適配海量模型,以專用算力保障運(yùn)行效率,最終在有限的物理與功耗約束中,實現(xiàn)性能與靈活性的雙重提升。周易NPU從2018 年發(fā)展至今已迭代至第六代,最新一代重點面向大模型,未來還將不斷拔高端側(cè)NPU IP規(guī)格,持續(xù)迭代升級穩(wěn)步深耕。

端側(cè)AI時代已經(jīng)到來,秉持AI Arm China這一發(fā)展戰(zhàn)略,安謀科技將聚焦AI技術(shù),依托Arm生態(tài),全力服務(wù)于中國本土市場的創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)計算效能

    的科技企業(yè)也在近期表示,將通過軟件層創(chuàng)新大幅提升資源利用率。作為高AI模組和
    的頭像 發(fā)表于 11-21 16:05 ?735次閱讀
    從CPU、GPU到<b class='flag-5'>NPU</b>,美格智能持續(xù)優(yōu)化異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>計算效能

    架構(gòu)//軟件/應(yīng)用全面突破,科技Arm China用“周易”X3破局端側(cè)AI

    高達(dá)39.6%。然而,當(dāng)大模型從云端向側(cè)滲透,瓶頸、能效矛盾、開發(fā)門檻成為制約側(cè)
    的頭像 發(fā)表于 11-21 08:52 ?7265次閱讀
    架構(gòu)/<b class='flag-5'>算</b><b class='flag-5'>力</b>/軟件/應(yīng)用全面突破,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技Arm China用“周易”X3破局端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>

    發(fā)布“周易”X3 NPU,破局AI,智繪未來藍(lán)圖

    2025年11月13日,國內(nèi)領(lǐng)先的芯片IP設(shè)計與服務(wù)提供商科技Arm China,正式揭開了新一代NPU IP“周易”X3的神秘面紗。通過其創(chuàng)新的專為大模型設(shè)計的DSP+DSA混合
    的頭像 發(fā)表于 11-17 11:47 ?136次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>謀</b>發(fā)布“周易”X3 <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,智繪未來藍(lán)圖

    矢量計算性能提升200%,STAR-MC3賦能側(cè)AI革命

    日益增長,推動芯片設(shè)計向更高能效、更強(qiáng)AI的方向演進(jìn)。 ? 就在近期,芯片IP設(shè)計與服務(wù)提供商科技(Arm China)正式發(fā)布其自
    的頭像 發(fā)表于 10-27 09:11 ?2260次閱讀

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)科天璣9500給出答案:行業(yè)首發(fā)將側(cè) AI 4K 文生圖帶到手機(jī),引領(lǐng)移動影像與創(chuàng)造
    的頭像 發(fā)表于 09-24 14:47 ?517次閱讀
    <b class='flag-5'>AI</b>體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>新時代

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:26 ?1155次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:25 ?432次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    的模型輕量化部署方案。用戶通過遠(yuǎn)程平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加
    的頭像 發(fā)表于 07-30 21:44 ?725次閱讀

    側(cè)AI需求大爆發(fā)!科技發(fā)布新一代NPU IP,賦能AI終端應(yīng)用

    ,汽車自動駕駛的本地決策,都依賴提升,這對側(cè)AI SoC的性能帶來挑戰(zhàn),上游IP廠商的新品可以給SoC廠商帶來最新助力。 7月9日,在
    的頭像 發(fā)表于 07-11 01:16 ?8361次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>需求大爆發(fā)!<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技發(fā)布新一代<b class='flag-5'>NPU</b> IP,賦能<b class='flag-5'>AI</b>終端應(yīng)用

    蘋芯科技 N300 存一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制
    的頭像 發(fā)表于 05-06 17:01 ?863次閱讀
    蘋芯科技 N300 存<b class='flag-5'>算</b>一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> <b class='flag-5'>AI</b> 新征程

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級的天璣AI開發(fā)套件2.0,在模型庫規(guī)模、架構(gòu)開放程度、前沿側(cè)AI技術(shù)支持和
    發(fā)表于 04-13 19:52

    【一文看懂】什么是側(cè)

    隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術(shù)的快速發(fā)展,側(cè)正逐漸成為智能設(shè)備性能提升和智能化應(yīng)用實現(xiàn)的關(guān)鍵
    的頭像 發(fā)表于 02-24 12:02 ?2995次閱讀
    【一文看懂】什么是<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>?

    科技“周易”NPU成功部署DeepSeek-R1

    應(yīng)用體驗。 “周易”NPU處理器采用了專為大模型特性優(yōu)化的架構(gòu)設(shè)計,旨在提升側(cè),滿足日益增長的AI
    的頭像 發(fā)表于 02-19 10:30 ?994次閱讀

    軟硬協(xié)同優(yōu)化,科技新一代“周易”NPU實現(xiàn)DeepSeek-R1側(cè)高效部署

    ?近日,搭載科技最新一代“周易”NPU處理器的硬件平臺成功運(yùn)行DeepSeek-R1系列模型,性能卓越、成本優(yōu)異,為用戶帶來了更高效、便捷的AI應(yīng)用體驗。這款
    發(fā)表于 02-14 10:52 ?297次閱讀
    軟硬協(xié)同優(yōu)化,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技新一代“周易”<b class='flag-5'>NPU</b>實現(xiàn)DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>高效部署

    廣和通開啟側(cè)AI新時代

    AI發(fā)展正酣,隨著終端芯片越來越高、側(cè)模型能力越來越強(qiáng)、實時響應(yīng)及隱私保護(hù)的
    的頭像 發(fā)表于 12-12 10:35 ?1294次閱讀