電子發(fā)燒友網(wǎng)報道(文/李彎彎)近些年AI模型的應用場景飛速擴展,包括自動駕駛、智慧城市、教育、醫(yī)療、金融等等,行業(yè)的多樣性和應用場景的分散,使得AI模型爆炸式增長。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。
為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓練中存在不同的卷積輸入?yún)?shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。
長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發(fā)框架和應用模型。
傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經(jīng)驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務方面,承擔著重要責任。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。

算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。

為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓練中存在不同的卷積輸入?yún)?shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。

長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發(fā)框架和應用模型。

傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經(jīng)驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務方面,承擔著重要責任。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI芯片
+關注
關注
17文章
1983瀏覽量
35925 -
AI算法
+關注
關注
0文章
263瀏覽量
12700
發(fā)布評論請先 登錄
相關推薦
熱點推薦
AlphaEvolve有望革新AI玩具芯片設計,算法進化驅(qū)動能效與成本雙突破
電子發(fā)燒友網(wǎng)綜合報道,近期,谷歌?DeepMind發(fā)布了一款AlphaEvolve,是一款通用科學AI代理,基于大語言模型Gemini系列與進化計算框架,專注于算法發(fā)現(xiàn)與優(yōu)化??梢灾С謹?shù)百行代碼
Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)
海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI
應用場景,自己采集樣本數(shù)據(jù),進
發(fā)表于 04-28 11:05
AI算法托管平臺是什么
AI算法托管平臺是一種提供AI模型運行、管理和優(yōu)化等服務的云端或邊緣計算平臺。下面,AI部落小編帶您詳細了解AI
《AI Agent 應用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成式代理
,斯坦福小鎮(zhèn)是一個非常有有意思的項目。生成式智能體作為AI領域的革命性突破,向我們揭示了計算機模擬人類行為的無限可能。憑借其創(chuàng)新的技術架構(gòu)與精密的算法設計,這些智能體能夠在虛擬環(huán)境中栩栩如生地生活與交互
發(fā)表于 02-25 21:59
AI商業(yè)應用平臺的特點
AI商業(yè)應用平臺集成了自然語言處理、機器學習、深度學習等前沿的人工智能技術。以下,是對AI商業(yè)應用平臺特點的整理,由AI部落小編整理。
AI賦能邊緣網(wǎng)關:開啟智能時代的新藍海
的引入徹底改變了這一局面。通過在邊緣網(wǎng)關集成AI芯片和算法模型,使其具備了實時數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場景中,搭載AI算法
發(fā)表于 02-15 11:41
涂鴉Wukong AI硬件開發(fā)框架超強兼容DeepSeek等大模型,助你打造爆款AI硬件
一、什么是“Wukong”?涂鴉全新推出的“Wukong”AI硬件開發(fā)框架,是為實現(xiàn)AI硬件領域的商業(yè)化而專門開發(fā)設計的創(chuàng)新平臺。它基于TuyaOS所構(gòu)建,繼承了諸多優(yōu)勢,如跨平臺兼容

AI開發(fā)框架集成介紹
隨著AI應用的廣泛深入,單一框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進技術創(chuàng)新的關鍵路徑。以下,是對AI
商湯參與基于昇思AI框架的大模型原生開發(fā)成果發(fā)布
近日,昇思人工智能框架峰會暨成果發(fā)布會在北京舉辦。AI框架作為大模型開發(fā)及產(chǎn)業(yè)落地的基礎軟件,在人工智能技術棧中起到使能算法開發(fā)、釋放硬件性能的“承上啟下”作用。
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+內(nèi)容簡介
、AI芯片、多媒體處理芯片等)都是由四則運算器、濾波器、特殊信號發(fā)生器等基本算法電路構(gòu)成的,熟練掌握這些基本算法電路是實現(xiàn)復雜
發(fā)表于 11-21 17:14
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎硬件算法模塊
結(jié)構(gòu)性的,而是算法性和原理性的,如WiFi芯片,里面充斥著各種復雜的矩陣運算、復數(shù)運算等,因為它們要解決的是多天線在無線道下的輸入、輸出問題。AI芯片、圖像/語音/視頻等多媒體處理
發(fā)表于 11-21 17:05
迅為瑞芯微RK3568核心板橋梁監(jiān)測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監(jiān)測,提高監(jiān)測效率和準確性。同時,RK3568處理器在智能顯示、工業(yè)控制等領域有廣泛應用,適配系統(tǒng)新增雙麒麟系統(tǒng),增強產(chǎn)品競爭力
發(fā)表于 09-13 10:11
迅為RK3568核心板橋梁監(jiān)測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監(jiān)測,提高監(jiān)測效率和準確性。同時,RK3568處理器在智能顯示、工業(yè)控制等領域有廣泛應用,適配系統(tǒng)新增雙麒麟系統(tǒng),增強產(chǎn)品競爭力
發(fā)表于 07-27 11:56
評論