近日,摩爾線程與北京智源人工智能研究院(簡(jiǎn)稱:智源研究院)已順利完成基于Triton語(yǔ)言的高性能算子庫(kù)FlagGems的適配工作。得益于摩爾線程自研統(tǒng)一系統(tǒng)計(jì)算架構(gòu)MUSA,雙方在短短一周多的時(shí)間里,即成功完成了近60個(gè)算子的功能驗(yàn)證,精度符合交付標(biāo)準(zhǔn),并實(shí)現(xiàn)對(duì)Bert-large模型的全面支持。FlagGems算子庫(kù)在摩爾線程MUSA架構(gòu)上展現(xiàn)出了接近手寫算子的計(jì)算性能,且性能還在持續(xù)調(diào)優(yōu),極大加速了開源大模型在摩爾線程全功能GPU上的部署速度。
智源研究院在今年的智源大會(huì)上推出了FlagGems算子庫(kù),這是一個(gè)使用Triton編程語(yǔ)言實(shí)現(xiàn)的高性能通用算子庫(kù),旨在為大語(yǔ)言模型提供一系列可應(yīng)用于PyTorch框架的算子,加速模型的推理與訓(xùn)練,降低新算法的開發(fā)門檻,促進(jìn)芯片架構(gòu)的創(chuàng)新。FlagGems算子庫(kù)以Triton編程語(yǔ)言的易用性和編譯器的標(biāo)準(zhǔn)接口為基礎(chǔ),為多元芯片提供了一套易適配、高性能的算子解決方案,推動(dòng)基于Triton的統(tǒng)一、開源的軟硬件生態(tài)建設(shè)。
在適配過程中,摩爾線程與智源研究院團(tuán)隊(duì)緊密合作,共同克服了一系列技術(shù)挑戰(zhàn),確保FlagGems算子庫(kù)在摩爾線程全功能GPU上的高效穩(wěn)定運(yùn)行。摩爾線程研發(fā)團(tuán)隊(duì)經(jīng)過充分調(diào)研論證,還形成了Triton編譯器在MUSA架構(gòu)上適配的完整方案,力求實(shí)現(xiàn)開發(fā)者在基于摩爾線程全功能GPU進(jìn)行Triton開發(fā)算子過程中,也能獲得與原來一致的體驗(yàn),做到CUDA框架和MUSA框架的無縫遷移。
此次合作不僅充分展示了摩爾線程全功能GPU強(qiáng)大的兼容性、靈活性與擴(kuò)展性,也為開發(fā)者和用戶帶來了更廣泛的選擇和更高效的開發(fā)體驗(yàn)。摩爾線程和智源研究院將繼續(xù)深化合作,共同促進(jìn)AI技術(shù)的發(fā)展和應(yīng)用,為中國(guó)大模型的發(fā)展貢獻(xiàn)力量。
關(guān)于智源研究院
北京智源人工智能研究院(簡(jiǎn)稱:智源研究院)是北京市于2018年11月推動(dòng)成立的新型研發(fā)機(jī)構(gòu)。智源研究院的核心目標(biāo)是聚焦人工智能原始創(chuàng)新和核心技術(shù),推動(dòng)人工智能理論、方法、工具、系統(tǒng)和應(yīng)用取得變革性、顛覆性突破,支撐北京建設(shè)成為全球人工智能學(xué)術(shù)思想、基礎(chǔ)理論、頂尖人才、企業(yè)創(chuàng)新和發(fā)展政策的源頭。
關(guān)于摩爾線程
摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。
我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。
-
開源
+關(guān)注
關(guān)注
3文章
4199瀏覽量
46102 -
摩爾線程
+關(guān)注
關(guān)注
2文章
279瀏覽量
6445 -
大模型
+關(guān)注
關(guān)注
2文章
3644瀏覽量
5173
原文標(biāo)題:摩爾線程 × 智源研究院|完成基于Triton的大模型算子庫(kù)適配
文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
摩爾線程MTT S5000全面適配Qwen3.5三款新模型
摩爾線程快速完成對(duì)Qwen3.5模型全面適配
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
摩爾線程MTT S5000率先完成對(duì)GLM-5的適配
Day-0支持|摩爾線程MTT S5000率先完成對(duì)GLM-5的適配
國(guó)產(chǎn)算力首證具身大腦模型訓(xùn)練實(shí)力:摩爾線程聯(lián)合智源研究院完成RoboBrain 2.5全流程訓(xùn)練
摩爾線程新一代大語(yǔ)言模型對(duì)齊框架URPO入選AAAI 2026
廣電計(jì)量攜手南山研究院打造大健康產(chǎn)業(yè)新生態(tài)
摩爾線程發(fā)布Torch-MUSA v2.1.1版本
進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐
摩爾線程率先支持騰訊混元-A13B模型
摩爾線程MTT S4000完成DeepSeek R1-671B大模型適配驗(yàn)證
摩爾線程GPU成功適配Deepseek-V3-0324大模型
安徽省水利科學(xué)研究院攜手中科曙光完成DeepSeek大模型部署
摩爾線程支持阿里云通義千問QwQ-32B開源模型
摩爾線程攜手智源研究院完成基于Triton的大模型算子庫(kù)適配
評(píng)論