大模型訓(xùn)練成本高?推理效率低?硬件適配難?
4月1日,百度發(fā)布飛槳框架3.0正式版!五大特性專為大模型設(shè)計(jì)。
作為大模型時(shí)代的Infra“基礎(chǔ)設(shè)施”,深度學(xué)習(xí)框架的重要性愈發(fā)凸顯,大模型訓(xùn)練、推理等任務(wù)都離不開深度學(xué)習(xí)框架的優(yōu)化與支撐。
飛槳框架3.0,從設(shè)計(jì)理念上實(shí)現(xiàn)了從底層硬件適配到頂層開發(fā)體驗(yàn)的全面進(jìn)化,在訓(xùn)練效率、性能、兼容性等關(guān)鍵指標(biāo)上建立了新標(biāo)桿。
其中,“動(dòng)靜統(tǒng)一自動(dòng)并行”、“大模型訓(xùn)推一體”、“科學(xué)計(jì)算高階微分”、“神經(jīng)網(wǎng)絡(luò)編譯器”、“異構(gòu)多芯適配”這五大技術(shù)新特性,系統(tǒng)性解決了當(dāng)前大模型研發(fā)應(yīng)用面臨的分布式策略開發(fā)門檻高、訓(xùn)練推理效率低、硬件適配優(yōu)化難等核心痛點(diǎn),并為科學(xué)智能領(lǐng)域前沿探索提供強(qiáng)大支撐。

飛槳新一代框架
◎ 飛槳提出的“動(dòng)靜統(tǒng)一自動(dòng)并行”技術(shù),大幅降低大模型開發(fā)訓(xùn)練成本,讓算法創(chuàng)新回歸核心價(jià)值創(chuàng)造;
◎ “訓(xùn)推一體”設(shè)計(jì)理念打破了訓(xùn)練與推理的割裂狀態(tài),通過(guò)全方位深度優(yōu)化,飛槳框架3.0能夠支持眾多開源大模型進(jìn)行高性能推理,并在DeepSeek V3/R1上取得了突出的性能表現(xiàn)。目前,飛槳框架3.0支持文心4.5、文心X1等多款主流大模型,DeepSeek-R1滿血版單機(jī)部署吞吐提升一倍。通過(guò)技術(shù)算法創(chuàng)新,飛槳讓低時(shí)延、高吞吐、低算力成本的推理服務(wù)成為了現(xiàn)實(shí);
◎ 在科學(xué)智能領(lǐng)域,飛槳框架3.0錨定科學(xué)前沿探索需要,提升微分方程求解速度。通過(guò)高階自動(dòng)微分和神經(jīng)網(wǎng)絡(luò)編譯器技術(shù),加速微分方程求解,速度比PyTorch開啟編譯器優(yōu)化后的2.6版本平均快115%。飛槳還對(duì)DeepXDE、Modulus等主流開源科學(xué)計(jì)算工具進(jìn)行了廣泛適配,并成為 DeepXDE的默認(rèn)推薦后端。其展現(xiàn)的科學(xué)智能潛力在氣象預(yù)測(cè)、生命科學(xué)、航空航天等領(lǐng)域具有廣泛的應(yīng)用價(jià)值;
◎在運(yùn)算速度上,借助創(chuàng)新研制的神經(jīng)網(wǎng)絡(luò)編譯器CINN,實(shí)現(xiàn)性能的顯著提升,在A100平臺(tái)上RMSNorm算子進(jìn)行性能測(cè)試,相較于采用Python開發(fā)接口組合實(shí)現(xiàn)的方式,經(jīng)過(guò)編譯優(yōu)化后的算子運(yùn)行速度提升了4倍;使用超過(guò)60個(gè)模型進(jìn)行實(shí)驗(yàn),使用CINN編譯器后超60%模型有顯著性能提升,平均提升達(dá) 27.4%;
◎ 在硬件適配方面,飛槳框架3.0推出了多芯片統(tǒng)一適配方案,構(gòu)建“一次開發(fā),全棧部署”的生態(tài)體系。目前已適配超過(guò)60個(gè)芯片系列,覆蓋訓(xùn)練集群、自動(dòng)駕駛、智能終端等場(chǎng)景,開發(fā)者只需編寫一份代碼,就可以讓程序在不同芯片上順暢運(yùn)行,輕松實(shí)現(xiàn)業(yè)務(wù)的跨芯片遷移。
2016年,飛槳首次開源;
2018年,發(fā)布1.0版本,訓(xùn)推一體,支持大規(guī)模分布式訓(xùn)練和多端推理;
2021 年,2.0 版本發(fā)布,動(dòng)靜統(tǒng)一,兼具靈活性與高效性;
今年,飛槳框架3.0發(fā)布,專為大模型設(shè)計(jì),五大特性系統(tǒng)性解決了大模型研發(fā)應(yīng)用面臨的核心痛點(diǎn),同時(shí)更高效支撐科學(xué)智能。
截至2024年10月,飛槳文心生態(tài)已凝聚1808萬(wàn)開發(fā)者,服務(wù)了43萬(wàn)家企事業(yè)單位,創(chuàng)建了101萬(wàn)個(gè)模型。
飛槳框架3.0正式版本已面向開發(fā)者開放,并且兼容2.0版本的開發(fā)接口,歡迎廣大開發(fā)者使用和反饋~
-
百度
+關(guān)注
關(guān)注
9文章
2368瀏覽量
94207 -
飛槳
+關(guān)注
關(guān)注
0文章
37瀏覽量
2613 -
大模型
+關(guān)注
關(guān)注
2文章
3435瀏覽量
4955
原文標(biāo)題:超穩(wěn)定!飛槳框架3.0正式版發(fā)布
文章出處:【微信號(hào):baidu_2000,微信公眾號(hào):百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
百度世界大會(huì)亮點(diǎn) 五年五芯 百度宣布打造最硬AI云
百度世界2025進(jìn)行中 百度昆侖芯超節(jié)點(diǎn)亮相 性能巨幅提升
寧暢與與百度文心大模型展開深度技術(shù)合作
百度地圖重磅發(fā)布地圖AI開放平臺(tái)
百度發(fā)布文心4.5 Turbo、X1 Turbo和多款A(yù)I應(yīng)用
百度在AI領(lǐng)域的最新進(jìn)展
上汽大眾與百度地圖達(dá)成戰(zhàn)略合作
燧原科技正式納入飛槳例行版本發(fā)布體系
沐曦曦云C500通用計(jì)算GPU與百度飛槳完成Ⅱ級(jí)兼容性測(cè)試
百度2024財(cái)報(bào)亮點(diǎn):營(yíng)收破千億,凈利潤(rùn)增21%
百度文心大模型將升級(jí)并開源
凌智電子榮獲“百度AI技術(shù)生態(tài)伙伴”認(rèn)證

百度飛槳框架3.0正式版發(fā)布
評(píng)論