英偉達(dá)團(tuán)隊(duì)近日在AI領(lǐng)域投下了一枚震撼彈,他們提出了一種全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)——?dú)w一化Transformer(nGPT)。這一創(chuàng)新架構(gòu)基于超球面(hypersphere)進(jìn)行表示學(xué)習(xí),為AI領(lǐng)域帶來了新的突破。
相較于傳統(tǒng)的Transformer架構(gòu),nGPT在保持原有精度的同時(shí),直接將大型語言模型(LLM)的訓(xùn)練速度提升了高達(dá)20倍。這一顯著的性能提升,無疑將極大地推動(dòng)AI技術(shù)的發(fā)展和應(yīng)用。
在nGPT中,所有的向量(包括嵌入向量、多層感知機(jī)(MLP)向量、注意力矩陣向量以及隱藏狀態(tài)向量)都被歸一化為單位范數(shù)(unit norm)。這一設(shè)計(jì)不僅簡化了模型訓(xùn)練過程,還提高了模型的穩(wěn)定性和泛化能力。
英偉達(dá)團(tuán)隊(duì)的這一創(chuàng)新成果,無疑為AI領(lǐng)域注入了新的活力。nGPT架構(gòu)的提出,不僅將推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展,還將為各種應(yīng)用場(chǎng)景提供更加高效、準(zhǔn)確的解決方案。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4819瀏覽量
106066 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4014瀏覽量
96792 -
Transformer
+關(guān)注
關(guān)注
0文章
153瀏覽量
6719 -
LLM
+關(guān)注
關(guān)注
1文章
337瀏覽量
1143
發(fā)布評(píng)論請(qǐng)先 登錄
第四次工業(yè)革命AI將實(shí)現(xiàn)十億倍增長 | 中國AI芯片與英偉達(dá)的角色

愛立信推出革命性OSS/BSS產(chǎn)品組合
特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元
Melexis推出革命性熱成像傳感器芯片MLX90642
新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率
新思科技亮相英偉達(dá)GTC 2025大會(huì)
英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%
格瑞普推出革命性半固態(tài)電池,為行業(yè)無人機(jī)續(xù)航注入未來動(dòng)力

英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫
英偉達(dá)推出基石世界模型Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問題


加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
什么是LLM?LLM在自然語言處理中的應(yīng)用
如何訓(xùn)練自己的LLM模型
LLM和傳統(tǒng)機(jī)器學(xué)習(xí)的區(qū)別
端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

評(píng)論