近日,RWKV社區(qū)在上海漕河涇舉辦了主題為《RWKV-7與未來趨勢(shì)》的開發(fā)者大會(huì),來自全國(guó)各地的開發(fā)者、行業(yè)專家和技術(shù)創(chuàng)新者齊聚一堂,共同交流和探討后Transformer時(shí)代的AI新架構(gòu)和新的發(fā)展方向。格靈深瞳算法工程師楊鎧成受邀參會(huì)并發(fā)表了《RWKV-CLIP:一個(gè)魯棒的視覺-語(yǔ)言表征學(xué)習(xí)器》的主題演講。
據(jù)悉,RWKV是國(guó)產(chǎn)開源的首個(gè)非Transformer架構(gòu)的大語(yǔ)言模型,結(jié)合了RNN和Transformer的相關(guān)特性:出色的性能、快速的推理、快速的訓(xùn)練、節(jié)省VRAM、“無(wú)限” 的ctxlen和免費(fèi)的句嵌入,而且100% 不含自注意力機(jī)制。
楊鎧成談到,在大模型時(shí)代背景下,RWKV架構(gòu)得益于其在長(zhǎng)上下文背景下的高效訓(xùn)練和推理能力,得到了廣泛的關(guān)注。伴隨著RWKV、Mamba等架構(gòu)的爆火,格靈深瞳第一時(shí)間將這類架構(gòu)應(yīng)用到圖文表征學(xué)習(xí)任務(wù)中,并構(gòu)建了RWKV-CLIP模型,在相同的預(yù)訓(xùn)練數(shù)據(jù)以及預(yù)訓(xùn)練參數(shù)設(shè)置下,RWKV-CLIP相較于基于Transformer架構(gòu)的CLIP模型,在線性探測(cè)、零樣本分類、零樣本檢索等任務(wù)中展示出了顯著的性能提升。相關(guān)論文目前已被EMNLP 2024主會(huì)錄用,相關(guān)訓(xùn)練代碼、數(shù)據(jù)均已開源。
作為行業(yè)領(lǐng)先的人工智能公司,格靈深瞳高度重視與社區(qū)和學(xué)術(shù)領(lǐng)域的交流合作。近日,格靈深瞳還發(fā)布了億級(jí)規(guī)模的圖文預(yù)訓(xùn)練RealSyn數(shù)據(jù)集,通過構(gòu)建一種高效的數(shù)據(jù)清洗和轉(zhuǎn)換范式,將圖文交錯(cuò)文檔轉(zhuǎn)換為圖文對(duì)比學(xué)習(xí)可高效使用的圖文對(duì)數(shù)據(jù)。目前相關(guān)論文與數(shù)據(jù)集均已開源。
-
AI
+關(guān)注
關(guān)注
88文章
37038瀏覽量
290089 -
開發(fā)者
+關(guān)注
關(guān)注
1文章
687瀏覽量
17843 -
格靈深瞳
+關(guān)注
關(guān)注
1文章
72瀏覽量
5853
原文標(biāo)題:格靈深瞳受邀參加RWKV開發(fā)者大會(huì),分享RWKV結(jié)構(gòu)在跨模態(tài)表征學(xué)習(xí)上的應(yīng)用實(shí)踐
文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
格靈深瞳視覺基礎(chǔ)模型Glint-MVT的發(fā)展脈絡(luò)

格靈深瞳加入海光產(chǎn)業(yè)生態(tài)合作組織
格靈深瞳智慧金融產(chǎn)品家族全新升級(jí)
格靈深瞳視覺基礎(chǔ)模型Glint-MVT升級(jí)

格靈深瞳與您相約WAIC 2025
啟揚(yáng)受邀參加2025瑞芯微開發(fā)者大會(huì)

評(píng)論