模型評(píng)估、模型選擇和算法選擇技術(shù)的正確使用
機(jī)器學(xué)習(xí)已經(jīng)成為我們生活的中心,無(wú)論是作為消費(fèi)者、客戶、研究者還是從業(yè)人員。無(wú)論將預(yù)測(cè)建模技術(shù)應(yīng)用到....
如何通過(guò)多模態(tài)對(duì)比學(xué)習(xí)增強(qiáng)句子特征學(xué)習(xí)
視覺作為人類感知體驗(yàn)的核心部分,已被證明在建立語(yǔ)言模型和提高各種NLP任務(wù)的性能方面是有效的。作者認(rèn)....
Taskflow API之三大特性
文檔級(jí)輸入:支持文檔級(jí)輸入,解決預(yù)訓(xùn)練模型對(duì)輸入文本的長(zhǎng)度限制問(wèn)題,大大節(jié)省用戶輸入長(zhǎng)文本時(shí)的代碼開....
如何統(tǒng)一各種信息抽取任務(wù)的輸入和輸出
信息抽取任務(wù)包括命名實(shí)體識(shí)別(NER)、關(guān)系抽?。≧E)、事件抽?。‥E)等各種各樣的任務(wù)。
深度學(xué)習(xí)與經(jīng)典統(tǒng)計(jì)學(xué)的差異
深度學(xué)習(xí)和簡(jiǎn)單的統(tǒng)計(jì)學(xué)是一回事嗎?很多人可能都有這個(gè)疑問(wèn),畢竟二者連術(shù)語(yǔ)都有很多相似的地方。在這篇文....
視覺語(yǔ)言導(dǎo)航領(lǐng)域任務(wù)、方法和未來(lái)方向的綜述
視覺語(yǔ)言導(dǎo)航(VLN)是一個(gè)新興的研究領(lǐng)域,旨在構(gòu)建一種可以用自然語(yǔ)言與人類交流并在真實(shí)的3D環(huán)境中....
一種簡(jiǎn)單而有效的轉(zhuǎn)換方法來(lái)降低預(yù)測(cè)情感標(biāo)簽的難度
面向目標(biāo)的多模態(tài)情感分類(TMSC)是方面級(jí)情感分析的一個(gè)新的子任務(wù),旨在預(yù)測(cè)一對(duì)句子和圖片中提到的....
基于谷歌中長(zhǎng)尾item或user預(yù)測(cè)效果的遷移學(xué)習(xí)框架
文中提出的遷移學(xué)習(xí)框架主要包括model-level transfer和item-level tra....
預(yù)訓(xùn)練模型在搜索中使用的思路和方案
當(dāng)然了,和往常的文章一樣,我不會(huì)復(fù)述這一篇文章,而是聊聊里面的一些關(guān)鍵點(diǎn)和一些有意思的內(nèi)容,拿出來(lái)和....
自然語(yǔ)言處理(NLP)領(lǐng)域的高效方法
訓(xùn)練越來(lái)越大的深度學(xué)習(xí)模型已經(jīng)成為過(guò)去十年的一個(gè)新興趨勢(shì)。如下圖所示,模型參數(shù)量的不斷增加讓神經(jīng)網(wǎng)絡(luò)....
幾種常用的NLP數(shù)據(jù)增強(qiáng)方法
因?yàn)橹苯訉?duì)原是文本進(jìn)行數(shù)據(jù)增強(qiáng),很難保證維持原始的文本語(yǔ)義,因此可以通過(guò)在語(yǔ)義空間上進(jìn)行隱式數(shù)據(jù)增強(qiáng)....
深度解析YOLOv7的網(wǎng)絡(luò)結(jié)構(gòu)
最近,Scaled-YOLOv4的作者(也是后來(lái)的YOLOR的作者)和YOLOv4的作者AB大佬再次....
為什么深度學(xué)習(xí)模型經(jīng)常出現(xiàn)預(yù)測(cè)概率和真實(shí)情況差異大的問(wèn)題?
文中對(duì)比了簡(jiǎn)單模型LeNet和現(xiàn)代模型ResNet的校準(zhǔn)情況,LeNet的輸出結(jié)果校準(zhǔn)性很好,而Re....
深度學(xué)習(xí)刷SOTA的一堆trick
對(duì)抗訓(xùn)練就是在輸入的層次增加擾動(dòng),根據(jù)擾動(dòng)產(chǎn)生的樣本,來(lái)做一次反向傳播。以FGM為例,在NLP上,擾....
刷SOTA一般通用的trick
像優(yōu)秀的優(yōu)化器,學(xué)習(xí)率調(diào)度方法,數(shù)據(jù)增強(qiáng),dropout,初始化,BN,LN,確實(shí)是調(diào)參大師的寶貴經(jīng)....
用于多模態(tài)命名實(shí)體識(shí)別的通用匹配對(duì)齊框架
該模塊通過(guò)注意力機(jī)制建立起文本和圖像之間的關(guān)系,使用文本token序列表示 作為Query,使用圖....
介紹一種通用匹配對(duì)齊框架MAF
多模態(tài)命名實(shí)體識(shí)別在傳統(tǒng)的命名實(shí)體識(shí)別基礎(chǔ)上額外引入了圖像,可以為文本補(bǔ)充語(yǔ)義信息來(lái)進(jìn)行消岐,近些年....
對(duì)預(yù)訓(xùn)練模型在召回與排序部分的應(yīng)用做一個(gè)總結(jié)
搜索任務(wù)就是給定一個(gè)query或者QA中的question,去大規(guī)模的文檔庫(kù)中找到相似度較高的文檔,....
解決長(zhǎng)尾和冷啟動(dòng)問(wèn)題的基本方法
長(zhǎng)尾問(wèn)題的難點(diǎn)主要體現(xiàn)在以下2點(diǎn)。首先,長(zhǎng)尾實(shí)體的樣本量太少,模型很難學(xué)習(xí)這部分樣本的規(guī)律,例如用戶....
一窺AMR圖譜在自然語(yǔ)言處理中的應(yīng)用
TreeBank 作為自然語(yǔ)言語(yǔ)法的結(jié)構(gòu)化表示可謂廣為人知,其實(shí)在語(yǔ)義層面也有一種類似的結(jié)構(gòu)化方法—....
AMR圖譜在自然語(yǔ)言處理中的應(yīng)用
AMR 既不會(huì)自動(dòng)從文本中展現(xiàn)出來(lái),也無(wú)法自行表達(dá)一個(gè)句子。因此對(duì)于 AMR 而言,最重要的任務(wù)就是....
一種將知識(shí)圖譜與語(yǔ)言模型結(jié)合的具體方式分享
知識(shí)嵌入(Knowledge Embedding)將知識(shí)圖譜中的關(guān)系和實(shí)體嵌入向量空間進(jìn)行表示。
基于知識(shí)的對(duì)話生成任務(wù)
基于知識(shí)的對(duì)話生成任務(wù)(Knowledge-Grounded Dialogue Generation....
預(yù)訓(xùn)練模型技術(shù)在金融事件分析中有何作用
綜合前面介紹的各種事件分析技術(shù)和應(yīng)用場(chǎng)景,一個(gè)完整的事件分析框架支持4大能力:搜索某個(gè)事,搜索某個(gè)主....
基于圖文多模態(tài)領(lǐng)域典型任務(wù)
圖文多模態(tài)領(lǐng)域典型任務(wù)如img-text retrieval、VQA、captioning、grou....
基于小樣本增量學(xué)習(xí) NER 的框架
之前的工作(Monaikul 等人,2021)通過(guò)對(duì)新實(shí)體類添加輸出層(AddNER)以及對(duì)輸出層進(jìn)....
如何在GPU資源受限的情況下訓(xùn)練transformers庫(kù)上面的大模型
自BERT出現(xiàn)以來(lái),nlp領(lǐng)域已經(jīng)進(jìn)入了大模型的時(shí)代,大模型雖然效果好,但是畢竟不是人人都有著豐富的....
半監(jiān)督算法DocRE的新組件
文檔級(jí)關(guān)系抽取要同時(shí)從多個(gè)句子中提取關(guān)系。針對(duì)這個(gè)任務(wù),本文提出了一個(gè)半監(jiān)督算法 DocRE。Doc....
一篇解決表示學(xué)習(xí)坍塌問(wèn)題的工作報(bào)告
針對(duì)表示學(xué)習(xí)中的坍塌問(wèn)題,提出了VICREG方法,通過(guò)variance、invariance、cov....
Transformer的細(xì)節(jié)和效果如何
在文本理解任務(wù)(Natural Language Understanding)上,預(yù)訓(xùn)練模型已經(jīng)取得....