chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于多任務(wù)學(xué)習(xí)如何提升模型性能與原則

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來源:CSDN技術(shù)社區(qū) ? 作者:上杉翔二 ? 2021-03-21 11:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

提升模型性能的方法有很多,除了提出過硬的方法外,通過把神經(jīng)網(wǎng)絡(luò)加深加寬(深度學(xué)習(xí)),增加數(shù)據(jù)集數(shù)目(預(yù)訓(xùn)練模型)和增加目標(biāo)函數(shù)(多任務(wù)學(xué)習(xí))都是能用來提升效果的手段。(別名Joint Learning,Learning to learn,learning with auxiliary task.。..等)

對(duì)于人類來說,我們往往學(xué)會(huì)了一件事,是能夠觸類旁通,舉一反三的。即其他不同任務(wù)的經(jīng)驗(yàn)性,能夠帶來一些有用的信息,這是多任務(wù)學(xué)習(xí)的出發(fā)點(diǎn)。但如果處理多任務(wù)還是用single-task learning的話(類似bagging),模型會(huì)默認(rèn)為每個(gè)任務(wù)是獨(dú)立的,沒有關(guān)聯(lián)性的,所以每個(gè)模型的參數(shù)都是獨(dú)立進(jìn)行的。這樣做的缺點(diǎn)在于:

訓(xùn)練數(shù)據(jù)有限,所以模型并不具有很好的泛化性能

不考慮任務(wù)之間的相關(guān)性,缺乏對(duì)不同模型之間共享信息的挖掘,使得模型訓(xùn)練過程中性能下降

Multi-Task Learning(MTL)多任務(wù)學(xué)習(xí)實(shí)質(zhì)上是一種遷移機(jī)制,如何讓模型能夠同時(shí)解決多種問題,從而提高泛化準(zhǔn)確率、學(xué)習(xí)速度和能力,模型的可理解性。特別是如何使用與其他任務(wù)的“相關(guān)性”與“差異性”,通過多個(gè)任務(wù)訓(xùn)練并共享不同任務(wù)已學(xué)到的特征表示,減輕對(duì)特定任務(wù)的過度擬合,從正則化效果中獲益,提升最終的性能,使學(xué)習(xí)的嵌入在任務(wù)之間具有通用性。

多任務(wù)學(xué)習(xí)的構(gòu)建原則

理解建模任務(wù)之間的相關(guān)性,以構(gòu)建合適的多任務(wù)方案。

同時(shí)對(duì)多個(gè)任務(wù)的模型參數(shù)進(jìn)行聯(lián)合學(xué)習(xí)以挖掘不同任務(wù)的共享信息。

但需要同時(shí)考慮不同任務(wù)會(huì)存在的差異性,如何提高模型對(duì)不同任務(wù)的適應(yīng)能力。

為什么多任務(wù)是有效的?

可增加訓(xùn)練樣本,且不同任務(wù)的噪音不同,同時(shí)學(xué)習(xí)多個(gè)任務(wù)能得到更通用的表達(dá)

可以通過其他任務(wù)來判斷學(xué)習(xí)到的特征是否真的有效

對(duì)于某個(gè)任務(wù)難學(xué)到的特征,可以通過其他任務(wù)來學(xué)習(xí)

多任務(wù)學(xué)習(xí)傾向于讓模型關(guān)注其他模型也關(guān)注的信息表達(dá)

某種程度上可以視為正則化

常用多任務(wù)學(xué)習(xí)的主要方式

基于參數(shù)的共享,如神經(jīng)網(wǎng)絡(luò)隱層參數(shù)共享,然后上層得到多個(gè)特征完成多種任務(wù)以達(dá)到聯(lián)合訓(xùn)練的目的,即loss里面組合多個(gè)。

對(duì)于loss的組合的權(quán)重設(shè)置可以分為手工調(diào)整,Gradient normalization(希望不同任務(wù)loss的量級(jí)接近,納入梯度計(jì)算權(quán)重,優(yōu)點(diǎn)是可以考慮loss的量級(jí),缺點(diǎn)是每一步都要額外算梯度)。Dynamic weight averaging,DWA希望各個(gè)任務(wù)以相近的速度來進(jìn)行學(xué)習(xí)(記錄每步的loss,loss縮小快的任務(wù)權(quán)重會(huì)變小,缺點(diǎn)是沒有考慮量級(jí))。Dynamic Task Prioritization,DTP希望更難學(xué)的任務(wù)可以有更高的權(quán)重。Uncertainty Weighting,讓“簡(jiǎn)單”的任務(wù)權(quán)重更高(確定性越強(qiáng)的任務(wù)權(quán)重會(huì)大,而噪聲大難學(xué)的任務(wù)權(quán)重會(huì)變小)。對(duì)于loss的平衡挺講究的,也算是調(diào)參師需要掌握的東西吧,有空再新寫文章整理。

基于正則化的共享,如均值約束,聯(lián)合特征學(xué)習(xí)等。比如使用低秩參數(shù)矩陣分解,即假設(shè)不同任務(wù)的參數(shù)可能會(huì)共享某些維度的特征,那么每個(gè)任務(wù)的參數(shù)都接近所有任務(wù)平均的參數(shù)來建模任務(wù)之間的相關(guān)性,即在loss中加入這樣的正則化來約束參數(shù):

所以多任務(wù)的優(yōu)點(diǎn)在于它具有很好的泛化性能,對(duì)于有些任務(wù)的數(shù)據(jù)不足問題,也能借助其他任務(wù)得到訓(xùn)練,另外它還能起到正則的作用,即很難使某個(gè)任務(wù)過擬合以保證整個(gè)模型的泛化性能。

而其困難在于如何更好的對(duì)每個(gè)任務(wù)分配權(quán)重(已經(jīng)有人有NAS做了。..)以使其魯棒性最強(qiáng),同時(shí)如何兼顧特征共享部分和任務(wù)的特點(diǎn)表示,避免過擬合或者欠擬合是值得研究的。

除了一般處理多任務(wù)都是一個(gè)可學(xué)習(xí)的alpha來控制外,本篇文章將整理幾篇多任務(wù)學(xué)習(xí)的論文。

Single-Level MTL Models

單層主要有以下幾種方式:

「Hard Parameter Sharing」:不同任務(wù)底層共享,然后共不同任務(wù)各自輸出。當(dāng)兩個(gè)任務(wù)相關(guān)性較高時(shí),用這種結(jié)構(gòu)往往可以取得不錯(cuò)的效果,但任務(wù)相關(guān)性不高時(shí),會(huì)存在負(fù)遷移現(xiàn)象,導(dǎo)致效果不理想。

「Asymmetry Sharing(不對(duì)稱共享)」:不同任務(wù)的底層模塊有各自對(duì)應(yīng)的輸出,但其中部分任務(wù)的輸出會(huì)被其他任務(wù)所使用,而部分任務(wù)則使用自己獨(dú)有的輸出。哪部分任務(wù)使用其他任務(wù)的輸出,則需要人為指定。

「Customized Sharing(自定義共享)」:不同任務(wù)的底層模塊不僅有各自獨(dú)立的輸出,還有共享的輸出。

「MMoE」:底層包含多個(gè)Expert,然后基于門控機(jī)制,不同任務(wù)會(huì)對(duì)不同Expert的輸出進(jìn)行過濾。

「CGC」:這是PLE的結(jié)構(gòu)(圖自騰訊在RecSys2020最佳長(zhǎng)論文,Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized Recommendations),他的不同之處在于學(xué)習(xí)一個(gè)個(gè)性和共性兩方面的信息,然后再用不同的gate來控制。

Multi-Level MTL Models

「Cross-Stitch Network」:用參數(shù)來控制不同任務(wù)間共享的特征

「Sluice Network」:分層特征融合網(wǎng)絡(luò)

「ML-MMoE」:MMoE的多級(jí)結(jié)構(gòu)

「PLE」:多層萃?。ɑ贑GC)

MMoE(Multi-gate Mixture-of-Experts)論文:Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts

MMoE應(yīng)該是實(shí)際上用的比較多一個(gè)架構(gòu)了,想主要整理一下這個(gè)。

這篇文章是對(duì)多任務(wù)學(xué)習(xí)的一個(gè)擴(kuò)展,通過門控網(wǎng)絡(luò)的機(jī)制來平衡多任務(wù)。所謂“平衡”是因?yàn)槎嗳蝿?wù)學(xué)習(xí)中有個(gè)問題就是如果子任務(wù)之間的差異性太大了,多任務(wù)模型的效果會(huì)很差,那么如何平衡不同的任務(wù)呢?MMoE主要有兩個(gè)共享:

圖a,使用shared-bottom網(wǎng)絡(luò),多個(gè)上層任務(wù)共用底層網(wǎng)絡(luò)。

圖b,多個(gè)獨(dú)立模型的集成方法MoE,即每個(gè)expert network都可以認(rèn)為是神經(jīng)網(wǎng)絡(luò),公共一個(gè)門控網(wǎng)絡(luò)(One-gate MoE model),最終的輸出是所有experts的加權(quán)和。

圖c,MMoE,每個(gè)任務(wù)使用單獨(dú)的gating networks。即每個(gè)任務(wù)的gating networks通過最終輸出權(quán)重不同實(shí)現(xiàn)對(duì)experts的選擇性利用。不同任務(wù)的gating networks可以學(xué)習(xí)到不同的組合experts的模式,因此模型考慮到了捕捉到任務(wù)的相關(guān)性和區(qū)別。

通過這種multi-gate的結(jié)構(gòu)能夠緩解任務(wù)間差異大的情況。

Multi-task Learning in LM語(yǔ)言模型是天然無監(jiān)督的多任務(wù)學(xué)習(xí)。而且鑒于目前針對(duì)BERT的改進(jìn)很多(包括BERT-large等版本)都是增加了數(shù)據(jù)量,計(jì)算能力或訓(xùn)練過程。

比如RoBERTa,精細(xì)調(diào)參,為了優(yōu)化訓(xùn)練程序,從BERT的預(yù)訓(xùn)練程序中刪除了結(jié)構(gòu)預(yù)測(cè)(NSP)任務(wù),引入了動(dòng)態(tài)掩蔽,以便在訓(xùn)練期間使掩蔽的標(biāo)記發(fā)生變化。

比如DistilBERT學(xué)習(xí)了BERT的蒸餾版本,保留了95%的性能,但只使用了一半的參數(shù)。具體來說,它沒有標(biāo)記類型和池化層的嵌入,只保留了谷歌BERT中一半的層(當(dāng)然ALBERT也是等)。

MT-DNN與ERNIE2.0。這兩篇論文的多任務(wù)學(xué)習(xí)很有意思,接下來主要整理這兩篇文章。

MT-DNN論文:Multi-Task Deep Neural Networks for Natural Language Understanding

MT-DNN是結(jié)合了至少4種任務(wù)的模型:?jiǎn)尉浞诸?、句子?duì)分類、文本相似度打分和相關(guān)度排序等等。

「單句分類」:CoLA是判斷英語(yǔ)句子是否語(yǔ)法合適、SST-2是電影評(píng)論的情感(正面or負(fù)面)。

「文本相似度」:STS-B對(duì)兩句話進(jìn)行文本相似度打分

「句子對(duì)分類」:RTE和MNLI是文本蘊(yùn)含任務(wù)(推理兩個(gè)句子之間的關(guān)系,是否存在蘊(yùn)含關(guān)系、矛盾的關(guān)系或者中立關(guān)系),QQP和MRPC是判斷兩句話是否語(yǔ)義上一致,等價(jià)。

「相關(guān)性排序」:QNLI斯坦福問答數(shù)據(jù)集的一個(gè)版本,雖然是二分類問題,此時(shí)變成一個(gè)多排序問題,使更接近的答案排得更加靠前。

在MT-DNN的多任務(wù)學(xué)習(xí)中,也是低層的特征在所有任務(wù)之間共享,而頂層面向豐富的下游任務(wù)。從模型結(jié)構(gòu)上,從底向上的shared layers是Transformer逐步的過程,用于生成共享的上下文嵌入向量(contextual embedding layers),然后完成四種任務(wù)的預(yù)測(cè)。

ERNIE2.0論文:ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding

ERNIE2.0的貢獻(xiàn)主要有1 通過大型語(yǔ)料庫(kù)+先驗(yàn)知識(shí)。2,多任務(wù)學(xué)習(xí)逐步更新 ERNIE 模型。

「序列性多任務(wù)學(xué)習(xí)」。使模型能夠?qū)W習(xí)到詞匯,語(yǔ)法,語(yǔ)義信息。不同于持續(xù)學(xué)習(xí)和多任務(wù)學(xué)習(xí),序列多任務(wù)學(xué)習(xí)在引入新的訓(xùn)練任務(wù)時(shí),先利用之前學(xué)習(xí)到的參數(shù)對(duì)模型進(jìn)行初始化,再同時(shí)訓(xùn)練新任務(wù)和舊任務(wù)。

「定制和引入了多種預(yù)訓(xùn)練任務(wù)」。側(cè)重詞匯的任務(wù)(mask,大寫字詞預(yù)測(cè),字詞-文章關(guān)系),側(cè)重結(jié)構(gòu)/語(yǔ)法的任務(wù)(詞語(yǔ)重排序,語(yǔ)句距離),側(cè)重語(yǔ)義的任務(wù)(文章關(guān)系任務(wù),信息檢索相關(guān)性任務(wù))。如下圖,首先主要使用的任務(wù)有:

「Knowledge Masking Task、Capitalization Prediction Task和Token-Document Relation Prediction Task」。Knowledge Masking Task是預(yù)測(cè)被masked掉的短語(yǔ)和命名知識(shí)實(shí)體以學(xué)習(xí)到局部語(yǔ)境和全局語(yǔ)境的依賴關(guān)系信息。Capitalization Prediction Task是首字母大寫預(yù)測(cè),首字母大寫的詞往往有特殊的功能。Token-Document Relation Prediction Task預(yù)測(cè)段中的token是否出現(xiàn)在原始文檔的其他段(segment)中,即捕獲高頻詞或線索詞。

「Sentence Reordering Task和Sentence Distance Task」。Sentence Reordering Task句子重排任務(wù)是為了學(xué)習(xí)句子之間的關(guān)系。Sentence Distance Task通過文檔級(jí)的信息學(xué)習(xí)句子之間的距離。

「Discourse Relation Task和IR Relevance Task」。Discourse Relation Task引入2個(gè)句子之間語(yǔ)義或修辭關(guān)系的預(yù)測(cè)任務(wù)。IR Relevance Task學(xué)習(xí)短文本在信息檢索中的相關(guān)性。

這篇文章比較有趣的就是這個(gè)多任務(wù)連續(xù)增量學(xué)習(xí),或持續(xù)學(xué)習(xí)(Continual learning)了,它致力于對(duì)數(shù)個(gè)任務(wù)按順序依次訓(xùn)練模型,以確保模型在訓(xùn)練新任務(wù)時(shí)候,依舊能夠記住先前的任務(wù)。正如人類能夠不斷地通過學(xué)習(xí)或歷史經(jīng)驗(yàn)積累獲得信息,從而有效地發(fā)展新的技能。

具體關(guān)于連續(xù)增量學(xué)習(xí)的對(duì)比,第一個(gè)是如何以連續(xù)的方式訓(xùn)練任務(wù),而不忘記以前所學(xué)的知識(shí);第二個(gè)是如何更有效地學(xué)習(xí)這些預(yù)訓(xùn)練任務(wù)。

「Continual Learning」。在訓(xùn)練的每一個(gè)階段僅通過一項(xiàng)任務(wù)來訓(xùn)練模型,如訓(xùn)練任務(wù)A,在訓(xùn)練任務(wù)B,一直到訓(xùn)練任務(wù)Z,但是其缺點(diǎn)是會(huì)忘記先前學(xué)習(xí)的知識(shí),導(dǎo)致最后的結(jié)果會(huì)更加偏向靠后的任務(wù)。。

「Multi-task Learning」。是普通的MTL,即所有任務(wù)在一起進(jìn)行多任務(wù)學(xué)習(xí),即同時(shí)訓(xùn)練A,B..Z期間不做交互最后做集成。缺點(diǎn)是訓(xùn)練完的模型只能處理這些任務(wù),如果出現(xiàn)了比較新的任務(wù),比較大的概率需要重頭開始訓(xùn)練。

「Sequential Multi-task Learning」。當(dāng)有新任務(wù)出現(xiàn)時(shí),先使用先前學(xué)習(xí)的參數(shù)來初始化模型,并同時(shí)訓(xùn)練新引入的任務(wù)和原始任務(wù),如先訓(xùn)練A,再訓(xùn)練A,B,再訓(xùn)練A,B,C,如圖中的金字塔形狀,當(dāng)有新任務(wù)出現(xiàn)時(shí),它也能夠快速反應(yīng)做調(diào)整。

除了這種,其實(shí)還可以先(A)(B)(C)訓(xùn)練,再(A,B)(B,C)(A,C),最后再(A,B,C)這種方式。有點(diǎn)像我們做題往往會(huì)先做單項(xiàng)訓(xùn)練,再綜合訓(xùn)練。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 多任務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    9216
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122789

原文標(biāo)題:【多任務(wù)】如何利用多任務(wù)學(xué)習(xí)提升模型性能?

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動(dòng)力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能
    的頭像 發(fā)表于 06-04 17:15 ?666次閱讀
    數(shù)據(jù)標(biāo)注與大<b class='flag-5'>模型</b>的雙向賦能:效率與<b class='flag-5'>性能</b>的躍升

    多任務(wù)處理卡頓頻發(fā),無風(fēng)扇工控機(jī)如何優(yōu)化性能?聚徽廠家一文讀懂

    在工業(yè)自動(dòng)化、物聯(lián)網(wǎng)等領(lǐng)域的深度應(yīng)用中,無風(fēng)扇工控機(jī)常常需要同時(shí)運(yùn)行數(shù)據(jù)采集、實(shí)時(shí)監(jiān)控、程序控制等多個(gè)任務(wù)。然而,頻繁出現(xiàn)的多任務(wù)處理卡頓問題,不僅影響生產(chǎn)效率,還可能導(dǎo)致數(shù)據(jù)丟失、系統(tǒng)崩潰等
    的頭像 發(fā)表于 06-03 15:25 ?292次閱讀

    快速入門——LuatOS:sys庫(kù)多任務(wù)管理實(shí)戰(zhàn)攻略!

    在嵌入式開發(fā)中,多任務(wù)管理是提升系統(tǒng)效率的關(guān)鍵。本教程專為快速入門設(shè)計(jì),聚焦LuatOS的sys庫(kù),通過實(shí)戰(zhàn)案例帶你快速掌握多任務(wù)創(chuàng)建、調(diào)度與同步技巧。無論你是零基礎(chǔ)新手還是希望快速提升
    的頭像 發(fā)表于 05-29 14:36 ?211次閱讀
    快速入門——LuatOS:sys庫(kù)<b class='flag-5'>多任務(wù)</b>管理實(shí)戰(zhàn)攻略!

    BEVFusion —面向自動(dòng)駕駛的多任務(wù)多傳感器高效融合框架技術(shù)詳解

    ,激光雷達(dá)在3D視圖中捕獲數(shù)據(jù)。1. 核心目標(biāo)與創(chuàng)新?目標(biāo)? 解決多模態(tài)傳感器(攝像頭、激光雷達(dá)等)在3D感知任務(wù)中的異構(gòu)數(shù)據(jù)融合難題,實(shí)現(xiàn)高效、通用的多任務(wù)學(xué)習(xí)(如3D檢測(cè)、BEV分割)核心創(chuàng)新
    的頭像 發(fā)表于 02-26 20:33 ?3849次閱讀
    BEVFusion —面向自動(dòng)駕駛的<b class='flag-5'>多任務(wù)</b>多傳感器高效融合框架技術(shù)詳解

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+大模型微調(diào)技術(shù)解讀

    同時(shí)優(yōu)化多個(gè)相關(guān)任務(wù)的損失函數(shù)來提升模型的泛化能力。學(xué)習(xí)率調(diào)整策略:合理的學(xué)習(xí)率調(diào)整可以加速模型
    發(fā)表于 01-14 16:51

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    布外任務(wù)展示出多樣化和復(fù)雜的推廣能力。 知識(shí)載體 知識(shí)嵌入在訓(xùn)練期間學(xué)習(xí)模型參數(shù)中。 知識(shí)載體是記憶和隱藏狀態(tài),專注于上下文學(xué)習(xí)和適應(yīng)。 可擴(kuò)展性 通過擴(kuò)展參數(shù)和預(yù)訓(xùn)練數(shù)據(jù)集提高
    發(fā)表于 12-24 15:03

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    某些類型模型的訓(xùn)練過程。 保留稀疏激活:與ReLU類似,Leaky ReLU仍然能夠促進(jìn)稀疏激活,這對(duì)模型學(xué)習(xí)是有利的。 缺點(diǎn): 性能提升
    發(fā)表于 12-19 14:33

    DDR內(nèi)存頻率對(duì)性能的影響

    的整體性能,特別是在處理大量數(shù)據(jù)或運(yùn)行復(fù)雜程序時(shí),如視頻編輯、3D渲染和高端游戲等場(chǎng)景??焖俚膬?nèi)存可以縮短CPU和內(nèi)存之間的通信時(shí)間,從而提升整體系統(tǒng)的響應(yīng)效率。 二、多任務(wù)處理能力 內(nèi)存頻率高可以
    的頭像 發(fā)表于 11-20 14:25 ?3839次閱讀

    NPU技術(shù)如何提升AI性能

    設(shè)計(jì)的處理器,與傳統(tǒng)的CPU和GPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時(shí)具有更高的效率和更低的能耗。NPU通過專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)中的大量并行計(jì)算任務(wù)。 1. 優(yōu)化硬件架構(gòu) NPU技術(shù)通過優(yōu)化硬件架構(gòu)來
    的頭像 發(fā)表于 11-15 09:11 ?1438次閱讀

    深度學(xué)習(xí)模型的魯棒性優(yōu)化

    深度學(xué)習(xí)模型的魯棒性優(yōu)化是一個(gè)復(fù)雜但至關(guān)重要的任務(wù),它涉及多個(gè)方面的技術(shù)和策略。以下是一些關(guān)鍵的優(yōu)化方法: 一、數(shù)據(jù)預(yù)處理與增強(qiáng) 數(shù)據(jù)清洗 :去除數(shù)據(jù)中的噪聲和異常值,這是提高模型魯棒
    的頭像 發(fā)表于 11-11 10:25 ?1179次閱讀

    驍龍8至尊版性能實(shí)測(cè):自研Oryon?CPU實(shí)現(xiàn)45%性能與能效提升

    重磅升級(jí)后,天極網(wǎng)將通過跑分與游戲?qū)崪y(cè)為大家揭曉其真實(shí)性能與游戲表現(xiàn)。 高通Oryon?CPU:45%性能與能效提升 驍龍8至尊版集成第二代高通Oryon?CPU,基于臺(tái)積電第二代3nm制程工藝,采用“2+6”設(shè)計(jì)——擁有2顆4
    的頭像 發(fā)表于 10-25 10:01 ?2073次閱讀
    驍龍8至尊版<b class='flag-5'>性能</b>實(shí)測(cè):自研Oryon?CPU實(shí)現(xiàn)45%<b class='flag-5'>性能與</b>能效<b class='flag-5'>提升</b>

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度學(xué)習(xí)
    的頭像 發(fā)表于 10-23 15:25 ?2878次閱讀

    AI大模型性能優(yōu)化方法

    AI大模型性能優(yōu)化是一個(gè)復(fù)雜而關(guān)鍵的任務(wù),涉及多個(gè)方面和策略。以下是一些主要的性能優(yōu)化方法: 一、模型壓縮與優(yōu)化
    的頭像 發(fā)表于 10-23 15:01 ?2408次閱讀

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    今天來學(xué)習(xí)大語(yǔ)言模型在自然語(yǔ)言理解方面的原理以及問答回復(fù)實(shí)現(xiàn)。 主要是基于深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)。 大語(yǔ)言模型涉及以下幾個(gè)過程: 數(shù)據(jù)收集:大語(yǔ)言
    發(fā)表于 08-02 11:03