chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用對比前綴控制文本生成以及長文本生成的動態(tài)內(nèi)容規(guī)劃

深度學(xué)習(xí)自然語言處理 ? 來源:復(fù)旦DISC ? 作者:復(fù)旦DISC ? 2022-08-02 15:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

文本生成作為人工智能領(lǐng)域研究熱點(diǎn)之一,其研究進(jìn)展與成果也引發(fā)了眾多關(guān)注。本篇主要介紹了三篇ACL2022的三篇文章。主要包含了增強(qiáng)預(yù)訓(xùn)練語言模型理解少見詞語能力的可插拔模型、利用對比前綴控制文本生成以及長文本生成的動態(tài)內(nèi)容規(guī)劃。

文章概覽

1. A Simple but Effective Pluggable Entity Lookup Table for Pre-trained Language Models

一個簡單但有效的預(yù)訓(xùn)練語言模型的可插拔實(shí)體查找表

論文地址:https://arxiv.org/pdf/2202.13392.pdf

預(yù)訓(xùn)練語言模型(PLM)不能很好地回憶大規(guī)模語料庫中實(shí)體詞語的知識,尤其是那些少見的實(shí)體。這篇文章通過將實(shí)體在語料庫中多次出現(xiàn)的輸出嵌入表示結(jié)合起來,構(gòu)建了一個簡單但有效的可插拔實(shí)體查找表(PELT)。PELT可以兼容地插入PLM,向其補(bǔ)充實(shí)體詞語的知識。與以往的知識增強(qiáng)PLM相比,PELT僅需要0.2% ~ 5%預(yù)訓(xùn)練的計(jì)算量,并具有從不同領(lǐng)域語料庫獲取知識的能力。

2. Controllable Natural Language Generation with Contrastive Prefixes

帶有對比前綴的可控文本生成

論文地址:https://arxiv.org/pdf/2202.13257.pdf

為了引導(dǎo)預(yù)訓(xùn)練語言模型的生成具有某種屬性的文本,以前的工作主要集中在微調(diào)語言模型或利用屬性鑒別器。這篇文章在前綴微調(diào)的基礎(chǔ)上進(jìn)行改進(jìn),考慮了前綴之間的關(guān)系,同時訓(xùn)練多個前綴。本文提出了一種新的監(jiān)督學(xué)習(xí)和一種無監(jiān)督學(xué)習(xí)來訓(xùn)練單個屬性標(biāo)簽控制的前綴,而這兩種方法的結(jié)合可以實(shí)現(xiàn)多個屬性標(biāo)簽的控制。實(shí)驗(yàn)結(jié)果表明,該方法能夠在保持較高語言質(zhì)量的同時,引導(dǎo)生成文本具有所需的屬性。

3. PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation

PLANET:用于長文本生成的自回歸Transformer中的動態(tài)內(nèi)容規(guī)劃

論文地址:https://arxiv.org/pdf/2203.09100.pdf

現(xiàn)有的方法在長文本生成任務(wù)中存在邏輯不連貫的問題,這篇文章提出了一個新的生成框架PLANET,利用自回歸的自注意力機(jī)制來動態(tài)地進(jìn)行內(nèi)容規(guī)劃和表層實(shí)現(xiàn)。為了指導(dǎo)輸出句子的生成,該框架將句子的潛在表征補(bǔ)充到Transformer解碼器中,以維持基于詞袋的句子級語義規(guī)劃。此外,該模型引入了一個基于文本連貫性的對比學(xué)習(xí)目標(biāo),以進(jìn)一步提高輸出的內(nèi)容連貫性。在反駁論點(diǎn)生成和觀點(diǎn)文章生成這兩個任務(wù)中,該方法明顯優(yōu)于base line,能生成更連貫的文本和更豐富的內(nèi)容。

論文

01001b50-118e-11ed-ba43-dac502259ad0.png

動機(jī)

一些最新的研究表明,預(yù)訓(xùn)練語言模型(PLM)可以通過自我監(jiān)督的預(yù)訓(xùn)練從大規(guī)模語料庫中自動獲取知識,然后將學(xué)到的知識編碼到模型參數(shù)中。然而,由于詞匯量有限,PLM難以從大規(guī)模語料庫中回憶知識,尤其是少見的實(shí)體。

為了提高PLM理解實(shí)體的能力,目前有兩種方法:

一是從知識圖譜、實(shí)體描述或語料庫中獲得外部實(shí)體詞嵌入。為了利用外部知識,模型將原始詞嵌入與外部實(shí)體嵌入對齊。缺點(diǎn)是忽略了從PLM本身探索實(shí)體嵌入,使得所學(xué)到的嵌入沒有領(lǐng)域適應(yīng)性。

二是通過額外的預(yù)訓(xùn)練將知識注入PLM的參數(shù)中,例如從語料庫構(gòu)建額外的實(shí)體詞匯,或采用與實(shí)體相關(guān)的訓(xùn)練前任務(wù)來強(qiáng)化實(shí)體表示。缺點(diǎn)是額外預(yù)訓(xùn)練計(jì)算量過于龐大,增加了下游任務(wù)擴(kuò)展或更新定制詞匯表的成本。

本文為了解決前兩種方法的缺點(diǎn),引入了一個簡單有效的可插拔實(shí)體查找表(PELT),將知識注入到PLM中。優(yōu)點(diǎn)是只消耗相當(dāng)于0.2% ~ 5%的預(yù)訓(xùn)練計(jì)算量,并且支持來自不同領(lǐng)域的詞匯。

01182696-118e-11ed-ba43-dac502259ad0.png

模型

重新審視Masked Language Modeling

PLM進(jìn)行自我監(jiān)督的預(yù)訓(xùn)練任務(wù),如掩碼語言建模(Masked Language Modeling,MLM),從大規(guī)模未標(biāo)記語料庫中學(xué)習(xí)語義和句法知識。MLM可以看作是一種完形填空任務(wù),根據(jù)上下文表示來預(yù)測缺失的詞。

給定一個詞序列, MLM先將其中某個詞語替換為[MASK]標(biāo)記,再將替換之后的進(jìn)行詞嵌入和位置嵌入作為PLM的輸入,獲得上下文表示:

01297de2-118e-11ed-ba43-dac502259ad0.png

其中為Transformer的編碼器,為層歸一化,為詞嵌入,為位置嵌入。

然后PLM使用前饋神經(jīng)網(wǎng)絡(luò)(FFN)來輸出被掩蓋位置的預(yù)測詞嵌入

013b128c-118e-11ed-ba43-dac502259ad0.png

進(jìn)一步計(jì)算在所有單詞之間的交叉熵?fù)p失

0153dcfe-118e-11ed-ba43-dac502259ad0.png

重新審視上式中的損失,可以直觀地觀察到詞嵌入和PLM的輸出位于同一個向量空間。因此,我們能夠從PLM的輸出補(bǔ)充實(shí)體詞的嵌入,將其上下文知識注入到模型中。

構(gòu)建可插拔的實(shí)體嵌入

具體地說,給定一個通用的或特定于領(lǐng)域的語料庫,本文的模型構(gòu)建了一個實(shí)體詞查找表。對于實(shí)體,例如Wikidata實(shí)體或?qū)S忻~實(shí)體,我們構(gòu)造其嵌入如下:

步驟1:收集所有包含實(shí)體e的句子,并用[MASK]掩蓋

為了在PLM詞匯表中加入實(shí)體,可以在其他參數(shù)被凍結(jié)的情況下優(yōu)化其嵌入。首先收集包含實(shí)體的句子,并用[MASK]替換。在中,對MLM損失的影響為

0165be6a-118e-11ed-ba43-dac502259ad0.png

其中

0175bb12-118e-11ed-ba43-dac502259ad0.png

步驟2:求

與整個詞匯量對的影響相比,的影響要小得多。如果忽略這部分影響,

求對的最優(yōu)解,那么的結(jié)果與成正比,記為

01813eec-118e-11ed-ba43-dac502259ad0.png

其中為比例因子。

這里說明了將若干個相加即可得到實(shí)體的新嵌入表示,如下圖所示。

0194366e-118e-11ed-ba43-dac502259ad0.png

將實(shí)體知識注入PLM

由于上述得到的新的實(shí)體嵌入和原始詞嵌入都是從MLM中獲得的,因此新的實(shí)體嵌入可以看作是一個特殊的輸入表示。為了將實(shí)體知識注入到PLM中,本文使用一對括號將構(gòu)建的新嵌入包圍起來,然后將其插入到原始實(shí)體詞嵌入之后。例如,原始輸入為Most people with COVID-19 have a dry [MASK] they can feel in their chest.,在注入新嵌入之后變?yōu)?Most people with COVID-19(COVID-19)have a dry [MASK] they can feel in their chest.

括號中的即為實(shí)體COVID-19新嵌入,而其他詞使用了原來的嵌入。本文只是將修改后的輸入傳遞給PLM進(jìn)行編碼,而不需要任何額外的結(jié)構(gòu)或參數(shù),以幫助模型預(yù)測[MASK]處的單詞為"cough"。

實(shí)驗(yàn)

論文比較了關(guān)系分類、知識獲取的準(zhǔn)確率:

01b44274-118e-11ed-ba43-dac502259ad0.png

01d153b4-118e-11ed-ba43-dac502259ad0.png

01e7f3a8-118e-11ed-ba43-dac502259ad0.png

以及對低頻率實(shí)體性能的提升:

0203099a-118e-11ed-ba43-dac502259ad0.png

論文

0214ac0e-118e-11ed-ba43-dac502259ad0.png

動機(jī)

可控文本生成的任務(wù)是引導(dǎo)文本向著期望屬性生成。屬性之間往往存在相互關(guān)系,例如,對情感這個主題可以設(shè)定兩個對立的屬性:積極和消極,作者認(rèn)為這種相反的關(guān)系有助于提高前綴的可控性,訓(xùn)練時將某個主題的所有屬性一起訓(xùn)練,但每個屬性都各自訓(xùn)練一個前綴,且前綴互相獨(dú)立。

模型

本文的方法是使用前綴來引導(dǎo)GPT-2的文本生成,其中前綴是一個屬性特定的連續(xù)向量,位于GPT-2激活層之前。某個主題的前綴集合記為。與Li和Liang(2021)的每個屬性前綴都獨(dú)立訓(xùn)練不同,作者考慮了屬性之間的關(guān)系,同時訓(xùn)練多個前綴。

的維數(shù)為,其中為前綴數(shù)量,在單主題控制中,等于屬性的數(shù)量。為前綴向量的長度。,為GPT-2中激活層維度,其中為Transformer層數(shù),為隱藏層大小,代表一個key向量和一個value向量。仿照Li和Liang(2021)的做法,作者通過一個大矩陣和有較小參數(shù)的對進(jìn)行訓(xùn)練,式子為。訓(xùn)練結(jié)束后,只需要保留,和可以丟棄。由于GPT-2參數(shù)在訓(xùn)練時被固定,因此也不需要保存。

下圖顯示了一個在訓(xùn)練后的前綴控制下生成文本的示例。這些前綴可以以監(jiān)督、半監(jiān)督或無監(jiān)督的方式進(jìn)行訓(xùn)練。由于半監(jiān)督方法是監(jiān)督方法和無監(jiān)督方法的結(jié)合,所以文章將介紹監(jiān)督方法和無監(jiān)督方法。為了清晰起見,文章在單主題控制設(shè)置下介紹這些方法。

0229aa64-118e-11ed-ba43-dac502259ad0.png

監(jiān)督學(xué)習(xí)

假設(shè)相關(guān)主題有屬性集,每個訓(xùn)練樣本都是一對,其中是輸入文本,,為的屬性。注意屬性同時表示中前綴的索引,因此在下面的描述中也表示前綴索引。

給定一個訓(xùn)練樣本,對前綴進(jìn)行優(yōu)化以生成,而不鼓勵其他前綴生成。為了實(shí)現(xiàn)這一目標(biāo),中的所有前綴都應(yīng)該同時進(jìn)行訓(xùn)練,且需要引入額外的損失函數(shù)。因此,總訓(xùn)練損失是語言模型損失與對比損失的加權(quán)和:

0239f018-118e-11ed-ba43-dac502259ad0.png

損失能夠讓生成的文本包含鼓勵生成的信息,損失能夠讓生成的文本去除不鼓勵產(chǎn)生的信息,代表著不同屬性之間的“距離”。整個訓(xùn)練過程如下圖所示。

02527656-118e-11ed-ba43-dac502259ad0.png

無監(jiān)督學(xué)習(xí)

在無監(jiān)督學(xué)習(xí)中,假設(shè)相關(guān)主題的屬性集是已知的。訓(xùn)練樣本只包含輸入文本。屬性不再可用,因此與x關(guān)聯(lián)的前綴的索引是未知的。因此,對應(yīng)的前綴的索引是一個潛變量,其后驗(yàn)分布遵循分類分布。

文章采用上述監(jiān)督學(xué)習(xí)中的主要模型作為解碼器,并引入一個編碼器來參數(shù)化分類分布,根據(jù)選擇前綴索引,然后將前綴輸入解碼器。由于前綴的選擇過程不可微,作者使用Gumbel-Softmax松弛,計(jì)算如下:

0286f94e-118e-11ed-ba43-dac502259ad0.png

其中是Gumbel-Softmax的溫度,是編碼器函數(shù)。

為了訓(xùn)練前綴,總損失函數(shù)是三個損失項(xiàng)的加權(quán)和:

029b5df8-118e-11ed-ba43-dac502259ad0.png

其中為語言模型損失。是KL散度,這里作者假設(shè)先驗(yàn)是均勻分布。注意,這兩項(xiàng)構(gòu)成了VAE的損失函數(shù),優(yōu)化這兩個損失項(xiàng)可以改善的證據(jù)下界。

為無監(jiān)督對比損失,類似于監(jiān)督學(xué)習(xí)中,但計(jì)算方式不同,因?yàn)檎鎸?shí)屬性不可用。其中為預(yù)先設(shè)置的距離,是另一個表示相對前綴索引的潛在變量,計(jì)算方法如下

02ab89f8-118e-11ed-ba43-dac502259ad0.png

的目的是通過將從推開一段距離。的計(jì)算如下:

02d5d618-118e-11ed-ba43-dac502259ad0.png

實(shí)驗(yàn)

作者做了三個實(shí)驗(yàn),分別是情感控制、去除有害文本、主題控制。結(jié)果說明了模型在引導(dǎo)生成文本具有某種屬性的能力上有提升

02e471e6-118e-11ed-ba43-dac502259ad0.png

03142882-118e-11ed-ba43-dac502259ad0.png

0334581e-118e-11ed-ba43-dac502259ad0.png

論文

03489914-118e-11ed-ba43-dac502259ad0.png

動機(jī)

盡管預(yù)訓(xùn)練語言模型在生成流暢文本方面取得了進(jìn)展,但現(xiàn)有的方法在長文本生成任務(wù)中仍然存在邏輯不連貫的問題,這些任務(wù)需要適當(dāng)?shù)膬?nèi)容規(guī)劃,以形成連貫的高級邏輯流?,F(xiàn)有的方法大致分為兩類,一類是全局規(guī)劃,利用潛在變量作為全局規(guī)劃來指導(dǎo)生成過程,但是沒有考慮細(xì)粒度的句子級規(guī)劃。

03720b14-118e-11ed-ba43-dac502259ad0.png

另一類是兩階段規(guī)劃,首先生成句子級的內(nèi)容規(guī)劃,然后將內(nèi)容規(guī)劃傳遞給表層實(shí)現(xiàn)模塊生成文本,但是內(nèi)容規(guī)劃和表層實(shí)現(xiàn)模塊是脫節(jié)的,無法反向傳播,會導(dǎo)致錯誤累積。

0390d5e4-118e-11ed-ba43-dac502259ad0.png

因此文章提出了一個新的生成框架PLANET,利用自回歸的自我注意力機(jī)制來動態(tài)地進(jìn)行內(nèi)容規(guī)劃和表層實(shí)現(xiàn)。

03a07486-118e-11ed-ba43-dac502259ad0.png

模型

任務(wù)描述

輸入:

(1)一個語句,該語句可以是論點(diǎn)生成的主題,也可以是文章生成的標(biāo)題,

(2)與該語句相關(guān)的一組無序的關(guān)鍵短語,作為話題的引導(dǎo)信號,對長文本生成任務(wù)進(jìn)行建模。

輸出:

一個由多個句子組成的文本,以連貫的邏輯恰當(dāng)?shù)胤从沉酥黝}和關(guān)鍵短語。

訓(xùn)練目標(biāo):

03bb783a-118e-11ed-ba43-dac502259ad0.png

整體框架如圖

03c714f6-118e-11ed-ba43-dac502259ad0.png

潛在表征學(xué)習(xí)

為每個目標(biāo)句子引入一個潛在表征,來表示整個語義信息,并指導(dǎo)詞的生成。

步驟一:在每個目標(biāo)句子前插入一個標(biāo)記,并將解碼器在對應(yīng)位置的隱藏層作為目標(biāo)句子的潛在表征。

步驟二:當(dāng)產(chǎn)生第j個輸出句子時,潛在表征首先通過前面的潛在表征和前面句子計(jì)算得到。

步驟三:在句子表層實(shí)現(xiàn)時,之前生成的句子和潛在表征都參與到當(dāng)前句子的計(jì)算中,且以當(dāng)前潛在表征為指導(dǎo)。

0401d190-118e-11ed-ba43-dac502259ad0.png

內(nèi)容選擇

關(guān)鍵詞潛在表征

先將關(guān)鍵詞用分隔符拼接,輸入編碼器以獲得潛在表征,再收集這些潛在表征,構(gòu)建關(guān)鍵詞存儲庫

內(nèi)容選擇層

內(nèi)容選擇層從關(guān)鍵詞存儲庫B中檢索關(guān)鍵詞信息,并將所選信息集成到解碼過程中。

步驟一:在解碼時間步,Transformer解碼器的頂層表示通過多頭注意力連接到關(guān)鍵詞存儲庫,獲得加入所選關(guān)鍵詞信息的上下文向量

0412e4bc-118e-11ed-ba43-dac502259ad0.png

步驟二:通過前饋層和殘差連接(RC)將關(guān)鍵詞上下文向量合并到解碼器的隱藏層中

0426f74a-118e-11ed-ba43-dac502259ad0.png

步驟三:通過softmax將增強(qiáng)后的隱藏層傳遞到另一個前饋層,估計(jì)每個輸出詞的概率

04393de2-118e-11ed-ba43-dac502259ad0.png

句子級詞袋規(guī)劃

該部分的目的是監(jiān)督潛在表征SN的學(xué)習(xí)過程。目的是通過目標(biāo)句子的詞袋來反映全局語義規(guī)劃,從而為潛在表征的意義奠定基礎(chǔ)。

將第j個目標(biāo)句子的詞袋定義為整個詞匯上的分類分布。其中,為多層前饋網(wǎng)絡(luò)。我們期望該分布能夠捕捉到對應(yīng)句子的整體語義規(guī)劃。

044abe50-118e-11ed-ba43-dac502259ad0.png

損失函數(shù):最大化預(yù)測每個目標(biāo)句子詞袋的可能性。

045e00a0-118e-11ed-ba43-dac502259ad0.png

基于一致性的對比學(xué)習(xí)

該部分的目的是加強(qiáng)內(nèi)容規(guī)劃,并驅(qū)動模型學(xué)習(xí)更加連貫的輸出。于是進(jìn)一步設(shè)計(jì)了一個對比學(xué)習(xí)(CL)的訓(xùn)練任務(wù)。

負(fù)樣本構(gòu)造

將原始目標(biāo)句子視為代表邏輯連貫輸出的正樣本,并構(gòu)造不連貫的負(fù)樣本。

對于一個正樣本,根據(jù)以下策略創(chuàng)建4個負(fù)樣本:

?SHUFFLE:隨機(jī)打亂目標(biāo)句子

?REPLACE:將50%的原始目標(biāo)句子隨機(jī)替換為語料庫中的隨機(jī)句子

?DIFFERENT:將所有原始目標(biāo)句子全部替換為語料庫中的隨機(jī)句子

?MASK:從關(guān)鍵詞集合中隨機(jī)掩蓋與關(guān)鍵詞相關(guān)的20%的非停詞,并采用BART填充掩蓋的位置

損失函數(shù)

模型將內(nèi)容選擇層的輸出表征映射到0到1之間的一致性得分,并且強(qiáng)制原始目標(biāo)句子的得分比所有對應(yīng)的負(fù)樣本都大,即設(shè)定一個固定的邊界

04745b70-118e-11ed-ba43-dac502259ad0.png

其中,是sigmoid變換,和是正樣本和負(fù)樣本在內(nèi)容選擇層的輸出表征,是平均池化層

訓(xùn)練目標(biāo)函數(shù)

損失函數(shù)聯(lián)合優(yōu)化了內(nèi)容規(guī)劃和表層實(shí)現(xiàn)模型,結(jié)合了以下目標(biāo)函數(shù):

?句子級詞袋規(guī)劃損失函數(shù)()

?交叉熵?fù)p失函數(shù)()

?對比學(xué)習(xí)損失函數(shù)()

0485c96e-118e-11ed-ba43-dac502259ad0.png

其中α和β被為超參數(shù)。

實(shí)驗(yàn)

在論點(diǎn)生成和觀點(diǎn)文章生成任務(wù)上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明了方法在兩種任務(wù)上都有提升。

0498794c-118e-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49700

    瀏覽量

    261114
  • PLM
    PLM
    +關(guān)注

    關(guān)注

    2

    文章

    146

    瀏覽量

    21931
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    17733

原文標(biāo)題:ACL2022 | 文本生成的相關(guān)前沿進(jìn)展

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    萬里紅文本生成算法通過國家網(wǎng)信辦備案

    近日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了第十四批深度合成服務(wù)算法備案信息,北京萬里紅科技有限公司(以下簡稱:萬里紅)自主研發(fā)的“萬里紅文本生成算法”正式通過備案。該算法致力于通過自動化的方式,提升知識問答、RAG分類、預(yù)測、文檔生成的準(zhǔn)確率,確保信息的安全性和合規(guī)性,為用戶提供及
    的頭像 發(fā)表于 11-14 09:06 ?376次閱讀

    基于Arm架構(gòu)的新款聯(lián)想Chromebook Plus設(shè)備亮相

    從實(shí)時文本生成、摘要提煉,到智能助手與高級搜索,人工智能 (AI) 已成為現(xiàn)代消費(fèi)電子設(shè)備體驗(yàn)中不可或缺的要素,正在重新定義人們工作與娛樂的方式。
    的頭像 發(fā)表于 07-03 14:43 ?927次閱讀

    關(guān)于鴻蒙App上架中“AI文本生成模塊的資質(zhì)證明文件”的情況說明

    的應(yīng)用缺少AI文本生成模塊的資質(zhì)證明文件,不符合相關(guān)法律法規(guī)要求。 修改建議:AI文本生成模塊需補(bǔ)充提供《安全評估報(bào)告》并加手寫簽名、《安全評估報(bào)告》在全國互聯(lián)網(wǎng)安全服務(wù)管理平臺的提交結(jié)果截圖,且現(xiàn)場
    發(fā)表于 06-30 18:37

    邊緣生成式AI面臨哪些工程挑戰(zhàn)?

    本文由TechSugar編譯自electronicdesign當(dāng)大多數(shù)人想到人工智能(AI)時,他們通常能想到的是能夠生成文本、圖像或語音內(nèi)容的應(yīng)用。像ChatGPT這樣流行的文本應(yīng)
    的頭像 發(fā)表于 06-25 10:44 ?880次閱讀
    邊緣<b class='flag-5'>生成</b>式AI面臨哪些工程挑戰(zhàn)?

    生成式人工智能認(rèn)證:重構(gòu)AI時代的人才培養(yǎng)與職業(yè)躍遷路徑

    ,恰似一座連接技術(shù)前沿與個體成長的橋梁,既承載著時代對人才的迫切需求,也指向著未來職場的核心競爭力。 一、技術(shù)革命的雙重性:賦能與失衡并存 生成式人工智能的突破性,在于其首次讓機(jī)器具備了“無中生有”的創(chuàng)造力。從文本生成到圖像
    的頭像 發(fā)表于 05-23 09:29 ?585次閱讀

    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實(shí)測報(bào)告

    DeepSeek-R1 模型在 4 張 NVIDIA RTX 5880 Ada 顯卡配置下,面對短文本生成、長文本生成、總結(jié)概括三大實(shí)戰(zhàn)場景,會碰撞出怎樣的性能火花?參數(shù)規(guī)模差異懸殊的 70B
    的頭像 發(fā)表于 03-17 11:12 ?2558次閱讀
    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實(shí)測報(bào)告

    stm32cubemx 6.13.0(win)版本生成代碼中文注釋亂碼怎么解決?

    stm32cubemx 6.13.0(win)版本生成代碼中文注釋亂碼
    發(fā)表于 03-11 07:10

    飛凌RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南(一)

    DeepSeek作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長文本處理效能躍遷、多模態(tài)擴(kuò)展規(guī)劃、嵌入式適配等技術(shù)維度
    的頭像 發(fā)表于 02-21 14:55 ?2971次閱讀
    飛凌RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南(一)

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇

    : 1. 核心定位差異 維度 DeepSeek-V3 DeepSeek-R1 目標(biāo)場景 通用型任務(wù)(文本生成、多輪對話等) 復(fù)雜推理與數(shù)學(xué)能力優(yōu)先(如STEM領(lǐng)域) 優(yōu)化方向 平衡性能與成本,覆蓋廣泛
    發(fā)表于 02-14 02:08

    BQ3588/BQ3576系列開發(fā)板深度融合DeepSeek-R1大模型

    DeepSeek 作為國產(chǎn) AI 大數(shù)據(jù)模型的杰出典范,以出色的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域中備受矚目。DeepSeek-R1-distill-Qwen-7B 作為該系列的最新迭代版本,在長文本處理效能、多模態(tài)擴(kuò)展規(guī)
    的頭像 發(fā)表于 02-12 11:20 ?1174次閱讀

    BQ3588/BQ3576系列開發(fā)板成功部署 DeepSeek-R1開發(fā)板

    ,在長文本處理效能、多模態(tài)擴(kuò)展規(guī)劃以及嵌入式適配等技術(shù)維度上實(shí)現(xiàn)了重大突破。BQ3576系列開發(fā)板依托瑞芯微RK3576平臺處理器,具備四個A72核心與四個A53核
    的頭像 發(fā)表于 02-12 09:26 ?1876次閱讀
    BQ3588/BQ3576系列開發(fā)板成功部署 DeepSeek-R1開發(fā)板

    阿里云通義開源長文本新模型Qwen2.5-1M

    近日,阿里云通義宣布了一項(xiàng)重大開源舉措,推出了支持100萬Tokens上下文的Qwen2.5-1M模型。這一新模型在處理長文本任務(wù)中展現(xiàn)出了卓越的性能,穩(wěn)定超越了GPT-4o-mini
    的頭像 發(fā)表于 02-05 14:01 ?757次閱讀

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

    理和理解這些數(shù)據(jù)。在自然語言處理中,Embedding常用于將文本數(shù)據(jù)中的單詞、句子或文檔映射為固定長度的實(shí)數(shù)向量,這些向量包含了豐富的語義信息。RAG技術(shù)是一種結(jié)合信息檢索與文本生成能力的技術(shù),它通過
    發(fā)表于 01-17 19:53

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、音頻、視頻等
    發(fā)表于 01-13 10:46

    AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、音頻、視頻等
    發(fā)表于 01-13 10:32