chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型時(shí)代下的新一代廣告系統(tǒng)

京東云 ? 來(lái)源:jf_75140285 ? 作者:jf_75140285 ? 2024-09-20 14:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

京東零售廣告部承擔(dān)著京東全站流量變現(xiàn)及營(yíng)銷(xiāo)效果提升的重要職責(zé),廣告研發(fā)部是京東最核心的技術(shù)部門(mén),也是京東最主要的盈利來(lái)源之一。作為京東廣告部的核心方向,我們基于京東海量的用戶(hù)和商家數(shù)據(jù),探索最前沿的深度學(xué)習(xí)算法技術(shù),創(chuàng)新并應(yīng)用到業(yè)務(wù)實(shí)踐中,賦能千萬(wàn)商家和數(shù)億消費(fèi)者的消費(fèi)連接,不斷拓展中國(guó)乃至全世界的數(shù)字經(jīng)濟(jì)邊界。

在這里,你將與各業(yè)務(wù)、產(chǎn)品、工程團(tuán)隊(duì)緊密合作,深入京東億量級(jí)的數(shù)據(jù)與豐富的廣告業(yè)務(wù)場(chǎng)景,進(jìn)行前沿AI算法和工程架構(gòu)的研究與應(yīng)用工作。通過(guò)AGI算法創(chuàng)新和行業(yè)領(lǐng)先的廣告技術(shù),賦能京東多個(gè)業(yè)務(wù)線(xiàn)的廣告投放和管理需求,幫助商家實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo),同時(shí)提升用戶(hù)購(gòu)物體驗(yàn),推動(dòng)京東的商業(yè)增長(zhǎng),創(chuàng)造數(shù)以?xún)|計(jì)的業(yè)務(wù)貢獻(xiàn)。

大模型時(shí)代的到來(lái),新一代廣告系統(tǒng)中,我們目前重點(diǎn)攻堅(jiān)以下五個(gè)方向,歡迎敢于挑戰(zhàn)、有夢(mèng)想的同學(xué),和我們一起共事。讓我們一起來(lái)看看新一代廣告系統(tǒng)中如何實(shí)現(xiàn)大模型時(shí)代的流量?jī)r(jià)值預(yù)估、流量售賣(mài)機(jī)制、生成式推薦、智能創(chuàng)意以及承載它的算法工程體系。

?

文末有最新的機(jī)會(huì)喲~

?

?

一、流量?jī)r(jià)值預(yù)估——更好的人貨場(chǎng)理解能力

1、廣告用戶(hù)意圖理解

Query意圖識(shí)別是電商搜索中離用戶(hù)最近和最基礎(chǔ)的一個(gè)模塊,主要的功能是精確地理解用戶(hù)的搜索意圖,為下游的召回/相關(guān)性/排序提供決策信息和特征。Query意圖識(shí)別主要是做分詞、糾錯(cuò)、NER、品牌識(shí)別、類(lèi)目預(yù)測(cè)和query改寫(xiě)等,需準(zhǔn)確捕捉用戶(hù)意圖輔助下游決策,是供需匹配和用戶(hù)體驗(yàn)的基礎(chǔ)。

當(dāng)前query意圖識(shí)別訓(xùn)練樣本的產(chǎn)生邏輯導(dǎo)致約85%的query預(yù)測(cè)的類(lèi)目都是單類(lèi)目,且多標(biāo)簽樣本的標(biāo)簽量較少。因此亟需在保持現(xiàn)有的類(lèi)目精準(zhǔn)度情況下,提升類(lèi)目的召回率。通過(guò)分析,主要存在以下類(lèi)型的query的高相關(guān)召回率不足:

?泛詞的多意圖:側(cè)重知識(shí)類(lèi),詞與具體商品之間需要知識(shí)關(guān)聯(lián),例如:水果,生日禮物,燈;

?歧義詞的多意圖:多意圖query下,基于樣本生成邏輯,會(huì)偏向主意圖,弱化甚至丟失次意圖,導(dǎo)致召回問(wèn)題,例如:小米(糧食or手機(jī)?),蘋(píng)果(水果or手機(jī)?);

?長(zhǎng)尾類(lèi)目冷啟:由于用戶(hù)點(diǎn)擊數(shù)據(jù)的馬太效應(yīng),使得大量的長(zhǎng)尾類(lèi)目沒(méi)有曝光機(jī)會(huì),類(lèi)目下商品無(wú)法獲得點(diǎn)擊,加深了模型無(wú)法得到長(zhǎng)尾類(lèi)目訓(xùn)練數(shù)據(jù)的問(wèn)題,例如: 服務(wù)類(lèi),健康類(lèi),工業(yè)品類(lèi);

?長(zhǎng)尾query的多意圖:由于用戶(hù)背景和表達(dá)習(xí)慣不同,對(duì)同類(lèi)商品需求,會(huì)有多種表達(dá)方式,產(chǎn)生很多長(zhǎng)尾query。模型給出的類(lèi)目不準(zhǔn),因此產(chǎn)生的點(diǎn)擊數(shù)據(jù)也不夠準(zhǔn)確。

?

生成-判別模型增強(qiáng)長(zhǎng)尾類(lèi)目訓(xùn)練數(shù)據(jù)

模型的訓(xùn)練依賴(lài)query點(diǎn)擊商品的類(lèi)目來(lái)作為監(jiān)督信號(hào)。像這些偏冷啟動(dòng)類(lèi)目的商品,我們希望通過(guò)增加商品曝光來(lái)讓它們獲得更多點(diǎn)擊。有了點(diǎn)擊數(shù)據(jù),就能正向影響下次模型迭代,讓模型下一次可以預(yù)測(cè)的更準(zhǔn)。從而讓整個(gè)模型迭代的流程形成良性循環(huán),而不是馬太效應(yīng)的惡性循環(huán)。

wKgZombtGKaAbAYwAAIkQuMzOfE837.png

解決方案:針對(duì)訓(xùn)練樣本的類(lèi)目高度不平衡問(wèn)題,我們?cè)O(shè)計(jì)了生成-匹配模型,預(yù)訓(xùn)練一個(gè)query生成模型+query-SKU匹配模型,生成模型用來(lái)根據(jù)SKU的標(biāo)題/屬性信息生成query,匹配模型用于計(jì)算生成query和原SKU title的相關(guān)性分?jǐn)?shù),卡掉低質(zhì)量的query,保證生成query的質(zhì)量。Sku的類(lèi)目作為生成query的類(lèi)目,補(bǔ)充到類(lèi)目預(yù)測(cè)的訓(xùn)練樣本中,平衡和緩解訓(xùn)練集類(lèi)目失衡問(wèn)題,讓模型能夠?qū)W習(xí)到用戶(hù)query中的長(zhǎng)尾類(lèi)目需求,從而讓長(zhǎng)尾類(lèi)目商品有一定的曝光機(jī)會(huì)。

wKgaombtGKeAflQCAAOIk3_KCjg592.png

生成數(shù)據(jù)樣例:

wKgZombtGKmALlHsAASZ5ZvX1hM297.png

基于搜索日志數(shù)據(jù)預(yù)訓(xùn)練的生成-匹配模型不僅可以在類(lèi)目預(yù)測(cè)中使用,也可以用在其他相關(guān)業(yè)務(wù)線(xiàn)。例如query suggestion 和 query改寫(xiě)業(yè)務(wù),根據(jù)sku title生成的query可以作為兩者的query召回源。

?

先驗(yàn)知識(shí)注入模型解決中長(zhǎng)尾類(lèi)目召回不足導(dǎo)致的商家獲量困難問(wèn)題

算法訓(xùn)練以用戶(hù)點(diǎn)擊sku的類(lèi)目為標(biāo)簽。但由于馬太效應(yīng),高點(diǎn)擊商品的類(lèi)目才能獲得展現(xiàn)。模型的更新,反而會(huì)加劇馬太效應(yīng),形成惡性循環(huán)。

?用戶(hù)反饋信號(hào)被高頻類(lèi)目主導(dǎo),需打破僅依賴(lài)用戶(hù)反饋的馬太效應(yīng)閉環(huán)。例如:用戶(hù)搜“耳機(jī)”,相關(guān)類(lèi)目包含 862-手機(jī)耳機(jī),842-藍(lán)牙耳機(jī)... 等9個(gè)三級(jí)類(lèi)目。由于馬太效應(yīng),系統(tǒng)只能展現(xiàn)出1~2個(gè)高點(diǎn)擊類(lèi)目的商品,中長(zhǎng)尾類(lèi)目下商品無(wú)展現(xiàn)。

?業(yè)界最新算法,也高度依賴(lài)后驗(yàn)反饋信號(hào),無(wú)法召回中長(zhǎng)尾類(lèi)目。

?

解決方案:通過(guò)引入先驗(yàn)知識(shí)和模型的優(yōu)化,增強(qiáng)模型對(duì)電商知識(shí)的感知,弱化模型對(duì)后驗(yàn)反饋的依賴(lài):引入先驗(yàn)知識(shí):類(lèi)目語(yǔ)義知識(shí)、類(lèi)目共現(xiàn)/語(yǔ)義關(guān)系圖。通過(guò)提取類(lèi)目名、類(lèi)目的產(chǎn)品詞等,代表類(lèi)目側(cè)的語(yǔ)義表征。通過(guò)類(lèi)目關(guān)系圖,反映類(lèi)目共點(diǎn)擊和語(yǔ)義相似關(guān)系,實(shí)現(xiàn)頭部類(lèi)目帶長(zhǎng)尾(相關(guān))類(lèi)目來(lái)提升召回率。學(xué)習(xí)先驗(yàn)知識(shí):設(shè)計(jì)新模型,以BERT為文本編碼器,學(xué)習(xí)Query和類(lèi)目表征。以多通道GCN為圖結(jié)構(gòu)編碼器,學(xué)習(xí)類(lèi)目之間的關(guān)系。設(shè)計(jì)半監(jiān)督Loss,通過(guò)query-類(lèi)目語(yǔ)義匹配分?jǐn)?shù),作為監(jiān)督信號(hào)增強(qiáng)類(lèi)目標(biāo)簽。

wKgaombtGKuAL_tNAAdEetSJI2k607.png

?

chaijie_default.png

算法方案發(fā)表于WWW 2024《A Semi-supervised Multi-channel Graph Convolutional Network for Query Classification in E-commerce》

?

2、廣告多模態(tài)內(nèi)容理解

隨著富媒體時(shí)代的到來(lái),商業(yè)廣告已告別了純文本廣告時(shí)代,圖文廣告、視頻廣告已成為廣告主進(jìn)行創(chuàng)意表達(dá)的新型方式。目前京東APP中的推薦和搜索頁(yè)面均包含大量圖像、視頻形式的商品展示。在此場(chǎng)景下,傳統(tǒng)單模態(tài)or少模態(tài)的建模方式,有以下問(wèn)題:

?無(wú)法建模視覺(jué)信息對(duì)用戶(hù)行為的影響,用戶(hù)對(duì)商品展示效果的偏好無(wú)法建模。

?只局限在文本/ID特征上,無(wú)法對(duì)商品細(xì)節(jié)進(jìn)行精準(zhǔn)建模。

?大量使用物料 ID 特征會(huì)帶來(lái)模型記憶性的問(wèn)題,使得整個(gè)廣告系統(tǒng)對(duì)廣告物料的換血能力會(huì)比較差,新物料無(wú)法在系統(tǒng)中快速生效。

針對(duì)上述問(wèn)題,我們?cè)趶V告場(chǎng)景下實(shí)現(xiàn)了多方位的多模態(tài)表征能力建設(shè),并在召回及創(chuàng)意等環(huán)節(jié)進(jìn)行了應(yīng)用,取得了顯著的線(xiàn)上效果提升。

wKgZombtGK6AZo8RABHLz7pdwNY560.png

圖1.電商場(chǎng)景下的多模態(tài)商品展示

?

多模態(tài)表征在召回環(huán)節(jié)的應(yīng)用

當(dāng)前線(xiàn)上的向量化召回模型,過(guò)于依賴(lài)于sku的切詞特征、品牌、類(lèi)目特征等客觀特征,對(duì)于刻畫(huà)sku的全局屬性、主觀信息等方面的能力是缺失的。引入sku的圖像信息,相當(dāng)于從另一個(gè)維度增加了圖片的信息,對(duì)于query-item本身的match任務(wù)是有正向增益效果的。在未來(lái)的發(fā)展趨勢(shì)中,單純基于文本匹配的方式已經(jīng)缺乏了優(yōu)勢(shì),圖像、視頻、虛擬現(xiàn)實(shí)&人機(jī)交互等途徑的沖擊對(duì)傳統(tǒng)的搜索、推薦任務(wù)提出了新的挑戰(zhàn)。

基于圖像&文本多模態(tài)的商品表征 本工作中,我們基于雙流模型pipeline,分別利用預(yù)訓(xùn)練的文本表征提取網(wǎng)絡(luò)和圖像表征提取網(wǎng)絡(luò),提取京東站內(nèi)商品的視覺(jué)與文本表征,并通過(guò)不同的對(duì)齊流程得到用于下游推薦任務(wù)的多模態(tài)商品表征。整體流程包括:內(nèi)容模態(tài)表征提取->內(nèi)容模態(tài)對(duì)齊->推薦空間對(duì)齊三個(gè)主要部分。內(nèi)容模態(tài)表征提取對(duì)于文本模態(tài)信息,基于商品標(biāo)題+品牌詞+三級(jí)類(lèi)目,使用預(yù)訓(xùn)練的BGE-large-zh1.5模型提取隱層表征,對(duì)于視覺(jué)模態(tài)信息,基于商品主圖,使用預(yù)訓(xùn)練ViT-CLIP-base提取視覺(jué)表征。內(nèi)容模態(tài)對(duì)齊:對(duì)基于預(yù)訓(xùn)練backbone提取到的隱層表征,使用基于CLIP的對(duì)比學(xué)習(xí)方式訓(xùn)練一個(gè)projection head,對(duì)文本和視覺(jué)模態(tài)進(jìn)行對(duì)齊和降維處理。推薦空間對(duì)齊:在對(duì)齊到推薦任務(wù)的語(yǔ)義空間時(shí),首先構(gòu)造不同模態(tài)的商品關(guān)系圖,之后利用Gate-GNN的特征聚合能力,在item-item關(guān)系圖上進(jìn)行基于商品活躍度的聚合,得到混合模態(tài)的商品表表征。

?

多模態(tài)表征在創(chuàng)意優(yōu)選環(huán)節(jié)的應(yīng)用

創(chuàng)意優(yōu)選環(huán)節(jié)的多模態(tài)理解與排序等環(huán)節(jié)存在較大區(qū)別,排序任務(wù)的目標(biāo)是建模同一用戶(hù)在多個(gè)候選sku之間的排序關(guān)系,用多模態(tài)理解作sku信息精細(xì)化建模的信息增益來(lái)源,更好地建模商品信息,以實(shí)現(xiàn)不同商品之間的對(duì)比。創(chuàng)意可以表征很多高階的結(jié)構(gòu)化信息。基于這一點(diǎn),在創(chuàng)意優(yōu)化的特征工程上,方向大致是:強(qiáng)化User/Context,弱化Item/POI,通過(guò)引入多模態(tài)的創(chuàng)意表征,來(lái)個(gè)性化地學(xué)習(xí)到創(chuàng)意中的賣(mài)點(diǎn)信息,從而實(shí)現(xiàn)創(chuàng)意層面的最優(yōu)排序。

基于圖像模態(tài)的商品表征 目前商詳主圖中存在一定的噪聲,因此對(duì)于全圖的表征往往會(huì)受到噪聲的干擾,之前的做法往往先對(duì)主商品進(jìn)行摳圖,之后再進(jìn)行特征提取,但是這種兩階段的特征提取依賴(lài)主圖區(qū)域的準(zhǔn)確標(biāo)注,并會(huì)帶來(lái)誤差累積的問(wèn)題,不適合缺乏標(biāo)簽的電商圖像預(yù)訓(xùn)練任務(wù)。我們考慮直接進(jìn)行圖像自監(jiān)督方法(DINO)進(jìn)行預(yù)訓(xùn)練,在模型訓(xùn)練的同時(shí)端到端提取可靠的圖像主體表征,具體流程如下圖所示:

?

wKgaombtGLWAD1k3AAB9Virc7S4413.png

無(wú)監(jiān)督模型方案

?

wKgZombtGLaAAxg1AASLStsNh1Q872.png

注意力圖可視化

?

二、流量售賣(mài)機(jī)制——更優(yōu)的機(jī)制能力

1、ListVCG:基于強(qiáng)化學(xué)習(xí)的序列拍賣(mài)機(jī)制

推薦信息流廣告是典型的多品拍賣(mài)場(chǎng)景,業(yè)界通用方案GSP在理論、效率上均不是最優(yōu)解,VCG多品拍賣(mài)機(jī)制是我們的理想方案。但是VCG僅僅是一個(gè)理論上的解決方案,他的前提是需要高效的找到最佳組合拍賣(mài)結(jié)果。與此同時(shí),推薦業(yè)務(wù)復(fù)雜,是典型的多目標(biāo)優(yōu)化場(chǎng)景,但是標(biāo)準(zhǔn)VCG是追求社會(huì)福利最大化的機(jī)制,因此在由GSP切換到VCG時(shí),平臺(tái)收益在短期內(nèi)會(huì)顯著下降,這也是業(yè)界公認(rèn)的VCG機(jī)制切換難題。因此如何將VCG與多目標(biāo)優(yōu)化進(jìn)行結(jié)合也是我們面臨的主要挑戰(zhàn)。結(jié)合京東的實(shí)際應(yīng)用場(chǎng)景,我們提出了ListVCG拍賣(mài)機(jī)制,來(lái)解決上述問(wèn)題。

首先面臨要解決的是700選4的排列組合問(wèn)題,序列的搜索空間上千億,我們將此定義成一個(gè)強(qiáng)化學(xué)習(xí)的問(wèn)題,借鑒了經(jīng)典的Actor-Critic架構(gòu),Actor輸出概率矩陣,通過(guò)采樣的手段去求解排列組合問(wèn)題,同時(shí)我們利用用戶(hù)的真實(shí)反饋去提升Critic的評(píng)估水平,挑選出的最優(yōu)組合會(huì)利用策略梯度的方式指引Actor學(xué)習(xí)。通過(guò)這種互相迭代自提升的方式去高效逼近最優(yōu)組合。

wKgaombtGLeAVuW9AABoebTEgLY952.png

VCG下的多品拍賣(mài)同時(shí)是一個(gè)經(jīng)濟(jì)學(xué)問(wèn)題,需要滿(mǎn)足激勵(lì)相容的拍賣(mài)理論約束來(lái)保證長(zhǎng)期的生態(tài)健康發(fā)展,然而常見(jiàn)的多目標(biāo)問(wèn)題的優(yōu)化思路會(huì)使得無(wú)法使用vcg計(jì)費(fèi)。因此我們?cè)贚istvcg中對(duì)于ECPM價(jià)值進(jìn)行了參數(shù)化的變形,在保證可計(jì)費(fèi)的同時(shí)通過(guò)可學(xué)習(xí)的參數(shù)來(lái)滿(mǎn)足平臺(tái)收益、社會(huì)福利、用戶(hù)體驗(yàn)以及物料整體價(jià)值多目標(biāo)優(yōu)化的訴求。

為了更好地對(duì)流量長(zhǎng)期價(jià)值進(jìn)行建模,我們自然地引入了強(qiáng)化學(xué)習(xí)的方式,起初我們嘗試了傳統(tǒng)off-policy的Q-Learning算法如DDQN等,然而,由于后驗(yàn)反饋的獎(jiǎng)勵(lì)稀疏,模型訓(xùn)練效果不穩(wěn)定,因此,我們嘗試引入reward shaping以及curriculum RL的思想,通過(guò)加入稠密先驗(yàn)獎(jiǎng)勵(lì)緩解數(shù)據(jù)側(cè)的獎(jiǎng)勵(lì)稀疏,并讓模型在相對(duì)簡(jiǎn)單的單步?jīng)Q策任務(wù)(如序列曝光、點(diǎn)擊、單步價(jià)值預(yù)估等)收斂后,再學(xué)習(xí)長(zhǎng)期決策任務(wù),使得模型效果有了顯著提升,在優(yōu)化長(zhǎng)期競(jìng)價(jià)環(huán)境的同時(shí),實(shí)現(xiàn)了短期收入和廣告主roi的上升。

wKgZombtGLiAJApxAAEAHOwLEo0439.png

?

?

2、基于強(qiáng)化學(xué)習(xí)的多智能體博弈

多智體在拍賣(mài)機(jī)制的博弈環(huán)境

目標(biāo)層面:機(jī)制和出價(jià)智能體聯(lián)合優(yōu)化是行業(yè)發(fā)展趨勢(shì),出價(jià)與機(jī)制智能體具有一致的整體目標(biāo)。

算法層面:我們從算法視角分析出價(jià)與機(jī)制的策略如何影響廣告收入和tcharge。

?平臺(tái)一段時(shí)間的收入由以下三個(gè)因素決定:

1.流量?jī)r(jià)值分布:一段時(shí)間請(qǐng)求數(shù)量,廣告主數(shù)量,以及每個(gè)請(qǐng)求pctr、pcvr、tcpa

2.廣告主調(diào)價(jià)策略:bid ratio (假設(shè)這段時(shí)間不變)

3.平臺(tái)機(jī)制策略:分配以及計(jì)費(fèi)規(guī)則

?具體的,我們有(假設(shè)100個(gè)請(qǐng)求,10個(gè)廣告主)

機(jī)制、出價(jià)與用戶(hù)(環(huán)境)的交互關(guān)系如下圖所示,事實(shí)上,在單智能體強(qiáng)化學(xué)習(xí)下,機(jī)制和出價(jià)互為環(huán)境

?

wKgaombtGLmABG8VAAB0TeTO7x4892.png

?

基于強(qiáng)化學(xué)習(xí)的多智能體博弈的研究和落地工作

基于MPC和強(qiáng)化學(xué)習(xí)的出價(jià)算法優(yōu)化點(diǎn)主要在于對(duì)未來(lái)一段時(shí)間請(qǐng)求環(huán)境獎(jiǎng)勵(lì)(tcharge、達(dá)成率)的預(yù)測(cè),以及根據(jù)當(dāng)前的狀態(tài)(展現(xiàn)、點(diǎn)擊、消耗、達(dá)成情況)來(lái)決定下一步動(dòng)作(bid ratio);同樣的,基于強(qiáng)化學(xué)習(xí)的機(jī)制策略也需要對(duì)未來(lái)一段時(shí)間請(qǐng)求環(huán)境獎(jiǎng)勵(lì)(廣告收入)進(jìn)行預(yù)測(cè),并且根據(jù)當(dāng)前的狀態(tài)(歷史收入、預(yù)算情況等)來(lái)決定下一步動(dòng)作(分配&計(jì)費(fèi))。

?

機(jī)制和出價(jià)對(duì)未來(lái)一段時(shí)間獎(jiǎng)勵(lì)預(yù)測(cè)越準(zhǔn)確,動(dòng)作選擇越準(zhǔn)確,會(huì)帶來(lái)越多的收入和達(dá)成提升。為此,我們根據(jù)不同階段對(duì)多智能體技術(shù)就行研發(fā):

(1)第一階段:基于離線(xiàn)請(qǐng)求數(shù)據(jù)的模擬

?出價(jià)和機(jī)制智能體一側(cè)固定,通過(guò)離線(xiàn)模擬盡可能還原線(xiàn)上策略,進(jìn)行模型訓(xùn)練

?難點(diǎn):

?缺少精確的離線(xiàn)模擬環(huán)境,目前只有部分精排隊(duì)列還原,復(fù)雜邏輯難以還原

?計(jì)算量級(jí)大;新的機(jī)制還在不斷迭代中

(2)第二階段:基于離線(xiàn)仿真環(huán)境的模擬

?出價(jià)和機(jī)制智能體通過(guò)感知 自身不同動(dòng)作下對(duì)方的反饋,對(duì)未來(lái)獎(jiǎng)勵(lì)預(yù)估更準(zhǔn)確

?風(fēng)險(xiǎn):

?模擬誤差累計(jì)增大(無(wú)法模擬部分/用戶(hù)行為模擬偏差)

?實(shí)驗(yàn)評(píng)估難以進(jìn)行

?

以機(jī)制為例,收益本質(zhì)上來(lái)自于對(duì)廣告主未來(lái)行為的預(yù)測(cè),比如在某個(gè)流量上bidder由于bid ratio高(但是cvr低)獲得了流量,雖然平臺(tái)當(dāng)次請(qǐng)求收入最大,但是會(huì)影響后續(xù)bid ratio調(diào)節(jié),整體收入非最優(yōu)。通過(guò)在仿真環(huán)境下尋找更優(yōu)均衡(需考慮離在線(xiàn)不一致的問(wèn)題),可以避免廣告主(比如某個(gè)類(lèi)目)的出價(jià)收斂到對(duì)平臺(tái)整體收入不利的均衡。

?

三、廣告生成式推薦——更顛覆的推薦范式

在京東廣告場(chǎng)景,我們面臨了如下的挑戰(zhàn):用戶(hù)行為復(fù)雜、平臺(tái)數(shù)據(jù)邊界、數(shù)據(jù)稀疏性高、冷啟動(dòng)問(wèn)題、場(chǎng)景理解困難、多樣性和新穎性。由于現(xiàn)實(shí)系統(tǒng)中的商品數(shù)量巨大,傳統(tǒng)RS通常采用多級(jí)過(guò)濾范式,包括召回、粗排、精排、重排等流程,

相較于傳統(tǒng)RS,生成式推薦系統(tǒng)具備如下的優(yōu)勢(shì):1)簡(jiǎn)化推薦流程。實(shí)現(xiàn)從多級(jí)過(guò)濾范式(discriminative-based,判別式)到單級(jí)過(guò)濾范式(generative-based,生成式)的變遷。2)具備更好的泛化性和穩(wěn)定性。利用LLM中的世界知識(shí)和推理能力,在具有新用戶(hù)和商品的冷啟動(dòng)和新領(lǐng)域場(chǎng)景下具備更好的推薦效果和遷移效果。

?

1、方案

生成式推薦涉及兩個(gè)接地(grounding)過(guò)程,“將語(yǔ)言空間接地到推薦空間”和“將推薦空間接地到實(shí)際商品空間”。為了實(shí)現(xiàn)這兩個(gè)過(guò)程,我們的方案如下:

wKgZombtGLuAAloSAANeUNSZwfk716.png

?

步驟一:商品量化表示階段

選取高點(diǎn)擊商品的標(biāo)題、類(lèi)目等語(yǔ)義信息,經(jīng)由編碼器模型獲得向量表示,再利用RQ-VAE對(duì)向量進(jìn)行殘差量化,從而獲得商品的語(yǔ)義ID。例如,商品“ThinkPad 聯(lián)想ThinkBook 14+ 2024 14.5英寸輕薄本英特爾酷睿ultra AI全能本高性能獨(dú)顯商務(wù)辦公筆記本電腦”可表示為:

步驟二:繼續(xù)預(yù)訓(xùn)練階段

(1)量化token擴(kuò)展大模型詞表并完成初始化

將商品量化表示的底層token集合,加入到大模型中,進(jìn)行微調(diào)對(duì)齊訓(xùn)練,使得模型“理解"這些底層token

(2)語(yǔ)義ID和商品文本信息互譯任務(wù)

提示詞:
請(qǐng)告訴我,商品的四元組表示為{input_turple}的標(biāo)題是什么?
輸入:

輸出:
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+512GB 宣白

提示詞:
請(qǐng)告訴我,商品的標(biāo)題是{input_title}, 它的四元組表示是什么?
輸入:
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+512GB 宣白
輸出:


步驟三:微調(diào)階段

非對(duì)稱(chēng)商品預(yù)測(cè)任務(wù)1:
提示詞:
用戶(hù)歷史瀏覽的商品的四元組序列為{input_tuple1, input_tuple2, ..., input_tupleN},
請(qǐng)幫我預(yù)測(cè)用戶(hù)下一個(gè)要瀏覽的商品是什么?
輸入:
,
,
, 

輸出:
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+512GB 宣白

提示詞:
用戶(hù)歷史瀏覽的商品序列的文本語(yǔ)義信息為{input_text1, input_text2, ..., input_text_N},
請(qǐng)幫我預(yù)測(cè)用戶(hù)下一個(gè)要瀏覽的商品是什么?
輸入:
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+512GB 宣白,
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+1TB 宣白,
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+512GB 硯黑,
華為(HUAWEI)旗艦手機(jī)mate60 pro+ 16G+1TB 硯黑,
華為
輸出:


提示詞:
用戶(hù)歷史瀏覽的商品的四元組序列為{input_tuple1, input_tuple2, ..., input_tupleN},
請(qǐng)幫我預(yù)測(cè)用戶(hù)下一個(gè)要瀏覽的商品是什么?
輸入:
,, , 
輸出:


步驟四:DPO階段

提示詞:
用戶(hù)歷史瀏覽的商品的四元組序列為{input_tuple1, input_tuple2, ..., input_tupleN},
請(qǐng)幫我預(yù)測(cè)用戶(hù)下一個(gè)要瀏覽的商品是什么?
輸入:
, , , 
正例: 

負(fù)例:


2、效果

wKgaombtGL-AKpkgABMKg1QdimM015.png

我們將上述方案應(yīng)用于京東站內(nèi)和站外廣告的推薦流程,取得了顯著的效果提升。

?

?

?

四、廣告智能創(chuàng)意——更生動(dòng)的視覺(jué)沖擊

?

廣告創(chuàng)意不僅能夠抓住消費(fèi)者的眼球,還可以傳遞品牌核心價(jià)值和故事,建立起與消費(fèi)者之間的情感聯(lián)系。在電商場(chǎng)景下,創(chuàng)意內(nèi)容是影響用戶(hù)點(diǎn)擊的重要因素,對(duì)廣告收入有著重要的影響。為了滿(mǎn)足千人千面的用戶(hù)偏好,我們?cè)诖竽P蜁r(shí)代借助其強(qiáng)大的生成能力,產(chǎn)出以下一系列的創(chuàng)意內(nèi)容:

?

wKgaombtGMKAD5EmAAbnKG8hfy4131.png

盡管最近AIGC技術(shù)蓬勃發(fā)展,使得創(chuàng)意制作擺脫了成本和效率的限制。然而,大模型在廣告創(chuàng)意的應(yīng)用上還存在諸多問(wèn)題。如下方圖片所示,現(xiàn)有的圖片生成模型會(huì)產(chǎn)出空間失調(diào)/大小失調(diào)/商品不顯著和形狀幻覺(jué)等bad case:

wKgZombtGMSALYDHAAfIs6-fCNU585.png

為了解決上述問(wèn)題,我們提出一種多模態(tài)可靠反饋網(wǎng)絡(luò)(RFNet),用于自動(dòng)審核生成的圖片,并將其應(yīng)用于遞歸生成過(guò)程中,從而提高可用廣告圖片的數(shù)量。此外,我們通過(guò)一致性條件正則化(Consistent Condition regularization)微調(diào)擴(kuò)散模型,利用RFNet的反饋,顯著提升了生成圖片的可用率,減少了遞歸生成的嘗試次數(shù),同時(shí)保持了高效的生產(chǎn)過(guò)程和視覺(jué)吸引力。我們還構(gòu)建了一個(gè)包含超過(guò)一百萬(wàn)張人工標(biāo)注生成廣告圖片的RF1M數(shù)據(jù)集,幫助訓(xùn)練RFNet準(zhǔn)確評(píng)估圖片的可用性。這項(xiàng)工作發(fā)表在計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議ECCV2024。

wKgaombtGMaAQmcLAALqweP8GBw179.png

?

?

五、廣告大模型算法工程體系——更極致的算法基建

大模型尤其以L(fǎng)LM、AIGC類(lèi)的典型模型為例,其模型參數(shù)通常在0.5B ~ 72B之間,在廣告場(chǎng)景上帶來(lái)最直觀的挑戰(zhàn)是:超大規(guī)模模型的訓(xùn)練推理挑戰(zhàn)、復(fù)雜業(yè)務(wù)鏈路的融合。

推理上,廣告鏈路跟傳統(tǒng)的對(duì)話(huà)系統(tǒng)不同,其延遲要求極高,通常請(qǐng)求到計(jì)算完畢返回之間的耗時(shí)僅有100ms,因此,耗時(shí)約束下的推理能力是一個(gè)極大的挑戰(zhàn)。此外,單請(qǐng)求的推理成本也是業(yè)界大模型服務(wù)公司揮之不去的追求點(diǎn)。京東廣告已經(jīng)可以做到1.5B體積模型,百萬(wàn)Token成本較行業(yè)成本更低。

訓(xùn)練上,不論是開(kāi)源模型再微調(diào)和在訓(xùn)練,還是以Transformer為核心的自行搭建的模型結(jié)構(gòu),對(duì)片上網(wǎng)絡(luò)、存內(nèi)計(jì)算、空間時(shí)間編排的脈動(dòng)計(jì)算模式等技術(shù)要求都有成倍的要求提升。

業(yè)務(wù)鏈路上,最典型的模型服務(wù)以模型內(nèi)邏輯+外部鏈路邏輯整合而成,而一個(gè)DAG(RAG)服務(wù)是一種不錯(cuò)的融合方式。

wKgZombtGMeAa3y_AABs59keQWI552.jpg

?

?

京東廣告算法工程團(tuán)隊(duì)在人工智能領(lǐng)域持續(xù)深耕,不僅致力于LLM(Large Language Model)訓(xùn)練推理技術(shù)的前沿探索,力求突破自然語(yǔ)言處理的瓶頸,提升模型的語(yǔ)義理解和生成能力。同時(shí),我們也充分認(rèn)識(shí)到硬件基礎(chǔ)設(shè)施對(duì)于大規(guī)模模型運(yùn)行的重要性,因此積極與業(yè)界領(lǐng)先的芯片制造商和網(wǎng)絡(luò)服務(wù)提供商展開(kāi)深度合作。

?

我們從底層的物理拓?fù)浣Y(jié)構(gòu)開(kāi)始優(yōu)化,確保數(shù)據(jù)傳輸?shù)母咝院头€(wěn)定性,為模型的高速運(yùn)行奠定堅(jiān)實(shí)基礎(chǔ)。接著,針對(duì)不同的芯片特性進(jìn)行定制化的適配工作,讓模型能夠在各種硬件環(huán)境下發(fā)揮出最優(yōu)性能。我們深知,只有軟硬件完美結(jié)合,才能真正釋放AI的潛能。

?

此外,京東廣告算法工程團(tuán)隊(duì)還對(duì)訓(xùn)練框架進(jìn)行了全方位的優(yōu)化。我們引入了最新的并行計(jì)算技術(shù)和分布式存儲(chǔ)方案,使得大規(guī)模數(shù)據(jù)的處理和模型的訓(xùn)練變得更加迅捷。同時(shí),我們也在推理服務(wù)上狠下功夫,通過(guò)緩存策略、負(fù)載均衡等手段,顯著提升了模型的響應(yīng)速度和并發(fā)處理能力。

?

這一切的努力,都是為了能夠支撐起下一代的超大規(guī)模模型,使其能夠應(yīng)對(duì)百萬(wàn)級(jí)QPS的嚴(yán)苛挑戰(zhàn),為用戶(hù)提供更快速、更精準(zhǔn)的廣告推薦服務(wù)。京東廣告算法工程團(tuán)隊(duì)將持續(xù)創(chuàng)新,以技術(shù)驅(qū)動(dòng)業(yè)務(wù)發(fā)展,為實(shí)現(xiàn)更智能、更個(gè)性化的廣告體驗(yàn)而不懈奮斗。

?

六、招聘簡(jiǎn)章

?

TO 親愛(ài)的朋友:

?

京東廣告研發(fā)部致力于提供全方位的廣告技術(shù)服務(wù),包括廣告排序、出價(jià)、創(chuàng)意算法、廣告投放平臺(tái)建設(shè)、大數(shù)據(jù)生產(chǎn)和數(shù)據(jù)挖掘、廣告質(zhì)量控制和廣告產(chǎn)品創(chuàng)新。我們?nèi)旌虮U暇〇|廣告系統(tǒng)的穩(wěn)定運(yùn)行,不斷優(yōu)化廣告系統(tǒng)全鏈路基礎(chǔ)能力,持續(xù)提升研發(fā)效率和交付能力。通過(guò)AGI算法創(chuàng)新和行業(yè)領(lǐng)先的廣告技術(shù),賦能京東多個(gè)業(yè)務(wù)線(xiàn)的廣告投放和管理需求,幫助商家實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo),同時(shí)提升用戶(hù)購(gòu)物體驗(yàn),推動(dòng)京東的商業(yè)增長(zhǎng),創(chuàng)造數(shù)以?xún)|計(jì)的日均廣告收入。在這里,你將與各業(yè)務(wù)、產(chǎn)品、工程團(tuán)隊(duì)緊密合作,深入京東億量級(jí)的數(shù)據(jù)與豐富的廣告業(yè)務(wù)場(chǎng)景,進(jìn)行前沿AI算法和工程架構(gòu)的研究與應(yīng)用工作。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    271

    瀏覽量

    13153
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智譜AI正式上線(xiàn)并開(kāi)源全新一代模型GLM-5

    智譜AI正式上線(xiàn)并開(kāi)源全新一代模型GLM-5。作為面向復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)打造的新一代模型,GLM-5在Coding與Agen
    的頭像 發(fā)表于 02-12 14:40 ?717次閱讀

    百度正式發(fā)布并開(kāi)源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布并開(kāi)源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以?xún)H 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文檔解析評(píng)測(cè)榜單 OmniDocBench V1.5 中取得
    的頭像 發(fā)表于 01-30 10:03 ?609次閱讀
    百度正式發(fā)布并開(kāi)源<b class='flag-5'>新一代</b>文檔解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    摩爾線(xiàn)程新一代大語(yǔ)言模型對(duì)齊框架URPO入選AAAI 2026

    近日,摩爾線(xiàn)程在人工智能前沿領(lǐng)域取得重要突破,其提出的新一代大語(yǔ)言模型對(duì)齊框架——URPO統(tǒng)獎(jiǎng)勵(lì)與策略?xún)?yōu)化,相關(guān)研究論文已被人工智能領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議AAAI 2026收錄。這
    的頭像 發(fā)表于 11-17 16:03 ?499次閱讀
    摩爾線(xiàn)程<b class='flag-5'>新一代</b>大語(yǔ)言<b class='flag-5'>模型</b>對(duì)齊框架URPO入選AAAI 2026

    JDD Oxygen智能零售論壇 | 《大模型時(shí)代廣告營(yíng)銷(xiāo)變革與實(shí)踐》

    核心觀點(diǎn) 1. 通用大模型想解決營(yíng)銷(xiāo)領(lǐng)域問(wèn)題需向垂類(lèi)模型轉(zhuǎn)型。 “全才”通用大模型難覆蓋廣告營(yíng)銷(xiāo)全流程,需升級(jí)為“懂營(yíng)銷(xiāo)”的垂直模型,實(shí)現(xiàn)從
    的頭像 發(fā)表于 10-27 17:18 ?942次閱讀
    JDD Oxygen智能零售論壇 | 《大<b class='flag-5'>模型</b><b class='flag-5'>時(shí)代</b>的<b class='flag-5'>廣告</b>營(yíng)銷(xiāo)變革與實(shí)踐》

    思嵐科技推出新一代全集成AI空間感知系統(tǒng)Aurora S

    我們非常榮幸地通知大家:思嵐新一代全集成AI空間感知系統(tǒng)——Aurora S正式發(fā)布!
    的頭像 發(fā)表于 10-14 15:39 ?1004次閱讀

    中科馭數(shù)亮相2025新一代計(jì)算產(chǎn)業(yè)大會(huì)

    經(jīng)濟(jì)時(shí)代計(jì)算產(chǎn)業(yè)的標(biāo)準(zhǔn)化建設(shè)與技術(shù)創(chuàng)新,不僅發(fā)布核心標(biāo)準(zhǔn)體系,更明確了各關(guān)鍵領(lǐng)域的牽頭單位,為我國(guó)新一代計(jì)算產(chǎn)業(yè)高質(zhì)量發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。
    的頭像 發(fā)表于 09-26 11:14 ?766次閱讀

    【內(nèi)測(cè)活動(dòng)同步開(kāi)啟】這么???這么強(qiáng)?新一代模型MCP開(kāi)發(fā)板來(lái)啦!

    【內(nèi)測(cè)活動(dòng)同步開(kāi)啟】這么???這么強(qiáng)?新一代模型MCP開(kāi)發(fā)板來(lái)啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強(qiáng)強(qiáng)
    發(fā)表于 09-25 11:47

    新一代超大模型訓(xùn)練引擎XTuner V1開(kāi)源

    9月8日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)開(kāi)源書(shū)生大模型新一代訓(xùn)練引擎XTuner V1。
    的頭像 發(fā)表于 09-10 10:55 ?1167次閱讀

    摩爾線(xiàn)程“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    演講中表示,為應(yīng)對(duì)生成式AI爆發(fā)式增長(zhǎng)的大模型訓(xùn)練效率瓶頸,摩爾線(xiàn)程將通過(guò)系統(tǒng)級(jí)工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時(shí)代
    發(fā)表于 07-28 10:34 ?2806次閱讀
    摩爾線(xiàn)程“AI工廠”:以<b class='flag-5'>系統(tǒng)</b>級(jí)創(chuàng)新定義<b class='flag-5'>新一代</b>AI基礎(chǔ)設(shè)施

    新一代高效電機(jī)技術(shù)—PCB電機(jī)

    純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:新一代高效電機(jī)技術(shù)—PCB電機(jī).pdf 內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持一下,謝謝! 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)第
    發(fā)表于 07-17 14:35

    芯盾時(shí)代中標(biāo)延安卷煙廠 打造新一代身份認(rèn)證平臺(tái)

    芯盾時(shí)代中標(biāo)延安卷煙廠身份認(rèn)證系統(tǒng),將基于前期零信任安全架構(gòu)的建設(shè)成果,又為延安卷煙廠打造了新一代身份認(rèn)證平臺(tái),通過(guò)動(dòng)態(tài)身份驗(yàn)證和權(quán)限管控等,打破傳統(tǒng)邊界安全防護(hù)模式,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)與核
    的頭像 發(fā)表于 06-18 11:11 ?886次閱讀

    谷歌新一代生成式AI媒體模型登陸Vertex AI平臺(tái)

    我們?cè)?Vertex AI 上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1102次閱讀

    廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開(kāi)幕。廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista,并已率先應(yīng)用于車(chē)聯(lián)網(wǎng),成為智能駕駛的“用車(chē)伙伴”和“出行伴侶”。通過(guò)創(chuàng)新AI大模型和場(chǎng)景服務(wù)洞察,F(xiàn)iboVista將在智慧家居、工業(yè)互聯(lián)等更多萬(wàn)億級(jí)市場(chǎng)應(yīng)用,打造全場(chǎng)景
    的頭像 發(fā)表于 06-17 09:22 ?1267次閱讀

    新一代光纖涂覆機(jī)

    新一代光纖涂覆機(jī)系列:國(guó)產(chǎn)! 2025年,濰坊華纖光電科技將推出五大類(lèi)全光纖涂覆機(jī),標(biāo)志著國(guó)產(chǎn)光纖涂覆機(jī)技術(shù)邁入水平。以下是該系列產(chǎn)品的詳細(xì)介紹: 五大類(lèi)光纖涂覆機(jī) 單套模組光纖涂覆機(jī) 特點(diǎn):可替代
    發(fā)表于 04-03 09:13

    寶馬發(fā)布全新一代智能電子電氣架構(gòu)

    "超級(jí)大腦"賦能寶馬新世代車(chē)型智能駕駛樂(lè)趣 全新一代電子電氣架構(gòu)搭載新世代車(chē)型,覆蓋全動(dòng)力系統(tǒng)和全細(xì)分車(chē)型 全新一代電子電氣架構(gòu)集成算力提升20倍,支持AI用戶(hù)體驗(yàn)和場(chǎng)景 全新一代電子
    的頭像 發(fā)表于 03-13 15:42 ?751次閱讀