chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

京東:基于多類目MoE模型的電商搜索引擎

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 2023-01-06 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

商品索引擎是電商平臺(tái)滿足用戶購物需求的一個(gè)重要系統(tǒng),它根據(jù)用戶輸入的搜索詞,返回個(gè)性化的排序列表。商品一般會(huì)被歸為某一大類下某個(gè)小類目,例如電子產(chǎn)品,在電子產(chǎn)品這個(gè)大類目下面還有更細(xì)粒度的類目(冰箱或者電視)。這種體系用于構(gòu)造查詢類別的層次結(jié)構(gòu)。在不同的查詢類別中,價(jià)格和品牌知名度等特征的分布差異很大。在CTR(點(diǎn)擊率)/CVR(轉(zhuǎn)化率)預(yù)估問題中,特征重要性在不同類目間也是不一樣的。本文主要介紹專家混合模型(MoE)在京東搜索精排中的應(yīng)用,以及結(jié)合實(shí)際場景對(duì)MoE模型進(jìn)行的一系列改進(jìn)。

Part1. 背景介紹

越來越多的人轉(zhuǎn)向電子商務(wù)來滿足他們的購物需求,這給搜索排名帶來了新的挑戰(zhàn)。電子商務(wù)搜索排名的一個(gè)關(guān)鍵輸入是產(chǎn)品類別標(biāo)簽,店主通常被要求用特定的類別來標(biāo)記他們的產(chǎn)品,以方便搜索索引。從這些產(chǎn)品類別中,可以構(gòu)造查詢類別的概念,通常是通過聚合在查詢下正確檢索到的最頻繁出現(xiàn)的產(chǎn)品類別。目前大多數(shù)電子商務(wù)排名系統(tǒng)都沒有為每個(gè)查詢類別部署專用模型的工程資源,即使是主要的查詢類別也是如此。但是作為人工編目員,自然的策略是首先確定查詢最可能屬于的類別,然后檢索該類別中的項(xiàng)目。不同類別的特性對(duì)于產(chǎn)品排名的重要性可能不同。直觀地說,根據(jù)用戶購買反饋判斷,不同類別的單獨(dú)排名策略應(yīng)該能夠提高整體產(chǎn)品搜索相關(guān)性。
??京東電商平臺(tái)有一套完整的以樹形結(jié)構(gòu)組織的多層級(jí)類目結(jié)構(gòu)。下圖是一個(gè)兩層級(jí)類目結(jié)構(gòu)的示意圖,不同的Top-Categories 之間,用戶的購物行為會(huì)有比較明顯的差異,例如:當(dāng)用戶搜索食品相關(guān)商品時(shí),可能選擇銷量高的;而當(dāng)搜索服飾相關(guān)商品時(shí),可能會(huì)更關(guān)注風(fēng)格、品牌等信息。相反同一個(gè)Top-Categories下的Sub-Categories之間,用戶的購物行為一般比較接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,對(duì)于一些小類目的商品,在訓(xùn)練集樣本量上和大類目相比差距懸殊,在模型訓(xùn)練過程中會(huì)被大類目商品的樣本所影響和主導(dǎo)。針對(duì)類目差異和小類目學(xué)習(xí)這兩個(gè)問題,本文提出了一種多類目MoE(Mixture of Experts)模型。

Part2. 多類目MoE模型

MoE模型

MoE 主要包括兩個(gè)核心部分:門網(wǎng)絡(luò)(gating network)和專家網(wǎng)絡(luò)(expert network)。門網(wǎng)絡(luò)的輸出作為對(duì)應(yīng)的專家網(wǎng)絡(luò)的權(quán)重,用于對(duì)專家網(wǎng)絡(luò)的輸出進(jìn)行加權(quán)求和。MoE 模型的輸出可以寫成下面的公式:

其中,N表示專家網(wǎng)絡(luò)的個(gè)數(shù),G表示門網(wǎng)絡(luò),Q表示專家網(wǎng)絡(luò)。

Top-K gating MoE模型

模型會(huì)根據(jù)門網(wǎng)絡(luò)的輸出,選擇最大的K個(gè)權(quán)重所對(duì)應(yīng)的專家網(wǎng)絡(luò)進(jìn)行激活,然后只對(duì)選中的K個(gè)專家網(wǎng)絡(luò)的輸出進(jìn)行加權(quán)求和。計(jì)算公式如下:

在Top_k MoE模型中,如果一個(gè)專家網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重值不在最高的K個(gè)集合里,那么經(jīng)過softmax函數(shù)之后權(quán)重會(huì)變?yōu)?。從而在模型訓(xùn)練中這些專家網(wǎng)絡(luò)不會(huì)被激活,能降低模型的計(jì)算復(fù)雜度。

多類目MoE的模型

針對(duì)上述提到的類目差異和小類目學(xué)習(xí)兩個(gè)問題,本文在Top_K MoE 的基礎(chǔ)上加入了兩種改進(jìn)方法,提出了多類目MoE的模型結(jié)構(gòu),如下圖:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)網(wǎng)絡(luò)

針對(duì)小類目樣本學(xué)習(xí)問題,本文的改進(jìn)是增加一個(gè)與MoE門網(wǎng)絡(luò)結(jié)構(gòu)相同的HSC門網(wǎng)絡(luò)(圖種藍(lán)色部分)。HSC門網(wǎng)絡(luò)的輸入是Top-Category,輸出與MoE的門網(wǎng)絡(luò)結(jié)構(gòu)維度一致,代表了不同專家網(wǎng)絡(luò)對(duì)于Top-Category 的重要程度。同時(shí)將激活的專家網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重和HSC門網(wǎng)絡(luò)對(duì)應(yīng)的權(quán)重的L2距離作為模型訓(xùn)練的一個(gè)損失項(xiàng),加入到模型的訓(xùn)練過程中。
??具體來說,圖2中的Top-Category和Sub-Category具有層次關(guān)系,Top-Category是父節(jié)點(diǎn),Sub-Category是子節(jié)點(diǎn)。為了進(jìn)一步強(qiáng)調(diào)不同門網(wǎng)絡(luò)的功能,我們分別將它們稱之為inference MoE gate(綠色部分)和constraint HSC gate(藍(lán)色部分)。

a. Inference MoE Gate

將Sub-Category的嵌入向量,輸入inference gate,其輸出代表專家的權(quán)重。定義inference gate函數(shù)如下:

其中,是一個(gè) q×N的可訓(xùn)練的權(quán)重矩陣,q表示embedding的維度,N表示expert的個(gè)數(shù)。
??為了節(jié)省計(jì)算,只在中保留前K個(gè)值,并將其余值設(shè)置為?∞。然后應(yīng)用softmax函數(shù)從前K個(gè)中得到如下的概率分布:
,如果
,如果<

由于有K個(gè)大于0的值,為了節(jié)省計(jì)算,只激活這些對(duì)應(yīng)的專家。模型的計(jì)算復(fù)雜度取決于單個(gè)專家的網(wǎng)絡(luò)和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的結(jié)構(gòu)。用表示constraint gate,表示inference gate,constraint gate的輸入特征記為,是Top-Category的嵌入向量,定義inference gate和constraint gate之間的分層軟約束(HSC)如下:



??通過上述HSC網(wǎng)絡(luò),可以讓相同Top-Category下的所有Sub-Category所激活的專家網(wǎng)絡(luò)盡量的接近。尤其對(duì)于樣本量少的小類目,可以利用到相同Top-category下的其他類目信息,能一定程度上解決小樣本學(xué)習(xí)難的問題。

(2)Adversarial Regularization

第二個(gè)改進(jìn)是Adversarial Regularization。在Top_K門網(wǎng)絡(luò)結(jié)構(gòu)中,對(duì)于每條樣本,專家網(wǎng)絡(luò)都會(huì)分為激活的專家網(wǎng)絡(luò)和沒有激活的專家網(wǎng)絡(luò)。Adversarial Regularization的目的是在訓(xùn)練過程中讓不同專家網(wǎng)絡(luò)盡量區(qū)別開,避免專家網(wǎng)絡(luò)的預(yù)測結(jié)果相同。即鼓勵(lì)激活的專家網(wǎng)絡(luò)和沒有被激活的專家網(wǎng)絡(luò)給出的預(yù)測結(jié)果差異較大。Adversarial Regularization計(jì)算公式如下:
其中, 表示激活的專家網(wǎng)絡(luò)集合, 表示沒有被激活的專家網(wǎng)絡(luò)集合。
??增加了HSC網(wǎng)絡(luò)和Adversarial Regularization之后,模型的損失函數(shù)如下所示:

Part3. 實(shí)驗(yàn)結(jié)論

作者在Amazon和In-house兩個(gè)數(shù)據(jù)集上分別評(píng)估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分別表示只有Adversarial Regularization和HSC loss的兩個(gè)模型,Adv&HSC-MoE表示作者提出的最終多類目模型。
??作者首先在In-house數(shù)據(jù)集上測試了模型的整體效果、類目差異的效果以及在小樣本類目上的提升效果。表3給出了各個(gè)模型在AUC和NDCG兩個(gè)指標(biāo)上結(jié)果。與DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指標(biāo)上實(shí)現(xiàn)了0.96%的增益(NDCG為0.99%),具有較好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同時(shí),作者也在amazon數(shù)據(jù)集上做了實(shí)驗(yàn),下表顯示改進(jìn)后的Adv-MoE、HSC-MoE和Adv& HSC-MoE結(jié)果與In-house一致,驗(yàn)證了對(duì)抗正則化和分層軟約束技術(shù)的一般適用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型門網(wǎng)絡(luò)的輸出代表了各個(gè)專家網(wǎng)絡(luò)的權(quán)重,作者同樣測試了不同類目下門網(wǎng)絡(luò)的輸出結(jié)果,以評(píng)估模型對(duì)于類目差異的學(xué)習(xí)效果。本文將門網(wǎng)絡(luò)的輸出結(jié)果使用T-SNE降維展示出來,以便觀察不同類目的聚類效果。圖5中藍(lán)色表示日用百貨類目,綠色表示電器類目,紅色表示流行服飾類目。結(jié)果顯示,本文的方法聚類效果更好,這表明對(duì)于相似的類目,本文提出的模型更傾向于選擇相似的專家網(wǎng)絡(luò),差異大的類目,更傾向于選擇不同的專家網(wǎng)絡(luò)。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 總結(jié)

本文提出的對(duì)抗性正則化和層次軟約束技術(shù)是在產(chǎn)品搜索中開發(fā)類別感知排名模型的有效方法。它在行業(yè)規(guī)模的數(shù)據(jù)集上取得了顯著的改進(jìn),主要體現(xiàn)在以下幾個(gè)方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的專家,從而克服了有限訓(xùn)練數(shù)據(jù)下的參數(shù)稀疏性;(2)對(duì)抗性正則化鼓勵(lì)專家“獨(dú)立思考”,從不同角度處理每個(gè)問題。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7815

    瀏覽量

    90982
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50444
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25458

原文標(biāo)題:京東:基于多類目MoE模型的電商搜索引擎

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    京東 API 接口,訂單管理高效解決方案!

    ? 在當(dāng)今高速發(fā)展的時(shí)代,京東作為領(lǐng)先的平臺(tái),其 API 接口為商家和開發(fā)者提供了強(qiáng)大的工具,幫助實(shí)現(xiàn)訂單管理的高效化。本文將逐步解
    的頭像 發(fā)表于 07-04 16:12 ?168次閱讀
    <b class='flag-5'>京東</b><b class='flag-5'>電</b><b class='flag-5'>商</b> API 接口,訂單管理高效解決方案!

    微軟面臨法國反壟斷機(jī)構(gòu)調(diào)查

    據(jù)媒體報(bào)道,微軟目前正在接受法國反壟斷機(jī)構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點(diǎn)在于,微軟是否在搜索引擎聯(lián)盟市場中濫用其市場支配地位。 知情人士透露,法國監(jiān)管機(jī)構(gòu)正在仔細(xì)評(píng)估微軟的行為,特別是其是否向那些
    的頭像 發(fā)表于 02-11 10:57 ?595次閱讀

    OpenAI免費(fèi)開放ChatGPT搜索功能

    近日,OpenAI宣布了一項(xiàng)重大決策:向所有用戶免費(fèi)開放ChatGPT搜索功能。這一舉措無疑將為用戶帶來更加高效、智能的搜索體驗(yàn)。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜索
    的頭像 發(fā)表于 02-06 14:35 ?508次閱讀

    LZO Data Compression,高性能LZO無損數(shù)據(jù)壓縮加速器介紹,F(xiàn)PGA&amp;ASIC

    無損數(shù)據(jù)壓縮2.可配置的數(shù)據(jù)塊分段和搜索窗口大小[8KB,16KB,32KB]3.可配置的并行處理等級(jí)[搜索引擎的數(shù)量,1~32]4.可配置的字典深度[8K,16KB],字典RAM類型[BRAM
    發(fā)表于 01-24 23:53

    蘋果為谷歌支付數(shù)十億美元辯護(hù),參與搜索案反壟斷審判

    近日,蘋果公司已正式要求參與谷歌即將在美國舉行的在線搜索反壟斷審判,此舉旨在為其與谷歌之間的收入分成協(xié)議進(jìn)行辯護(hù)。該協(xié)議使得谷歌成為Safari瀏覽器的默認(rèn)搜索引擎,而谷歌每年因此向蘋果支付數(shù)十
    的頭像 發(fā)表于 12-26 10:41 ?505次閱讀

    SSR的優(yōu)勢和劣勢分析

    SSR(Server-Side Rendering,服務(wù)器端渲染)的優(yōu)勢和劣勢分析如下: SSR的優(yōu)勢 SEO友好 : 由于搜索引擎爬蟲的性質(zhì),更容易識(shí)別和抓取服務(wù)端渲染的頁面內(nèi)容,因此提升了網(wǎng)站
    的頭像 發(fā)表于 11-18 11:27 ?1779次閱讀

    阿里國際推出全球首個(gè)B2B AI搜索引擎Accio

    近日,在歐洲科技峰會(huì)Web Summit上,阿里國際正式推出了全球首個(gè)B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1215次閱讀

    阿里國際推出B2B領(lǐng)域AI搜索引擎Accio

    近日,阿里國際宣布正式進(jìn)軍AI搜索領(lǐng)域,并面向全球商家推出了首個(gè)B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品的推出,標(biāo)志著阿里國際在電子商務(wù)和人工智能技術(shù)結(jié)合方面邁出了重要一步。 Accio
    的頭像 發(fā)表于 11-14 11:47 ?899次閱讀

    租用ip云服務(wù)器可以帶來哪些好處?應(yīng)用場景有哪些?

    租用ip云服務(wù)器可以為用戶帶來多種好處和應(yīng)用場景,主要包括: 1、SEO優(yōu)化: 搜索引擎優(yōu)化(SEO)通常推薦使用多個(gè)ip地址來托管不同的網(wǎng)站,以減少網(wǎng)站之間的潛在負(fù)面影響,提高搜索引擎
    的頭像 發(fā)表于 11-04 11:33 ?491次閱讀

    Meta開發(fā)新搜索引擎,減少對(duì)谷歌和必應(yīng)的依賴

    近日,Meta正在積極進(jìn)軍人工智能領(lǐng)域,并試圖跟上OpenAI的發(fā)展步伐。為實(shí)現(xiàn)這一目標(biāo),Meta正在開發(fā)一款全新的搜索引擎,該搜索引擎具備網(wǎng)絡(luò)爬蟲功能,能夠?yàn)橛脩籼峁┯嘘P(guān)時(shí)事的對(duì)話答案,而這些答案
    的頭像 發(fā)表于 10-29 11:49 ?811次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統(tǒng)搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網(wǎng)絡(luò)、知識(shí)庫、大模型三大支柱。借助首創(chuàng)的 CoE 技術(shù)架構(gòu),360AI搜索
    的頭像 發(fā)表于 09-09 13:44 ?877次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b>成為全球增速最快的AI<b class='flag-5'>搜索引擎</b>

    搜索革命:大模型如何重塑購物體驗(yàn)?

    項(xiàng)發(fā)明專利并出版兩部著作。 ? ? 隨著商行業(yè)的蓬勃發(fā)展,搜索技術(shù)作為連接用戶與商品的橋梁,其重要性日益凸顯。在技術(shù)不斷革新的今天,搜索
    的頭像 發(fā)表于 08-19 15:09 ?589次閱讀

    恒訊科技分析:香港站群服務(wù)器為什么要做偽靜態(tài)處理呢?

    提高搜索引擎優(yōu)化(SEO)效果:偽靜態(tài)處理可以使得動(dòng)態(tài)網(wǎng)頁URL看起來像是靜態(tài)網(wǎng)頁的URL,這有助于搜索引擎更好地索引網(wǎng)站內(nèi)容。搜索引擎通常偏好靜態(tài)網(wǎng)頁,因?yàn)樗鼈冋J(rèn)為靜態(tài)網(wǎng)頁更穩(wěn)定、內(nèi)
    的頭像 發(fā)表于 07-31 12:49 ?526次閱讀

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發(fā)起挑戰(zhàn)

    在人工智能領(lǐng)域的持續(xù)探索中,OpenAI 邁出了重大一步,發(fā)布了其最新的 SearchGPT 原型,直接瞄準(zhǔn)了 Google 的核心業(yè)務(wù)——搜索引擎。這一舉動(dòng)不僅標(biāo)志著 OpenAI 在技術(shù)上的又一次飛躍,也預(yù)示著搜索引擎市場即將迎來一場前所未有的變革。
    的頭像 發(fā)表于 07-26 15:11 ?827次閱讀

    微軟計(jì)劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動(dòng)向,微軟緊隨百度與谷歌的步伐,宣布計(jì)劃在其搜索引擎Bing中引入先進(jìn)的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗(yàn)。
    的頭像 發(fā)表于 07-26 14:23 ?782次閱讀