chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

京東:基于多類目MoE模型的電商搜索引擎

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-01-06 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

商品索引擎是電商平臺滿足用戶購物需求的一個重要系統(tǒng),它根據用戶輸入的搜索詞,返回個性化的排序列表。商品一般會被歸為某一大類下某個小類目,例如電子產品,在電子產品這個大類目下面還有更細粒度的類目(冰箱或者電視)。這種體系用于構造查詢類別的層次結構。在不同的查詢類別中,價格和品牌知名度等特征的分布差異很大。在CTR(點擊率)/CVR(轉化率)預估問題中,特征重要性在不同類目間也是不一樣的。本文主要介紹專家混合模型(MoE)在京東搜索精排中的應用,以及結合實際場景對MoE模型進行的一系列改進。

Part1. 背景介紹

越來越多的人轉向電子商務來滿足他們的購物需求,這給搜索排名帶來了新的挑戰(zhàn)。電子商務搜索排名的一個關鍵輸入是產品類別標簽,店主通常被要求用特定的類別來標記他們的產品,以方便搜索索引。從這些產品類別中,可以構造查詢類別的概念,通常是通過聚合在查詢下正確檢索到的最頻繁出現的產品類別。目前大多數電子商務排名系統(tǒng)都沒有為每個查詢類別部署專用模型的工程資源,即使是主要的查詢類別也是如此。但是作為人工編目員,自然的策略是首先確定查詢最可能屬于的類別,然后檢索該類別中的項目。不同類別的特性對于產品排名的重要性可能不同。直觀地說,根據用戶購買反饋判斷,不同類別的單獨排名策略應該能夠提高整體產品搜索相關性。
??京東電商平臺有一套完整的以樹形結構組織的多層級類目結構。下圖是一個兩層級類目結構的示意圖,不同的Top-Categories 之間,用戶的購物行為會有比較明顯的差異,例如:當用戶搜索食品相關商品時,可能選擇銷量高的;而當搜索服飾相關商品時,可能會更關注風格、品牌等信息。相反同一個Top-Categories下的Sub-Categories之間,用戶的購物行為一般比較接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,對于一些小類目的商品,在訓練集樣本量上和大類目相比差距懸殊,在模型訓練過程中會被大類目商品的樣本所影響和主導。針對類目差異和小類目學習這兩個問題,本文提出了一種多類目MoE(Mixture of Experts)模型。

Part2. 多類目MoE模型

MoE模型

MoE 主要包括兩個核心部分:門網絡(gating network)和專家網絡(expert network)。門網絡的輸出作為對應的專家網絡的權重,用于對專家網絡的輸出進行加權求和。MoE 模型的輸出可以寫成下面的公式:

其中,N表示專家網絡的個數,G表示門網絡,Q表示專家網絡。

Top-K gating MoE模型

模型會根據門網絡的輸出,選擇最大的K個權重所對應的專家網絡進行激活,然后只對選中的K個專家網絡的輸出進行加權求和。計算公式如下:

在Top_k MoE模型中,如果一個專家網絡對應的權重值不在最高的K個集合里,那么經過softmax函數之后權重會變?yōu)?。從而在模型訓練中這些專家網絡不會被激活,能降低模型的計算復雜度。

多類目MoE的模型

針對上述提到的類目差異和小類目學習兩個問題,本文在Top_K MoE 的基礎上加入了兩種改進方法,提出了多類目MoE的模型結構,如下圖:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)網絡

針對小類目樣本學習問題,本文的改進是增加一個與MoE門網絡結構相同的HSC門網絡(圖種藍色部分)。HSC門網絡的輸入是Top-Category,輸出與MoE的門網絡結構維度一致,代表了不同專家網絡對于Top-Category 的重要程度。同時將激活的專家網絡對應的權重和HSC門網絡對應的權重的L2距離作為模型訓練的一個損失項,加入到模型的訓練過程中。
??具體來說,圖2中的Top-Category和Sub-Category具有層次關系,Top-Category是父節(jié)點,Sub-Category是子節(jié)點。為了進一步強調不同門網絡的功能,我們分別將它們稱之為inference MoE gate(綠色部分)和constraint HSC gate(藍色部分)。

a. Inference MoE Gate

將Sub-Category的嵌入向量,輸入inference gate,其輸出代表專家的權重。定義inference gate函數如下:

其中,是一個 q×N的可訓練的權重矩陣,q表示embedding的維度,N表示expert的個數。
??為了節(jié)省計算,只在中保留前K個值,并將其余值設置為?∞。然后應用softmax函數從前K個中得到如下的概率分布:
,如果
,如果<

由于有K個大于0的值,為了節(jié)省計算,只激活這些對應的專家。模型的計算復雜度取決于單個專家的網絡和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的結構。用表示constraint gate,表示inference gate,constraint gate的輸入特征記為,是Top-Category的嵌入向量,定義inference gate和constraint gate之間的分層軟約束(HSC)如下:



??通過上述HSC網絡,可以讓相同Top-Category下的所有Sub-Category所激活的專家網絡盡量的接近。尤其對于樣本量少的小類目,可以利用到相同Top-category下的其他類目信息,能一定程度上解決小樣本學習難的問題。

(2)Adversarial Regularization

第二個改進是Adversarial Regularization。在Top_K門網絡結構中,對于每條樣本,專家網絡都會分為激活的專家網絡和沒有激活的專家網絡。Adversarial Regularization的目的是在訓練過程中讓不同專家網絡盡量區(qū)別開,避免專家網絡的預測結果相同。即鼓勵激活的專家網絡和沒有被激活的專家網絡給出的預測結果差異較大。Adversarial Regularization計算公式如下:
其中, 表示激活的專家網絡集合, 表示沒有被激活的專家網絡集合。
??增加了HSC網絡和Adversarial Regularization之后,模型的損失函數如下所示:

Part3. 實驗結論

作者在Amazon和In-house兩個數據集上分別評估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分別表示只有Adversarial Regularization和HSC loss的兩個模型,Adv&HSC-MoE表示作者提出的最終多類目模型。
??作者首先在In-house數據集上測試了模型的整體效果、類目差異的效果以及在小樣本類目上的提升效果。表3給出了各個模型在AUC和NDCG兩個指標上結果。與DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指標上實現了0.96%的增益(NDCG為0.99%),具有較好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同時,作者也在amazon數據集上做了實驗,下表顯示改進后的Adv-MoE、HSC-MoE和Adv& HSC-MoE結果與In-house一致,驗證了對抗正則化和分層軟約束技術的一般適用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型門網絡的輸出代表了各個專家網絡的權重,作者同樣測試了不同類目下門網絡的輸出結果,以評估模型對于類目差異的學習效果。本文將門網絡的輸出結果使用T-SNE降維展示出來,以便觀察不同類目的聚類效果。圖5中藍色表示日用百貨類目,綠色表示電器類目,紅色表示流行服飾類目。結果顯示,本文的方法聚類效果更好,這表明對于相似的類目,本文提出的模型更傾向于選擇相似的專家網絡,差異大的類目,更傾向于選擇不同的專家網絡。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 總結

本文提出的對抗性正則化和層次軟約束技術是在產品搜索中開發(fā)類別感知排名模型的有效方法。它在行業(yè)規(guī)模的數據集上取得了顯著的改進,主要體現在以下幾個方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的專家,從而克服了有限訓練數據下的參數稀疏性;(2)對抗性正則化鼓勵專家“獨立思考”,從不同角度處理每個問題。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網絡
    +關注

    關注

    14

    文章

    8251

    瀏覽量

    94679
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52093
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26187

原文標題:京東:基于多類目MoE模型的電商搜索引擎

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何快速查找工業(yè)部件的 3D CAD 模型

    處于規(guī)格階段的早期,像3Dfindit這樣的 CAD 搜索引擎要比訪問多個制造網站更快。 使用3Dfindit,您可以 按幾何體、草圖、標準和其他屬性搜索 按制造、產品類別或
    發(fā)表于 03-04 16:22

    如何通過API接口同步京東平臺類目數據

    ? 在現代電系統(tǒng)中,實時同步京東平臺的類目數據至關重要。這能確保您的系統(tǒng)擁有最新的商品分類信息,支持高效的庫存管理、搜索優(yōu)化和用戶體驗提升。京東
    的頭像 發(fā)表于 03-02 16:02 ?65次閱讀
    如何通過API接口同步<b class='flag-5'>京東</b>平臺<b class='flag-5'>類目</b>數據

    京東圖片搜索API深度解析:以圖搜貨賦能全場景

    京東圖片搜索API 是京東開放平臺提供的一項基于圖像識別技術的視覺搜索服務,能夠通過上傳圖片或圖片URL,在京東海量商品庫中精準匹配外觀、功
    的頭像 發(fā)表于 02-08 14:56 ?661次閱讀

    關鍵詞搜索京東列表 API 技術對接指南

    一、前言 在商數據服務、代購集運系統(tǒng)搭建、平臺競品分析、自有商城商品同步等業(yè)務場景中,京東商品列表的精準、實時獲取是核心環(huán)節(jié)之一。 二、接口概述 關鍵詞
    的頭像 發(fā)表于 02-05 16:36 ?347次閱讀

    邁富時GEO服務:技術驅動AI搜索時代的企業(yè)增長新引擎

    導語: 隨著DeepSeek、豆包、文心一言等生成式AI搜索引擎的快速普及,用戶獲取信息的方式正從傳統(tǒng)"鏈接點擊"轉向"AI直接對話"。在這場深刻的信息檢索范式變革中,企業(yè)如何讓品牌內容被AI系統(tǒng)
    的頭像 發(fā)表于 01-17 21:20 ?254次閱讀

    京東按關鍵字搜索商品 API接口item_search Pro

    京東搜索商品 API(item_search Pro)賦能運營全指南 item_search Pro 是京東商品
    的頭像 發(fā)表于 01-05 11:03 ?445次閱讀

    利用京東搜索關鍵詞 API 接口賦能運營

    利用京東搜索關鍵詞 API 接口賦能運營:從技術調用到業(yè)務增長全指南 京東搜索關鍵詞 API
    的頭像 發(fā)表于 01-05 09:21 ?295次閱讀

    國內 API 深度賦能:從選品、庫存到履約,重構運營效率新范式

    邏輯與實際價值: 選品環(huán)節(jié):從經驗判斷到數據驅動的精準決策 傳統(tǒng)選品依賴買手經驗,風險高且難以復制,而 API 通過打通平臺數據,讓選品成為可量化的科學決策。一方面,商品詳情 API 和
    的頭像 發(fā)表于 12-17 09:35 ?309次閱讀

    NVIDIA Grace Blackwell平臺實現MoE模型性能十倍提升

    如今,幾乎任一前沿模型的內部結構都采用混合專家 (MoE) 模型架構,這種架構旨在模擬人腦的高效運作機制。
    的頭像 發(fā)表于 12-13 09:23 ?888次閱讀
    NVIDIA Grace Blackwell平臺實現<b class='flag-5'>MoE</b><b class='flag-5'>模型</b>性能十倍提升

    ???????京東API:開啟物流新速度,訂單配送快人一步!

    競爭日益激烈的今天,“速度”已成為用戶體驗的核心要素。京東憑借其強大的自建物流體系,始終引領著配送時效的標準。而面向開發(fā)者和合作伙伴開放的 京東API ,則如同為
    的頭像 發(fā)表于 12-08 14:26 ?459次閱讀
    ???????<b class='flag-5'>京東</b>API:開啟<b class='flag-5'>電</b><b class='flag-5'>商</b>物流新速度,訂單配送快人一步!

    5分鐘了解SEO優(yōu)化服務器對網站加載速度的影響

    一個為SEO優(yōu)化過的服務器,能顯著提升網站性能,從而在搜索引擎排名中占據有利位置。
    的頭像 發(fā)表于 12-02 10:27 ?330次閱讀

    蘇寧搜索接口深析:全品類智能分軌如何解決 O2O 搜索痛點?

    本文深度解析蘇寧全品類O2O搜索接口核心技術,涵蓋智能分軌引擎、庫存聯(lián)動系統(tǒng)與高并發(fā)架構設計,解決品類參數識別、線上線下庫存同步等
    的頭像 發(fā)表于 10-28 16:20 ?883次閱讀
    蘇寧<b class='flag-5'>搜索</b>接口深析:全品類智能分軌如何解決 O2O <b class='flag-5'>電</b><b class='flag-5'>商</b>的<b class='flag-5'>搜索</b>痛點?

    根據標題獲取商品鏈接評論接口的技術實現

    [調用評論API] F --?> G[數據清洗存儲] ? 關鍵組件說明: 搜索引擎接口 :通過電平臺開放API實現標題搜索 $$ text{API}_{search} = text{https://api.ecommerce.
    的頭像 發(fā)表于 10-20 16:03 ?652次閱讀
    根據標題獲取商品鏈接評論接口的技術實現

    京東:利用商品管理API自動調整商品上下架狀態(tài),優(yōu)化搜索排名

    ? 京東:利用商品管理API自動調整商品上下架狀態(tài),優(yōu)化搜索排名 在運營中,高效管理商品狀態(tài)是提升銷售的關鍵。京東作為領先的
    的頭像 發(fā)表于 09-08 16:09 ?1141次閱讀
    <b class='flag-5'>京東</b>:利用商品管理API自動調整商品上下架狀態(tài),優(yōu)化<b class='flag-5'>搜索</b>排名

    京東 API 接口,訂單管理高效解決方案!

    ? 在當今高速發(fā)展的時代,京東作為領先的平臺,其 API 接口為商家和開發(fā)者提供了強大的工具,幫助實現訂單管理的高效化。本文將逐步解
    的頭像 發(fā)表于 07-04 16:12 ?788次閱讀
    <b class='flag-5'>京東</b><b class='flag-5'>電</b><b class='flag-5'>商</b> API 接口,訂單管理高效解決方案!