chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

8g3K_AI_Thinker ? 2018-04-02 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

▌引言

推薦作為解決信息過載和挖掘用戶潛在需求的技術(shù)手段,在美團點評這樣業(yè)務(wù)豐富的生活服務(wù)電子商務(wù)平臺,發(fā)揮著重要的作用。在美團App里,首頁的“猜你喜歡”、運營區(qū)、酒店旅游推薦等重要的業(yè)務(wù)場景,都是推薦的用武之地。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖1 美團首頁“猜你喜歡”場景

目前,深度學(xué)習(xí)模型憑借其強大的表達能力和靈活的網(wǎng)絡(luò)結(jié)構(gòu)在諸多領(lǐng)域取得了重大突破,美團平臺擁有海量的用戶與商家數(shù)據(jù),以及豐富的產(chǎn)品使用場景,也為深度學(xué)習(xí)的應(yīng)用提供了必要的條件。本文將主要介紹深度學(xué)習(xí)模型在美團平臺推薦排序場景下的應(yīng)用和探索。

▌深度學(xué)習(xí)模型的應(yīng)用與探索

美團推薦場景中每天活躍著千萬級別的用戶,這些用戶與產(chǎn)品交互產(chǎn)生了海量的真實行為數(shù)據(jù),每天能夠提供十億級別的有效訓(xùn)練樣本。為處理大規(guī)模的訓(xùn)練樣本和提高訓(xùn)練效率,我們基于PS-Lite研發(fā)了分布式訓(xùn)練的DNN模型,并基于該框架進行了很多的優(yōu)化嘗試,在排序場景下取得了顯著的效果提升。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖2 模型排序流程圖

如上圖所示,模型排序流程包括日志收集、訓(xùn)練數(shù)據(jù)生成、模型訓(xùn)練和線上打分等階段。當(dāng)推薦系統(tǒng)對瀏覽推薦場景的用戶進行推薦時,會記錄當(dāng)時的商品特征、用戶狀態(tài)與上下文信息,并收集本次推薦的用戶行為反饋。在經(jīng)過標簽匹配和特征處理流程后生成最終的訓(xùn)練數(shù)據(jù)。我們在離線運用PS-Lite框架對Multi-task DNN模型進行分布式訓(xùn)練,通過離線評測指標選出效果較好的模型并加載到線上,用于線上排序服務(wù)。

下面將著重介紹我們在特征處理和模型結(jié)構(gòu)方面所做的優(yōu)化與嘗試。

特征處理

美團“猜你喜歡”場景接入了包括美食、酒店、旅游、外賣、民宿、交通等多種業(yè)務(wù),這些業(yè)務(wù)各自有著豐富的內(nèi)涵和特點,同時各業(yè)務(wù)的供給、需求與天氣、時間、地理位置等條件交織,構(gòu)成了O2O生活服務(wù)場景下特有的多樣性和復(fù)雜性,這就給如何更高效地組織排序結(jié)果提出了更高的要求。構(gòu)造更全面的特征、更準確高效地利用樣本一直是我們優(yōu)化的重點方向。

特征種類

User特征:用戶年齡,性別,婚否,有無孩子等

Item特征:價格,折扣,品類和品牌相關(guān)特征,短期和長期統(tǒng)計類特征等

Context特征:天氣,時間,地理位置,溫度等

用戶行為:用戶點擊Item序列,下單Item序列等

除上述列舉的幾類特征外,我們還根據(jù)O2O領(lǐng)域的知識積累,對部分特征進行交叉,并針對學(xué)習(xí)效果對特征進行了進一步處理。具體的樣本和特征處理流程如下:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖3 訓(xùn)練數(shù)據(jù)處理流程

標簽匹配

推薦后臺日志會記錄當(dāng)前樣本對應(yīng)的User特征、Item特征與Context特征,Label日志會捕獲用戶對于推薦項的行為反饋。我們把兩份數(shù)據(jù)按照唯一ID拼接到一起,生成原始的訓(xùn)練日志。

等頻歸一化

通過對訓(xùn)練數(shù)據(jù)的分析,我們發(fā)現(xiàn)不同維度特征的取值分布、相同維度下特征值的差異都很大。例如距離、價格等特征的數(shù)據(jù)服從長尾分布,體現(xiàn)為大部分樣本的特征值都比較小,存在少量樣本的特征值非常大。常規(guī)的歸一化方法(例如min-max,z-score)都只是對數(shù)據(jù)的分布進行平移和拉伸,最后特征的分布仍然是長尾分布,這就導(dǎo)致大部分樣本的特征值都集中在非常小的取值范圍內(nèi),使得樣本特征的區(qū)分度減??;與此同時,少量的大值特征可能造成訓(xùn)練時的波動,減緩收斂速度。此外也可以對特征值做對數(shù)轉(zhuǎn)化,但由于不同維度間特征的分布不同,這種特征值處理的方式并不一定適用于其他維度的特征。

在實踐中,我們參考了Google的Wide & Deep Model[6]中對于連續(xù)特征的處理方式,根據(jù)特征值在累計分布函數(shù)中的位置進行歸一化。即將特征進行等頻分桶,保證每個桶里的樣本量基本相等,假設(shè)總共分了n個桶,而特征xi屬于其中的第bi(bi∈ {0, …, n - 1})個桶,則特征xi最終會歸一化成bi/n。這種方法保證對于不同分布的特征都可以映射到近似均勻分布,從而保證樣本間特征的區(qū)分度和數(shù)值的穩(wěn)定性。

低頻過濾

過多的極為稀疏的離散特征會在訓(xùn)練過程中造成過擬合問題,同時增加參數(shù)的儲存數(shù)量。為避免該問題,我們對離散特征進行了低頻過濾處理,丟掉小于出現(xiàn)頻次閾值的特征。

經(jīng)過上述特征抽取、標簽匹配、特征處理后,我們會給特征分配對應(yīng)的域,并對離散特征進行Hash處理,最終生成LIBFFM格式的數(shù)據(jù),作為Multi-task DNN的訓(xùn)練樣本。下面介紹針對業(yè)務(wù)目標所做的模型方面的優(yōu)化嘗試。

模型優(yōu)化與嘗試

在模型方面,我們借鑒工業(yè)界的成功經(jīng)驗,在MLP模型的基礎(chǔ)上,針對推薦場景進行模型結(jié)構(gòu)方面的優(yōu)化。在深度學(xué)習(xí)中,很多方法和機制都具有通用性,比如Attention機制在機器翻譯,圖像標注等方向上取得了顯著的效果提升,但并不是所有具體的模型結(jié)構(gòu)都能夠直接遷移,這就需要結(jié)合實際業(yè)務(wù)問題,對引入的模型網(wǎng)絡(luò)結(jié)構(gòu)進行了針對性調(diào)整,從而提高模型在具體場景中的效果。

Multi-task DNN

推薦場景上的優(yōu)化目標要綜合考慮用戶的點擊率和下單率。在過去我們使用XGBoost進行單目標訓(xùn)練的時候,通過把點擊的樣本和下單的樣本都作為正樣本,并對下單的樣本進行上采樣或者加權(quán),來平衡點擊率和下單率。但這種樣本的加權(quán)方式也會有一些缺點,例如調(diào)整下單權(quán)重或者采樣率的成本較高,每次調(diào)整都需要重新訓(xùn)練,并且對于模型來說較難用同一套參數(shù)來表達這兩種混合的樣本分布。針對上述問題,我們利用DNN靈活的網(wǎng)絡(luò)結(jié)構(gòu)引入了Multi-task訓(xùn)練。

根據(jù)業(yè)務(wù)目標,我們把點擊率和下單率拆分出來,形成兩個獨立的訓(xùn)練目標,分別建立各自的Loss Function,作為對模型訓(xùn)練的監(jiān)督和指導(dǎo)。DNN網(wǎng)絡(luò)的前幾層作為共享層,點擊任務(wù)和下單任務(wù)共享其表達,并在BP階段根據(jù)兩個任務(wù)算出的梯度共同進行參數(shù)更新。網(wǎng)絡(luò)在最后一個全連接層進行拆分,單獨學(xué)習(xí)對應(yīng)Loss的參數(shù),從而更好地專注于擬合各自Label的分布。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖4 點擊與下單多目標學(xué)習(xí)

Multi-task DNN的網(wǎng)絡(luò)結(jié)構(gòu)如上圖所示。線上預(yù)測時,我們將Click-output和Pay-output做一個線性融合。

在此結(jié)構(gòu)的基礎(chǔ)上,我們結(jié)合數(shù)據(jù)分布特點和業(yè)務(wù)目標進行了進一步的優(yōu)化:針對特征缺失普遍存在的情況我們提出Missing Value Layer,以用更合理的方式擬合線上數(shù)據(jù)分布;考慮將不同task的物理意義關(guān)聯(lián)起來,我們提出KL-divergence Bound,以減輕某單一目標的Noise的影響。下面我們就這兩塊工作做具體介紹。

Missing Value Layer

通常在訓(xùn)練樣本中難以避免地有部分連續(xù)特征存在缺失值,更好地處理缺失值會對訓(xùn)練的收斂和最終效果都有一定幫助。通常處理連續(xù)特征缺失值的方式有:取零值,或者取該維特征的平均值。取零值會導(dǎo)致相應(yīng)權(quán)重?zé)o法進行更新,收斂速度減慢。而取平均值也略顯武斷,畢竟不同的特征缺失所表示的含義可能不盡相同。一些非神經(jīng)網(wǎng)絡(luò)的模型能比較合理的處理缺失值,比如XGBoost會通過Loss的計算過程自適應(yīng)地判斷特征缺失的樣本被劃分到左子樹還是右子樹更優(yōu)。受此啟發(fā),我們希望神經(jīng)網(wǎng)絡(luò)也可以通過學(xué)習(xí)的方式自適應(yīng)地處理缺失值,而不是人為設(shè)置默認值。因此設(shè)計了如下的Layer來自適應(yīng)的學(xué)習(xí)缺失值的權(quán)重:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖5 Miss Value Layer

通過上述的Layer,缺失的特征可以根據(jù)對應(yīng)特征的分布去自適應(yīng)的學(xué)習(xí)出一個合理的取值。

通過離線調(diào)研,對于提升模型的訓(xùn)練效果,自適應(yīng)學(xué)習(xí)特征缺失值的方法要遠優(yōu)于取零值、取均值的方式,模型離線AUC隨訓(xùn)練輪數(shù)的變化如下圖所示:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖6 自適應(yīng)學(xué)習(xí)特征缺失值與取0值和均值效果對比

AUC相對值提升如下表所示:

圖7 自適應(yīng)學(xué)習(xí)特征缺失值A(chǔ)UC相對值提升

KL-divergence Bound

我們同時考慮到,不同的標簽會帶有不同的Noise,如果能通過物理意義將有關(guān)系的Label關(guān)聯(lián)起來,一定程度上可以提高模型學(xué)習(xí)的魯棒性,減少單獨標簽的Noise對訓(xùn)練的影響。例如,可以通過MTL同時學(xué)習(xí)樣本的點擊率,下單率和轉(zhuǎn)化率(下單/點擊),三者滿足p(點擊) * p(轉(zhuǎn)化) = p(下單)的意義。因此我們又加入了一個KL散度的Bound,使得預(yù)測出來的p(點擊) * p(轉(zhuǎn)化)更接近于p(下單)。但由于KL散度是非對稱的,即KL(p||q) != KL(q||p),因此真正使用的時候,優(yōu)化的是KL(p||q) + KL(q||p)。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖8 KL-divergence Bound

經(jīng)過上述工作,Multi-tast DNN模型效果穩(wěn)定超過XGBoost模型,目前已經(jīng)在美團首頁“猜你喜歡”場景全量上線,在線上也取得了點擊率的提升:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖9 線上CTR效果與基線對比圖

線上CTR相對值提升如下表所示:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖10 線上CTR效果相對值提升

除了線上效果的提升,Multi-task訓(xùn)練方式也很好的提高了DNN模型的擴展性,模型訓(xùn)練時可以同時考慮多個業(yè)務(wù)目標,方便我們加入業(yè)務(wù)約束。

更多探索

在Multi-task DNN模型上線后,為了進一步提升效果,我們利用DNN網(wǎng)絡(luò)結(jié)構(gòu)的靈活性,又做了多方面的優(yōu)化嘗試。下面就NFM和用戶興趣向量的探索做具體介紹。

NFM

為了引入Low-order特征組合,我們在Multi-task DNN的基礎(chǔ)上進行了加入NFM的嘗試。各個域的離散特征首先通過Embedding層學(xué)習(xí)得到相應(yīng)的向量表達,作為NFM的輸入,NFM通過Bi-Interaction Pooling的方式對輸入向量對應(yīng)的每一維進行2-order的特征組合,最終輸出一個跟輸入維度相同的向量。我們把NFM學(xué)出的向量與DNN的隱層拼接在一起,作為樣本的表達,進行后續(xù)的學(xué)習(xí)。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖11 NFM + DNN

NFM的輸出結(jié)果為向量形式,很方便和DNN的隱層進行融合。而且從調(diào)研的過程中發(fā)現(xiàn),NFM能夠加快訓(xùn)練的收斂速度,從而更有利于Embedding層的學(xué)習(xí)。因為DNN部分的層數(shù)較多,在訓(xùn)練的BP階段,當(dāng)梯度傳到最底層的Embedding層時很容易出現(xiàn)梯度消失的問題,但NFM與DNN相比層數(shù)較淺,有利于梯度的傳遞,從而加快Embedding層的學(xué)習(xí)。

通過離線調(diào)研,加入NFM后,雖然訓(xùn)練的收斂速度加快,但AUC并沒有明顯提升。分析原因是由于目前加入NFM模型部分的特征還比較有限,限制了學(xué)習(xí)的效果。后續(xù)會嘗試加入更多的特征域,以提供足夠的信息幫助NFM學(xué)出有用的表達,深挖NFM的潛力。

用戶興趣向量

用戶興趣作為重要的特征,通常體現(xiàn)在用戶的歷史行為中。通過引入用戶歷史行為序列,我們嘗試了多種方式對用戶興趣進行向量化表達。

Item的向量化表達:線上打印的用戶行為序列中的Item是以ID的形式存在,所以首先需要對Item進行Embedding獲取其向量化的表達。最初我們嘗試通過隨機初始化Item Embedding向量,并在訓(xùn)練過程中更新其參數(shù)的方式進行學(xué)習(xí)。但由于Item ID的稀疏性,上述隨機初始化的方式很容易出現(xiàn)過擬合。后來采用先生成item Embedding向量,用該向量進行初始化,并在訓(xùn)練過程中進行fine tuning的方式進行訓(xùn)練。

用戶興趣的向量化表達:為生成用戶興趣向量,我們對用戶行為序列中的Item向量進行了包括Average Pooling、 Max Pooling與Weighted Pooling三種方式的融合。其中Weighted Pooling參考了DIN的實現(xiàn),首先獲取用戶的行為序列,通過一層非線性網(wǎng)絡(luò)(Attention Net)學(xué)出每個行為Item對于當(dāng)前要預(yù)測Item的權(quán)重(Align Vector),根據(jù)學(xué)出的權(quán)重,對行為序列進行Weighted Pooling,最終生成用戶的興趣向量。計算過程如下圖所示:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖12 Weighted Pooling

通過離線AUC對比,針對目前的訓(xùn)練數(shù)據(jù),Average Pooling的效果為最優(yōu)的。效果對比如下圖所示:

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖13 不同Pooling方式點擊AUC對比

以上是我們在模型結(jié)構(gòu)方面的優(yōu)化經(jīng)驗和嘗試,下面我們將介紹針對提高模型訓(xùn)練效率所做的框架性能優(yōu)化工作。

訓(xùn)練效率優(yōu)化

經(jīng)過對開源框架的廣泛調(diào)研和選型,我們選擇了PS-Lite作為DNN模型的訓(xùn)練框架。PS-Lite是DMLC開源的Parameter Server實現(xiàn),主要包含Server和Worker兩種角色,其中Server端負責(zé)模型參數(shù)的存儲與更新,Worker端負責(zé)讀取訓(xùn)練數(shù)據(jù)、構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)和進行梯度計算。相較于其他開源框架,其顯著優(yōu)點在于:

PS框架:PS-Lite的設(shè)計中可以更好的利用特征的稀疏性,適用于推薦這種有大量離散特征的場景。

封裝合理:通信框架和算法解耦,API強大且清晰,集成比較方便。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖14 Parameter Server

在開發(fā)過程中,我們也遇到并解決了一些性能優(yōu)化問題:

為了節(jié)約Worker的內(nèi)存,通常不會將所有的數(shù)據(jù)儲存在內(nèi)存中,而是分Batch從硬盤中Pre-fetch數(shù)據(jù),但這個過程中存在大量的數(shù)據(jù)解析過程,一些元數(shù)據(jù)的重復(fù)計算(大量的key排序去重等),累計起來也是比較可觀的消耗。針對這個問題我們修改了數(shù)據(jù)的讀取方式,將計算過的元數(shù)據(jù)也序列化到硬盤中,并通過多線程提前將數(shù)據(jù)Pre-fetch到對應(yīng)的數(shù)據(jù)結(jié)構(gòu)里,避免了在此處浪費大量的時間來進行重復(fù)計算。

在訓(xùn)練過程中Worker的計算效率受到宿主機實時負載和硬件條件的影響,不同的Worker之間的執(zhí)行進度可能存在差異(如下圖所示,對于實驗測試數(shù)據(jù),大部分Worker會在700秒完成一輪訓(xùn)練,而最慢的Worker會耗時900秒)。而通常每當(dāng)訓(xùn)練完一個Epoch之后,需要進行模型的Checkpoint、評測指標計算等需要同步的流程,因此最慢的節(jié)點會拖慢整個訓(xùn)練的流程??紤]到Worker的執(zhí)行效率是大致服從高斯分布的,只有小部分的Worker是效率極低的,因此我們在訓(xùn)練流程中添加了一個中斷機制:當(dāng)大部分的機器已經(jīng)執(zhí)行完當(dāng)前Epoch的時候,剩余的Worker進行中斷,犧牲少量Worker上的部分訓(xùn)練數(shù)據(jù)來防止訓(xùn)練流程長時間的阻塞。而中斷的Worker在下個Epoch開始時,會從中斷時的Batch開始繼續(xù)訓(xùn)練,保證慢節(jié)點也能利用所有的訓(xùn)練數(shù)據(jù)。

根據(jù)美團“猜你喜歡”來深度學(xué)習(xí)排序模型實踐

圖15 Worker耗時分布

▌總結(jié)與展望

深度學(xué)習(xí)模型落地到推薦場景后,對業(yè)務(wù)指標有了明顯的提升,今后我們還將深化對業(yè)務(wù)場景的理解,做進一步優(yōu)化嘗試。

在業(yè)務(wù)方面,我們將嘗試對更多的業(yè)務(wù)規(guī)則進行抽象,以學(xué)習(xí)目標的方式加入到模型中。業(yè)務(wù)規(guī)則一般是我們短期解決業(yè)務(wù)問題時提出的,但解決問題的方式一般不夠平滑,規(guī)則也不會隨著場景的變化進行自適應(yīng)。通過Multi-task方式,把業(yè)務(wù)的Bias抽象成學(xué)習(xí)目標,在訓(xùn)練過程中對模型的學(xué)習(xí)進行指導(dǎo),從而可以比較優(yōu)雅的通過模型解決業(yè)務(wù)問題。

在特征方面,我們會繼續(xù)對特征的挖掘和利用進行深入調(diào)研。不同于其他推薦場景,對于O2O業(yè)務(wù),Context特征的作用非常顯著,時間,地點,天氣等因素都會影響用戶的決策。今后會繼續(xù)嘗試挖掘多樣的Context特征,并利用特征工程或者模型進行特征的組合,用于優(yōu)化對樣本的表達。

在模型方面,我們將持續(xù)進行網(wǎng)絡(luò)結(jié)構(gòu)的探索,嘗試新的模型特性,并針對場景的特點進行契合。學(xué)術(shù)界和工業(yè)界的成功經(jīng)驗都很有價值,給我們提供了新的思路和方法,但由于面臨的業(yè)務(wù)問題和場景積累的數(shù)據(jù)不同,還是需要進行針對場景的適配,以達到業(yè)務(wù)目標的提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)處理
    +關(guān)注

    關(guān)注

    0

    文章

    627

    瀏覽量

    29191
  • 排序模型
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    1539

原文標題:干貨 | 美團“猜你喜歡”深度學(xué)習(xí)排序模型實踐

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    大語言模型:原理與工程實踐+初識2

    前言 深度學(xué)習(xí)是機器學(xué)習(xí)的分支,而大語言模型深度學(xué)習(xí)的分支。機器
    發(fā)表于 05-13 00:09

    【NanoPi K1 Plus試用體驗】搭建深度學(xué)習(xí)框架

    置的模塊可以用最少的代價自由組合在一起。具體而言,網(wǎng)絡(luò)層、損失函數(shù)、優(yōu)化器、初始化策略、激活函數(shù)、正則化方法都是獨立的模塊,可以使用它們構(gòu)建自己的模型。 易擴展性:添加新模塊超級容易,只需要仿照現(xiàn)有
    發(fā)表于 07-17 11:40

    labview調(diào)用深度學(xué)習(xí)tensorflow模型非常簡單,附上源碼和模型

    ]`labview調(diào)用高性能YOLOV5:http://t.elecfans.com/c1659.html 讓的CPU也可以運行最新深度學(xué)習(xí)模型labview調(diào)用高性能Tensorf
    發(fā)表于 06-03 16:38

    深度學(xué)習(xí)模型是如何創(chuàng)建的?

    具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個行業(yè)的企業(yè)和組織。
    發(fā)表于 10-27 06:34

    什么是深度學(xué)習(xí)?使用FPGA進行深度學(xué)習(xí)的好處?

    類型,但經(jīng)常使用稱為準確性的一種。假設(shè)將 10 張貓的圖像輸入到預(yù)訓(xùn)練模型中,其中 9 張被確定為“貓”。在這一點上,該模型可以說具有 90% 的準確率。一般來說,可以通過學(xué)習(xí)大量的
    發(fā)表于 02-17 16:56

    基于PRank算法的主動排序學(xué)習(xí)算法

    針對排序學(xué)習(xí)中如何選擇最值得標注的樣本和通過盡可能少的已標注樣本訓(xùn)練出較好的排序模型的問題,將主動學(xué)習(xí)的思想引入
    發(fā)表于 04-11 09:24 ?20次下載

    深度學(xué)習(xí)在現(xiàn)實生活中的運用場景

    本文將主要介紹深度學(xué)習(xí)模型平臺推薦排序場景下的應(yīng)用和探索。
    的頭像 發(fā)表于 04-02 09:28 ?2.1w次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在現(xiàn)實生活中的運用場景

    深度學(xué)習(xí)在58同城首頁推薦中的應(yīng)用

    推薦過程可以概括為數(shù)據(jù)算法層通過相關(guān)召回算法根據(jù)用戶的興趣和行為歷史在海量帖子中篩選出候選集,使用相關(guān)機器學(xué)習(xí)、深度學(xué)習(xí)模型為候選帖子集合進
    的頭像 發(fā)表于 01-27 10:37 ?2354次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在58同城首頁推薦中的應(yīng)用

    使用NVIDIA GPU助力CTR預(yù)測服務(wù)升級

      通過 NVIDIA T4 深度優(yōu)化方案,成功為 CTR 模型創(chuàng)造更多應(yīng)用機會,不僅極大地提升了系統(tǒng)吞吐量,更進一步地提升了整個模型訓(xùn)
    的頭像 發(fā)表于 04-13 15:15 ?1017次閱讀

    超詳細配置教程:用Windows電腦訓(xùn)練深度學(xué)習(xí)模型

    雖然大多數(shù)深度學(xué)習(xí)模型都是在 Linux 系統(tǒng)上訓(xùn)練的,但 Windows 也是一個非常重要的系統(tǒng),也可能是很多機器學(xué)習(xí)初學(xué)者更為熟悉的系統(tǒng)。要在 Windows 上開發(fā)
    的頭像 發(fā)表于 11-08 10:57 ?1906次閱讀

    模型為什么是深度學(xué)習(xí)的未來?

    與傳統(tǒng)機器學(xué)習(xí)相比,深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí),而大模型則是通過使用大量的模型
    的頭像 發(fā)表于 02-16 11:32 ?2412次閱讀

    深度學(xué)習(xí)框架pytorch入門與實踐

    深度學(xué)習(xí)框架pytorch入門與實踐 深度學(xué)習(xí)是機器學(xué)習(xí)中的一個分支,它使用多層神經(jīng)網(wǎng)絡(luò)對大量數(shù)
    的頭像 發(fā)表于 08-17 16:03 ?1953次閱讀

    與華為合作,華為支持研發(fā)原生應(yīng)用

    根據(jù)合作協(xié)議,華為將全力幫助開發(fā)針對鴻蒙系統(tǒng)的原生應(yīng)用,實現(xiàn)業(yè)務(wù)在手機、平板、車載設(shè)備等多個終端上的無縫連接。此外,鴻蒙的分布式設(shè)計
    的頭像 發(fā)表于 11-15 17:26 ?2086次閱讀

    深度學(xué)習(xí)中的模型權(quán)重

    深度學(xué)習(xí)這一充滿無限可能性的領(lǐng)域中,模型權(quán)重(Weights)作為其核心組成部分,扮演著至關(guān)重要的角色。它們不僅是模型學(xué)習(xí)的基石,更是
    的頭像 發(fā)表于 07-04 11:49 ?4203次閱讀

    AI大模型深度學(xué)習(xí)的關(guān)系

    AI大模型深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大
    的頭像 發(fā)表于 10-23 15:25 ?2900次閱讀