在“精準推薦者得民心”的今天,推薦系統(tǒng)已成為各大互聯(lián)網(wǎng)公司的標配。但由于現(xiàn)實中很多數(shù)據(jù)是非歐氏空間生成的(例如,社交網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等),一些復(fù)雜場景下的業(yè)務(wù)需求很難通過協(xié)同過濾等基于歷史行為挖掘用戶或產(chǎn)品相似性的傳統(tǒng)算法來滿足。圖神經(jīng)網(wǎng)絡(luò)作為一種約束性較少、極其靈活的數(shù)據(jù)表征方式,在深度學習各主要領(lǐng)域中嶄露頭角,一系列圖學習模型涌現(xiàn)并得到越來越多的應(yīng)用。
網(wǎng)易云音樂在推薦領(lǐng)域的探索
作為國民級的音樂App,網(wǎng)易云音樂很久之前就將定位從傳統(tǒng)的音樂工具軟件轉(zhuǎn)移到音樂內(nèi)容社區(qū),致力于聯(lián)結(jié)泛音樂產(chǎn)品與用戶,打造最懂用戶的音樂 App。在音樂內(nèi)容社區(qū)中,直播可以說是用戶參與度極高的場景了,云音樂內(nèi)部投入了大量的人力物力以求將匹配度更高的主播推薦給用戶,但仍然面臨多重嚴峻的挑戰(zhàn)。
如何破解歷史行為稀少的用戶冷啟動問題
眾所周知,推薦系統(tǒng)的整體框架主要包括召回、粗排和精排3個部分。其中,最底層的召回模型具有舉足輕重的作用,而成功的召回推理需要依賴充足的歷史數(shù)據(jù)。但在云音樂的業(yè)務(wù)場景中,通過站內(nèi)廣告看到直播推薦的用戶很大比例是直播功能的新用戶,即沒有產(chǎn)生過觀看直播行為數(shù)據(jù)的用戶。如何向這類數(shù)據(jù)稀疏的用戶推薦合適的內(nèi)容成了亟待解決的難題,這類問題也通常被稱為冷啟動。
大規(guī)模圖模型如何訓練?
云音樂現(xiàn)有計算資源已全面實現(xiàn)容器化部署,對于各個業(yè)務(wù)團隊來說,計算資源都是有限的,需要以最高效合理的方式利用有限的資源。如何在有限的分布式資源調(diào)控策略下低本高效地完成大規(guī)模圖神經(jīng)網(wǎng)絡(luò)的模型訓練,成為必須攻克的難題。
PGL圖神經(jīng)網(wǎng)絡(luò)助力推薦場景落地
為了解決以上問題,網(wǎng)易云音樂的研發(fā)團隊調(diào)研了大量開源方案,最終選擇了對大規(guī)模圖訓練更加友好的百度飛槳分布式圖學習框架PGL,作為云音樂的基礎(chǔ)框架。
基于PGL的行為域知識遷移解決冷啟動問題
云音樂直播場景的新用戶中,有很多在音樂、歌單、Mlog 等業(yè)務(wù)中產(chǎn)生過較豐富的歷史行為,能否通過將這部分歷史行為知識映射到直播領(lǐng)域,來解決“行為”數(shù)據(jù)不足的問題呢? 帶著疑問,云音樂引入了圖模型結(jié)構(gòu),以多種不同類型的實體(如歌曲、DJ、Query、RadioID 等)為節(jié)點,通過用戶與主播、用戶與歌曲、Query與主播等歷史行為關(guān)系,構(gòu)建了一張統(tǒng)一的圖關(guān)系網(wǎng)絡(luò)。 然后,基于飛槳圖學習框架 PGL對圖模型進行訓練。先采用 DeepWalk、Metapath2Vec、GraphSage等模型學習出足夠強大的Graph Embedding表示來建模實體ID;再通過向量召回,將用戶在歌曲、Query等處的行為遷移到主播領(lǐng)域,達到召回合適主播的目的。
基于PGL通用的分布式能力進行訓練
云音樂的數(shù)據(jù)規(guī)模非常龐大,數(shù)據(jù)關(guān)系即使經(jīng)過裁剪也高達億級別以上。在常用的硬件資源配備情況下,此等量級規(guī)模的數(shù)據(jù)早已成為某些開源的圖神經(jīng)網(wǎng)絡(luò)框架的瓶頸,需要使用極其昂貴的計算資源才能解決。對于數(shù)據(jù)規(guī)模必將持續(xù)增大的云音樂來說,相較于使用什么類型的模型,能否在這種數(shù)據(jù)規(guī)模下訓練出模型才是優(yōu)先要考慮的關(guān)鍵問題,也是網(wǎng)易云音樂與PGL成功牽手的關(guān)鍵因素! 百度飛槳深度學習平臺PaddlePaddle 2019年開源的分布式圖學習框架PGL,原生支持圖學習中較為獨特的分布式圖存儲(Distributed Graph Storage)和分布式采樣(Distributed Sampling),可以方便地通過上層Python接口,將 圖的特征(如Side Feature等)存儲在不同的Server上,也支持通用的分布式采樣接口,將不同子圖的采樣分布式處理,并基于PaddlePaddle Fleet API來完成分布式訓練(Distributed Training),實現(xiàn)在分布式的“瘦計算節(jié)點”上加速計算。這些能力對云音樂內(nèi)容社區(qū)直播推薦遇到的訓練問題來說,極具魅力! 實驗對比顯示,在主播推薦場景采用圖計算帶來有效觀看大幅提升,尤其在新用戶和新主播冷啟動上引入其它域數(shù)據(jù)后有了明顯提升。
想了解更多落地細節(jié)和實戰(zhàn)經(jīng)驗?
3月16日,網(wǎng)易云音樂機器學習平臺與框架負責人段石石,將在飛槳B站直播間分享深度學習實戰(zhàn)進階課程《圖神經(jīng)網(wǎng)絡(luò)在云音樂業(yè)務(wù)落地》。除了上面提到的數(shù)據(jù)稀疏性、冷啟動召回和大規(guī)模分布式訓練等業(yè)務(wù)難題的解決方案,段老師還將分享云音樂如何應(yīng)對訓練數(shù)據(jù)質(zhì)量、瘦計算節(jié)點等技術(shù)挑戰(zhàn)。 3月17日,百度高級算法工程師蘇煒躍將分享《分布式圖學習框架PGL及其推薦應(yīng)用》,重點介紹圖學習算法的理論基礎(chǔ)、圖學習框架PGL的特點和優(yōu)勢;同時將通過演示經(jīng)典大規(guī)模推薦場景的圖學習訓練過程,幫助大家快速學習和實現(xiàn)產(chǎn)業(yè)級的圖模型實踐。
責任編輯:lq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103685 -
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122806 -
開源項目
+關(guān)注
關(guān)注
0文章
38瀏覽量
7464
發(fā)布評論請先 登錄
Centos7分用戶記錄歷史命令至日志文件教程
【HarmonyOS 5】鴻蒙中的UIAbility詳解(三)
鴻蒙5開發(fā)寶藏案例分享---冷啟動優(yōu)化案例分享
電機常見的噪音、振動問題及解決方法
9160 gps 定位需要多長時間呢?
自媒體推廣實時監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
如何從eMMC啟動分區(qū)使用NXP MIMXRT595-EVK?
FRED的光路和光路歷史記錄
如何逆向破解世嘉游樂設(shè)備的條碼啟動系統(tǒng)
鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用
USB驅(qū)動問題:設(shè)備無法識別的全面指南!

增加電容器設(shè)備是否可以解決電壓波動問題

AIC3254啟動過程是怎樣的?需要功能調(diào)節(jié)延時,請問怎么實現(xiàn)?
基于DPU的容器冷啟動加速解決方案

評論