詳解深度學(xué)習(xí)在廣告推薦領(lǐng)域的作用
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
當(dāng)2012年Facebook在廣告領(lǐng)域開(kāi)始應(yīng)用定制化受眾(Facebook Custom Audiences)功能后,“受眾發(fā)現(xiàn)”這個(gè)概念真正得到大規(guī)模應(yīng)用,什么叫“受眾發(fā)現(xiàn)”?如果你的企業(yè)已經(jīng)積累了一定的客戶,無(wú)論這些客戶是否關(guān)注你或者是否跟你在Facebook上有互動(dòng),都能通過(guò)Facebook的廣告系統(tǒng)觸達(dá)到?!笆鼙姲l(fā)現(xiàn)”實(shí)現(xiàn)了什么功能?在沒(méi)有這個(gè)系統(tǒng)之前,廣告投放一般情況都是用標(biāo)簽去區(qū)分用戶,再去給這部分用戶發(fā)送廣告,“受眾發(fā)現(xiàn)”讓你不用選擇這些標(biāo)簽,包括用戶基本信息、興趣等。你需要做的只是上傳一批你目前已有的用戶或者你感興趣的一批用戶,剩下的工作就等著Custom Audiences幫你完成了。
Facebook這種通過(guò)一群已有的用戶發(fā)現(xiàn)并擴(kuò)展出其他用戶的推薦算法就叫Lookalike,當(dāng)然Facebook的算法細(xì)節(jié)筆者并不清楚,各個(gè)公司實(shí)現(xiàn)Lookalike也各有不同。這里也包括騰訊在微信端的廣告推薦上的應(yīng)用、Google在YouTube上推薦感興趣視頻等。下面讓我們結(jié)合前人的工作,實(shí)現(xiàn)自己的Lookalike算法,并嘗試著在新浪微博上應(yīng)用這一算法。
調(diào)研
首先要確定微博領(lǐng)域的數(shù)據(jù),關(guān)于微博的數(shù)據(jù)可以這樣分類:
用戶基礎(chǔ)數(shù)據(jù):年齡、性別、公司、郵箱、地點(diǎn)、公司等。
關(guān)系圖:根據(jù)人?人,人?微博的關(guān)注、評(píng)論、轉(zhuǎn)發(fā)信息建立關(guān)系圖。
內(nèi)容數(shù)據(jù):用戶的微博內(nèi)容,包含文字、圖片、視頻。
有了這些數(shù)據(jù)后,怎么做數(shù)據(jù)的整合分析?來(lái)看看現(xiàn)在應(yīng)用最廣的方式——協(xié)同過(guò)濾、或者叫關(guān)聯(lián)推薦。協(xié)同過(guò)濾主要是利用某興趣相投、擁有共同經(jīng)驗(yàn)群體的喜好來(lái)推薦用戶可能感興趣的信息,協(xié)同過(guò)濾的發(fā)展有以下三個(gè)階段:
第一階段,基于用戶喜好做推薦,用戶A和用戶B相似,用戶B購(gòu)買(mǎi)了物品a、b、c,用戶A只購(gòu)買(mǎi)了物品a,那就將物品b、c推薦給用戶A。這就是基于用戶的協(xié)同過(guò)濾,其重點(diǎn)是如何找到相似的用戶。因?yàn)橹挥袦?zhǔn)確的找到相似的用戶才能給出正確的推薦。而找到相似用戶的方法,一般是根據(jù)用戶的基本屬性貼標(biāo)簽分類,再高級(jí)點(diǎn)可以用上用戶的行為數(shù)據(jù)。
第二階段,某些商品光從用戶的屬性標(biāo)簽找不到聯(lián)系,而根據(jù)商品本身的內(nèi)容聯(lián)系倒是能發(fā)現(xiàn)很多有趣的推薦目標(biāo),它在某些場(chǎng)景中比基于相似用戶的推薦原則更加有效。比如在購(gòu)書(shū)或者電影類網(wǎng)站上,當(dāng)你看一本書(shū)或電影時(shí),推薦引擎會(huì)根據(jù)內(nèi)容給你推薦相關(guān)的書(shū)籍或電影。
第三階段,如果只把內(nèi)容推薦單獨(dú)應(yīng)用在社交網(wǎng)絡(luò)上,準(zhǔn)確率會(huì)比較低,因?yàn)樯缃痪W(wǎng)絡(luò)的關(guān)鍵特性還是社交關(guān)系。如何將社交關(guān)系與用戶屬性一起融入整個(gè)推薦系統(tǒng)就是關(guān)鍵。在神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法出現(xiàn)后,提取特征任務(wù)就變得可以依靠機(jī)器完成,人們只要把相應(yīng)的數(shù)據(jù)準(zhǔn)備好就可以了,其他數(shù)據(jù)都可以提取成向量形式,而社交關(guān)系作為一種圖結(jié)構(gòu),如何表示為深度學(xué)習(xí)可以接受的向量形式,而且這種結(jié)構(gòu)還需要有效還原原結(jié)構(gòu)中位置信息?這就需要一種可靠的向量化社交關(guān)系的表示方法?;谶@一思路,在2016年的論文中出現(xiàn)了一個(gè)算法node2vec,使社交關(guān)系也可以很好地適應(yīng)神經(jīng)網(wǎng)絡(luò)。這意味著深度學(xué)習(xí)在推薦領(lǐng)域應(yīng)用的關(guān)鍵技術(shù)點(diǎn)已被解決。
在實(shí)現(xiàn)算法前我們主要參考了如下三篇論文:
Audience Expansion for Online Social Network Advertising 2016
node2vec: Scalable Feature Learning for Networks Aditya Grover 2016
Deep Neural Networks for YouTube Recommendations 2016
第一篇論文是LinkedIn給出的,主要談了針對(duì)在線社交網(wǎng)絡(luò)廣告平臺(tái),如何根據(jù)已有的受眾特征做受眾群擴(kuò)展。這涉及到如何定位目標(biāo)受眾和原始受眾的相似屬性。論文給出了兩種方法來(lái)擴(kuò)展受眾:
1. 與營(yíng)銷活動(dòng)無(wú)關(guān)的受眾擴(kuò)展;
2. 與營(yíng)銷活動(dòng)有關(guān)的受眾擴(kuò)展。
圖1 LinkedIn的Lookalike算法流程圖
在圖1中,LinkedIn給出了如何利用營(yíng)銷活動(dòng)數(shù)據(jù)、目標(biāo)受眾基礎(chǔ)數(shù)據(jù)去預(yù)測(cè)目標(biāo)用戶行為進(jìn)而發(fā)現(xiàn)新的用戶。今天的推薦系統(tǒng)或廣告系統(tǒng)越來(lái)越多地利用了多維度信息。如何將這些信息有效加以利用,這篇論文給出了一條路徑,而且在工程上這篇論文也論證得比較扎實(shí),值得參考。
第二篇論文,主要講的是node2vec,這也是本文用到的主要算法之一。node2vec主要用于處理網(wǎng)絡(luò)結(jié)構(gòu)中的多分類和鏈路預(yù)測(cè)任務(wù),具體來(lái)說(shuō)是對(duì)網(wǎng)絡(luò)中的節(jié)點(diǎn)和邊的特征向量表示方法。
簡(jiǎn)單來(lái)說(shuō)就是將原有社交網(wǎng)絡(luò)中的圖結(jié)構(gòu),表達(dá)成特征向量矩陣,每一個(gè)node(可以是人、物品、內(nèi)容等)表示成一個(gè)特征向量,用向量與向量之間的矩陣運(yùn)算來(lái)得到相互的關(guān)系。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
詳解深度學(xué)習(xí)在廣告推薦領(lǐng)域的作用下載
相關(guān)電子資料下載
- 深度學(xué)習(xí)在工業(yè)缺陷檢測(cè)中的應(yīng)用 63
- 探討目前主流3D激光SLAM算法方案 94
- 華為成為中國(guó)首個(gè)PyTorch基金會(huì)Premier會(huì)員 453
- 《人工智能在指揮和控制系統(tǒng)中的決策支持》 133
- 中國(guó)手機(jī)廠商發(fā)力這一領(lǐng)域 外媒:大戲剛剛開(kāi)始 262
- 百度智能云推出國(guó)內(nèi)首個(gè)大模型全鏈路生態(tài)支持體系 251
- 人工智能領(lǐng)域存在第一性原理嗎? 53
- 基于機(jī)器視覺(jué)檢測(cè)技術(shù)現(xiàn)狀 41
- 自動(dòng)駕駛規(guī)控決策方面的建議與解決方案 40
- 里程碑 主線科技無(wú)人集卡在舟山港開(kāi)啟全天候真無(wú)人常態(tài)化運(yùn)營(yíng) 166