在今天Face book博客上的一篇文章中,工程師們描述了一種算法-SybilEdge-來檢測假賬戶,這些假賬戶在注冊時逃避Face book的反虐過濾器,但還沒有足夠的朋友來延續(xù)虐待。 目標(biāo)是降低賬戶對其他用戶發(fā)起攻擊的能力,部分是通過比較用戶向擴展社交網(wǎng)絡(luò)添加好友的方式。
SybilEdge能夠發(fā)現(xiàn)假的Face book賬戶不到一周,朋友的請求不到20個,它立即申請平臺來處理關(guān)于流行的一波誤導(dǎo)性信息。 路透社牛津大學(xué)新聞學(xué)研究所發(fā)表的一項分析發(fā)現(xiàn),33%的人在Twitter、Face book和YouTube等社交網(wǎng)絡(luò)上看到了某種形式的關(guān)于COVID-19的錯誤信息。
在設(shè)計SybilEdge時,開發(fā)團隊指出,施虐者需要連接到目標(biāo)才能發(fā)起虐待-也就是說,他們需要找到目標(biāo),向他們發(fā)送朋友請求,并接受請求。 也許不足為奇的是,F(xiàn)ace book內(nèi)部研究表明,非用戶在選擇朋友和那些朋友對朋友請求的回應(yīng)方面都有所不同:假帳戶的請求比真實用戶的請求更經(jīng)常被拒絕。 此外,假賬戶在選擇朋友請求目標(biāo)時往往很小心,這可能會最大限度地提高他們的請求被接受的概率。
Face book創(chuàng)建了一個語料庫,通過將用戶分成兩組來訓(xùn)練SybilEdge:那些更有可能接受來自真實帳戶的朋友請求的人和那些可能接受虛假帳戶請求的人。 如果前者拒絕傳入的請求,它將發(fā)出請求者是合法用戶的信號。 另一方面,如果接受更多假請求的用戶接受請求,則表明請求者可能是假的。
西比爾邊緣分兩個階段工作。 首先,它是通過觀察上述樣本的時間來訓(xùn)練的,然后它利用Face book的行為和內(nèi)容分類器的輸出,這些分類器根據(jù)實際的濫用標(biāo)記帳戶。 這個訓(xùn)練階段為模型提供了所有必要的參數(shù)(即從數(shù)據(jù)中估計的配置變量,以及模型在進行預(yù)測時所需的配置變量),以便為每個朋友的請求和響應(yīng)實時運行,并更新請求者被假的概率。
Face book聲稱,SybilEdge在檢測假賬戶方面的準(zhǔn)確率高于90%,平均有15個或更少的朋友請求,在檢測5個朋友請求的假賬戶方面的準(zhǔn)確率高于80%。 此外,與其比較的基線不同,它的性能不會隨著更多的朋友請求而降低(超過45)。
“SybilEdge幫助我們快速識別施虐者,并以一種可以解釋和分析的方式。 在不久的將來,我們計劃研究更多的方法,可以進一步加快發(fā)現(xiàn)濫用帳戶,并幫助作出自信的決定,甚至比SybilEdge更快。 我們計劃通過混合基于特征和基于行為的模型來實現(xiàn)這一點,“Face book寫道。
Face book正向一種名為自我監(jiān)督學(xué)習(xí)的人工智能培訓(xùn)技術(shù)邁進,在這種技術(shù)中,未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)一起使用,以提高學(xué)習(xí)精度。 Face book的深度實體分類(DEC)機器學(xué)習(xí)框架在部署以來的兩年里導(dǎo)致平臺上濫用賬戶減少了20%。 在一個單獨的實驗中,F(xiàn)ace book的研究人員能夠訓(xùn)練一個語言理解模型,該模型只有80個小時的數(shù)據(jù),而人工標(biāo)記的數(shù)據(jù)為12,000個小時。
-
Facebook
+關(guān)注
關(guān)注
3文章
1432瀏覽量
57991 -
分類器
+關(guān)注
關(guān)注
0文章
153瀏覽量
13609 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8528瀏覽量
135904
發(fā)布評論請先 登錄

電子發(fā)燒友工程師看!電子領(lǐng)域評職稱,技術(shù)之路更扎實

流量計連接神器 CClinkie轉(zhuǎn)Modbus RTU:工程師的「斷舍離」指南

硬件工程師看了只會找個角落默默哭泣#硬件工程師 #MDD #MDD辰達(dá)半導(dǎo)體 #產(chǎn)品經(jīng)理 #軟件工程師
工程師的“新神器”:用CCLinkie轉(zhuǎn)Devicenet連接水質(zhì)分析儀,輕松搞定數(shù)據(jù)難題

從“設(shè)計到生產(chǎn)”的蛻變:華秋DFM如何讓工程師們“輕松上陣”?



硬件工程師的終極幻想:焊板子焊上人生巔峰!#半導(dǎo)體器件 #硬件工程師 #MDD辰達(dá)半導(dǎo)體


不同時期的硬件工程師,最怕發(fā)生的事 #電子工程師 #硬件工程師 #內(nèi)容過于真實 #YXC晶振 #揚興科技

圖像算法工程師的利器——SpeedDP深度學(xué)習(xí)算法開發(fā)平臺

評論