chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從校園實驗室到京東零售:一位算法工程師的風(fēng)控實戰(zhàn)錄

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-05-22 16:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家好,我是王曉婷,在京東零售研究廣告反作弊算法設(shè)計、實現(xiàn)與優(yōu)化,結(jié)合LLM、深度學(xué)習(xí)、強化學(xué)習(xí)賦能反作弊系統(tǒng),用算法識別和打擊數(shù)字廣告領(lǐng)域的欺詐行為。本文與大家分享我從高校實驗室到廣告風(fēng)控戰(zhàn)場的蛻變,一場關(guān)于認(rèn)知覺醒、技術(shù)探索與思維重構(gòu)的旅程。

象牙塔與工業(yè)界的思維碰撞

在清華園求學(xué)期間,我開始接觸數(shù)據(jù)挖掘競賽,那時常沉浸于算法優(yōu)化的世界里。和許多初學(xué)者一樣,我認(rèn)為模型指標(biāo)就是解決問題的萬能鑰匙,一次一次在異常檢測項目中投入大量精力,當(dāng)在看到95%+準(zhǔn)報率和低于0.35%的誤報率時,那種純粹的喜悅讓我對技術(shù)產(chǎn)生了近乎理想化的信仰。


wKgZPGgu4s6AV5xHABf_kZpiRAQ783.png


圖1. 曾發(fā)表論文中算法取得的高準(zhǔn)異常檢測結(jié)果(誤報率僅為0.35%以下)


實驗室的環(huán)境確實為研究提供了理想條件:規(guī)整的數(shù)據(jù)集、清晰的問題邊界、穩(wěn)定的評估體系。這種純粹的科研訓(xùn)練讓我打下了扎實的基礎(chǔ),但也無形中構(gòu)建了某種思維定式。


畢業(yè)后,我加入京東,投身于廣告風(fēng)控的實戰(zhàn)戰(zhàn)場,一場認(rèn)知的風(fēng)暴悄然來襲,在一次電商大促期間,現(xiàn)實給我上了深刻的一課。面對流量洪峰、以及洪峰中涌現(xiàn)的虛假流量,我曾引以為傲且平穩(wěn)調(diào)度的模型出現(xiàn)了資源和作弊識別之間的掣肘,實驗室里的“完美指標(biāo)”、優(yōu)秀的“AUC、TPR、FPR”,在海量流量面前凸顯蒼白,工業(yè)界需要的是能在混沌中能持續(xù)進(jìn)化的解決方案。面對這樣的挑戰(zhàn)和日新月異的反作弊需求,迫使我重新審視技術(shù)應(yīng)用的邊界,在技術(shù)可能性、業(yè)務(wù)價值與實施成本之間尋找平衡點,這個過程至今仍在持續(xù)。

京東的“反作弊大腦”就像一位24小時在線的智能偵探,主要從多維度打擊作弊行為:在用戶端利用大模型識別假交易,通過智能算法自動揪出異常訂單;在流量端分析每個廣告點擊的數(shù)百項特征,一旦發(fā)現(xiàn)異常行為,立刻攔截,保障廣告主的每一分錢都花在真實用戶身上。


技術(shù)偵探,用AI破解黑產(chǎn)的加密暗號


CPS模式本是為激勵優(yōu)質(zhì)推廣設(shè)計的共贏機制,在激勵眾多聯(lián)盟伙伴積極推廣的同時,也滋生了黑灰產(chǎn)的關(guān)注。在廣告CPS中,黑灰產(chǎn)為了騙取平臺傭金,極盡所能地在地址信息中藏匿各種暗號,這些暗號仿若隱秘的“密碼”,在看似平常的地址文本中隱匿著其真實的不軌意圖,損害平臺利益,致使CPS傭金流失。


一種典型的作弊方式是,在用戶下單時填寫一個無法正常派送的“真假參半”地址。黑灰產(chǎn)為了實現(xiàn)不法目的,精心設(shè)計出各種暗號嵌入地址信息,給傳統(tǒng)文本檢測方法帶來了巨大挑戰(zhàn)。


面對這種新型作弊手段,我們持續(xù)觀測數(shù)據(jù),發(fā)現(xiàn)即便不斷添加過濾規(guī)則,異常訂單仍像地鼠般此起彼伏,基于正則表達(dá)式的策略方式無法適應(yīng)日新月異的暗號變種。這讓我意識到:必須突破文本表面特征,深入語義層面理解地址信息(詳細(xì)細(xì)節(jié)見 文本異常檢測:利用大模型偵測地址暗號 )。


在團(tuán)隊技術(shù)討論中,我嘗試將大模型引入檢測系統(tǒng)。在NLP的世界里,大模型如同超級偵探通過深度的網(wǎng)絡(luò)層和億級參數(shù),超前掌握語言的深層次結(jié)構(gòu)和語義。在地址異常檢測問題中,大模型的核心能力也能得到很好發(fā)揮。基于開源大語言模型并結(jié)合LoRA微調(diào)技術(shù)降低訓(xùn)練成本,讓人工標(biāo)注的數(shù)千條異常地址樣本教會模型識別"異常模式"。


其次,在地址的生成式識別中,我基于人類反饋的強化學(xué)習(xí)框架(RHLF框架),在模型給予錯誤答案時及時糾偏,并會及時收集人類專家的判斷,并將這些反饋納入強化學(xué)習(xí)過程。


通過LLM+RHLF訓(xùn)練,模型逐漸學(xué)會了根據(jù)上下文來判斷數(shù)字是否屬于暗號的“生成式識別能力”。比如在類似”3棟78910單元1023室”、“3棟2單元1023室ATTTT233”這樣的地址中,大模型通過生成式推理識別出"78910"、“ATTTT233”這類偽裝地址,實現(xiàn)了異常訂單地址的生成式精準(zhǔn)抓取,這正是傳統(tǒng)正則表達(dá)式無法企及的語義穿透力和識別能力。


經(jīng)過了三個版本的迭代優(yōu)化,這套系統(tǒng)實現(xiàn)了精準(zhǔn)識別與高效運行的平衡,模型的誤判率降至0.3%,實現(xiàn)準(zhǔn)確識別出各類顯性暗號和隱蔽性暗號。這也是我第一次通過將大模型技術(shù)與CPS業(yè)務(wù)場景深度融合,構(gòu)建了更加精準(zhǔn)和高效的反作弊防護(hù)體系。


不做最炫的技術(shù),只做最有效的方案


隨著廣告作弊手段的不斷升級進(jìn)化,反作弊技術(shù)正面臨前所未有的挑戰(zhàn)。從早期的單一IP代理,到如今的分布式攻擊網(wǎng)絡(luò);從簡單的機器群控,到精心設(shè)計的真人騙傭產(chǎn)業(yè)鏈,黑產(chǎn)集團(tuán)正在以驚人的速度迭代他們的作弊手法。這種"道高一尺,魔高一丈"的對抗態(tài)勢,讓傳統(tǒng)的基于統(tǒng)計規(guī)則的防御體系逐漸力不從心。就像一位經(jīng)驗豐富的老刑警突然面對一群裝備精良的高智商罪犯,舊有的破案方法開始顯得捉襟見肘。


在這樣的背景下,我們嘗試將大模型的上下文理解能力引入行為序列分析領(lǐng)域?;贚LM技術(shù),我們構(gòu)建了一套全新的反作弊系統(tǒng)(詳細(xì)細(xì)節(jié)見 AIGC風(fēng)控系統(tǒng):大模型重塑廣告安全新范式 )。這套系統(tǒng)就像一位擁有超強洞察力的偵探,通過深度解析用戶行為軌跡中的矛盾點,識別隱藏在正常交互模式下的異常信號


wKgZO2gu4tCAXQg9AAUP8HlYBzM403.png



圖2:基于LLM的流量多階段防御


然而,面對京東主站的巨大流量,LLM雖然具備獲得優(yōu)秀的生成式識別能力,卻很難在當(dāng)前資源和耗時要求下實現(xiàn)實時在線推理。為了解決這個“既要精準(zhǔn)又要快速”的難題,我采用了蒸餾技術(shù):讓大模型擔(dān)任”資深教授”,小模型作為“尖子生”,通過特征層蒸餾,將大模型的“辦案經(jīng)驗”提煉傳授給小模型,經(jīng)過十余個版本的迭代打磨,最終實現(xiàn)了精度與速度的完美平衡。


這個過程中,我深刻體會到:真正的技術(shù)創(chuàng)新,不是簡單粗暴地把最新技術(shù)塞進(jìn)業(yè)務(wù)場景,而是要在學(xué)術(shù)前沿與工業(yè)實踐之間找到那個微妙的平衡點。像一位技藝精湛的工匠,既要知道最先進(jìn)的工具怎么用,更要明白什么時候該用什么樣的工具。這種平衡不僅需要對技術(shù)有深刻的理解,還需要對業(yè)務(wù)有深入的洞察。

在從學(xué)術(shù)研究到工業(yè)實踐的跨越中,我深刻體會到廣告風(fēng)控的本質(zhì)是一場多維度的復(fù)雜博弈。有三點核心認(rèn)知與各位分享:


1. 成本意識驅(qū)動技術(shù)選型,技術(shù)人也要會算賬

在公司海量流量和實戰(zhàn)場景中,技術(shù)人不僅要關(guān)注技術(shù)本身的先進(jìn)性,還需要從數(shù)據(jù)規(guī)模、計算成本和產(chǎn)出價值三個維度綜合評估模型的應(yīng)用。數(shù)據(jù)規(guī)模決定了模型的訓(xùn)練深度,而計算成本則直接影響到模型的實時性。最終,產(chǎn)出價值體現(xiàn)在誤判率的降低和業(yè)務(wù)損失的減少上。


技術(shù)方案不是越fancy越好,現(xiàn)在每次做模型選型,我都會清晰評估,每提升1%準(zhǔn)確率需要多少標(biāo)注成本?降低10ms延遲能多攔截多少欺詐訂單?這種量化思維幫助我們找到技術(shù)投入的黃金平衡點。


2. 持續(xù)進(jìn)化知識體系,充分熟悉業(yè)務(wù)

在閱讀《Attention Is All You Need》等專業(yè)文獻(xiàn)時,我發(fā)現(xiàn)了Attention機制在異常檢測中的巨大潛力,并成功將其應(yīng)用于自部署大語言模型的優(yōu)化。這一過程中,我學(xué)會了如何從大量的研究成果中篩選出對業(yè)務(wù)有價值的洞見和創(chuàng)新想法。這不僅需要對技術(shù)有深刻的理解,還需要具備敏銳的技術(shù)敏感度,能夠快速識別和應(yīng)用前沿技術(shù)。


此外,知識體系不僅包括上述的算法前沿,也包括業(yè)務(wù)洞察力的鉆研能力,只有充分熟悉業(yè)務(wù),才能快速通過算法賦能業(yè)務(wù),為技術(shù)的迭代和創(chuàng)新制定堅實的基礎(chǔ)。


3. 跨領(lǐng)域思考,擁有主動破局的力量

在面對黑產(chǎn)日新月異的攻擊時,我們必須比對手進(jìn)化得更快。在處理CPS傭金欺詐的場景中,我利用博弈論模型預(yù)測黑灰產(chǎn)可能使用的地址暗號設(shè)計模式,并提前調(diào)整檢測prompt,以此來阻止他們的欺詐行為。這種方法就像是在一場智力游戲中,通過預(yù)測對手的下一步行動,提前布局,從而保持主動。


在面對黑產(chǎn)帶來的虛假流量時,我借鑒了復(fù)雜系統(tǒng)理論中的耗散結(jié)構(gòu)理論,應(yīng)對“作弊熵增”的問題。黑產(chǎn)的攻擊手段越來越復(fù)雜,像是一個不斷變化的系統(tǒng),為了應(yīng)對這種變化,我在防御系統(tǒng)中引入了隨機性和非線性反饋機制,使得我們的防御系統(tǒng)能夠像一個活的有機體一樣,具備自適應(yīng)和進(jìn)化的能力。


寫在最后


技術(shù)人需要構(gòu)建"T型能力":既要具備垂直領(lǐng)域的技術(shù)深度,又要擁有橫向拓展的視野廣度。


這種能力結(jié)構(gòu)不僅能有效應(yīng)對當(dāng)前的業(yè)務(wù)挑戰(zhàn),更能為未來的技術(shù)革新提供堅實基礎(chǔ)。我也要求自己持續(xù)精進(jìn)技術(shù)深度、敏銳培養(yǎng)商業(yè)敏感度、始終堅守人文關(guān)懷。不斷探索大模型的技術(shù)潛力,深入理解業(yè)務(wù)的核心訴求,同時確保技術(shù)應(yīng)用始終符合倫理規(guī)范和用戶利益。


技術(shù)人的浪漫,或許就在于這種永不停歇的攻防之舞。每當(dāng)看到凌晨的A/B test中降低的后鏈路作弊率,看板中實現(xiàn)的業(yè)務(wù)目標(biāo),上線帶來的一次次可觀價值,都是數(shù)字時代風(fēng)控守護(hù)者的微小確幸。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4709

    瀏覽量

    95353
  • 京東云
    +關(guān)注

    關(guān)注

    0

    文章

    176

    瀏覽量

    139
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【免費送書】電源工程師的實用手冊:開關(guān)電源控制環(huán)路設(shè)計實戰(zhàn)秘籍

    開關(guān)電源控制環(huán)路設(shè)計:ChristopheBasso的實戰(zhàn)秘籍開關(guān)電源(開關(guān)變換器)的環(huán)路穩(wěn)定性設(shè)計是每一位電源工程師在研發(fā)過程中必須面對的挑戰(zhàn)。目前市面上大多數(shù)開關(guān)電源設(shè)計參考書都會涉及環(huán)路
    的頭像 發(fā)表于 07-01 08:07 ?242次閱讀
    【免費送書】電源<b class='flag-5'>工程師</b>的實用手冊:開關(guān)電源控制環(huán)路設(shè)計<b class='flag-5'>實戰(zhàn)</b>秘籍

    重構(gòu)零售數(shù)智化:Splashtop 8大核心場景應(yīng)用實踐

    當(dāng)下,零售業(yè)正加速擁抱智慧化轉(zhuǎn)型。面對門店設(shè)備管理分散、IT運維成本高企、跨區(qū)域協(xié)同效率低下、數(shù)據(jù)安全風(fēng)險攀升等諸多挑戰(zhàn),零售企業(yè)急需通過技術(shù)創(chuàng)新實現(xiàn)設(shè)備高效管理、降低運維成本、保障業(yè)務(wù)連續(xù)性。
    的頭像 發(fā)表于 06-23 17:36 ?449次閱讀
    重構(gòu)<b class='flag-5'>零售</b>數(shù)智化:Splashtop 8大核心場景應(yīng)用實踐

    微軟邀您相約2025全零售AI火花大會

    零售業(yè)AI轉(zhuǎn)型已進(jìn)入深水區(qū),碎片化嘗試難破困局。5月8日至9日,由中國連鎖經(jīng)營協(xié)會主辦的“全零售AI火花大會”將在深圳召開。微軟攜手中國移動、海爾、瑪氏、嘉士伯等零售領(lǐng)軍企業(yè),多角度輸出AI轉(zhuǎn)型落地方法論邀你
    的頭像 發(fā)表于 04-28 11:19 ?639次閱讀

    實驗室安全管理成焦點,漢威科技賦能實驗室安全升級

    實驗室是國家科技創(chuàng)新體系的重要組成部分,是國家組織高水平基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究、聚集和培養(yǎng)優(yōu)秀科學(xué)家、開展學(xué)術(shù)交流的重要基地。近年來,各高校、研究院所、科創(chuàng)園區(qū)、高新產(chǎn)業(yè)園區(qū)相關(guān)企業(yè)的實驗室呈現(xiàn)爆發(fā)
    的頭像 發(fā)表于 04-10 10:41 ?408次閱讀
    <b class='flag-5'>實驗室</b>安全管理成焦點,漢威科技賦能<b class='flag-5'>實驗室</b>安全升級

    :集成電路封裝測試實驗室建設(shè)的關(guān)鍵要素

    集成電路封裝測試實驗室的建設(shè)是項涉及多學(xué)科、多環(huán)節(jié)的系統(tǒng)工程。研發(fā)型實驗室的精準(zhǔn)溫控需求到量產(chǎn)型實驗
    的頭像 發(fā)表于 03-08 14:40 ?569次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>零</b>到<b class='flag-5'>一</b>:集成電路封裝測試<b class='flag-5'>實驗室</b>建設(shè)的關(guān)鍵要素

    MWC 2025 | 移遠(yuǎn)通信推出AI智能無人零售解決方案,以“動態(tài)視覺+邊緣計算”引領(lǐng)智能零售新潮流

    在無人零售市場蓬勃發(fā)展的浪潮中,自動售貨機正經(jīng)歷著傳統(tǒng)機械式操作向AI視覺技術(shù)的重大跨越。移遠(yuǎn)通信作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,精準(zhǔn)把握行業(yè)趨勢,在2025世界移動通信大會(MWC)上
    的頭像 發(fā)表于 03-04 19:02 ?452次閱讀
    MWC 2025 | 移遠(yuǎn)通信推出AI智能無人<b class='flag-5'>零售</b>解決方案,以“動態(tài)視覺+邊緣計算”引領(lǐng)智能<b class='flag-5'>零售</b>新潮流

    TüV萊茵蘇州汽車部件實驗室獲奇瑞汽車認(rèn)可

    蘇州2025年2月28日?/美通社/ -- 近日,國際獨立第三方檢測、檢驗和認(rèn)證機構(gòu)德國萊茵TüV大中華區(qū)(以下簡稱"TüV萊茵")位于蘇州太倉的汽車部件實驗室獲得了奇瑞汽車股份有限公司 (以下
    的頭像 發(fā)表于 03-03 16:38 ?379次閱讀
    TüV萊茵蘇州汽車<b class='flag-5'>零</b>部件<b class='flag-5'>實驗室</b>獲奇瑞汽車認(rèn)可

    京東零售數(shù)據(jù)資產(chǎn)能力升級與實踐

    作者:京東零售 韓雷鈞 開篇 京東自營和商家自運營模式,以及伴隨的多種運營視角、多種組合計算、多種銷售屬性等數(shù)據(jù)維度,相較于行業(yè)同等量級,數(shù)據(jù)處理的難度與復(fù)雜度都顯著增加。如何海量的
    的頭像 發(fā)表于 02-21 09:50 ?473次閱讀
    <b class='flag-5'>京東</b><b class='flag-5'>零售</b>數(shù)據(jù)資產(chǎn)能力升級與實踐

    熵基云聯(lián)入選《零售媒體化專項研究報告》

    零售媒體化實踐典范,成功脫穎而出,成為報告中的亮點之。 作為零售媒體化領(lǐng)域的先鋒,熵基云聯(lián)直致力于探索和實踐零售與媒體的深度融合。其自
    的頭像 發(fā)表于 02-17 11:17 ?536次閱讀

    PIX與松下攜手加速無人零售機器人商業(yè)化

    PIX Moving與松下控股(Panasonic Holdings Corporation)攜手,在日本東京新宿御苑進(jìn)行無人零售服務(wù)“PIMTO”的實證實驗,PIX 為該項目提供了行駛底盤,雙方將共同推動智能零售技術(shù)的創(chuàng)新與應(yīng)
    的頭像 發(fā)表于 02-12 14:32 ?586次閱讀

    物聯(lián)網(wǎng)如何改變零售行業(yè)

    零售商深知,節(jié)日的熱鬧氣氛讓顧客們忙著尋找完美的禮物和抓住年終優(yōu)惠。這直是公司最繁忙的時期之,客流量和銷售額大幅增加。為應(yīng)對激增的需求,零售商正轉(zhuǎn)向引入物聯(lián)網(wǎng)(IoT)技術(shù),以通過
    的頭像 發(fā)表于 01-14 09:27 ?657次閱讀

    基礎(chǔ)入門PCB工程師

    各位前輩大家好,基礎(chǔ)入門PCB工程師,有什么學(xué)習(xí)資料推薦嗎?
    發(fā)表于 11-27 16:54

    數(shù)據(jù)驅(qū)動到智能運營,國產(chǎn)體機主板賦能智慧新零售發(fā)展

    隨著科技的迅猛發(fā)展,智慧新零售逐漸成為零售行業(yè)轉(zhuǎn)型升級的重要方向。在這個過程中,國產(chǎn)體機主板作為關(guān)鍵的硬件基礎(chǔ),發(fā)揮著巨大的作用,推動著數(shù)據(jù)驅(qū)動和智能運營的深度融合。
    的頭像 發(fā)表于 09-26 10:09 ?548次閱讀

    智慧零售:國產(chǎn)工控主板在智慧零售終端中的關(guān)鍵作用

    在數(shù)字化和智能化技術(shù)不斷推進(jìn)的背景下,智慧零售不僅僅是技術(shù)的應(yīng)用,更是零售業(yè)態(tài)和商業(yè)模式的全面升級。傳統(tǒng)的店面銷售到以數(shù)據(jù)驅(qū)動的精準(zhǔn)營銷和個性化服務(wù),智慧零售正在改變消費者的購物體驗
    的頭像 發(fā)表于 09-13 10:22 ?759次閱讀

    LIMS實驗室管理軟件在汽車部件行業(yè)的應(yīng)用

    LIMS實驗室管理軟件在汽車部件行業(yè)的應(yīng)用不僅提高了生產(chǎn)效率和產(chǎn)品質(zhì)量,還促進(jìn)了企業(yè)的可持續(xù)發(fā)展和合規(guī)性管理。隨著技術(shù)的不斷進(jìn)步和汽車行業(yè)對質(zhì)量管理的日益重視,LIMS實驗室管理軟件的應(yīng)用前景將更加廣闊。
    的頭像 發(fā)表于 08-20 14:58 ?863次閱讀