chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PAKDD 2019 AutoML挑戰(zhàn)賽結(jié)果出爐:國內(nèi)團隊DeepBlueAI斬獲第一名

DPVg_AI_era ? 來源:lp ? 2019-04-19 08:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,數(shù)據(jù)挖掘領(lǐng)域頂會PAKDD的AutoML挑戰(zhàn)賽結(jié)果出爐,DeepBlueAI、微軟&北航、清華大學等團隊斬獲前三名。本文帶來冠軍團隊解決方案的技術(shù)分享。

PAKDD 2019 AutoML挑戰(zhàn)賽結(jié)果出爐:國內(nèi)團隊 DeepBlueAI 斬獲第一名,微軟亞洲研究院&北航組成的ML Intelligence團隊獲得第二名,清華大學Meta_Learners團隊獲得第三。

Feedback phase 排行榜

PAKDD 全稱亞太地區(qū)知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際會議(Pacific Asia Knowledge Discovery and Data Mining),是亞太地區(qū)數(shù)據(jù)挖掘領(lǐng)域的頂級國際會議。該會議在全球數(shù)據(jù)挖掘領(lǐng)域享有盛譽,一直受到業(yè)內(nèi)各國科學家的高度重視和廣泛認可。

PAKDD 2019 第 4 屆自動機器學習挑戰(zhàn)賽(AutoML Challenge)的主題是“AutoML for Lifelong Machine Learning”,要求參賽選手創(chuàng)建一個自動預(yù)測模型(沒有任何人為干預(yù)),并在一個終身機器學習(Lifelong Machine Learning)設(shè)置中訓練和評估該模型。

AutoML,全稱為Automated Machine Learning,是機器學習領(lǐng)域的一個新興方向。旨在自動化整個機器學習的流程,降低數(shù)據(jù)預(yù)處理、特征工程、模型選擇、參數(shù)調(diào)節(jié)等環(huán)節(jié)中的人工成本。

隨著機器學習系統(tǒng)的日益復(fù)雜化,AutoML 得到了產(chǎn)學研各界的廣泛關(guān)注,已成為人工智能領(lǐng)域最熱門的研究方向之一。

據(jù)悉,本次競賽共有 127 個隊伍參加,共收到 550 多個方案,最終有 31 個隊伍進入決賽。

最終獲勝的隊伍為:

冠軍:DeepBlueAI,羅志鵬,黃堅強,陳明健

亞軍:ML Intelligence,包夢蛟,Hui Xue,Yihuan Mao,Yujing Wang

季軍:Meta_Learners,熊錚,蔣繼研,張文鵬

接下來,本文帶來冠軍團隊解決方案的分享。

冠軍方案關(guān)鍵技術(shù):自動特征工程和自動快速特征選擇

如下圖所示,研究團隊實現(xiàn)了一個Lifelong AutoML 框架,包括自動特征工程和自動快速特征選擇、自動模型調(diào)參、自動模型融合等步驟,在類別不平衡的處理上我們使用了自適應(yīng)采樣并在模型訓練上有一定的創(chuàng)新,對概念漂移問題我們結(jié)合DNN的預(yù)訓練和LightGBM的再訓練以及針對性地設(shè)計特征來緩解概念漂移,并且利用了多種策略對運行時間和運行內(nèi)存進行了有效的控制,以確保解決方案能在限制時間和內(nèi)存下完成整個流程。

自動特征工程與快速特征選擇:

與以往的AutoML框架所不同的是,我們的框架更加注重自動特征工程與特征選擇,我們構(gòu)建的自動特征工程不僅是基于時間特征、分類特征、數(shù)值特征、多值分類特征做特征間的高階組合,同時我們自動提取跨時間、樣本的高階組合。

對于特征選擇,我們結(jié)合特征重要性及序列后向選擇算法實現(xiàn)了一個有效的快速特征選擇,在忽略重要性低的特征上結(jié)合序列后向特征選擇算法,對重要性極高的特征進行篩選,這能快速地篩選掉過擬合特征,從而大幅度提高模型性能。為了避免維度災(zāi)難,我們迭代地進行特征工程和特征選擇,在低階特征生成后,利用特征選擇過濾大部分特征,在其基礎(chǔ)上進行更高階的特征組合,更有效地提取了高階特征并避免了維度災(zāi)難。

緩解類別不平衡:

我們能夠自動針對數(shù)據(jù)情況(數(shù)據(jù)大小,數(shù)據(jù)類型,以及正負樣本比例),以及比賽時間的限制等各種因素的不同,自適應(yīng)地對數(shù)據(jù)采取不同的采樣方式和比例,既保證了效率的同時又保證了效果。傳統(tǒng)的類別不平衡的數(shù)據(jù)訓練方式,是通過提前對數(shù)據(jù)進行采樣,緩解類別不平衡問題,然后將數(shù)據(jù)加入模型中訓練。但是這樣會損失大量的數(shù)據(jù)信息,所以我們在數(shù)據(jù)采樣的時候,仍然保留大量的高比例樣本,并且將其分批,在加入模型中訓練時,讓模型在梯度提升中輪流訓練分批數(shù)據(jù),這樣能夠盡可能保留更多的原始數(shù)據(jù)的信息,同時緩解了類別不平衡問題。

抗概念漂移處理:

針對數(shù)據(jù)大小,數(shù)據(jù)復(fù)雜度,自適應(yīng)選擇batch數(shù)目。同時,對于每個batch,加入了“不同batch間采樣率隨時間增加”機制。我們使用DNN模型對特征Embedding進行預(yù)訓練,遷移到新的數(shù)據(jù)批上進行再訓練,有效地緩解了概念漂移和增強了特征表達。

挑戰(zhàn)和改進

研究團隊表示,不同特征類型的處理是本次大賽最棘手的挑戰(zhàn)。

本次大賽數(shù)據(jù)由多種不同的數(shù)據(jù)類型組成,這些都是現(xiàn)實世界問題需要處理的真實數(shù)據(jù)。而現(xiàn)有的AutoML框架往往只支持數(shù)值類型,不能簡單將現(xiàn)有框架應(yīng)用到這些現(xiàn)實數(shù)據(jù)中。研究人員通過以往的大量競賽及實際項目經(jīng)驗,在特征工程處理上加入了大量的先驗知識,使得框架能支持不同特征類型的特征工程,以及能自動對這些不同類型特征做高階組合以及特征選擇。支持更多的數(shù)據(jù)類型而不僅僅是數(shù)值類型保證了AutoML能應(yīng)用到更廣泛的現(xiàn)實問題中,大大增強了AutoML的實用性。

團隊表示,該解決方案有一些可以改進的方面:

首先,比賽所使用的數(shù)據(jù)僅來自于10個不同的任務(wù),雖然我們在10個任務(wù)的數(shù)據(jù)集上都取得了很好的效果,但并不能保證我們的AutoML框架能應(yīng)用到更廣泛的不同現(xiàn)實世界問題中。

其次,比賽所提供的都是單表數(shù)據(jù),而現(xiàn)實中的問題往往是多表關(guān)聯(lián)的且關(guān)系復(fù)雜的,表間的關(guān)系往往包括多對多、一對多、多對一、一對一等多種關(guān)系。

為了更好地將AutoML應(yīng)用到現(xiàn)實問題中,我們將設(shè)計并實現(xiàn)并實現(xiàn)支持多表聯(lián)結(jié)數(shù)據(jù)以及不同數(shù)據(jù)類型的AutoML框架,將該框架應(yīng)用到更多現(xiàn)實世界問題的數(shù)據(jù)上進行測試。

終生自動化機器學習:AutoML對現(xiàn)實世界問題的意義

這次比賽將AutoML擴展到了多種不同的數(shù)據(jù)類型上,其目標是實現(xiàn)一個支持不同數(shù)據(jù)類型并能適應(yīng)概念漂移的終生自動化機器學習。

首先,現(xiàn)實世界問題的數(shù)據(jù)往往是多種不同數(shù)據(jù)類型的,需要特定領(lǐng)域的專家對這些數(shù)據(jù)進行大量的預(yù)處理及特征工程,而現(xiàn)有的自動化機器學習框架又僅支持數(shù)值類型,對其他類型不能有很好的支持,很難應(yīng)用到各種現(xiàn)實世界問題中。在這次比賽中,我們團隊設(shè)計的AutoML將自動化機器學習擴展到了多種數(shù)據(jù)類型,引入了不同類型的特征預(yù)處理以及不同類型特征的特征工程及特征組合,這樣能在不需要專家的干預(yù)下將AutoML應(yīng)用到更多的現(xiàn)實世界問題中。

其次,許多現(xiàn)實世界問題數(shù)據(jù)是根據(jù)時間逐漸獲取的,數(shù)據(jù)間往往帶有概念漂移,并存在大量的類別不平衡問題,模型需要不停地重復(fù)訓練去適應(yīng)概念漂移并需要專家去處理概念漂移及類別不平衡問題。我們團隊設(shè)計的框架通過融合不同時期的數(shù)據(jù)以及結(jié)合DNN和LightGBM的訓練來自適應(yīng)概念漂移,引入了自適應(yīng)采樣以及對梯度提升模型的采樣率進行改進來緩解類別不平衡,實現(xiàn)了終生機器學習。

我們設(shè)計的終生自動化機器學習框架可以應(yīng)用到各種現(xiàn)實世界問題中,例如在推薦系統(tǒng)、異常檢測、在線廣告、欺詐檢測、運輸監(jiān)控、計量經(jīng)濟學、病人監(jiān)控等諸多領(lǐng)域中,無需領(lǐng)域?qū)<业母深A(yù),我們的框架可以訓練出一個性能高、時效性強、時間可行的模型,從而降低應(yīng)用門檻,縮短項目開發(fā)周期,促進機器學習的大規(guī)模落地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6723

    瀏覽量

    107379
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24977
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136260

原文標題:PAKDD AutoML競賽結(jié)果出爐,冠軍方案關(guān)鍵技術(shù)解讀

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    蔚來獲得2025年中國新能源汽車用戶滿意度測評雙第一

    12月3日,由中國質(zhì)量協(xié)會舉辦的2025年中國新能源汽車行業(yè)用戶滿意度指數(shù)(NEV-CACSI)測評結(jié)果正式發(fā)布。蔚來EC6榮獲純電動中型SUV用戶滿意度第一名。同時,蔚來售后服務(wù)也再次斬獲用戶滿意度
    的頭像 發(fā)表于 12-05 17:41 ?1750次閱讀

    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰(zhàn)賽雙料亞軍

    近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標分割和語言指引視頻
    的頭像 發(fā)表于 10-31 09:42 ?321次閱讀
    傳音TEX AI<b class='flag-5'>團隊</b><b class='flag-5'>斬獲</b>ICCV 2025大型視頻目標分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    長城汽車榮獲2025年中國燃油汽車用戶滿意度測評六項第一

    緊湊型SUV用戶滿意度并列第一名,坦克300車型榮獲硬派SUV第一名,哈弗、坦克銷售服務(wù)榮獲自主品牌并列第一名,哈弗售后服務(wù)榮獲自主品牌第一名。
    的頭像 發(fā)表于 10-28 10:33 ?662次閱讀

    億緯鋰能榮膺AQR新能源乘用車電池系統(tǒng)供應(yīng)商質(zhì)量表現(xiàn)第一名

    2025年9月25日,2025年中國汽車產(chǎn)品質(zhì)量表現(xiàn)研究(AQR)結(jié)果發(fā)布暨頒獎典禮在北京隆重舉行。億緯鋰能憑借卓越的產(chǎn)品質(zhì)量表現(xiàn),榮獲 "新能源乘用車電池系統(tǒng)供應(yīng)商質(zhì)量表現(xiàn)第一名" 獎項,億緯鋰能質(zhì)量中心副總裁施諾受邀出席典禮并代表公司領(lǐng)獎。
    的頭像 發(fā)表于 10-21 18:00 ?1348次閱讀

    東風本田CR-V榮獲2025合資SUV質(zhì)量體驗第一名

    近日,2025年中國汽車產(chǎn)品質(zhì)量表現(xiàn)研究(AQR)結(jié)果發(fā)布暨頒獎典禮圓滿落幕。東風本田CR-V憑借卓越的質(zhì)量表現(xiàn),榮獲“合資SUV質(zhì)量體驗第一名”的桂冠,這權(quán)威獎項不僅是對東風本田CR-V的肯定,更是對品牌在質(zhì)量、品質(zhì)等方面多
    的頭像 發(fā)表于 10-09 09:56 ?415次閱讀

    2025 EDA精英挑戰(zhàn)賽華大九天題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學位管理與研究生教育司指導,中國學位與研究生教育學會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1342次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題發(fā)布

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學位管理與研究生教育司指導,中國學位與研究生教育學會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1311次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題發(fā)布

    地平線H-RDT模型斬獲CVPR 2025大冠軍

    近日,在計算機視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機器人競賽中,地平線機器人實驗室與清華大學計算機系朱軍團隊聯(lián)合提出的H-RDT憑強大性能和領(lǐng)先成功率,斬獲真機
    的頭像 發(fā)表于 08-21 10:02 ?483次閱讀
    地平線H-RDT模型<b class='flag-5'>斬獲</b>CVPR 2025大<b class='flag-5'>賽</b>冠軍

    軟通動力斬獲2024年中國IT服務(wù)市場份額第一名

    近日,迪顧問發(fā)布《2024-2025年中國信息技術(shù)服務(wù)市場研究年度報告》。軟通動力憑借在智能化轉(zhuǎn)型浪潮中的卓越表現(xiàn),以領(lǐng)先的數(shù)智化能力持續(xù)領(lǐng)跑中國IT服務(wù)市場,不僅斬獲2024年市場份額第一名,更在IT咨詢、IT運維等核心領(lǐng)域
    的頭像 發(fā)表于 08-01 17:53 ?1661次閱讀

    潤和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名

    ”)憑借自身卓越的技術(shù)實力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名;在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方案子市場躍升至第一名。同時,其在開放銀行、交易銀行、智能營銷、智能風控、數(shù)據(jù)智能
    的頭像 發(fā)表于 07-14 17:36 ?1149次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    (NTIRE2025EfficientSuper-ResolutionChallenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE2025Short-formUGCImageSuper-Reso
    的頭像 發(fā)表于 06-24 17:03 ?764次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE 2025 Short-form UGC Image Super-Resolution
    的頭像 發(fā)表于 06-24 16:08 ?1447次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    華為榮登GlobalData運營商基礎(chǔ)設(shè)施管理服務(wù)排名報告Leader象限第一名

    象限第一名。 報告對通信服務(wù)商從商業(yè)模式、解決方案、網(wǎng)絡(luò)設(shè)計與優(yōu)化、網(wǎng)絡(luò)轉(zhuǎn)型能力、服務(wù)規(guī)模、和業(yè)務(wù)敏捷性六個維度進行了全面評估,華為綜合得分第一。這印證了華為在對全球運營商客戶提供領(lǐng)先服務(wù)解決方案、網(wǎng)絡(luò)極致性能和數(shù)智化轉(zhuǎn)型等方面做出了卓越
    的頭像 發(fā)表于 05-22 18:43 ?912次閱讀
    華為榮登GlobalData運營商基礎(chǔ)設(shè)施管理服務(wù)排名報告Leader象限<b class='flag-5'>第一名</b>

    平頭哥半導體亮相AICAS 2025挑戰(zhàn)賽技術(shù)研討會

    近日,歷時兩個多月,600余支參賽隊伍激烈角逐,AICAS 2025全球技術(shù)挑戰(zhàn)賽初賽階段賽程已順利結(jié)束,中技術(shù)研討于2月22日在杭州圓滿召開。本次研討會作為AICAS全球技術(shù)挑戰(zhàn)賽的重要環(huán)節(jié),在初賽和復(fù)賽之間架起橋梁,為參賽
    的頭像 發(fā)表于 02-25 11:23 ?1120次閱讀

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA競賽)決賽在南京江北新區(qū)舉辦。今年EDA競賽首次升級為國,在全國超過500個參賽隊伍中,來自華南理工大學的"EDA240931參賽隊"從芯華章賽道脫穎而出,斬獲
    的頭像 發(fā)表于 12-17 15:47 ?1326次閱讀