chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Byte Cup 2018國際機器學習競賽奪冠記

IEEE電氣電子工程師 ? 來源:lq ? 2019-02-14 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月份,我們兩位同學一起組隊,參加Byte Cup 2018國際機器學習競賽。本次比賽由中國人工智能學會和字節(jié)跳動主辦,IEEE中國代表處聯(lián)合組織。比賽的任務是文章標題自動生成。最終,我們隊伍獲得了第一名。

1.比賽介紹

本次比賽的任務是給定文章文本內(nèi)容,自動生成標題。本質(zhì)上和文本摘要任務比較類似。本次比賽有100多萬篇文章的訓練數(shù)據(jù)。

1.1數(shù)據(jù)介紹

詳細參見:https://biendata.com/competition/bytecup2018/data/。

本次競賽使用的訓練集包括了約130萬篇文本的信息,驗證集1000篇文章,

測試集800篇文章。

1.2數(shù)據(jù)處理

文章去重,訓練數(shù)據(jù)中包含一些重復數(shù)據(jù),清洗,去重;

清洗非英文文章。

1.3評價指標

本次比賽將使用Rouge(Recall-Oriented Understudy for Gisting Evaluation)作為模型評估度量。Rough是評估自動文摘以及機器翻譯的常見指標。它通過將自動生成的文本與人工生成的文本(即參考文本)進行比較,根據(jù)相似度得出分值。

2.模型介紹

本次比賽主要嘗試了seq2seq的方法。參考的模型包括Transformer模型和pointer-generator模型。

模型如下圖:

(其實就是將pointer-generator的copy機制加到transformer模型上)。

同時,嘗試了將ner-tagger和pos-tagger信息加入到模型中,如下圖所示:

3.問題分析

最開始我們嘗試了最基本的transformer模型,通過查看數(shù)據(jù),遇到以下幾類明顯錯誤:

OOV(out of vocabulary);

數(shù)字,人名,地名預測錯誤;

詞形預測錯誤。

OOV問題,主要原因是數(shù)據(jù)集詞表太大,但是,模型能夠?qū)嶋H使用的詞表較??;數(shù)字,人名,地名預測錯誤,主要原因是低頻詞embedding學習不充分;詞形預測錯誤,主要原因是模型中沒有考慮詞的形態(tài)問題(當然,如果訓練數(shù)據(jù)足夠大,是能避免這個問題的)。

為了解決這些問題,我們嘗試了以下方法。

4.重要組件

4.1copy機制

對于很多低頻詞,通過生成式方法生成,其實是很不靠譜的。為此,我們借鑒Pointer-generator的方法,在生成標題的單詞的時候,通過Attention的概率分布,從原文中拷貝詞。

4.2subword

為了避免oov問題,我們采用subword的方法,處理文本。這樣,可以將詞表大小減小到20k,同時,subword會包含一些單詞詞形結(jié)構(gòu)的信息。

4.3ner-tagger和pos-tagger信息

因為baseline在數(shù)字,人名,地名,詞形上預測錯誤率較高,所以我們考慮能不能將ner-tagger和pos-tagger信息加入到模型中。如上圖所示。實驗證明通過加入這兩個序列信息能夠大大加快模型的收斂速度(訓練收斂后,指標上基本沒差異)。

4.4Gradient Accumulation

在實驗過程中,我們發(fā)現(xiàn)transformer模型對batch_size非常敏感。之前,有研究者在機器翻譯任務中,通過實驗也證明了這一觀點。然而,對于文章標題生成任務,因為每個sample的文章長度較長,所以,并不能使用超大batch_size來訓練模型,所以,我們用Gradient Accumulation的方法模擬超大batch_size。

4.5ensemble

采用了兩層融合。第一層,對于每一個模型,將訓練最后保存的N個模型參數(shù)求平均值(在valid集上選擇最好的N)。第二層,通過不同隨機種子得到的兩個模型,一個作為生成候選標題模型(選擇不同的beam_width, length_penalty), 一個作為打分模型,將候選標題送到模型打分,選擇分數(shù)最高的標題。

5.失敗的方法

將copy機制加入到transformer遇到一些問題,我們直接在decoder倒數(shù)第二層加了一層Attention層作為copy機制需要的概率分布,訓練模型非常不穩(wěn)定,并且結(jié)果比baseline還要差很多;

我們嘗試了bert,我們將bert-encoder抽出的feature拼接到我們模型的encoder的最后一層,結(jié)果并沒有得到提升;

word-embedding的選擇,我們使用glove和fasttext等預訓練的詞向量,模型收斂速度加快,但是,結(jié)果并沒有random的方法好。

6.結(jié)束語

非常感謝主辦方舉辦本次比賽,通過本次比賽,我們探索,學習到了很多算法方法和調(diào)參技巧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50091

    瀏覽量

    265236
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15526
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26187

原文標題:Byte Cup 2018國際機器學習競賽奪冠記

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    太燃了!人形機器人1500米比賽,這家奪冠!更有機器人全程自主奔跑

    人民政府、世界機器人合作組織和亞太機器人世界杯國際理事會聯(lián)合主辦,吸引了來自16個國家的280支隊伍,500余臺人形機器人齊聚一堂,共同角逐競技賽、表演賽、場景賽和外圍賽四大類共26個
    的頭像 發(fā)表于 08-17 06:21 ?9696次閱讀
    太燃了!人形<b class='flag-5'>機器</b>人1500米比賽,這家<b class='flag-5'>奪冠</b>!更有<b class='flag-5'>機器</b>人全程自主奔跑

    人工智能與機器學習在這些行業(yè)的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發(fā)表于 02-04 14:44 ?461次閱讀

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?182次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    思嵐科技亮相2025日本東京國際機器人展覽會

    12月6日,作為全球規(guī)模最大、歷史最悠久的機器人專業(yè)展會之一的第26屆日本國際機器人展(IREX 2025)在東京國際展覽中心圓滿收官。
    的頭像 發(fā)表于 12-16 11:36 ?1681次閱讀
    思嵐科技亮相2025日本東京<b class='flag-5'>國際</b><b class='flag-5'>機器</b>人展覽會

    思嵐科技邀您相約2025日本東京國際機器人展覽會

    第26屆日本東京國際機器人展覽會(iREX 2025)將于12月3日-6日在東京國際展覽中心(Tokyo Big Sight)盛大啟幕。作為全球最具影響力、規(guī)模最大的機器人專業(yè)展會之一
    的頭像 發(fā)表于 12-03 17:44 ?1266次閱讀

    廣和通斬獲具身智能家務機器人黑客松競賽二等獎

    近日,廣和通受邀參加由 Hugging Face、NVIDIA 與 Seeed Studio 聯(lián)合舉辦的“具身智能家務機器人黑客松”競賽。在本次前沿賽事中,廣和通團隊成功開發(fā)、部署并演示了“雙臂協(xié)作家務機器人系統(tǒng)”,憑借其創(chuàng)新的
    的頭像 發(fā)表于 11-08 14:51 ?1697次閱讀

    普渡樓宇配送機器人榮獲2025年IDEA國際設計卓越獎

    近日,普渡樓宇配送機器人“閃電匣”憑借其卓越的產(chǎn)品設計與創(chuàng)新理念,成功斬獲美國IDEA國際設計大獎(International Design Excellence Awards) !這是全球設計業(yè)內(nèi)
    的頭像 發(fā)表于 10-15 17:58 ?1198次閱讀

    舍弗勒攜手英飛凌共赴智能汽車競賽

    此前,2025年8月18-20日,第二十屆全國大學生智能汽車競賽(以下簡稱“競賽”)全國總決賽在杭州電子科技大學舉辦并圓滿落幕,是國內(nèi)最具影響力的大學生學科競賽之一。在本屆競賽中,來自
    的頭像 發(fā)表于 09-04 14:34 ?937次閱讀

    第六屆TE Connectivity AI Cup全球競賽圓滿收官

    近日,在全球行業(yè)技術(shù)領先企業(yè)TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽中,中國西南財經(jīng)大學團隊與華南理工大學團隊憑借出色表現(xiàn)雙雙奪冠。作為聚焦培養(yǎng)高校
    的頭像 發(fā)表于 08-25 14:13 ?0次閱讀

    傳音斬獲WMT 2025國際機器翻譯大賽四項冠軍

    近日,在由國際計算語言學協(xié)會(ACL)主辦的WMT 2025國際機器翻譯大賽中,傳音在低資源印度語言翻譯任務(Low-Resource Indic Language Translation)中斬獲
    的頭像 發(fā)表于 08-06 18:21 ?1224次閱讀

    中國兩大高校團隊斬獲第六屆TE Connectivity AI Cup全球競賽桂冠

    中國上海,2025年8月4日 ——近日,在全球行業(yè)技術(shù)領先企業(yè)TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽中,中國西南財經(jīng)大學團隊與華南理工大學團隊憑借
    的頭像 發(fā)表于 08-05 15:03 ?1067次閱讀
    中國兩大高校團隊斬獲第六屆TE Connectivity AI <b class='flag-5'>Cup</b>全球<b class='flag-5'>競賽</b>桂冠

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2883次閱讀

    Python從入門到精通背手冊

    電子發(fā)燒友網(wǎng)站提供《Python從入門到精通背手冊.pdf》資料免費下載
    發(fā)表于 03-28 17:43 ?108次下載

    普渡機器人榮獲ISO 56005國際標準知識產(chǎn)權(quán)體系認證

    近日,深圳市普渡科技有限公司(簡稱:普渡機器人)正式通過《創(chuàng)新管理·知識產(chǎn)權(quán)管理指南(ISO 56005: 2020)》國際標準認證,榮獲《創(chuàng)新與知識產(chǎn)權(quán)管理能力》等級證書(1級)。該標準是由我
    的頭像 發(fā)表于 03-19 15:37 ?828次閱讀

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34