chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌在Kaggle發(fā)布了一項地標(biāo)檢索挑戰(zhàn)賽

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-06-30 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

四個月前,谷歌在Kaggle發(fā)布了一項地標(biāo)檢索挑戰(zhàn)賽,在這場比賽中,參賽者會得到一些圖像,他們需要在所有圖像數(shù)據(jù)集中找到含有給定圖像中地標(biāo)的圖片。

圖像檢索是計算機視覺領(lǐng)域的基礎(chǔ)問題,對于包含地標(biāo)的圖像更是非常重要,因為這是用戶拍攝的熱門對象。本次挑戰(zhàn)賽的數(shù)據(jù)集是世界最大的圖像檢索數(shù)據(jù)集,其中有超過一百萬張圖像,覆蓋了全球1.5萬個不同景點。

同時,這項挑戰(zhàn)賽也是CVPR 2018的地標(biāo)辨認(rèn)研討會的一部分。下面就是本次競賽排名第一的解決方案,參賽隊伍是由anokas帶領(lǐng)的團(tuán)隊,論智對其進(jìn)行了編譯。

解決方案包括兩個主要元素:

首先,創(chuàng)建一個高性能的全局描述符(global descriptor),它可以將數(shù)據(jù)庫中的圖像用奇異向量表示;

然后,創(chuàng)建一個高效的框架,能將這些向量和最可能的圖片聯(lián)系起來,最后提交到積分榜上。

下面是總體框架的流程圖,其中每一步應(yīng)用后都有對應(yīng)的LB分?jǐn)?shù)。

注:下文中所有分?jǐn)?shù)都以百分?jǐn)?shù)表示,即62.5%=0.625

方案詳細(xì)講解

全局描述符(Global Descriptors)

我們的方案中最主要的部分就是幾個全局描述符,這些向量描述了圖片的全部內(nèi)容。我們從兩個預(yù)訓(xùn)練的CNN模型開始(ResNet和ResNeXt),并用四種目前最先進(jìn)的集結(jié)方法(aggregation methods)生成全局描述符。下面是四種集結(jié)方法各自的細(xì)節(jié)以及它們“原始”的表現(xiàn)性能(也就是沒有進(jìn)行檢索詞擴展和數(shù)據(jù)庫擴展):

基于區(qū)域熵的多層抽象池化(REMAP)[42.8% mAP]:我們之前設(shè)計的一個全局描述符聚合了不同CNN層的深度特征,之后經(jīng)過訓(xùn)練可以表示多個水平的可視化抽象對象。我們將在之后的CVPR研討會上進(jìn)一步展示REMAP的細(xì)節(jié)架構(gòu)。

最大卷積激活值(MAC)[32.9% mAP]:MAC描述符將每個CNN的最后一層卷積過濾的最大局部回應(yīng)進(jìn)行編碼。在它的架構(gòu)中,ResNeXt的最后一個卷積層后面有一個最大池化層、L2-正則化層和PCA+白化層。

卷積的池化和(SPoC)[31.7% mAP]:在SPoC這一過程中,ResNeXt的最后一個卷積層后接池化和層、L2-正則化層和PCA+白化層。

卷積的區(qū)域最大激活值(RMAC)[34.7% mAP]:在RMAC中,ResNeXt最后的卷積特征是在多個規(guī)模重疊區(qū)域中進(jìn)行的最大池化。這些區(qū)域同樣是基于有L2-正則化層和PCA+白化層的描述符。最后把所有描述符匯總到一個單一的描述符中。

基礎(chǔ)的CNN網(wǎng)絡(luò)(ResNet和ResNeXt)是在ImageNet上進(jìn)行的訓(xùn)練,之后再一個地標(biāo)數(shù)據(jù)集的子集中進(jìn)行調(diào)整。該子集來自Babenko等人的研究成果,其中包括大約12萬張圖片和650個著名景點。

這一數(shù)據(jù)集中的圖像最初是在圖片搜索引擎中用文字搜到的,沒有經(jīng)過檢驗,所以其中可能含有很多不相關(guān)的圖片,這需要我們過濾掉。刪除圖片的過程是半自動的,利用帶有密集SIFT特征的Hessian-affine檢測器以及RVD-W描述符進(jìn)行聚合。處理完圖像后,還剩下25000張左右的圖片,都屬于一種地標(biāo),我們想用它對模型進(jìn)行調(diào)整。

我們沒有用其他類似競賽中的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),因為我們想看看在新的數(shù)據(jù)集下,我們的方案生成的效果如何。

合并描述符

通過用上述方法訓(xùn)練的六個全局描述符合并,就得到了最終的全局描述符(括號中的是LB分?jǐn)?shù)):

ResNeXt+REMAP(42.8%)

ResNeXt+RMAC(34.7%)

ResNeXt+MAC(32.9%)

ResNeXt+SPoC(31.7%)

ResNet+REMAP(35.8%)

ResNet+MAC(30.4%)

接著我們將每個描述符縮放到固定的L2 norm上,為每個描述符分配權(quán)重,按以下方式連接描述符:

XG = [2× ResNeXt+REMAP; 1.5× ResNeXt+RMAC; 1.5× ResNeXt+MAC; 1.5× ResNeXt+SPoC; ResNet+MAC; ResNet+REMAP]

權(quán)重的選擇是點對點的,以反映每種方法相應(yīng)的性能。之后,我們用PCA將描述符的維度降到4K,同時應(yīng)用白化,讓所有維度的方差相同。雖然PCA和白化只能改善一小部分,但是它將查詢擴展的結(jié)果提升了幾個百分點。

最近鄰搜索

創(chuàng)建好描述符后,每張圖片都由一個4096維的描述符表示。接下來,我們用復(fù)雜的k-最近鄰搜索找到每張圖前2500個近鄰和L2距離。這一階段提交每張圖片的前100個最近鄰得到了47.2%的分?jǐn)?shù)。

這一步驟使用優(yōu)化過的NumPy代碼實現(xiàn),用了2小時對每個1.2M的圖片找出了前2500個最近鄰。

數(shù)據(jù)庫增強

接下來要做的是數(shù)據(jù)庫增強(DBA),即把數(shù)據(jù)庫中每張圖片的描述符換成它本身和前10個最近鄰的加權(quán)結(jié)合。目的就是利用它們近鄰的特征提高圖像表示的質(zhì)量。更準(zhǔn)確的是,我們進(jìn)行描述符的加權(quán)求和,其中權(quán)重按以下代碼計算:

weights = logspace(0, -1.5, 10)

有趣的是,在其他數(shù)據(jù)集上我們發(fā)現(xiàn)只要用大于兩個近鄰進(jìn)行增強就會讓分?jǐn)?shù)下降,但10個近鄰對數(shù)據(jù)集增強和圖片是最好的。

需要注意的是,DBA是整個過程中添加的最后一步,雖然它能讓分?jǐn)?shù)得到大幅提升,但是將它和查詢擴展結(jié)合起來時,提升只有1%—2%。我們認(rèn)為這是由于數(shù)據(jù)庫擴展與查詢擴展方法的第一步很相似。

查詢擴展

查詢擴展是圖像檢索問題中的基礎(chǔ)技術(shù),通常對模型的性能有很大提升。它工作的原理是:如果A與B匹配,B與C匹配,那么A與C匹配。我們可以在下面的實例中看到這種原理的優(yōu)勢,圖中三個區(qū)域相互重疊:

在這一案例中,查詢擴張系統(tǒng)可以將A和C聯(lián)系起來,判斷它們屬于同一場景,即使它們?nèi)置枋龇赡懿幌喾?。這在一些光線不同或視角不同的圖像中也很有用。

在這次比賽中,我們設(shè)計了一種新的、快速的技術(shù)用于查詢擴展,它可以通過遞歸運行捕捉圖像之間的長距離連接。這種特點非常適合這一問題,因為含有某個地標(biāo)的圖像有很多,只有一張圖像才能成為查詢結(jié)果,其他的只能歸為top 100的結(jié)果中。

第一次迭代后,查詢擴展提升了約11%,進(jìn)行了30分鐘的遞歸運行后,提升了14%,加入數(shù)據(jù)增強后這一結(jié)果有所下降。

簡化模型

在產(chǎn)品級機器學(xué)習(xí)環(huán)境中,由于收益遞減原則,幾乎不會使用大規(guī)模的多模型集成。通常使用較小的子集就能達(dá)到理想性能。我們想得到原來方案的簡化版本,只需要不到12個小時,僅僅用ResNeXt-REMAP和查詢擴展就能得到56%—57%的分?jǐn)?shù)。

不足之處

局部描述符:這可能是我們在比賽中最意想不到的事。我們試了好幾種基于多種局部描述符的方法,包括使用和不使用幾何驗證的方法,例如用它對我們的結(jié)果重新排名,或者用它從上到下瀏覽幾千個全局近鄰,找找有沒有遺漏掉的局部匹配。不知道其他隊伍使用局部描述符的情況如何,也許是基于CNN的全局描述符太好用了以至于局部的時代終結(jié)了?

處理旋轉(zhuǎn)圖像:在數(shù)據(jù)集中我們發(fā)現(xiàn)很多圖片都是旋轉(zhuǎn)的。我們用好幾種方法處理這個問題,例如在k-最近鄰方法中比較旋轉(zhuǎn)和不旋轉(zhuǎn)的描述符,并為每組圖像進(jìn)行最近匹配。但是分?jǐn)?shù)依然沒有變化。有可能是因為這個數(shù)據(jù)集有太多干擾項了,誤報率太高,即使真正匹配對整體分?jǐn)?shù)的影響也不大。

集成:我們試了好幾種方法將不同模型和方法的結(jié)果結(jié)合起來,例如排序平均和交錯預(yù)測等,然而成效不大。似乎早期將模型結(jié)合比結(jié)束時結(jié)合要好一些。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像檢索
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    8204
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47622
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26186

原文標(biāo)題:Kaggle地標(biāo)圖片檢索挑戰(zhàn)賽冠軍方案講解

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動

    第四屆AICAS Grand Challenge——AICAS 2026全球技術(shù)挑戰(zhàn)賽現(xiàn)已正式啟動,誠邀各界英才和技術(shù)先鋒共同參與,以“芯”智能驅(qū)動未來!
    的頭像 發(fā)表于 02-04 14:59 ?492次閱讀

    第三屆開放原子大賽OpenTenBase兩大賽圓滿落幕

    2025年12月19日,由開放原子開源基金會主辦,深圳市騰訊計算機系統(tǒng)有限公司承辦的“OpenTenBase多模態(tài)分析開發(fā)挑戰(zhàn)賽”與“OpenTenBase-TXSQL SQL改寫優(yōu)化挑戰(zhàn)賽”兩大賽決賽路演
    的頭像 發(fā)表于 12-29 13:53 ?482次閱讀

    摩爾線程SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術(shù)LiteGS出色的算法實力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認(rèn)可。
    的頭像 發(fā)表于 12-22 18:01 ?1799次閱讀
    摩爾線程<b class='flag-5'>在</b>SIGGRAPH Asia 2025斬獲3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    2025 全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent全球?qū)m?b class='flag-5'>賽線下半決賽新聞發(fā)布會在深圳召開

    12月10日下午,以“智啟未來,星耀深圳”為主題的2025全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent 全球?qū)m?b class='flag-5'>賽線下半決賽新聞發(fā)布會在深圳召開。本次發(fā)布會由CICAS?AI Age
    的頭像 發(fā)表于 12-10 18:11 ?1187次閱讀
    2025 全國人工智能應(yīng)用場景創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b>AI Agent全球?qū)m?b class='flag-5'>賽</b>線下半決賽新聞<b class='flag-5'>發(fā)布</b>會在深圳召開

    openDACS 2025 開源EDA與芯片 題七:基于大模型的生成式原理圖設(shè)計

    ,形成了批具有應(yīng)用價值的技術(shù)成果。本屆大賽預(yù)計發(fā)布50個,持續(xù)規(guī)劃1500萬元總獎金。 openDACS2025開源EDA與芯片
    發(fā)表于 11-13 11:49

    東風(fēng)睿立達(dá)斬獲NEVC 2025中國新能源商用車挑戰(zhàn)賽大獎

    9月15日,NEVC2025第十屆中國新能源商用車挑戰(zhàn)賽頒獎盛典圓滿落幕。東風(fēng)睿立達(dá)以卓越表現(xiàn)橫掃六大獎,包括“大面組全能金獎”及四關(guān)鍵單項冠軍,成為本屆賽事中最耀眼的新能源商用車之星。
    的頭像 發(fā)表于 09-16 16:57 ?1018次閱讀

    2025 EDA精英挑戰(zhàn)賽華大九天發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1638次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1654次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    2025 EDA精英挑戰(zhàn)賽概倫電子發(fā)布

    近日,2025中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽正式拉開帷幕。作為國內(nèi)首家EDA上市公司,關(guān)鍵核心技術(shù)具備國際市場競爭力的EDA領(lǐng)軍企業(yè),同時也是集成電路設(shè)計自動化(EDA)產(chǎn)教融合聯(lián)盟
    的頭像 發(fā)表于 08-25 09:31 ?1289次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>概倫電子<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計挑戰(zhàn)賽

    安富利旗下e絡(luò)盟社區(qū)與 Würth Elektronik 合作推出全球設(shè)計挑戰(zhàn)賽。這項全新競賽誠邀工程師、創(chuàng)客和愛好者們使用 Würth Elektronik 先進(jìn)的 SMD LED(集成了 WL-ICLED 控制器)開發(fā)原型或測試裝置。
    的頭像 發(fā)表于 07-23 10:15 ?911次閱讀
    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計<b class='flag-5'>挑戰(zhàn)賽</b>

    傳音多媒體團(tuán)隊攬獲CVPR NTIRE 2025兩挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    近日,計算機視覺領(lǐng)域最具影響力的國際競賽CVPRNTIRE2025中,傳音多媒體團(tuán)隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?909次閱讀
    傳音多媒體團(tuán)隊攬獲CVPR NTIRE 2025兩<b class='flag-5'>項</b><b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團(tuán)隊攬獲CVPR NTIRE 2025兩挑戰(zhàn)賽冠亞軍

    近日,計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1626次閱讀
    傳音多媒體團(tuán)隊攬獲CVPR NTIRE 2025兩<b class='flag-5'>項</b><b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢力知識挑戰(zhàn)賽正式啟動

    ASML光刻「芯」勢力知識挑戰(zhàn)賽由全球半導(dǎo)體行業(yè)領(lǐng)先供應(yīng)商ASML發(fā)起,是一項面向中國半導(dǎo)體人才與科技愛好者的科普賽事。依托ASML光刻領(lǐng)域的技術(shù)積累與行業(yè)洞察,賽事致力于為參賽者打造
    的頭像 發(fā)表于 06-23 17:04 ?1255次閱讀
    ASML杯光刻「芯 」勢力知識<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動

    兆易創(chuàng)新助力2025年“西門子杯”中國智能制造挑戰(zhàn)賽

    全球智能制造浪潮奔涌向前,兆易創(chuàng)新(GigaDevice)作為半導(dǎo)體行業(yè)的領(lǐng)跑者,不斷通過高校競賽加速技術(shù)革新與人才培養(yǎng)。2025年,兆易創(chuàng)新深度參與CIMC “西門子杯”中國智能制造挑戰(zhàn)賽,聚焦
    的頭像 發(fā)表于 04-10 15:24 ?1662次閱讀

    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器挑戰(zhàn)賽

    安富利旗下社區(qū) e絡(luò)盟攜手 TDK 發(fā)起新的設(shè)計挑戰(zhàn)賽,誠邀工程師、創(chuàng)客及技術(shù)愛好者利用 TDK 防水超聲波測距傳感器開發(fā)創(chuàng)新項目,供實際應(yīng)用使用。
    的頭像 發(fā)表于 03-11 10:09 ?1027次閱讀
    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器<b class='flag-5'>挑戰(zhàn)賽</b>