chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Keras構(gòu)建基于關(guān)鍵字和圖像的搜索引擎

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:人工智能遇見磐創(chuàng) ? 2020-05-05 08:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

動機(jī)

想象一下,如果有數(shù)十萬到數(shù)百萬張圖像的數(shù)據(jù)集,卻沒有描述每張圖像內(nèi)容的元數(shù)據(jù)。我們?nèi)绾谓⒁粋€系統(tǒng),能夠找到這些圖像的子集來更好地回答用戶的搜索查詢?

我們基本上需要的是一個搜索引擎,它能夠根據(jù)圖像與搜索查詢的對應(yīng)程度對圖像結(jié)果進(jìn)行排序,可以用一種自然語言表示,,也可以用其他查詢圖像表示。

我們將在本文中解決問題的方法是訓(xùn)練一個深度神經(jīng)模型,該模型學(xué)習(xí)任何輸入圖像和文本的固定長度表示形式(或嵌入形式),使得如果文本-圖像或圖像-圖像是“相似的”,則他們在歐氏空間中接近,。

數(shù)據(jù)集

我找不到足夠大的搜索結(jié)果排名數(shù)據(jù)集,但我能夠得到這個數(shù)據(jù)集:http://jmcauley.ucsd.edu/data/amazon/它將電子商務(wù)項目的圖像鏈接到它們的標(biāo)題和描述。我們將使用這些元數(shù)據(jù)作為監(jiān)督源來學(xué)習(xí)有意義的聯(lián)合文本-圖像表示。為了管理計算和存儲成本,這些實驗僅限于時尚(服裝、鞋子和珠寶)物品和50萬張圖像。

問題設(shè)置

我們的數(shù)據(jù)集將每個圖像與用自然語言編寫的描述鏈接起來。因此,我們定義了一個任務(wù),在該任務(wù)中,我們要學(xué)習(xí)圖像和文本的固定長度的聯(lián)合表示,以便每個圖像表示都接近其描述的表示。

模型

該模型有3個輸入:圖像(即錨點(diǎn))、圖像標(biāo)題與描述(即正例)和第三個輸入是一些隨機(jī)采樣的文本(即負(fù)例)。

然后定義兩個子模型:

圖像編碼器:Resnet50預(yù)訓(xùn)練的ImageNet+GlobalMaxpooling2D

文本編碼器:GRU+GlobalMaxpooling1D

圖像子模型產(chǎn)生錨點(diǎn)E_a的嵌入,文本子模型輸出正標(biāo)題和描述E_p的嵌入和負(fù)例文本E_n的嵌入。

然后,我們通過優(yōu)化以下?lián)p失函數(shù)進(jìn)行訓(xùn)練:

L = max( d(Ea, Ep)-d(Ea, En)+alpha, 0)

其中d為歐氏距離,alpha為超參數(shù),在本實驗中為0.4。

基本上,這種損失允許做的是使d(E_a,E_p)變小,使d(E_a,E_n)變大,這樣每個圖像的嵌入就接近于它的描述的嵌入,而遠(yuǎn)離隨機(jī)文本的嵌入。

可視化結(jié)果

一旦我們學(xué)習(xí)了圖像嵌入模型和文本嵌入模型,我們就可以通過使用tsne (https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html)將它們投影到二維空間中來實現(xiàn)可視化。測試圖像及其對應(yīng)的文本描述用綠線連接

從圖中可以看出,通常在嵌入空間中,圖像及其對應(yīng)的描述是接近的??紤]到使用的訓(xùn)練損失,這是我們期望的。

文字圖片搜索

在這里,我們使用幾個文本查詢示例來在一組70,000張圖像中搜索最佳匹配。我們計算查詢的文本嵌入,然后計算集合中每個圖像的嵌入。我們最終在嵌入空間中選擇最接近查詢的前9張圖像。

這些例子表明,嵌入模型能夠?qū)W習(xí)圖像的有用表示形式和簡單單詞組成的嵌入。

圖像搜索

在這里,我們將使用圖像作為查詢,然后在包含70,000張圖像的數(shù)據(jù)庫中搜索與之最相似的示例。排序是由每對圖像在嵌入空間內(nèi)的歐氏距離決定的。

結(jié)果表明,生成的嵌入是圖像的高級表示,它捕獲了所表示對象的最重要特征,而不受方向、光照或局部細(xì)節(jié)的過度影響,也沒有經(jīng)過明確的訓(xùn)練。

結(jié)論:在這個項目中,我們研究了機(jī)器學(xué)習(xí)模塊,它允許我們構(gòu)建一個基于關(guān)鍵字和圖像的搜索引擎,應(yīng)用于圖像集合。其基本思想是學(xué)習(xí)一個有意義的文本和圖像的聯(lián)合嵌入函數(shù),然后利用嵌入空間中項之間的距離對搜索結(jié)果進(jìn)行排序。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4622

    瀏覽量

    88964
  • keras
    +關(guān)注

    關(guān)注

    2

    文章

    20

    瀏覽量

    6259
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里巴巴國際站關(guān)鍵字搜索 API 實戰(zhàn):從多條件篩選到商品列表高效獲客

    ??在跨境電商數(shù)據(jù)采集場景中,通過關(guān)鍵字精準(zhǔn)搜索商品列表是基礎(chǔ)且核心的需求。本文將聚焦阿里巴巴國際站的關(guān)鍵字搜索接口,詳細(xì)介紹如何構(gòu)建多條件
    的頭像 發(fā)表于 08-20 09:22 ?453次閱讀
    阿里巴巴國際站<b class='flag-5'>關(guān)鍵字</b><b class='flag-5'>搜索</b> API 實戰(zhàn):從多條件篩選到商品列表高效獲客

    micro 關(guān)鍵字搜索全覆蓋商品,并通過 API 接口提供實時數(shù)據(jù)

    micro 關(guān)鍵字搜索全覆蓋商品”并通過 API 接口提供實時數(shù)據(jù)
    的頭像 發(fā)表于 07-13 10:13 ?454次閱讀

    單片機(jī)編程關(guān)鍵字之volatile

    volatile 修飾的變量是說這變量可能會被意想不到地改變。通常對于程序員而言,單片機(jī) 中用的就算常見了volatile 是易變的,不穩(wěn)定的意思。其實對于很多人來說,根本沒見過這個關(guān)鍵字,不 知道
    發(fā)表于 04-02 13:47 ?2次下載

    微軟面臨法國反壟斷機(jī)構(gòu)調(diào)查

    據(jù)媒體報道,微軟目前正在接受法國反壟斷機(jī)構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點(diǎn)在于,微軟是否在搜索引擎聯(lián)盟市場中濫用其市場支配地位。 知情人士透露,法國監(jiān)管機(jī)構(gòu)正在仔細(xì)評估微軟的行為,特別是其是否向那些
    的頭像 發(fā)表于 02-11 10:57 ?771次閱讀

    LZO Data Compression,高性能LZO無損數(shù)據(jù)壓縮加速器介紹,F(xiàn)PGA&amp;ASIC

    無損數(shù)據(jù)壓縮2.可配置的數(shù)據(jù)塊分段和搜索窗口大小[8KB,16KB,32KB]3.可配置的并行處理等級[搜索引擎的數(shù)量,1~32]4.可配置的字典深度[8K,16KB],字典RAM類型[BRAM
    發(fā)表于 01-24 23:53

    javascript:void(0) 是否影響SEO優(yōu)化

    使用 javascript:void(0) 確實可能對SEO優(yōu)化產(chǎn)生負(fù)面影響 。以下是關(guān)于 javascript:void(0) 對SEO影響的具體分析: 搜索引擎爬蟲的理解問題 搜索引擎爬蟲(如
    的頭像 發(fā)表于 12-31 16:08 ?859次閱讀

    HTTP 協(xié)議對于SEO優(yōu)化的影響

    搜索引擎優(yōu)化(SEO)是提高網(wǎng)站在搜索引擎中的可見性和排名的過程。HTTP協(xié)議作為互聯(lián)網(wǎng)通信的基礎(chǔ),對SEO有著深遠(yuǎn)的影響。 1. HTTP狀態(tài)碼 HTTP狀態(tài)碼是服務(wù)器響應(yīng)客戶端請求的結(jié)果。這些
    的頭像 發(fā)表于 12-30 09:29 ?834次閱讀

    蘋果為谷歌支付數(shù)十億美元辯護(hù),參與搜索案反壟斷審判

    近日,蘋果公司已正式要求參與谷歌即將在美國舉行的在線搜索反壟斷審判,此舉旨在為其與谷歌之間的收入分成協(xié)議進(jìn)行辯護(hù)。該協(xié)議使得谷歌成為Safari瀏覽器的默認(rèn)搜索引擎,而谷歌每年因此向蘋果支付數(shù)十
    的頭像 發(fā)表于 12-26 10:41 ?622次閱讀

    C語言關(guān)鍵字分別發(fā)生在哪個階段

    以下C語言關(guān)鍵字,分別發(fā)生在哪個階段? 第一個,define。 首先得糾正一下,define 并不是C語言里面的關(guān)鍵字,即使加了井號,也不是。 define 屬于C語言的預(yù)處理指令,很顯然,它發(fā)生
    的頭像 發(fā)表于 11-24 10:31 ?787次閱讀

    SSR的優(yōu)勢和劣勢分析

    SSR(Server-Side Rendering,服務(wù)器端渲染)的優(yōu)勢和劣勢分析如下: SSR的優(yōu)勢 SEO友好 : 由于搜索引擎爬蟲的性質(zhì),更容易識別和抓取服務(wù)端渲染的頁面內(nèi)容,因此提升了網(wǎng)站
    的頭像 發(fā)表于 11-18 11:27 ?2170次閱讀

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1540次閱讀

    阿里國際推出B2B領(lǐng)域AI搜索引擎Accio

    近日,阿里國際宣布正式進(jìn)軍AI搜索領(lǐng)域,并面向全球商家推出了首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品的推出,標(biāo)志著阿里國際在電子商務(wù)和人工智能技術(shù)結(jié)合方面邁出了重要一步。 Accio
    的頭像 發(fā)表于 11-14 11:47 ?1233次閱讀

    租用多ip云服務(wù)器可以帶來哪些好處?應(yīng)用場景有哪些?

    租用多ip云服務(wù)器可以為用戶帶來多種好處和應(yīng)用場景,主要包括: 1、SEO優(yōu)化: 搜索引擎優(yōu)化(SEO)通常推薦使用多個ip地址來托管不同的網(wǎng)站,以減少網(wǎng)站之間的潛在負(fù)面影響,提高搜索引擎索引效率
    的頭像 發(fā)表于 11-04 11:33 ?650次閱讀

    OpenAI推出ChatGPT搜索功能

    查找網(wǎng)絡(luò)信息時,往往需要通過傳統(tǒng)的搜索引擎進(jìn)行檢索,然后從中篩選出有價值的內(nèi)容。而現(xiàn)在,有了ChatGPT搜索,用戶可以更加便捷地獲取所需信息。 OpenAI表示,ChatGPT搜索不僅能夠幫助用戶像在網(wǎng)絡(luò)上一樣
    的頭像 發(fā)表于 11-04 10:34 ?814次閱讀

    Meta開發(fā)新搜索引擎,減少對谷歌和必應(yīng)的依賴

    近日,Meta正在積極進(jìn)軍人工智能領(lǐng)域,并試圖跟上OpenAI的發(fā)展步伐。為實現(xiàn)這一目標(biāo),Meta正在開發(fā)一款全新的搜索引擎,該搜索引擎具備網(wǎng)絡(luò)爬蟲功能,能夠為用戶提供有關(guān)時事的對話答案,而這些答案
    的頭像 發(fā)表于 10-29 11:49 ?952次閱讀