chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI重磅推出語(yǔ)言模型DALL·E和圖像識(shí)別系統(tǒng)CLIP

454398 ? 來(lái)源:控制工程網(wǎng) ? 作者:控制工程網(wǎng) ? 2021-01-15 11:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI)研究組織OpenAI重磅推出了最新的語(yǔ)言模型DALL·E和圖像識(shí)別系統(tǒng)CLIP。

這兩個(gè)模型是OpenAI第三代語(yǔ)言生成器的一個(gè)分支。兩種神經(jīng)網(wǎng)絡(luò)都旨在生成能夠理解圖像和相關(guān)文本的模型。OpenAI希望這些升級(jí)后的語(yǔ)言模型能夠以接近人類解釋世界的方式來(lái)解讀圖像。

2020年5月,OpenAI發(fā)布了迄今為止全球規(guī)模最大的預(yù)訓(xùn)練語(yǔ)言模型GPT-3。GPT-3具有1750億參數(shù),訓(xùn)練所用的數(shù)據(jù)量達(dá)到45TB。對(duì)于所有任務(wù),應(yīng)用GPT-3無(wú)需進(jìn)行任何梯度更新或微調(diào),僅需要與模型文本交互為其指定任務(wù)和展示少量演示即可使其完成任務(wù)。

GPT-3在許多自然語(yǔ)言處理數(shù)據(jù)集上均具有出色的性能,包括翻譯、問答和文本填空任務(wù),還包括一些需要即時(shí)推理或領(lǐng)域適應(yīng)的任務(wù)等,已在很多實(shí)際任務(wù)上大幅接近人類水平。

新發(fā)布的語(yǔ)言模型DALL·E,是GPT-3的120億參數(shù)版本,可以按照自然語(yǔ)言文字描述直接生成對(duì)應(yīng)圖片!

這個(gè)新系統(tǒng)的名稱DALL·E,來(lái)源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦力(WALL-E)的結(jié)合。新系統(tǒng)展示了“為一系列廣泛的概念”創(chuàng)造圖像的能力,可從文字標(biāo)題直接創(chuàng)建圖像以表達(dá)概念。通過從文本描述而不是標(biāo)簽數(shù)據(jù)生成圖像,可以為模型提供了更多有關(guān)含義的上下文。

開發(fā)人員將DALL·E稱為“轉(zhuǎn)換語(yǔ)言模型”(transformer language model),能夠?qū)⑽谋竞蛨D像作為單個(gè)數(shù)據(jù)流接收。這種訓(xùn)練程序使得DALL·E不僅可以從零開始生成圖像,而且還可以重新生成現(xiàn)有圖像的任何矩形區(qū)域……。以一種與文本提示一致的方式。

這種語(yǔ)言模型能夠反映人類語(yǔ)言的微妙之處,包括 “將不同的想法結(jié)合起來(lái)合成物體的能力”。例如,在DALL·E模型中輸入“牛油果形狀的扶手椅”,它就可以生成這樣的圖片:

DALL·E還擴(kuò)展了被稱為“零樣本推理”(zero-shotreasoning)的GPT-3功能,這是一種強(qiáng)大的常識(shí)性機(jī)器學(xué)習(xí)形式。DALL·E將這一功能擴(kuò)展到了視覺領(lǐng)域,并且在以正確的方式提示時(shí)能夠執(zhí)行多種圖像到圖像的翻譯任務(wù)。

圖像識(shí)別系統(tǒng)CLIP的通用性比當(dāng)前針對(duì)單個(gè)任務(wù)的系統(tǒng)更好,可以用網(wǎng)上公開的文字圖像配對(duì)數(shù)據(jù)集來(lái)訓(xùn)練。CLIP系統(tǒng)可用于對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練,通過從網(wǎng)絡(luò)圖像中收集的自然語(yǔ)言監(jiān)督學(xué)習(xí)視覺概念。OpenAI表示CLIP的工作方式是提供要識(shí)別的視覺類別的名稱。

當(dāng)將其應(yīng)用于圖像分類基準(zhǔn)時(shí),可以指示模型執(zhí)行一系列基準(zhǔn),而無(wú)需針對(duì)每個(gè)測(cè)試進(jìn)行優(yōu)化。OpenAI表示:“通過不直接針對(duì)基準(zhǔn)進(jìn)行優(yōu)化,我們證明它變得更具代表性。” CLIP方法可將“穩(wěn)健性差距”縮小多達(dá)75%。

OpenAI 聯(lián)合創(chuàng)始人、首席科學(xué)家 Ilya Sutskever認(rèn)為,人工智能的長(zhǎng)期目標(biāo)是構(gòu)建多模態(tài)神經(jīng)網(wǎng)絡(luò),即AI能夠?qū)W習(xí)不同模態(tài)之間的概念(文本和視覺領(lǐng)域?yàn)橹鳎瑥亩玫乩斫馐澜?,?DALL·E 和 CLIP 使我們更接近“多模態(tài) AI 系統(tǒng)”這一目標(biāo)。

未來(lái),我們將擁有同時(shí)理解文本和圖像的模型。人工智能將能夠更好地理解語(yǔ)言,因?yàn)樗梢钥吹絾卧~和句子的含義。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4831

    瀏覽量

    107232
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    532

    瀏覽量

    39934
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49961

    瀏覽量

    263628
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    7234
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1241

    瀏覽量

    9887
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ??低暤\花圖像識(shí)別智能系統(tǒng)推動(dòng)水質(zhì)處理精細(xì)化管控

    為了解決這個(gè)痛點(diǎn),海康威視推出礬花圖像識(shí)別智能系統(tǒng)——為水處理提質(zhì)增效,告別單一“肉眼判斷”時(shí)代。
    的頭像 發(fā)表于 01-10 16:08 ?2209次閱讀

    基于米爾MYC-YM90X安路飛龍DR1開發(fā)板儀表圖像識(shí)別系統(tǒng)開發(fā)

    資源,具備強(qiáng)大計(jì)算能力與靈活定制特性,為構(gòu)建高性能儀表圖像識(shí)別系統(tǒng)帶來(lái)新機(jī)遇。通過合理利用其異構(gòu)架構(gòu),可實(shí)現(xiàn)圖像識(shí)別算法的高效執(zhí)行,提升系統(tǒng)實(shí)時(shí)性與準(zhǔn)確性。 二、安路飛龍 FPSOC 架構(gòu)分析
    發(fā)表于 08-17 21:29

    華怡豐推出ISC-B/C系列圖像識(shí)別傳感器

    在工業(yè)自動(dòng)化領(lǐng)域,精準(zhǔn)、高效的視覺檢測(cè)是提升生產(chǎn)效率的關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識(shí)別傳感器集高精度定位、測(cè)量算法與先進(jìn)圖像處理技術(shù)于一體,為各類工業(yè)場(chǎng)景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?1623次閱讀
    華怡豐<b class='flag-5'>推出</b>ISC-B/C系列<b class='flag-5'>圖像識(shí)別</b>傳感器

    基于FPGA的數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)

    圖像處理領(lǐng)域,圖像識(shí)別是較為困難而關(guān)鍵的技術(shù)。這項(xiàng)技術(shù)被廣泛的應(yīng)用到娛樂、工業(yè)、軍事等領(lǐng)域。本次設(shè)計(jì)數(shù)字識(shí)別系統(tǒng)已經(jīng)在車牌識(shí)別、運(yùn)動(dòng)員號(hào)碼識(shí)別
    的頭像 發(fā)表于 07-16 14:28 ?1305次閱讀
    基于FPGA的數(shù)字<b class='flag-5'>識(shí)別系統(tǒng)</b>設(shè)計(jì)

    火車車號(hào)圖像識(shí)別系統(tǒng)如何應(yīng)對(duì)不同光照條件下的識(shí)別問題?

    在鐵路運(yùn)輸管理中,準(zhǔn)確識(shí)別火車車號(hào)是實(shí)現(xiàn)自動(dòng)化車輛管理的關(guān)鍵環(huán)節(jié)。然而,實(shí)際應(yīng)用場(chǎng)景中復(fù)雜多變的光照條件給車號(hào)識(shí)別帶來(lái)了巨大挑戰(zhàn)。現(xiàn)代火車車號(hào)圖像識(shí)別系統(tǒng)通過多項(xiàng)技術(shù)創(chuàng)新,有效解決了這一難題。 多
    的頭像 發(fā)表于 07-15 11:37 ?615次閱讀
    火車車號(hào)<b class='flag-5'>圖像識(shí)別系統(tǒng)</b>如何應(yīng)對(duì)不同光照條件下的<b class='flag-5'>識(shí)別</b>問題?

    岸橋箱號(hào)識(shí)別系統(tǒng)的基本工作原理是什么?

    岸橋箱號(hào)識(shí)別系統(tǒng)是港口自動(dòng)化作業(yè)中的核心技術(shù)之一,它通過先進(jìn)的圖像識(shí)別與智能算法,實(shí)現(xiàn)對(duì)集裝箱號(hào)碼及關(guān)鍵信息的快速、精準(zhǔn)識(shí)別,從而提升港口物流效率。其基本工作原理可分為以下幾個(gè)核心環(huán)節(jié): 1.
    的頭像 發(fā)表于 06-18 11:16 ?463次閱讀

    工地AI行為識(shí)別系統(tǒng)作用

    工地AI行為識(shí)別系統(tǒng)作用 工地AI行為識(shí)別系統(tǒng)是什么? 工地AI行為識(shí)別系統(tǒng)是一種基于人工智能技術(shù)的智能監(jiān)控方案,通過攝像頭+AI算法,實(shí)時(shí)分析工地人員行為,自動(dòng)識(shí)別安全隱患(如未戴安
    的頭像 發(fā)表于 05-08 12:00 ?840次閱讀

    景區(qū)AI行為識(shí)別系統(tǒng)作用

    景區(qū)AI行為識(shí)別系統(tǒng)作用 景區(qū)AI行為識(shí)別系統(tǒng)是什么? 景區(qū)AI行為識(shí)別系統(tǒng)是利用人工智能技術(shù)(如視頻分析、人臉識(shí)別)構(gòu)建的智能管理方案。通過部署攝像頭+AI算法,實(shí)時(shí)監(jiān)控游客行為,自
    的頭像 發(fā)表于 05-07 15:32 ?786次閱讀
    景區(qū)AI行為<b class='flag-5'>識(shí)別系統(tǒng)</b>作用

    手持終端集裝箱識(shí)別系統(tǒng)圖像識(shí)別技術(shù)

    行業(yè)提供了更靈活、精準(zhǔn)的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識(shí)別技術(shù),結(jié)合深度學(xué)習(xí)算法,可快速捕捉并解析集裝箱號(hào)碼。其技術(shù)優(yōu)勢(shì)體現(xiàn)在: 1. 復(fù)雜環(huán)境適應(yīng)性:通過動(dòng)態(tài)曝光補(bǔ)償和圖像增強(qiáng)算
    的頭像 發(fā)表于 04-03 10:49 ?650次閱讀

    岸橋箱號(hào)識(shí)別系統(tǒng)如何工作?揭秘AI圖像識(shí)別技術(shù)!

    在港口自動(dòng)化升級(jí)的浪潮中,AI岸橋識(shí)別系統(tǒng)憑借前沿的圖像識(shí)別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實(shí)現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過AI技術(shù)替代傳統(tǒng)人工理貨?讓我們一探
    的頭像 發(fā)表于 04-02 09:45 ?658次閱讀

    岸橋箱號(hào)識(shí)別系統(tǒng)的工作原理 #人工智能 #識(shí)別系統(tǒng)

    識(shí)別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年03月24日 09:28:11

    ?VLM(視覺語(yǔ)言模型)?詳細(xì)解析

    視覺語(yǔ)言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語(yǔ)言(文本)處理能力的多模態(tài)人工智能模型
    的頭像 發(fā)表于 03-17 15:32 ?8186次閱讀
    ?VLM(視覺<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>)?詳細(xì)解析

    OpenAI即將推出GPT-5模型

    OpenAI首席執(zhí)行官奧爾特曼近日宣布了一項(xiàng)重要消息:OpenAI將在今年未來(lái)幾個(gè)月內(nèi)推出全新的GPT-5模型。這一消息引起了業(yè)界的廣泛關(guān)注和期待。 據(jù)了解,GPT-5
    的頭像 發(fā)表于 02-13 11:21 ?1052次閱讀