5月28日,北京智源人工智能研究院在2023年中關(guān)村論壇并行論壇之一的人工智能大規(guī)模模型發(fā)展論壇上發(fā)布了通用分割模型seggpt (segment everything in contex)。這是一種利用prompt(視覺提示)完成任意分割工作的通用視覺模型。
seggpt是一個基于支持通用視覺模型painter的模型,它優(yōu)化了所有物體的分割。seggpt具有上下文推理功能,即使沒有細微的調(diào)整,只要提供示例,就可以自動進行推理和相應(yīng)的分割工作。示例包括示例、類、部件、輪廓、文本、面部、醫(yī)療圖像等。它靈活的推論能力足以提供許多視覺線索。自動視頻分割和追蹤功能:seggpt以第一個框架的圖片和對象屏蔽為上下文單位,可以自動分割下一個視頻框架,并使用屏蔽顏色作為對象id自動追蹤。
seggpt與推出ai圖像分割基礎(chǔ)模型sam的meta不同,sam使用的是通過一個點或邊框相互提示預(yù)測圖像,識別分割畫面上的特定物體的“one touch touch”方式。seggpt通過提示一個或多個示例圖像和意圖面具來掌握用戶的意圖,并根據(jù)意圖進行分割等操作。只要用戶在畫面上表示識別一種物體,無論是現(xiàn)在的畫面還是其他畫面,都可以定量地識別和分割同類物體。
“一觸即通”或“一通百通”意味著視覺模型理解了形象結(jié)構(gòu)。sam的精細腳注功能與seggpt的通用分割腳注功能相結(jié)合,可以在像素排列中分析任何圖像,以像生物視覺一樣理解任何場景。
-
AI
+關(guān)注
關(guān)注
90文章
38241瀏覽量
297160 -
視覺模型
+關(guān)注
關(guān)注
0文章
8瀏覽量
7035 -
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16723
發(fā)布評論請先 登錄
GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍
GPT-5.1發(fā)布 OpenAI開始拼情商
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
如何用Arduino Nano/UNO R3開發(fā)板給另一個Arduino IDE不能下載的Arduino Nano/UNO R3開發(fā)板重新燒錄引導(dǎo)程序bootlaoder
最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)
一文講透 AI 歷史上的 10 個關(guān)鍵時刻
中軟國際在大型銀行AI項目領(lǐng)域實現(xiàn)重大突破
請問canmv-k230支持雙核嗎?如何調(diào)用另一個核心工作?
OpenAI即將發(fā)布GPT-4.5與GPT-5
EE-82:使用ADSP-2181 DSP的IO空間對另一個ADSP-2181進行IDMA引導(dǎo)

AI另一個重大領(lǐng)域視覺的GPT時刻何時到來?
評論