chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

哈工大提出Myriad:利用視覺專家進(jìn)行工業(yè)異常檢測的大型多模態(tài)模型

CVer ? 來源:CVer ? 2023-11-21 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一句話總結(jié)

通過應(yīng)用視覺專家進(jìn)行工業(yè)異常檢測,以實(shí)現(xiàn)明確的異常檢測和高質(zhì)量的異常描述,還可進(jìn)行多輪對話,性能表現(xiàn)出色!優(yōu)于AnomalyGPT等網(wǎng)絡(luò),代碼即將開源!

Myriad

81612fa6-8842-11ee-939d-92fbcf53809c.png

Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

單位:哈工大(左旺孟團(tuán)隊(duì)), 琶洲實(shí)驗(yàn)室

論文:https://arxiv.org/abs/2310.19070

代碼:https://github.com/tzjtatata/Myriad

現(xiàn)有的工業(yè)異常檢測(IAD)方法可以預(yù)測異常檢測和定位的異常分?jǐn)?shù)。然而,它們很難對異常區(qū)域進(jìn)行多輪對話和詳細(xì)描述,例如工業(yè)異常的顏色、形狀和類別。

最近,大型多模態(tài)(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務(wù)上表現(xiàn)出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現(xiàn)有的通用 LMM 中缺乏有關(guān)異常檢測的知識,而訓(xùn)練特定的 LMM 進(jìn)行異常檢測需要大量的注釋數(shù)據(jù)和大量的計(jì)算資源。

本文提出了一種新穎的大型多模態(tài)模型,通過應(yīng)用視覺專家進(jìn)行工業(yè)異常檢測(稱為Myriad),從而實(shí)現(xiàn)明確的異常檢測和高質(zhì)量的異常描述。

8174db1e-8842-11ee-939d-92fbcf53809c.png

具體來說,采用 MiniGPT-4 作為基礎(chǔ) LMM,并設(shè)計(jì)一個(gè)專家感知模塊,將視覺專家的先驗(yàn)知識嵌入到大型語言模型(LLM)可以理解的標(biāo)記中。

817bd270-8842-11ee-939d-92fbcf53809c.png

為了彌補(bǔ)視覺專家的錯(cuò)誤和困惑,引入了域適配器來彌合通用圖像和工業(yè)圖像之間的視覺表示差距。此外,提出了一個(gè)視覺專家講師,它使 Q-Former 能夠根據(jù)視覺專家先驗(yàn)生成 IAD 領(lǐng)域視覺語言標(biāo)記。

實(shí)驗(yàn)結(jié)果

在MVTec-AD 和 VisA 基準(zhǔn)上的大量實(shí)驗(yàn)表明,本文提出的方法不僅在 1-class 和少樣本設(shè)置下比最先進(jìn)的方法表現(xiàn)更好,而且還提供了明確的異常預(yù)測以及 IAD 中的詳細(xì)描述領(lǐng)域。

818720f8-8842-11ee-939d-92fbcf53809c.png

8193e388-8842-11ee-939d-92fbcf53809c.png

81d184e0-8842-11ee-939d-92fbcf53809c.png

81ed7236-8842-11ee-939d-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3644

    瀏覽量

    51683
  • 視覺
    +關(guān)注

    關(guān)注

    1

    文章

    171

    瀏覽量

    24705
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3435

    瀏覽量

    4955

原文標(biāo)題:工業(yè)異常檢測大模型來了!哈工大提出Myriad:利用視覺專家進(jìn)行工業(yè)異常檢測的大型多模態(tài)模型

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    亞馬遜云科技上線Amazon Nova模態(tài)嵌入模型

    Embeddings模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線,這是一款專為Agentic RAG與語義搜索應(yīng)用打造的頂尖模態(tài)
    的頭像 發(fā)表于 10-29 17:15 ?98次閱讀
    亞馬遜云科技上線Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>嵌入<b class='flag-5'>模型</b>

    工業(yè)視覺網(wǎng)關(guān):RK3576賦能多路檢測與邊緣AI

    工業(yè)4.0與智能制造的推動下,產(chǎn)線對檢測效率、良率與可追溯提出了更高要求。傳統(tǒng)IPC方案在通道數(shù)、功耗、體積與集成成本之間難以平衡,尤其在 AOI(自動光學(xué)檢測)、裝配工序監(jiān)控、不良
    發(fā)表于 10-16 17:56

    米爾RK3576部署端側(cè)模態(tài)輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    細(xì)化需求,系統(tǒng)需實(shí)時(shí)調(diào)整響應(yīng)策略 1.2 輪對話系統(tǒng)鳥瞰:三顆“核心”協(xié)同驅(qū)動RK3576 模態(tài)交互對話方案基于 RKLLM 的核心運(yùn)作,依賴于圖像視覺編碼器、大語言
    發(fā)表于 09-05 17:25

    如何利用AI算法進(jìn)行裝置數(shù)據(jù)的異常檢測?

    利用 AI 算法進(jìn)行裝置數(shù)據(jù)異常檢測,需結(jié)合工業(yè)裝置的數(shù)據(jù)特性(如實(shí)時(shí)性、源性、強(qiáng)時(shí)序性、噪聲
    的頭像 發(fā)表于 09-05 15:27 ?1071次閱讀
    如何<b class='flag-5'>利用</b>AI算法<b class='flag-5'>進(jìn)行</b>裝置數(shù)據(jù)的<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>?

    基于米爾瑞芯微RK3576開發(fā)板的Qwen2-VL-3B模型NPU模態(tài)部署評測

    是對 Qwen2-VL-3B 模態(tài)模型進(jìn)行部署,其中視覺 + 投影組件通過 rknn-toolkit2 導(dǎo)出為 RKNN
    發(fā)表于 08-29 18:08

    研華科技攜手創(chuàng)新奇智推出模態(tài)模型AI一體機(jī)

    這是一款基于研華高性能邊緣計(jì)算平臺MIC-733,深度集成創(chuàng)新奇智視覺模型模態(tài)模型的邊緣智能終端,通過創(chuàng)新的“
    的頭像 發(fā)表于 07-17 17:14 ?762次閱讀
    研華科技攜手創(chuàng)新奇智推出<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>AI一體機(jī)

    NVIDIA助力圖靈新訊美推出企業(yè)級模態(tài)視覺模型融合解決方案

    中國推出企業(yè)級模態(tài)視覺模型融合解決方案,推動先進(jìn) AI 模型在交通治理、工業(yè)質(zhì)檢、金融風(fēng)控等
    的頭像 發(fā)表于 06-26 09:17 ?952次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態(tài)模型

    InternVL2.5-1B/8B/MPO,Huggingface推出的全球最小模態(tài)模型SmloVLM-256M。為工業(yè)界提供了離線部署
    的頭像 發(fā)表于 04-21 10:56 ?2569次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B<b class='flag-5'>視覺</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    全系智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合
    發(fā)表于 03-21 14:12 ?396次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合
    的頭像 發(fā)表于 03-20 19:03 ?660次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新體驗(yàn)

    ?VLM(視覺語言模型)?詳細(xì)解析

    視覺語言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語言(文本)處理能力的模態(tài)人工智能
    的頭像 發(fā)表于 03-17 15:32 ?7485次閱讀
    ?VLM(<b class='flag-5'>視覺</b>語言<b class='flag-5'>模型</b>)?詳細(xì)解析

    使用OpenVINO? 2021.4在CPU和MYRIAD進(jìn)行自定義對象檢測,為什么結(jié)果差異巨大?

    使用自定義訓(xùn)練的模型執(zhí)行推理,以便在 2021.4 OpenVINO?中進(jìn)行人員檢測。 與 MYRIAD 相比,CPU 的輸出結(jié)果取得了巨大的差異
    發(fā)表于 03-06 07:45

    ??低暟l(fā)布模態(tài)模型文搜存儲系列產(chǎn)品

    模態(tài)模型為安防行業(yè)帶來重大技術(shù)革新,基于觀瀾大模型技術(shù)體系,??低晫⒋髤?shù)量、大樣本量的圖文模態(tài)
    的頭像 發(fā)表于 02-18 10:33 ?1000次閱讀

    一文詳解視覺語言模型

    視覺語言模型(VLM)是一種模態(tài)、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發(fā)表于 02-12 11:13 ?3169次閱讀
    一文詳解<b class='flag-5'>視覺</b>語言<b class='flag-5'>模型</b>

    商湯日日新模態(tài)模型權(quán)威評測第一

    剛剛,商湯科技日日新SenseNova模態(tài)模型,在權(quán)威綜合評測權(quán)威平臺OpenCompass的模態(tài)評測中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?1480次閱讀