人的大腦和自監(jiān)督學(xué)習(xí)模型的相似度有多高?
麥吉爾大學(xué)和魁北克人工智能研究所(Mila)的計算神經(jīng)科學(xué)家布萊克-理查茲(Blake Richar....
OpenCV中支持的非分類與檢測視覺模型
前面給大家分別匯總了OpenCV中支持的圖像分類與對象檢測模型,視覺視覺任務(wù)除了分類與檢測還有很多其....
EAST模型結(jié)構(gòu)
EAST( An Efficient and Accurate Scene Text Detecto....
灰度共生矩陣(GLCM)基本原理
灰度共生矩陣(Gray Level CO-Occurrence Matrix-GLCM)是圖像特征分....
二值圖像分析最常見的方式
二值圖像分析最常見的一個主要方式就是輪廓發(fā)現(xiàn)與輪廓分析,其中輪廓發(fā)現(xiàn)的目的是為輪廓分析做準(zhǔn)備,經(jīng)過輪....
基于一致性的半監(jiān)督語義分割方法
語義分割是一項重要的像素級別分類任務(wù)。但是由于其非常依賴于數(shù)據(jù)的特性(data hungary), ....
一項新的視聽分割任務(wù)
來自合肥工業(yè)大學(xué)、商湯、澳國立、北航、英偉達(dá)、港大和上海人工智能實驗室的研究者提出了一項新的視聽分割....
低分辨率行為識別技術(shù)具有廣泛的應(yīng)用價值
安防監(jiān)控是智慧城市的重要組成部分。然而,在城市監(jiān)控場景下,行人目標(biāo)往往距離攝像頭遠(yuǎn),所占像素小,這為....
谷歌宣布了一門新的編程語言Carbon
正如微軟創(chuàng)建TypeScript來更新JavaScript那樣,Carbon作為一種在C++基礎(chǔ)上開....
圖像修復(fù)面臨兩個關(guān)鍵問題
圖像修復(fù)是指對圖像缺失區(qū)域進(jìn)行補(bǔ)全,是計算機(jī)視覺的基本任務(wù)之一。該方向有許多實際應(yīng)用,例如物體移除、....
一個YOLO系列的算法實現(xiàn)庫YOLOU
這里主要是對于YOLO系列經(jīng)典化模型的訓(xùn)練對比,主要是對于YOLOv5、YOLOv6、YOLOv7以....
OpenCV4.x可實現(xiàn)加載模型與執(zhí)行推斷
OpenCV4.x發(fā)布以后,有很多新的特性與黑科技支持,無論是支持OpenVINO加速、圖計算模塊、....
一種使用Mask Transformer進(jìn)行全景分割的端到端解決方案
在 CVPR 2022 上發(fā)表的「CMT-DeepLab: Clustering Mask Tran....
HED算法介紹
OpenCV DNN本身是不支持該網(wǎng)絡(luò)直接加載與執(zhí)行的,必須通過OpenCV4中支持的自定義層方法,....
基于配準(zhǔn)的少樣本異常檢測的框架
近年來,異常檢測在工業(yè)缺陷檢測、醫(yī)療診斷,自動駕駛等領(lǐng)域有著廣泛的應(yīng)用。“異?!蓖ǔ6x為 “正?!?...
如何擴(kuò)大卷積來消除與Transformer的性能差距
首先,先讓我 brainstorm 一下。當(dāng)你看到 neural network scaling 這....
關(guān)于Next-ViT 的建模能力
由于復(fù)雜的注意力機(jī)制和模型設(shè)計,大多數(shù)現(xiàn)有的視覺 Transformer(ViT)在現(xiàn)實的工業(yè)部署場....
一個大規(guī)模多任務(wù)學(xué)習(xí)框架μ2Net
這種方法可以提高每個任務(wù)的質(zhì)量,并在收斂時間、訓(xùn)練實例數(shù)量、能源消耗等方面提高模型效率。本文提出的機(jī)....
單個CNN就能夠在多個數(shù)據(jù)集上實現(xiàn)SOTA
然而,由于卷積核的離散性,傳統(tǒng)的 CNN 不能跨分辨率使用。當(dāng)考慮具有相同 CNN 的不同維度數(shù)據(jù)時....
如何實現(xiàn)遙感圖像等超大尺寸圖像快速識別
目前比較成熟的衛(wèi)星圖像識別算法并不少,但大多依托于強(qiáng)大的計算資源,為了用有限的計算資源實現(xiàn)大尺寸圖像....
英偉達(dá)宣布全新編程平臺—QODA量子優(yōu)化設(shè)備架構(gòu)
與 CUDA 類似,QODA 是開放的、統(tǒng)一的環(huán)境,后者適用于當(dāng)今一些最強(qiáng)大的計算機(jī)和量子處理器,可....
圖像修復(fù)與處理經(jīng)典論文回顧和精讀
在實踐中,僅僅通過優(yōu)化隱向量z難以準(zhǔn)確重建ImageNet這樣的復(fù)雜真實圖像。訓(xùn)練GAN的數(shù)據(jù)集(I....
單應(yīng)性矩陣計算函數(shù)與應(yīng)用
其中scene_corners為對象在場景圖像中的四點坐標(biāo),獲得坐標(biāo)以后就可以繪制對應(yīng)的矩形,從而在....
存在一種完美的編程語言嗎?
Xous 開發(fā)的第一年都是使用’no-std’完成的,代價是占用大量內(nèi)存空間且復(fù)雜性高。盡管可以編寫....
OpenCV種支持標(biāo)準(zhǔn)卷積邊緣填充做法
OpenCV在使用卷積進(jìn)行圖像處理過程種,如何處理邊緣像素與錨定輸出兩個技術(shù)細(xì)節(jié)一直是很多人求而不得....
Imagen的工作原理解讀
在這部分,作者展示了 Imagen 的整體架構(gòu),并對其它的工作原理做了高級解讀;然后依次更透徹地剖析....
有關(guān)batch size的設(shè)置范圍
我們知道,batch size 決定了深度學(xué)習(xí)訓(xùn)練過程中,完成每個 epoch 所需的時間和每次迭代....