chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像捕獲是AI中最難的問題之一

倩倩 ? 來源:新經網 ? 作者:新經網 ? 2020-10-15 14:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

長期以來,AI的目標就是準確地描述圖像,而不僅僅是像笨拙的機器人。谷歌在2016年表示,其人工智能可以為人類提供幾乎與人類一樣的字幕圖像,準確度達到94%?,F(xiàn)在,微軟表示,它走得更遠:它的研究人員建立了一個AI系統(tǒng),甚至比人類更準確-以至于現(xiàn)在坐上了榜首的nocaps圖像字幕標桿。微軟聲稱其自2015年以來一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個顯著的里程碑,但微軟不僅僅是將這項技術保留在自己手中?,F(xiàn)在,它作為Azure認知服務的一部分提供了新的字幕模型,因此任何開發(fā)人員都可以將其引入他們的應用程序中。今天,它也可以在Seeing AI中使用,Seeing AI是面向盲人和視障用戶的Microsoft應用程序,可以描述周圍的世界。今年下半年,字幕模型還將改善您在PowerPoint中針對Web,Windows和Mac的演示文稿。它還會在桌面平臺的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時說:“圖像捕獲是AI中最難的問題之一。它不僅代表理解場景中的對象,還包括它們之間的交互方式,以及如何描述它們。”精細的字幕技術可以為每個用戶提供幫助:它使在搜索引擎中查找所需圖像變得更加容易;對于視障用戶,它可以使瀏覽網絡和軟件變得更加出色。

看到公司吹捧他們的AI研究創(chuàng)新并不少見,但是將這些發(fā)現(xiàn)迅速部署到運輸產品中卻很少見。Azure AI認知服務的CTO Huang Xuedong出于對用戶的潛在好處,推動將其迅速集成到Azure中。他的團隊使用標記有特定關鍵字的圖像對模型進行了訓練,這有助于使它成為大多數AI框架所沒有的視覺語言。通常,這些類型的模型是使用圖像和完整標題訓練的,這使得模型更難于學習特定對象的交互方式。

“視覺詞匯預訓練本質上是訓練系統(tǒng)所需的教育;我們正在嘗試教育這種運動記憶,”黃在博客文章中說。這就是這種新模型在nocaps基準測試中的優(yōu)勢,該基準測試側重于確定AI可以如何為字幕創(chuàng)建字幕,這些字幕從未見過。

但是,盡管要打破基準很重要,但微軟新模型的真正考驗將是它在現(xiàn)實世界中的功能。據博伊德說,Seeing AI開發(fā)人員Saqib Shaik也在自己的盲人手中推動了Microsoft的更大可訪問性,他說這是對他們先前產品的巨大改進。既然微軟已經設定了一個新的里程碑,那么有趣的是,看看來自Google和其他研究人員的競爭模型也將如何競爭。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6719

    瀏覽量

    107355
  • 機器人
    +關注

    關注

    213

    文章

    30590

    瀏覽量

    219632
  • AI
    AI
    +關注

    關注

    89

    文章

    38121

    瀏覽量

    296712
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別

    【飛凌OK-MX9596-C開發(fā)板試用】②體驗WIFI、藍牙、音頻、視頻,為AI應用打下基礎 - 飛凌嵌入式 - 電子技術論壇 - 廣受歡迎的專業(yè)電子論壇! 在上帖子中,我們測試了攝像頭拍照
    發(fā)表于 11-01 22:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    AI的應用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、語音和程序代碼等功能。 竟然連代碼都可以生成,會取代程序員
    發(fā)表于 09-12 16:07

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力有限的MaixCAM-Pro開發(fā)板上。 實時
    發(fā)表于 08-21 13:59

    AI 芯片浪潮下,職場晉升新契機?

    芯片設計為例,從最初的架構選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設計款面向智能安防領域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地優(yōu)化芯片架構,提升
    發(fā)表于 08-19 08:58

    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    Black Forest Labs,作為全球頂尖 AI 研究實驗室之一,為圖像生成領域帶來顛覆性變革。
    的頭像 發(fā)表于 08-05 16:27 ?1016次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b>加速FLUX.1 Kontext系列<b class='flag-5'>圖像</b>模型

    示波器波形捕獲率的定義和作用

    波形捕獲率(Waveform Capture Rate)是數字示波器的關鍵指標之一,指單位時間內示波器能夠捕獲并顯示波形的次數,通常以“次/秒”或“幀/秒”為單位。其本質是衡量示波器在單位時間內對信號變化的響應能力。
    的頭像 發(fā)表于 08-04 15:20 ?1129次閱讀

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現(xiàn)智能功能的特性,在些網絡條件受限或對數據隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    CX3顯示RAW12圖像錯誤的原因?

    我想通過CX3065從FPGA捕獲MIPI圖像,我可以切換4種分辨率并通過開始捕獲顯示圖像,但片刻之后,我的UVC_App顯示的圖像是錯誤的
    發(fā)表于 05-16 07:49

    【「零基礎開發(fā)AI Agent」閱讀體驗】+讀《零基礎開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    收到發(fā)燒友網站寄來的《零基礎開發(fā)AI Agent》這本書已經有好些天了,這段時間有幸拜讀了下全書,掌握了個開發(fā)智能體的方法。 該書充分從零基礎入手,先闡述了Agent是什么,它的基本概念和知識
    發(fā)表于 05-14 19:51

    使用STM32捕獲PWM時同時捕獲2個通道時會出現(xiàn)捕獲的頻率值不準,為什么?

    在使用STM32F103芯片的2個定時器捕獲2路PWM波時,當2路信號同時輸入時,會出現(xiàn)捕獲的頻率不準確,但是分開路的輸入捕獲時,
    發(fā)表于 04-22 10:43

    泰克MDO3052示波器波形捕獲率評測

    能力,為用戶提供選型參考。 、波形捕獲率的核心價值與技術原理 波形捕獲率是示波器在單位時間內捕獲并處理波形的次數,直接影響異常信號的捕獲
    的頭像 發(fā)表于 04-02 11:49 ?738次閱讀
    泰克MDO3052示波器波形<b class='flag-5'>捕獲</b>率評測

    芯原推出新代集成AI的ISP9000圖像信號處理器,賦能智能視覺應用

    芯原股份今日發(fā)布其ISP9000系列圖像信號處理器(ISP)IP——面向日益增長的智能視覺應用需求而打造的新AI ISP解決方案。ISP9000采用靈活的AI優(yōu)化架構,提供卓越的
    的頭像 發(fā)表于 04-02 10:43 ?665次閱讀

    中科億海微SoM模組——AI圖像推理解決方案

    隨著AI技術的快速發(fā)展,AI圖像推理作為種高效、智能的圖像處理技術,已成為推動各行業(yè)數字化轉型和智能化升級的關鍵。它憑借強大的
    的頭像 發(fā)表于 03-27 13:48 ?649次閱讀
    中科億海微SoM模組——<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>推理解決方案

    圖像采集卡:現(xiàn)代圖像處理技術的關鍵組件

    直接影響到圖像的質量和處理效率。本文將系統(tǒng)探討圖像采集卡的定義、工作原理、應用領域以及未來發(fā)展趨勢。圖像采集卡的定義圖像采集卡,通常被稱
    的頭像 發(fā)表于 02-20 10:42 ?932次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b>處理技術的關鍵組件