chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟新AI項目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-18 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關(guān)預(yù)印本存儲庫arXiv的論文中解釋了他們的機(jī)器學(xué)習(xí)模型的原理。

該模型使用可視語音詞匯預(yù)訓(xùn)練(VIVO),它利用大量成對的圖像標(biāo)簽數(shù)據(jù)來學(xué)習(xí)視覺詞匯。然后,使用帶有適當(dāng)字幕的圖像的第二個數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個人都應(yīng)在文檔,網(wǎng)絡(luò),社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內(nèi)容并參與對話。但是,可惜,人們卻沒有?!蔽④汚I平臺小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對新AI的性能進(jìn)行基準(zhǔn)測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時,Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實際上是如何描述您在訓(xùn)練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實驗室的首席研究經(jīng)理王麗娟評論道。

希望使用Microsoft自動字幕AI來構(gòu)建應(yīng)用程序的開發(fā)人員已經(jīng)可以這樣做,因為Azure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應(yīng)用程序?qū)⑹褂眯碌腁I進(jìn)行更新,該應(yīng)用程序使用計算機(jī)視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實現(xiàn)廣泛服務(wù)的核心計算機(jī)視覺功能之一,”Azure AI認(rèn)知服務(wù)的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺,以服務(wù)于更多客戶。” “這不僅是研究上的突破;在Azure上將突破轉(zhuǎn)化為生產(chǎn)所需的時間也是突破?!?/p>

改進(jìn)的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6753

    瀏覽量

    108085
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41156

    瀏覽量

    302620
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI輔助編程設(shè)計之道:從Spec到Code工程實踐

    設(shè)計還不夠細(xì),需要繼續(xù)補(bǔ)充細(xì)節(jié)。這是一種探索式、反饋式的設(shè)計過程。 三、設(shè)計文檔中需要明確的幾個要素 從多個項目的實踐經(jīng)驗來看,設(shè)計文檔要有效支撐AI代碼生成,通常需要包含以下幾個層面
    發(fā)表于 03-16 13:33

    【瑞薩AI挑戰(zhàn)賽】家庭AI相框

    推理,提取更貼近用戶理解的語義結(jié)果。 交互表達(dá)層 :將 AI 結(jié)果轉(zhuǎn)化為直觀的視覺反饋,而不是停留在串口日志。 本項目當(dāng)前以三類內(nèi)容原型驗證集:DOG、CAR、FOUNTAIN。它們并不是終局類別,而是
    發(fā)表于 03-13 21:44

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負(fù)載。[Axon NPU 技術(shù)頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存占用可小 10
    發(fā)表于 01-31 23:16

    20個常用服務(wù)端口及對應(yīng)服務(wù)信息

    和執(zhí)行命令。 (3) 端口號:23 服務(wù)名稱:Telnet 服務(wù)描述:用于遠(yuǎn)程登錄到遠(yuǎn)程主機(jī)并執(zhí)行命令。 (4) 端口號:25 服務(wù)名稱:SMTP 服務(wù)描述:簡單郵件傳輸協(xié)議,用于發(fā)送電子郵件
    發(fā)表于 12-03 06:07

    使用Firebase AI Logic生成圖像模型的兩種新功能

    您的應(yīng)用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩
    的頭像 發(fā)表于 11-30 09:28 ?554次閱讀

    微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升

    “ ?微軟發(fā)布 Visual Studio 2026 預(yù)覽版,新版本以深度融合的 AI Copilot 核心,結(jié)合全新的 Fluent Design 界面與顯著的性能提升,旨在打造前所未有的智能
    的頭像 發(fā)表于 09-16 11:17 ?2358次閱讀
    <b class='flag-5'>微軟</b>Visual Studio 2026 發(fā)布!<b class='flag-5'>AI</b> 深度融合、性能提升

    NVIDIA硅光技術(shù)助力邁向百萬GPU AI工廠

    在全球范圍內(nèi),AI 工廠正在崛起 —— 大量的這些新型數(shù)據(jù)中心并非提供網(wǎng)頁或電子郵件服務(wù)而建,而是用于訓(xùn)練和部署智能本身?;ヂ?lián)網(wǎng)巨頭們已經(jīng)其客戶在
    的頭像 發(fā)表于 08-27 12:34 ?1391次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    圖像的快速鑒別,滿足實時或準(zhǔn)實時的應(yīng)用需求。 3. 數(shù)據(jù)采集 AI圖片數(shù)據(jù)集,本項目使用gemini生成圖片,使用的是gem來實現(xiàn)的。 提示詞如下 你是一個能夠生成美術(shù)繪本風(fēng)格插畫的智能Agent
    發(fā)表于 08-21 13:59

    AI 芯片浪潮下,職場晉升新契機(jī)?

    芯片設(shè)計例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設(shè)計一款面向智能安防領(lǐng)域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地優(yōu)化芯片架構(gòu),提升
    發(fā)表于 08-19 08:58

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?

    實踐。 開源項目貢獻(xiàn)代碼或者文檔。比如,幫助完善一個機(jī)器學(xué)習(xí)數(shù)據(jù)集的加載模塊的代碼,或者撰寫某個AI算法的使用說明文檔。這不僅可以提升自己
    發(fā)表于 07-08 17:44

    新思科技攜手微軟借助AI技術(shù)加速芯片設(shè)計

    近日,微軟Build大會在西雅圖盛大開幕,聚焦AI在加速各行業(yè)(包括芯片設(shè)計行業(yè))科學(xué)突破方面的變革潛力。作為Microsoft Discovery平臺發(fā)布的啟動合作伙伴,新思科技亮相本次大會,并攜手微軟
    的頭像 發(fā)表于 06-27 10:23 ?1277次閱讀

    Arm 與微軟合作,基于 Arm 架構(gòu)的 PC 和移動設(shè)備應(yīng)用提供超強(qiáng) AI 體驗

    ArmKleidiAI與ONNXRuntime的集成,Windows和安卓操作系統(tǒng)帶來了顯著的AI性能優(yōu)化,實現(xiàn)高達(dá)2.6倍的AI推理速度提升,從而加速應(yīng)用體驗。聯(lián)合作者:Arm終端事業(yè)部產(chǎn)品
    的頭像 發(fā)表于 06-03 16:47 ?994次閱讀
    Arm 與<b class='flag-5'>微軟</b>合作,<b class='flag-5'>為</b>基于 Arm 架構(gòu)的 PC 和移動設(shè)備應(yīng)用提供超強(qiáng) <b class='flag-5'>AI</b> 體驗

    微軟推出多項革新性AI工具

    模型;多智能體協(xié)同編排功能重新定義協(xié)作模式,支持跨部門智能體團(tuán)隊協(xié)同處理復(fù)雜任務(wù)。微軟正將AI技術(shù)從工具升級組織核心生產(chǎn)力,重新定義人機(jī)協(xié)作的未來。
    的頭像 發(fā)表于 05-26 09:47 ?1311次閱讀

    在 KiCad 中添加一個 AI 助手是一種什么體驗?

    原文標(biāo)題:在 KiCad 中添加一個 AI 助手
    的頭像 發(fā)表于 05-15 14:28 ?1143次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發(fā)AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進(jìn)行了詳細(xì)概述。并就5大場景,11個開發(fā)案例分別從功能,使用場
    發(fā)表于 05-14 19:51