chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟新AI項(xiàng)目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2020-11-18 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟的一項(xiàng)新AI項(xiàng)目旨在自動(dòng)為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關(guān)預(yù)印本存儲(chǔ)庫arXiv的論文中解釋了他們的機(jī)器學(xué)習(xí)模型的原理。

該模型使用可視語音詞匯預(yù)訓(xùn)練(VIVO),它利用大量成對(duì)的圖像標(biāo)簽數(shù)據(jù)來學(xué)習(xí)視覺詞匯。然后,使用帶有適當(dāng)字幕的圖像的第二個(gè)數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個(gè)人都應(yīng)在文檔,網(wǎng)絡(luò),社交媒體中為所有圖像添加替代文本,因?yàn)檫@可以使盲人訪問內(nèi)容并參與對(duì)話。但是,可惜,人們卻沒有?!蔽④汚I平臺(tái)小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對(duì)新AI的性能進(jìn)行基準(zhǔn)測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時(shí),Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實(shí)際上是如何描述您在訓(xùn)練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實(shí)驗(yàn)室的首席研究經(jīng)理王麗娟評(píng)論道。

希望使用Microsoft自動(dòng)字幕AI來構(gòu)建應(yīng)用程序的開發(fā)人員已經(jīng)可以這樣做,因?yàn)锳zure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應(yīng)用程序?qū)⑹褂眯碌腁I進(jìn)行更新,該應(yīng)用程序使用計(jì)算機(jī)視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實(shí)現(xiàn)廣泛服務(wù)的核心計(jì)算機(jī)視覺功能之一,”Azure AI認(rèn)知服務(wù)的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺(tái),以服務(wù)于更多客戶?!?“這不僅是研究上的突破;在Azure上將突破轉(zhuǎn)化為生產(chǎn)所需的時(shí)間也是突破?!?/p>

改進(jìn)的自動(dòng)字幕功能也有望在今年晚些時(shí)候在Outlook,Word和PowerPoint中使用。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6735

    瀏覽量

    107562
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39144

    瀏覽量

    299810
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    20個(gè)常用服務(wù)端口及對(duì)應(yīng)服務(wù)信息

    和執(zhí)行命令。 (3) 端口號(hào):23 服務(wù)名稱:Telnet 服務(wù)描述:用于遠(yuǎn)程登錄到遠(yuǎn)程主機(jī)并執(zhí)行命令。 (4) 端口號(hào):25 服務(wù)名稱:SMTP 服務(wù)描述:簡單郵件傳輸協(xié)議,用于發(fā)送電子郵件
    發(fā)表于 12-03 06:07

    使用Firebase AI Logic生成圖像模型的兩種新功能

    您的應(yīng)用添加自定義圖像,能夠顯著改善和個(gè)性化用戶體驗(yàn),有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩
    的頭像 發(fā)表于 11-30 09:28 ?329次閱讀

    微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升

    “ ?微軟發(fā)布 Visual Studio 2026 預(yù)覽版,新版本以深度融合的 AI Copilot 核心,結(jié)合全新的 Fluent Design 界面與顯著的性能提升,旨在打造前所未有的智能
    的頭像 發(fā)表于 09-16 11:17 ?1709次閱讀
    <b class='flag-5'>微軟</b>Visual Studio 2026 發(fā)布!<b class='flag-5'>AI</b> 深度融合、性能提升

    NVIDIA硅光技術(shù)助力邁向百萬GPU AI工廠

    在全球范圍內(nèi),AI 工廠正在崛起 —— 大量的這些新型數(shù)據(jù)中心并非提供網(wǎng)頁或電子郵件服務(wù)而建,而是用于訓(xùn)練和部署智能本身?;ヂ?lián)網(wǎng)巨頭們已經(jīng)其客戶在
    的頭像 發(fā)表于 08-27 12:34 ?1111次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    圖像的快速鑒別,滿足實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的應(yīng)用需求。 3. 數(shù)據(jù)采集 AI圖片數(shù)據(jù)集,本項(xiàng)目使用gemini生成圖片,使用的是gem來實(shí)現(xiàn)的。 提示詞如下 你是一個(gè)能夠生成美術(shù)繪本風(fēng)格插畫的智能Agent
    發(fā)表于 08-21 13:59

    AI 芯片浪潮下,職場晉升新契機(jī)?

    芯片設(shè)計(jì)例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個(gè)環(huán)節(jié)都考驗(yàn)著工程師的專業(yè)素養(yǎng)。在設(shè)計(jì)一款面向智能安防領(lǐng)域的 AI 芯片時(shí),需要深入研究安防場景下圖像識(shí)別算法的特點(diǎn),針對(duì)性地優(yōu)化芯片架構(gòu),提升
    發(fā)表于 08-19 08:58

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?

    實(shí)踐。 開源項(xiàng)目貢獻(xiàn)代碼或者文檔。比如,幫助完善一個(gè)機(jī)器學(xué)習(xí)數(shù)據(jù)集的加載模塊的代碼,或者撰寫某個(gè)AI算法的使用說明文檔。這不僅可以提升自己
    發(fā)表于 07-08 17:44

    Arm 與微軟合作,基于 Arm 架構(gòu)的 PC 和移動(dòng)設(shè)備應(yīng)用提供超強(qiáng) AI 體驗(yàn)

    ArmKleidiAI與ONNXRuntime的集成,Windows和安卓操作系統(tǒng)帶來了顯著的AI性能優(yōu)化,實(shí)現(xiàn)高達(dá)2.6倍的AI推理速度提升,從而加速應(yīng)用體驗(yàn)。聯(lián)合作者:Arm終端事業(yè)部產(chǎn)品
    的頭像 發(fā)表于 06-03 16:47 ?801次閱讀
    Arm 與<b class='flag-5'>微軟</b>合作,<b class='flag-5'>為</b>基于 Arm 架構(gòu)的 PC 和移動(dòng)設(shè)備應(yīng)用提供超強(qiáng) <b class='flag-5'>AI</b> 體驗(yàn)

    微軟推出多項(xiàng)革新性AI工具

    模型;多智能體協(xié)同編排功能重新定義協(xié)作模式,支持跨部門智能體團(tuán)隊(duì)協(xié)同處理復(fù)雜任務(wù)。微軟正將AI技術(shù)從工具升級(jí)組織核心生產(chǎn)力,重新定義人機(jī)協(xié)作的未來。
    的頭像 發(fā)表于 05-26 09:47 ?1066次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺(tái)開發(fā)智能體方法

    儲(chǔ)備。然后介紹AI Agen的主流平臺(tái),接著說明了扣子平臺(tái)開發(fā)AI Agent的流程和策略,然后對(duì)其插件、工作流、圖像流、知識(shí)庫等功能模塊進(jìn)行了詳細(xì)概述。并就5大場景,11個(gè)開發(fā)案例分別從功能,使用場
    發(fā)表于 05-14 19:51

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)。通?;谏疃?/div>
    發(fā)表于 03-05 19:52

    AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀體驗(yàn)--跟著迪哥學(xué)Agent

    感謝電子發(fā)燒友的這次活動(dòng),讓我有幸抽中了《AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》(以下簡稱《Agent》)這本書的贈(zèng)送。 收到書本之后我就迫不及待地學(xué)習(xí)書本中的知識(shí)。如果說依靠各種平臺(tái)上的文章了解關(guān)于
    發(fā)表于 03-02 12:28

    DLPDLCR3310EVM如何添加1920*1080的圖像?

    我使用GUI的firmware功能更新Splash images,我添加了四副1920*1080,8位的bmp圖像,提示分辨率超過了顯示分辨率。經(jīng)嘗試,最大只能添加766*1366的圖像
    發(fā)表于 02-18 06:49

    The Bat! Voyager便攜式電子郵件客戶端軟件介紹

    ? ? The Bat! Voyager是一款便攜式電子郵件客戶端軟件,可以在任何運(yùn)行 Microsoft Windows 的電腦上通過 USB 或便攜式媒體啟動(dòng)。The Bat! Voyager
    的頭像 發(fā)表于 02-13 11:01 ?917次閱讀

    Spire.Cloud.Word云端Word文檔處理SDK介紹

    Microsoft Office。 Spire.Cloud.Word 能執(zhí)行多種 Word 文檔處理任務(wù),包括生成、讀取、轉(zhuǎn)換和打印 Word 文檔,插入圖片,添加頁眉和頁腳,創(chuàng)建表格,添加
    的頭像 發(fā)表于 02-11 11:11 ?929次閱讀
    Spire.Cloud.Word云端Word<b class='flag-5'>文檔</b>處理SDK介紹