chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用 AI 幫助視障者“聽懂”世界

yrlT_lianggezhi ? 來源:工程師李察 ? 2019-01-26 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自動駕駛、無人機,到監(jiān)控安防,視覺 AI 技術的突破為人們生活帶來了巨大改變,在許多領域迎來爆發(fā)式發(fā)展,僅在國內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺 AI 獨角獸。但若真要論能為使用者帶來多大改變,恐怕很少有比得上這一項,那就是用視覺 AI 來打造盲人的眼睛。

無障礙人工智能成顯學,各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智能近來已在國際間成為一項顯學。如何將發(fā)展迅速的人工智能技術,用來改善全世界約 10 億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。

以視障者來說,近日 Instagram 就新增一項輔助功能,用 AI 自動辨識照片內(nèi)容并以語音告知用戶。臉書 Messenger 也有無障礙機器人(Accessibility Bot),協(xié)助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個應用程序 Facing Emotions,可以將七種最普遍的情緒轉化為相應的聲音,可以大幅提升盲人與其他人的實時互動交流。

影像視覺 AI 并不是新的概念,其背后技術主要包含機器學習、深度學習,再加上 3D 臉部辨識等。尤其是深度學習算法運用在訓練 AI來協(xié)助盲人辨識物體,可以發(fā)揮非常大的用處。

比方說,如果我們想要設計一個 AI 協(xié)助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給 AI 看,讓它學習什么是一張 10 元紙鈔。通過大量反覆學習后,視障者只要能讓手機鏡頭看到 10 元紙鈔的一小角,AI 就能將它分辨出來。

“這些小事,會讓你很確實地感覺到自己的獨立性。希望隨著人工智能的進展,可以讓我們更容易感受環(huán)境,協(xié)助我們完成更多日常事務”,微軟視覺輔助應用程序 Seeing AI 的項目主管、同時自身也是視障者的 Saqib Shaikh,近日接受專訪時這樣對 DT 君說。

圖|微軟技術負責人(Tech Lead)Saqib Shaikh (來源:微軟)

Saqib Shaikh 在 7 歲時失去視力,此前不久,他才剛剛得到人生中的第一臺電腦。

所幸這并不是他與計算機科學之間的句點。

而后他就讀視障學生小學,一位老師看出了他的潛力,鼓勵他開始學習打字。此后他一路進入大學,主修計算機科學,以班上頂尖的成績畢業(yè),并取得人工智能碩士學位。而后,他又加入微軟的人工智能團隊,并在大約 3 年前通過微軟內(nèi)部的黑客松競賽,以Seeing AI這個項目脫穎而出,獲得資源將之打造為實際產(chǎn)品,現(xiàn)在已可在美國地區(qū)免費下載。

Seeing AI 用視覺 AI 幫助視障者“聽懂”世界

Seeing AI 這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程序,可以用手機上的攝像頭識別所有圖像,包含通過掃描條形碼來識別產(chǎn)品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內(nèi)容,并閱讀出菜單和文件。

同時,這款應用程序也可以結合智能眼鏡,更好地協(xié)助用戶了解所處的周遭環(huán)境。

圖|Seeing AI 是一款結合圖像辨識、語音說明及人性化使用介面的應用程序(來源:微軟)

Saqib Shaikh 指出,近年深度學習技術的成熟,是 Seeing AI 可以真正發(fā)揮用處的主要關鍵。通過深度學習訓練,向系統(tǒng)展示大量照片,并教導它們照片中的內(nèi)容,AI 可以真正有效辨識出現(xiàn)實生活環(huán)境中的各種物體與人物。

但是,要落實到讓 AI 有效協(xié)助視障者在生活中能真正用上,還必須歸功于近年硬件技術的發(fā)展,在軟、硬件配合之下,讓視覺 AI 技術實用價值大大提升。尤其是邊緣運算風潮興起,視覺信息可以在裝置終端就能完成運算,才能對使用者提供實時反饋,讓盲人能夠即時對互動對象做出適合的反應。

實時反饋絕對是關鍵。Saqib Shaikh 說,想像一個情境,當你在一個會議上進行簡報。因為這是一個正式場合,因此所有人,包含旁邊的同事、上級主管,都只是安靜聽你說話,不會任意發(fā)出聲音。所以在你說話的同時,若無法用眼睛去觀察聽眾,你對于他們的反應是毫無頭緒的,你甚至不知道應不應該繼續(xù)說下去,還是暫停下來詢問聽眾的想法。

這時候,如果有一個 AI 可以幫你辨識聽眾的反應,實時反饋你他們是不是看起來滿意、尤其是還能辨認出特定人士,比方說直屬主管的表情和動作如何,這樣一個人工智能,將能夠大大地讓盲人突破限制,改善他們在日常工作中表現(xiàn)。

非監(jiān)督學習是視覺 AI 下一步突破關鍵

今日我們所談的視覺 AI ,其實多半仍局限于靜態(tài)圖像、單一圖像,但 Saqib Shaikh 想像中的 Seeing AI 2.0,將可以解讀一系列的圖像、可以掌握使用者的偏好。

“就像當我與妻子一起在街上走路時,她會告訴我有什么我沒看過的新東西、有什么有趣的事物。比方說,她會告訴我我們很喜歡的一間咖啡店關門了?!盨aqib Shaikh 說,“一個真正的人可以了解什么是你會感興趣、什么是你會覺得重要的事物?!?/p>

而 AI 若要能夠做到這一點,就不能只是一次辨識單一圖像,而是還要能綜合理解背后的情境,甚至是接續(xù)出現(xiàn)的新的信息。Saqib Shaikh 分析,這意味著后續(xù) Seeing AI 必須運用更多非監(jiān)督學習的技術來訓練 AI,進一步拓展 AI 對多變場景復雜信息的處理能力。

其實,Saqib Shaikh 早在求學期間意識到,為了讓身為盲人的自己表現(xiàn)更好,他必須做很多額外的努力來改變他所處的生活環(huán)境,包括不只是自己看書、而是要雇請其他人為他朗讀教科書的內(nèi)容等,才能讓自己與其他正常人站在更接近一點的比較基準上。

當時就有個朋友建議過他,與其只用嘴巴說要改變生活環(huán)境,不如實際做點什么真正的改變。這讓他早就思考過,從某種角度來講,殘疾者本人其實就是最好的創(chuàng)新者。因為,他們比任何人都了解殘疾者最迫切的需求是什么?愿意做什么嘗試?可以如何改變?

然而,在 Saqib Shaikh 進入微軟工作的近乎前 10 年,他并未在工作上試圖突出任何作為一個盲人的特殊能力。相反的,他讓自己就像一名正常的工程師一樣,絕大多數(shù)時間都投入內(nèi)部的主流專案,如 Cortana 等。

“我想,起初我是想證明自己可以成為一個主流的工程師”,Saqib Shaikh 說,而轉捩點是出現(xiàn)在他于微軟工作的第10年?!肮ぷ鳚M 10 年后,我覺得我已經(jīng)達到了目標,證明了自己的能力,所以我可以開始運用自己的專業(yè)去幫助其他人?!?/p>

現(xiàn)在,他終于決定投入自己真正想做的事情,也就是用 AI 來改善殘疾人士的生活環(huán)境。就像他所說的,“我可以選擇用這一種與我自己最相關的方式,從個人經(jīng)驗來理解許多盲人的問題,并且用自己的專業(yè)來提供協(xié)助?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    37165

    瀏覽量

    291471
  • 人工智能
    +關注

    關注

    1812

    文章

    49529

    瀏覽量

    259095
  • 無人機
    +關注

    關注

    234

    文章

    11048

    瀏覽量

    191738

原文標題:用 AI 幫助視障者“聽懂”世界,專訪微軟傳奇盲人工程師 Saqib Shaikh

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質子】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    重磅!騰科技新官網(wǎng)正式上線,AI算力與智能解決方案一鍵直達

    AI算力模組到全棧智能解決方案,從技術研發(fā)到場景落地,騰科技始終以 “前沿技術落地” 為定位,助力產(chǎn)業(yè)智能化升級。新官網(wǎng)的上線,是我們與世界對話的新起點,未來,我們期待與更多伙伴
    的頭像 發(fā)表于 10-11 10:57 ?391次閱讀
    重磅!騰<b class='flag-5'>視</b>科技新官網(wǎng)正式上線,<b class='flag-5'>AI</b>算力與智能解決方案一鍵直達

    思必馳推出全新一代AI辦公本X5系列

    從“聽見”到“聽懂”,從“記錄”到“決策”,AI正在徹底重構我們的辦公方式。
    的頭像 發(fā)表于 09-30 11:32 ?931次閱讀

    什么是AI算力模組?

    未來,騰科技將繼續(xù)深耕AI算力模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷演進和物聯(lián)網(wǎng)應用的持續(xù)拓展,騰科技的
    的頭像 發(fā)表于 09-19 15:26 ?975次閱讀
    什么是<b class='flag-5'>AI</b>算力模組?

    什么是AI算力模組?

    未來,騰科技將繼續(xù)深耕AI算力模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷演進和物聯(lián)網(wǎng)應用的持續(xù)拓展,騰科技的
    的頭像 發(fā)表于 09-19 15:25 ?264次閱讀
    什么是<b class='flag-5'>AI</b>算力模組?

    360環(huán)技術推薦的硬件平臺:支持多攝像頭與三屏異顯的理想選擇

    硬件平臺選型360環(huán)的落地并不簡單。它不僅需要多個高清攝像頭的數(shù)據(jù)輸入,還需要穩(wěn)定的圖像處理能力、強大的AI推理能力,以及足夠多的視頻輸出接口支持顯示需求。很多開發(fā)在選型時會遇到一些挑戰(zhàn),比如:l
    發(fā)表于 07-30 17:32

    高達2070TFLOPS算力騰科技基于NVIDIA Jetson Thor系列模組,重磅推出全棧AI邊緣智算大腦解決方案

    探索物理AI的無限可能。無論是硬件廠商、軟件開發(fā),還是各行業(yè)的應用企業(yè),讓我們攜手共進,利用騰科技先進的全棧AI邊緣智算大腦解決方案,推動機器人技術在更多領域的創(chuàng)新應用,共同打造物
    的頭像 發(fā)表于 07-28 16:45 ?541次閱讀
    高達2070TFLOPS算力騰<b class='flag-5'>視</b>科技基于NVIDIA Jetson Thor系列模組,重磅推出全棧<b class='flag-5'>AI</b>邊緣智算大腦解決方案

    智能入選世界經(jīng)濟論壇“全球創(chuàng)新

    2025年7月,世界經(jīng)濟論壇(World Economic Forum)正式宣布魔智能(Motovis)入選"全球創(chuàng)新"(Global Innovators)。此次入選標志著
    的頭像 發(fā)表于 07-17 16:11 ?497次閱讀

    肇觀電子兩款無人機視覺避模組量產(chǎn)交付

    在無人機的世界里,視覺不僅定義了飛行的邊界,更是智能決策的核心。肇觀電子以其突破性的AI視覺芯片,賦予無人機前所未有的感知與認知能力。 基于肇觀自研芯片的兩款無人機視覺避模組:無人機輕量智能避
    的頭像 發(fā)表于 05-06 15:11 ?1217次閱讀

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數(shù)據(jù)工具的重大更新

    新模型可實現(xiàn)物理 AI 的預測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓練提供海量物理 AI 合成數(shù)據(jù)生成技術。 1X、Agility Robotics
    的頭像 發(fā)表于 03-20 19:01 ?1068次閱讀

    《零基礎開發(fā)AI Agent——手把手教你扣子做智能體》

    《零基礎開發(fā)AI Agent——手把手教你扣子做智能體》是一本為普通人量身打造的AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過詳細的工具介紹和實戰(zhàn)案例,幫助讀者快
    發(fā)表于 03-18 12:03

    RDK加持的導盲眼鏡:人士的“眼睛外掛”

    指路,讓朋友走哪都心里有數(shù)。智能瞳行不僅讓人士自由穿梭于大街小巷,還讓他們更好地感受世界的變化和精彩——昆明理工大學津橋學院:智能瞳
    的頭像 發(fā)表于 03-14 19:43 ?975次閱讀
    RDK加持的導盲眼鏡:<b class='flag-5'>視</b><b class='flag-5'>障</b>人士的“眼睛外掛”

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來自中國的學霸級AI”…… 從智能手機到自動駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來,F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    AI賦能銳測控平臺

    自2016年成立以來,簡儀科技致力于打造基于開源技術的銳測控平臺(SeeSharp Platform),建設測控開源生態(tài)圈。得益于OpenAI、ChatGPT、DeepSeek、通義千問等AI技術
    的頭像 發(fā)表于 02-10 09:23 ?794次閱讀
    <b class='flag-5'>AI</b>賦能銳<b class='flag-5'>視</b>測控平臺

    云端AI開發(fā)工具怎么

    云端AI開發(fā)工具通常包括代碼編輯器、模型訓練平臺、自動化測試工具、代碼管理工具等。這些工具不僅降低了AI開發(fā)的門檻,還極大地提高了開發(fā)效率和模型性能。下面,AI部落小編為您介紹云端
    的頭像 發(fā)表于 12-05 13:31 ?812次閱讀

    AI項目管理平臺怎么

    AI項目管理平臺是一種集成了項目管理工具、AI開發(fā)環(huán)境和數(shù)據(jù)分析能力的綜合性平臺。接下來,AI部落小編為您梳理AI項目管理平臺怎么。
    的頭像 發(fā)表于 11-13 09:38 ?947次閱讀