人工智能,或稱人工智能,讓我們在自拍時(shí)看起來更好,當(dāng)我們向Alexa詢問天氣情況時(shí),會順從地告訴我們天氣,并推動自動駕駛汽車的發(fā)展。正是這項(xiàng)技術(shù)使機(jī)器能夠從經(jīng)驗(yàn)中學(xué)習(xí)并執(zhí)行類似于人類的任務(wù)。
作為一個(gè)整體,人工智能包含許多子領(lǐng)域,包括自然語言處理、計(jì)算機(jī)視覺和深度學(xué)習(xí)。大多數(shù)時(shí)候,工作中的具體技術(shù)是機(jī)器學(xué)習(xí),它專注于開發(fā)分析數(shù)據(jù)和做出預(yù)測的算法,并且在很大程度上依賴于人類的監(jiān)督。
SMU信息系統(tǒng)助理教授孫乾茹將訓(xùn)練一個(gè)小規(guī)模的人工智能模型比作教小孩子識別周圍的物體。“一開始一個(gè)孩子不了解他周圍的很多事情。他可能看到一個(gè)蘋果,但不知道它是蘋果,他可能會問,這是香蕉嗎?他的父母會糾正他,不,這不是香蕉。這是一個(gè)蘋果。這樣的反饋在他的大腦中,然后信號微調(diào)他的知識?!?/p>
孫教授的研究主要集中在深度卷積神經(jīng)網(wǎng)絡(luò)、元學(xué)習(xí)、增量學(xué)習(xí)、半監(jiān)督學(xué)習(xí)以及它們在圖像和視頻識別中的應(yīng)用。
訓(xùn)練人工智能模型
由于人工智能的復(fù)雜性,孫教授在潛入研究項(xiàng)目之前,先對該領(lǐng)域的一般概念和當(dāng)前趨勢進(jìn)行了探討。
她解釋說,有監(jiān)督的機(jī)器學(xué)習(xí)涉及到模型本身在一個(gè)標(biāo)記的數(shù)據(jù)集上進(jìn)行訓(xùn)練。也就是說,數(shù)據(jù)被標(biāo)記為模型正在構(gòu)建以確定的信息,這些信息甚至可以按照模型應(yīng)該分類為數(shù)據(jù)的方式進(jìn)行分類。例如,一個(gè)設(shè)計(jì)用來識別蘋果的計(jì)算機(jī)視覺模型可能會在一組不同的蘋果圖像上進(jìn)行訓(xùn)練。
給它數(shù)據(jù),數(shù)據(jù)就有標(biāo)簽,她解釋道一張圖片可能包含一個(gè)蘋果,該圖片通過深度人工智能模型進(jìn)行一些預(yù)測。如果預(yù)測是對的,那就沒事了。否則,該模型將得到計(jì)算損失或懲罰,通過反向傳播來修改其參數(shù)。所以模型會不斷更新。
孫教授觀察到,目前最先進(jìn)或性能最好的人工智能模型幾乎都是基于深度學(xué)習(xí)模型的。在深度學(xué)習(xí)中,該模型基于包含許多層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從圖像、文本或聲音中學(xué)習(xí)執(zhí)行識別任務(wù)。例如,如果輸入是圖像,則假設(shè)圖像可以由不同的空間尺度或特征層來描述。
孫教授舉例說:“以我的臉為例。區(qū)別于其他人的特征是我的眼睛、鼻子、嘴巴作為局部特征,臉型和膚色作為全局特征。對于識別,我可以用這些特征來表示“這就是我”。對于機(jī)器模型,它在不同的層中對這些局部和全局特征進(jìn)行編碼,從而可以進(jìn)行相同的識別?!?/p>
訓(xùn)練人工智能模型需要大量的數(shù)據(jù)才能準(zhǔn)確識別。她認(rèn)為,如果一個(gè)人工智能模型只有一張人臉圖像,那么它在識別這個(gè)人時(shí)就會出錯(cuò),因?yàn)樗床坏狡渌娌刻卣?,而這些特征正是這個(gè)人區(qū)別于其他人的面部特征外觀有差異,人工智能依賴于高度不同的數(shù)據(jù)集,以便了解圖像的所有差異。
健康促進(jìn)應(yīng)用程序
孫教授正在研究的項(xiàng)目之一是Food AI++,這是新加坡健康促進(jìn)委員會(HPB)的一個(gè)應(yīng)用程序。用戶只需用手機(jī)拍下正在吃的食物的照片,就可以確定食物成分?jǐn)?shù)據(jù)。該應(yīng)用程序的目的是幫助用戶跟蹤所食用食物的營養(yǎng),并利用這些信息實(shí)現(xiàn)健康、均衡的飲食。
孫教授和她的團(tuán)隊(duì)收集用戶用餐時(shí)拍攝的圖像數(shù)據(jù)并上傳到應(yīng)用程序中。觀察發(fā)現(xiàn),食物圖像非常嘈雜和多樣,反映了不同的文化。
例如,新加坡的華人和馬來人有不同的飲食習(xí)慣、飲食風(fēng)格和不同的食物種類,她澄清道當(dāng)我們訓(xùn)練一個(gè)模型時(shí),我們從有限的類別列表開始,但是對于food應(yīng)用程序,我們發(fā)現(xiàn)我們必須在應(yīng)用程序編程接口(API)中一直擴(kuò)展這些類別。我們必須不斷地修改和更新數(shù)據(jù)集。新加坡豐富的文化多樣性是該項(xiàng)目最大的挑戰(zhàn)之一。
除了收集更多不同的數(shù)據(jù)外,該團(tuán)隊(duì)還在研究領(lǐng)域自適應(yīng)學(xué)習(xí)算法。在不同的文化背景下,有不同的領(lǐng)域,因此他們必須考慮如何通過利用有效的學(xué)習(xí)算法,快速調(diào)整他們預(yù)先訓(xùn)練的模型。為了對食物圖像進(jìn)行這種處理,他們需要開發(fā)特定于食物的域自適應(yīng)算法。他們還需要考慮將食品知識包括在內(nèi),以提高多領(lǐng)域模型的整體效率。
“我們希望通過在新領(lǐng)域中使用一個(gè)小數(shù)據(jù)集來進(jìn)行這種調(diào)整?!睂O教授說這是一項(xiàng)具有挑戰(zhàn)性的任務(wù),它將使來自不同文化的新加坡用戶受益。
AME的FANN項(xiàng)目
孫教授目前正處于一個(gè)名為“先進(jìn)人工智能系統(tǒng)的快速適應(yīng)神經(jīng)網(wǎng)絡(luò)(FANN)”的三年項(xiàng)目的早期階段。該項(xiàng)目由美國科學(xué)技術(shù)研究局(a*STAR)在其先進(jìn)制造與工程青年個(gè)人研究基金(AME YIRG)下資助,主要研究計(jì)算機(jī)視覺例如圖像處理,圖像識別,或者視頻中的目標(biāo)檢測。計(jì)算機(jī)視覺算法通常依賴于卷積神經(jīng)網(wǎng)絡(luò)(CNNs),這是她的專長領(lǐng)域。
“這項(xiàng)研究的關(guān)鍵假設(shè)是,有可能建立基于統(tǒng)計(jì)水平知識學(xué)習(xí)的模型適應(yīng)推理水平,通過驗(yàn)證這一假設(shè),我們也正在接近高級人工智能系統(tǒng)的目標(biāo),該系統(tǒng)可以為AME領(lǐng)域的應(yīng)用訓(xùn)練具有類人智能的機(jī)器模型?!?/p>
該研究旨在實(shí)現(xiàn)自動化視覺檢測的高魯棒性和計(jì)算效率,以及精密制造和先進(jìn)圖像識別技術(shù)之間的交叉知識。孫教授相信,當(dāng)快速適配檢測裝置廣泛應(yīng)用于生產(chǎn)線的設(shè)計(jì)、布局、制造、裝配和測試過程時(shí),研究成果將大大提高成品率,降低制造成本。
編輯:lyn
-
人工智能
+關(guān)注
關(guān)注
1814文章
49967瀏覽量
263708 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47544 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5594瀏覽量
124156 -
自然語言處理
+關(guān)注
關(guān)注
1文章
629瀏覽量
14628
發(fā)布評論請先 登錄
人工智能數(shù)據(jù)中心的光纖布線策略
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
云知聲出席中國科大2025人工智能行業(yè)校友上海峰會
超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
人工智能是做什么的
新思科技與Arm探討人工智能的發(fā)展機(jī)遇
開售RK3576 高性能人工智能主板
聲智APP通過北京市生成式人工智能服務(wù)登記
AI人工智能隱私保護(hù)怎么樣
西井科技亮相2025年人工智能行動峰會
人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用
探討人工智能的特點(diǎn)與如何讓人工智能更好的服務(wù)我們生活
評論