導讀
人工智能的迅猛發(fā)展和工業(yè)界的大量需求是否匹配?新模型新算法天天更新,看似解決了很多問題,但在工業(yè)上這些好像并不重要?本文作者將對AI進展是否供過于求給出他的解答。
就我的視角來看,人工智能目前的發(fā)展水平,還遠遠不能達到大部分工業(yè)界的需求,有很多工業(yè)問題靠目前的技術水平還無法解決。人工智能的發(fā)展路線大概是這樣的:
圖片來源:https://xueqiu.com/1640036587/110614869 當然我個人比較喜歡這張圖:
圖片來源:https://zhuanlan.zhihu.com/p/83018440
人工智能的高峰和限制
可以看到,每當人工智能領域有了新突破后,都會迎來一次發(fā)展的高峰。 第一個高峰來源于人工智能概念的確立、以及符號主義算法的發(fā)展;第二個高峰來源于感知機、BP 網絡、專家系統(tǒng)等理論的提出。然而每個高峰過后,隨之而來的就是發(fā)展的低谷,這是由于當時的算法,以及配套的算力、商業(yè)環(huán)境限制所決定的。 目前我們處于人工智能發(fā)展的第三個高峰階段,這次發(fā)展的動力來源是深度學習。但是就我目前看來,這一階段的人工智能高峰,在技術上存在四個比較大的限制:
1. 目前的深度學習還是嚴重依賴“獨立同分布”原則。
雖然有很多學界論文在研究無監(jiān)督學習,也取得了不錯的進展,但工業(yè)界目前用的最多的還是有監(jiān)督學習。一旦最后的應用環(huán)境跟手中的樣本有明顯差異,模型就很容易表現(xiàn)不佳。 這就導致了目前很多算法只能在封閉場景下進行。比如現(xiàn)在很多號稱 L4 自動駕駛的應用,實際上只能在一個限定范圍內進行,比如園區(qū)內的擺渡車、固定路線的出租車等。另外對于一些難以獲取數(shù)據(jù)的場合,由于樣本覆蓋的空間不夠大或覆蓋的不夠密集,模型的精度也難以保證。
2. 芯片算力有限。
一般來說模型越大,模型效果就越好,但所需算力也就越大。甚至有一種聲音:只要模型足夠大、算力足夠充足、數(shù)據(jù)足夠多,就能訓練出真正的人工智能(這么說有點期待量子計算出來,至少解決了算力問題)。但實際上芯片的算力不是無限的,在很多場合下甚至是嚴重匱乏的,比如手機、車輛等邊緣端場景。在這些場景下,算法人員不得不減少模型的大小,以保證模型能以合理的速度運行,但這往往也是伴隨著精度的下降的。
3. 深度學習的可解釋性不強。
在一些要求非常嚴苛的領域,沒有足夠可解釋性的技術難以落地。
4. 深度學習的可遷移性仍有提高空間。
在面對一個全新的領域時,還是需要大量的人員與時間投入。這點倒不是因為模型本身沒有可遷移性,而是因為各類場景本身的差異較大,在一個新場景下,場景問題的抽象、指標的定義與明確、數(shù)據(jù)的收集與標注、模型的部署這些往往會耗費大量的人力與時間,訓練模型反而是其中比較簡單、也比較容易遷移的一環(huán)了。 這些限制使得深度學習無法在全領域鋪開,只能在一些限定場景下得到很好的應用。
人工智能的發(fā)展和工業(yè)界的需求
回到題主的問題,題主認為“很多問題其實很多在工業(yè)上并不是很重要”其實是正確的,這是因為論文里面關注的問題,都是在深度學習容易鋪開的領域內的(人臉識別、目標檢測等等)。 而實際工業(yè)涉及到的問題領域,遠比論文關注的領域大得多得多得多。這些沒有得到關注的工業(yè)領域,一方面是本身利益場景不大(領域過于細分學術界關注不到,或者是市場沒前景,總之錢和命都不太好賺),另外有更多的是這些領域本身不適合深度學習的應用。舉個虛擬的例子(編一個故事【逃):
有一天一個工廠甲方找你,說有一個工藝環(huán)節(jié)人工成本太高了,看看能不能用人工智能代替。你去實地考察后,發(fā)現(xiàn)他們現(xiàn)場工人操作全靠經驗,規(guī)則十分模糊。經過多次調研后,你終于確定了大致的規(guī)則,能夠對這一個工藝環(huán)節(jié)以人工智能的方式抽象后,項目終于立項了。 然后你發(fā)現(xiàn)數(shù)據(jù)的收集特別困難(沒有電子記錄設備,你得駐場抄數(shù)據(jù),且沒有歷史數(shù)據(jù),一抄就要抄好久,不然數(shù)據(jù)不夠模型訓不了),收集到的數(shù)據(jù)標注很臟(因為經驗不足,有的時候不得不讓現(xiàn)場工人標注,因為基本沒法定標注規(guī)則,數(shù)據(jù)很臟)。 千辛萬苦收集到數(shù)據(jù)后,訓模型倒是很順利,找個 resnet/bert 訓一下,精度有 95%。然后你興沖沖的找甲方匯報,甲方說我們這沒有帶顯卡的機器,只有一個老舊的 CPU 服務器,讓你把模型部署在上面試試看。得,壓縮模型吧。經過大量的調優(yōu)后,模型在 CPU 服務器上速度夠了,但精度只能到 90% 了。 用戶看看之后覺得可行,然后又提出新需求了:過段時間項目要匯報了,能不能跟省里的專家講講你的算法的原理;90% 精度還是太低了,能不能搞到 100%;我們的工藝可能要變一下,你的模型應該能自適應的吧...
這個例子是我從我親身經歷的、聽朋友說的多個項目揉起來編的縫合怪,基本上把我前面提到的四個限制全踩了。實際上的項目可能不會踩這么多坑,但是多多少少會踩一部分,而且每個坑都不是省油的燈。 這也是為啥現(xiàn)在很多頭部大廠不愿意深入工業(yè)領域做深度學習應用的原因:要么就是因為各種因素的限制做不了(比如項目問題無法抽象),要么就是能做性價比太低(需要投入大量人力,項目款項還少,且每個廠子需求都不一樣沒法復用)。 前面討論的還僅僅是那些“嘗試用人工智能解決”的問題。工業(yè)界還有很多問題,工廠壓根就沒想過用人工智能去解決。所以題主感覺的“解決了很多的問題”,其實在真的是非常小非常小的一部分。
總結
所以回到開頭的觀點,目前人工智能的發(fā)展水平,還只能在一定限定條件下、在一些領域的一部分具體問題上得到很好的應用。在廣袤的工業(yè)應用場景下,深度學習因為其局限性并不能很好的應用,工業(yè)界里面有大量的問題無法用人工智能解決。 其實回顧歷史,前兩次人工智能高峰,都是因為在一些領域得到突破性的應用后,得到了高度的關注,但也因為人們發(fā)現(xiàn)人工智能因為各種因素的限制而不能替代萬事萬物后,熱情而慢慢消退。 此次深度學習引發(fā)的人工智能高峰,因其在眾多領域取得了突破性的進展而被人們捧上神壇,但我們也不可否認其存在的限制與問題。我沒辦法預測這次高峰會不會迎來低谷,因為畢竟可能鬧不好什么時候又有了理論或工程上的突破。但確定的是,即使人工智能又一次跌入了低谷,但其本身是一直在發(fā)展的。只要等到契機的到來,就會有下一個高峰在。在這樣跌宕起伏的發(fā)展過程中,我們會看到一個個過去無法解決的問題被解決,人們的生活也會因為人工智能的發(fā)展越來越便利。這跟科學的發(fā)展是何其的相似。
審核編輯 :李倩
-
人工智能
+關注
關注
1807文章
49029瀏覽量
249645 -
計算機視覺
+關注
關注
9文章
1709瀏覽量
46784
原文標題:【光電智造】現(xiàn)在計算機視覺、AI 的發(fā)展相比較工業(yè)界的需求,是不是供大于求了?
文章出處:【微信號:今日光電,微信公眾號:今日光電】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論