隨著移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速普及,全球數(shù)據(jù)總量呈指數(shù)級增長。據(jù)雷鋒網(wǎng)統(tǒng)計,我們每天創(chuàng)造約2.3萬億GB數(shù)據(jù)。
過去,人們對海量數(shù)據(jù)無從下手。隨著大數(shù)據(jù)與人工智能、云計算、物聯(lián)網(wǎng)、區(qū)塊鏈等前沿技術(shù)的緊密融合以及硬件基礎(chǔ)設(shè)施的快速發(fā)展,這些新興技術(shù)為數(shù)據(jù)增值提供了強(qiáng)有力保障,由此帶來了巨大商業(yè)應(yīng)用價值,并逐漸成為各國搶占下一步發(fā)展機(jī)遇的戰(zhàn)略性技術(shù)。
最近,美國政府啟動了大數(shù)據(jù)研究計劃,致力于提升大數(shù)據(jù)分析算法和系統(tǒng)的效率;同時,日本對信息產(chǎn)業(yè)提出新的戰(zhàn)略規(guī)劃,將大數(shù)據(jù)作為重點發(fā)展的科技領(lǐng)域,著重強(qiáng)調(diào)數(shù)據(jù)采集與分析;近年來,我國大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展。中國信通院在2018年發(fā)布的《大數(shù)據(jù)白皮書》進(jìn)一步調(diào)動了全國各地發(fā)展大數(shù)據(jù)的積極性,各行各業(yè)開始利用大數(shù)據(jù)進(jìn)行智能升級轉(zhuǎn)型。
在大數(shù)據(jù)技術(shù)中,數(shù)據(jù)分析逐漸成為其核心技術(shù),包括對數(shù)據(jù)處理的實時性成為工業(yè)界的主要需求。當(dāng)前,各種數(shù)據(jù)分析技術(shù)層出不窮。其中,最為引人關(guān)注的當(dāng)屬深度學(xué)習(xí)技術(shù)。
一、深度學(xué)習(xí)是最好的方法之一
深度學(xué)習(xí)仍是目前大數(shù)據(jù)處理與分析的最好方法之一。
深度學(xué)習(xí)擅于發(fā)掘多維數(shù)據(jù)中錯綜復(fù)雜的關(guān)系?;诖髷?shù)據(jù)的深度學(xué)習(xí)算法在計算機(jī)視覺、自然語言處理以及信息檢索等多個領(lǐng)域不斷刷新著記錄。
在這個數(shù)據(jù)為王的時代,深度學(xué)習(xí)中的監(jiān)督/半監(jiān)督學(xué)習(xí)與數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量等有很大關(guān)系,因此數(shù)據(jù)標(biāo)注是在現(xiàn)實場景中提升模型性能的最直接有效的方法。
但由于傳統(tǒng)的數(shù)據(jù)集數(shù)量/質(zhì)量有限,在解決新的問題或是想要獲得更好的效果時,往往需要進(jìn)行額外的數(shù)據(jù)標(biāo)注。因此,對于數(shù)據(jù)要求不那么高的半監(jiān)督/弱監(jiān)督學(xué)習(xí)一直是視覺大數(shù)據(jù)處理中的熱點問題。同時,當(dāng)使用某數(shù)據(jù)集訓(xùn)練了一個很好的模型,但在實際應(yīng)用時,往往由于“領(lǐng)域鴻溝”(domain gap)的存在,模型性能大幅度下降,遷移學(xué)習(xí)是這一問題的常用解決思路。
此外,由于移動設(shè)備或物聯(lián)網(wǎng)設(shè)備的存儲和計算資源有限,無法像服務(wù)器一樣輕松地運(yùn)行訓(xùn)練好的模型,限制了深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)領(lǐng)域的應(yīng)用落地,針對此問題,目前有效的解決方案包括模型壓縮、計算加速。
生成對抗網(wǎng)絡(luò)Generative Adversarial Networks (GANs)的提出,為神經(jīng)網(wǎng)絡(luò)添加了一個新的分支。該網(wǎng)絡(luò)結(jié)構(gòu)能極大提高圖像生成的質(zhì)量,進(jìn)一步推動了計算機(jī)視覺領(lǐng)域的發(fā)展。
近幾年,計算機(jī)視覺正在向視頻理解領(lǐng)域延伸,而視頻比圖像多了一維時序信息,如何有效建模并利用這一時序信息是處理這類問題的關(guān)鍵。
深度強(qiáng)化學(xué)習(xí)是大數(shù)據(jù)時代的另一研究熱點,強(qiáng)化學(xué)習(xí)是主體通過與外部環(huán)境交互來進(jìn)行學(xué)習(xí)的過程。目前已經(jīng)取得了實質(zhì)性的突破,2017年DeepMind公司的提出的AlphaGo Zero通過自我博弈的強(qiáng)化深度學(xué)習(xí)算法進(jìn)行訓(xùn)練,經(jīng)過3天的學(xué)習(xí),以100:0的成績超越了AlphaGo Lee的實力(以4:1戰(zhàn)勝李世石的版本),21天后達(dá)到了AlphaGo Master的水平,并在40天內(nèi)超過了所有之前的版本。
自2017年以來,AutoML(Automated machine learning)迅速興起,AutoML試圖將特征提取、模型優(yōu)化、參數(shù)調(diào)節(jié)等重要步驟進(jìn)行自動化地學(xué)習(xí),使得機(jī)器學(xué)習(xí)模型無需人工干預(yù)即可被應(yīng)用。但目前其在搜索效率、實際應(yīng)用等方面有待進(jìn)一步探索。
二、計算機(jī)視覺
計算機(jī)視覺是人工智能領(lǐng)域最為成熟的技術(shù)之一,其主旨在于利用計算機(jī)模擬人類視覺,是人工智能中的‘看’,進(jìn)而為后續(xù)的應(yīng)用目標(biāo)提供判別信息。計算機(jī)視覺研究和應(yīng)用非常廣泛,近幾年取得了快速的發(fā)展,其應(yīng)用已經(jīng)在政府、金融、互聯(lián)網(wǎng)等行業(yè)市場率先落地。
此外,利用大數(shù)據(jù)可以對實體經(jīng)濟(jì)行業(yè)進(jìn)行市場需求分析,優(yōu)化生產(chǎn)流程、供應(yīng)鏈與物流能源管理,以及提供智能客戶服務(wù)等。雖然大數(shù)據(jù)已經(jīng)服務(wù)于眾多行業(yè),但是在實際應(yīng)用中還有很多局限,仍舊有很多問題沒有解決。
近年來,國家對人工智能行業(yè)的大力支持為計算機(jī)視覺的發(fā)展提供了有利環(huán)境,極大促進(jìn)了計算機(jī)視覺的商業(yè)化落地。目前我國共有100余家計算機(jī)視覺企業(yè),涉獵身份認(rèn)證、安防影像、醫(yī)療影像等眾多領(lǐng)域。
目前CV公司比較集中的技術(shù)賽道有:人臉識別、自動駕駛、醫(yī)療圖像等,目前商業(yè)化落地最快的仍是人臉識別及其業(yè)務(wù)相關(guān)的一些技術(shù)。
縱觀計算機(jī)視覺發(fā)展,可以看到中國與西方國家的演進(jìn)路線的不同。國際上前沿的技術(shù)主要集中在深度學(xué)習(xí)的基礎(chǔ)研究層面,而中國的計算機(jī)視覺技術(shù)更傾向于產(chǎn)業(yè)落地。經(jīng)過多年的沉淀,中國已經(jīng)在人才、數(shù)據(jù)、場景和政策層面做了比較多的儲備,為中國計算機(jī)視覺技術(shù)的發(fā)展提供了豐沃的土壤。
尤其是在應(yīng)用方面。計算機(jī)視覺領(lǐng)域一定要通過落地應(yīng)用才能更好推動學(xué)術(shù)的發(fā)展,而中國在這方面具有巨大的優(yōu)勢。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
9050瀏覽量
143396 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5594瀏覽量
124142
發(fā)布評論請先 登錄
2017全國深度學(xué)習(xí)技術(shù)應(yīng)用大會
計算機(jī)視覺/深度學(xué)習(xí)領(lǐng)域常用數(shù)據(jù)集匯總
NLPIR-Parser大數(shù)據(jù)技術(shù)實現(xiàn)深度文本語義理解
推薦幾本機(jī)器學(xué)習(xí)和深度學(xué)習(xí)必讀書籍+機(jī)器學(xué)習(xí)實戰(zhàn)視頻PPT+大數(shù)據(jù)分析書籍
深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域圖像應(yīng)用總結(jié) 精選資料下載
超全!深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域應(yīng)用一覽(附鏈接)精選資料分享
基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)方法和技術(shù)研究
深度學(xué)習(xí)在IoT大數(shù)據(jù)和流分析中的應(yīng)用
視覺大數(shù)據(jù)領(lǐng)域的最好分析方法之一:深度學(xué)習(xí)
評論