隨著人工智能技術(shù)與產(chǎn)業(yè)不斷融合,人工智能技術(shù)助力傳統(tǒng)產(chǎn)業(yè)實現(xiàn)新的發(fā)展和升級,助力工業(yè)經(jīng)濟(jì)向數(shù)字經(jīng)濟(jì)快速轉(zhuǎn)型。目前,人工智能技術(shù)在醫(yī)療、金融、交通、零售、工業(yè)制造、教育、安防等領(lǐng)域均產(chǎn)生良好的發(fā)展前景。
雖然人工智能技術(shù)的行業(yè)應(yīng)用越來越廣泛,仿佛真的站在風(fēng)口準(zhǔn)備擁抱下一場革命,但正如專家們所言,對于人工智能的發(fā)展,應(yīng)該保持謹(jǐn)慎的樂觀態(tài)度。眾所周知,沃森是當(dāng)下諸多人工智能技術(shù)和應(yīng)用的典型代表,其重點領(lǐng)域是醫(yī)療(主攻癌癥的預(yù)測與治療)。然而,在經(jīng)歷了六年時間、耗資數(shù)十億美元之后,Watson的診斷結(jié)果卻令人沮喪。人工智能系統(tǒng)需要基于數(shù)據(jù)調(diào)整參數(shù),以達(dá)到最佳擬合效果,由于數(shù)據(jù)的復(fù)雜性和相對不可用性,人工智能的效用往往存在不確定性。
同樣對IBM沃森而言,當(dāng)Watson獲得足夠多的“條理清楚”的數(shù)據(jù)時,能通過不斷學(xué)習(xí)給出可能有用的答案。但在實際操作中,一方面Watson使用的訓(xùn)練數(shù)據(jù)并不豐富,例如,訓(xùn)練肺癌治療方案的數(shù)據(jù)僅有635例,其它疾病更是少得可憐。另一方面,由于患者就醫(yī)記錄沒有全部聯(lián)網(wǎng),醫(yī)生經(jīng)驗錄入成為沃森分析最核心的來源,這意味著當(dāng)它掃描大量文件時,必然要識別復(fù)雜的信息并從中抽取關(guān)鍵內(nèi)容。例如,患者的病歷可能包含醫(yī)生的大量注釋,這些注釋又是由簡寫和短語構(gòu)成的,機(jī)器想完全理解它們并非易事??偨Y(jié)IBM沃森失敗的原因,其算法算力毋庸置疑,而在數(shù)據(jù)處理上,除了收集的樣本數(shù)據(jù)量不足,最大的問題便是在數(shù)據(jù)質(zhì)量不高,幾十萬份病例下來,能夠用的可能才幾萬份病例。這一切導(dǎo)致了沃森不能提供足夠的敏感性、特異性和精準(zhǔn)性,而這都是臨床決策所必需的。
當(dāng)前人工智能還面臨諸多挑戰(zhàn),例如數(shù)據(jù)孤島問題、隱私保護(hù)問題、安全問題等瓶頸。一項2018年的研究顯示,人工智能的采納率急劇增加,從2017年的38%增至2018年的61%,醫(yī)療保健業(yè)、制造業(yè)和金融服務(wù)業(yè)等各個行業(yè)都是如此。但根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的一份報告指出,評估了4個行業(yè)(包括醫(yī)療健康行業(yè))的“數(shù)據(jù)質(zhì)量”,范圍為1(嚴(yán)重)到5(優(yōu)化)。IDC將醫(yī)療健康行業(yè)的數(shù)據(jù)質(zhì)量評為2.4。報告顯示,60%的醫(yī)療行業(yè)受訪者缺乏數(shù)據(jù)處理能力。
構(gòu)建高質(zhì)量數(shù)據(jù)集,推動人工智能快速發(fā)展
當(dāng)前,不管是人工智能技術(shù)的研發(fā)以及應(yīng)用領(lǐng)域的發(fā)展,“數(shù)據(jù)”都是一個不可或缺、位于重中之重的因素。機(jī)器學(xué)習(xí)等AI技術(shù)的基礎(chǔ)是應(yīng)用軟件分析系統(tǒng)對數(shù)據(jù)集進(jìn)行分析、挖掘。而數(shù)據(jù)集的大小至關(guān)重要,因為機(jī)器學(xué)習(xí)需要特定、大量的數(shù)據(jù)。只有數(shù)據(jù)上傳足夠高效,才能夠在相關(guān)工作中體現(xiàn)出及時,而準(zhǔn)確的數(shù)據(jù)是人工智能技術(shù)研發(fā)、訓(xùn)練的關(guān)鍵,以及其能夠在生活中起到多大作用的一個考量因素。乍一看,醫(yī)療健康行業(yè)應(yīng)該具有優(yōu)勢:該行業(yè)擁有大量數(shù)據(jù)。到2025年,醫(yī)療健康領(lǐng)域的數(shù)據(jù)數(shù)量將超過金融、媒體和制造業(yè)等領(lǐng)域,其年復(fù)合增長率達(dá)到36%。這在很大程度上是由于醫(yī)療健康領(lǐng)域新興技術(shù)的不斷涌現(xiàn),例如醫(yī)學(xué)成像、康復(fù)機(jī)器人以及不斷成熟的大數(shù)據(jù)分析工具。但不幸的是,數(shù)量只是數(shù)據(jù)的一個方面:質(zhì)量是另一個關(guān)鍵。醫(yī)療領(lǐng)域的數(shù)據(jù)往往數(shù)量足夠,但質(zhì)量堪憂。
GetApp的一項研究表示,他們調(diào)查了五個行業(yè)(包括醫(yī)療健康行業(yè))的近500名小企業(yè)領(lǐng)導(dǎo)者,當(dāng)詢問受訪者數(shù)據(jù)分析過程的哪個方面讓他們感到信心最低時,25%的醫(yī)療行業(yè)受訪者表示,他們對收集“相關(guān)數(shù)據(jù)”——可以提供決策的高質(zhì)量數(shù)據(jù)的能力最不自信,在所有五個領(lǐng)域(包括醫(yī)療行業(yè))數(shù)據(jù)質(zhì)量是他們關(guān)注的主要問題。加拿大的一家保險公司想要根據(jù)保險公司的工作地點來衡量保險公司的風(fēng)險時,其分析產(chǎn)生了垃圾結(jié)果,究其原因,是在對距離數(shù)據(jù)的標(biāo)注時,分別以英里和公里為標(biāo)記,使其結(jié)果出現(xiàn)了偏差。而在Dun&Bradstreet的一項調(diào)查中,很多組織表示,缺乏正確的數(shù)據(jù)是進(jìn)一步實施人工智能的最大障礙之一。
大數(shù)據(jù)是人工智能技術(shù)研發(fā)、訓(xùn)練的關(guān)鍵,是人工智能長期發(fā)展的重要保障。只有當(dāng)人工智能系統(tǒng)能夠獲取更為準(zhǔn)確、及時、一致的高質(zhì)量數(shù)據(jù),才能提供更有效、有用、精準(zhǔn)性高的智能化服務(wù)。根據(jù)埃森哲在2018年4月的一份調(diào)研發(fā)現(xiàn),中國制造企業(yè)在運用人工智能技術(shù)時面臨一系列挑戰(zhàn)。其中,52%的受訪中國企業(yè)將數(shù)據(jù)質(zhì)量列為突出挑戰(zhàn),數(shù)據(jù)安全與網(wǎng)絡(luò)安全緊隨其后(47%)。在2017年4月的一次研討會上,圍繞人工智能話題,某業(yè)界專家提出:“高質(zhì)量的數(shù)據(jù)是人工智能的前提和基礎(chǔ)”。當(dāng)前,不管是人工智能技術(shù)的研發(fā),還是人工智能應(yīng)用領(lǐng)域的發(fā)展,“數(shù)據(jù)質(zhì)量”都是一個不可或缺、位于重中之重的要素。
用戶隱私安全問題成制約人工智能發(fā)展因素
大數(shù)據(jù),被視為人工智能發(fā)展的基石。在過去很多年里,人們并沒有意識到大數(shù)據(jù)使用中的隱私風(fēng)險,企業(yè)對用戶數(shù)據(jù)的收集使用達(dá)到了無節(jié)制的程度,結(jié)果是“數(shù)據(jù)丑聞”在近兩年集中爆發(fā)。比如今年剛被曝光的IBM,為了進(jìn)行人臉識別訓(xùn)練,未經(jīng)當(dāng)事人許可,便從網(wǎng)絡(luò)圖庫上獲得了近100萬張照片。亞馬遜的智能音箱Alex,也屢次因隱私問題引發(fā)美國用戶的質(zhì)疑。雖然企業(yè)總會辯稱匿名化處理后的數(shù)據(jù)無法對應(yīng)到具體的用戶,人們還是無法完全放下?lián)鷳n。根據(jù)加州大學(xué)伯克利分校的一項新研究顯示,人工智能的進(jìn)步為人們健康數(shù)據(jù)的隱私性帶來了新威脅。業(yè)內(nèi)一項人工智能相關(guān)調(diào)查報告也顯示,8成受訪者擔(dān)心人工智能會威脅自己的隱私,3成受訪者已經(jīng)感受到了人工智能給自己工作帶來的威脅。
作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,人工智能正在深刻影響社會生活、改變發(fā)展格局。同時,人工智能如同一把“雙刃劍”,如果應(yīng)用不當(dāng),就可能帶來隱私泄露的倫理風(fēng)險。如何在人工智能應(yīng)用中兼顧隱私保護(hù),確保安全、可靠、可控,是一項亟須關(guān)注的倫理課題。
2019年9月5日,由北京大學(xué)、國家電網(wǎng)全球能源互聯(lián)網(wǎng)研究院與華矩科技三家產(chǎn)學(xué)研代表聯(lián)合發(fā)起的第三屆大數(shù)據(jù)數(shù)據(jù)質(zhì)量管理國際峰會將在北京舉辦,峰會以“數(shù)以質(zhì)造質(zhì)造未來”為主題展開深入探討與交流,薈萃技術(shù)發(fā)展與產(chǎn)業(yè)升級,匯聚國內(nèi)外數(shù)據(jù)質(zhì)量學(xué)術(shù)大拿、技術(shù)大拿、行業(yè)應(yīng)用及技術(shù)創(chuàng)新者,不僅從更新更全的角度剖析數(shù)據(jù)質(zhì)量的前沿發(fā)展,而且更貼合各行業(yè)各領(lǐng)域深度的業(yè)務(wù)場景,提供全新的視角與思考。
針對人工智能領(lǐng)域,DQMIS2019特設(shè)數(shù)據(jù)質(zhì)量與人工智能的結(jié)合主題板塊,深度挖掘機(jī)器視覺、智能機(jī)器人、大數(shù)據(jù)與數(shù)據(jù)服務(wù)、AI+產(chǎn)業(yè)等前沿技術(shù)話題,邀請了國內(nèi)外技術(shù)大咖及行業(yè)領(lǐng)袖現(xiàn)身說法,分享人工智能發(fā)展過程的數(shù)據(jù)質(zhì)量難點與實踐,給人工智能應(yīng)用與發(fā)展帶來更多啟發(fā)與探討。
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
2000瀏覽量
61582 -
人工智能
+關(guān)注
關(guān)注
1817文章
50091瀏覽量
265226 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1236瀏覽量
26187
發(fā)布評論請先 登錄
云知聲深度參與杭州市富陽區(qū)人工智能高質(zhì)量發(fā)展大會
維視智造受邀出席AI融智推動職業(yè)教育高質(zhì)量發(fā)展論壇
上海市計算機(jī)行業(yè)協(xié)會攜手深蘭科技推動人工智能高質(zhì)量發(fā)展
研華AI智能體推動儲能產(chǎn)業(yè)高質(zhì)量發(fā)展
中科天機(jī)開放共享全球高分辨率氣象數(shù)據(jù)
靈汐科技邀您共赴2025人工智能計算大會
中科曙光入選信通院2025上半年度高質(zhì)量數(shù)字化轉(zhuǎn)型十大典型案例
標(biāo)貝科技參編《人工智能高質(zhì)量數(shù)據(jù)集建設(shè)指南》
易華錄入選國家首批高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作名單
中國中車通過中國信通院可信AI人工智能數(shù)據(jù)集質(zhì)量四級評估
大模型時代,如何推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè)?
從芯片到主板,科技創(chuàng)新實現(xiàn)高質(zhì)量發(fā)展
淺析:數(shù)字經(jīng)濟(jì)時代,高質(zhì)量數(shù)據(jù)集對AI產(chǎn)業(yè)帶來哪些新的變化
標(biāo)貝科技“4D-BEV上億點云標(biāo)注系統(tǒng)”入選國家數(shù)據(jù)局首批數(shù)據(jù)標(biāo)注優(yōu)秀案例
構(gòu)建高質(zhì)量數(shù)據(jù)集,推動人工智能快速發(fā)展
評論