AI技術(shù)已經(jīng)家喻戶曉。不論是移動終端設(shè)備,還是企業(yè)系統(tǒng)平臺,都開始集成AI能力,現(xiàn)階段看,AI融合到各個行業(yè)的潛力非常巨大,能夠在眾多場景中發(fā)揮作用,比如云計算。在今天數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)上云成為了新常態(tài),云上大量的數(shù)據(jù)、豐富的應(yīng)用通過AI技術(shù),能夠解決很多問題,因此云與AI的融合也是新常態(tài)。
因為騰訊強(qiáng)大的社交、游戲等基因,騰訊AI有著非常豐富的實踐場景,在朋友圈爆款應(yīng)用、OCR識別、醫(yī)療、游戲等場景中都運用了AI技術(shù),開發(fā)出了大量的新功能和能力。即便如此,AI在這些領(lǐng)域的嘗試有些還在初級階段。如何在具體業(yè)務(wù)場景中提供匹配的能力,利用AI把問題簡單化,釋放生產(chǎn)力,依然非常具有挑戰(zhàn)性。
因此,7月28日,騰訊云在北京舉辦云+社區(qū)沙龍,邀請來自騰訊與四川云檢科技的五位AI技術(shù)專家,分享他們在專業(yè)領(lǐng)域的AI開發(fā)經(jīng)驗,幫助開發(fā)者在具體行業(yè)場景中實踐AI技術(shù)?,F(xiàn)場有近400位開發(fā)者參與,答疑及茶歇環(huán)節(jié)氣氛熱烈,多位開發(fā)者與講師就演講內(nèi)容展開討論,表現(xiàn)出對AI濃厚的開發(fā)興趣。最后,所有開發(fā)者們與講師們合影留念,結(jié)束了這次盛夏中的、充滿前沿知識洗禮的趣味沙龍。
朋友圈爆款背后的計算機(jī)視覺技術(shù)與應(yīng)用
在現(xiàn)階段,強(qiáng)調(diào)AI在場景中落地,就是希望AI走進(jìn)千家萬戶,融入整個社會,而不僅僅是曲高和寡的模型,這就是AI技術(shù)產(chǎn)業(yè)化的趨勢。比如,朋友圈里像軍裝照、武士青年這種有趣的互動活動,就是目前探索出來的計算機(jī)視覺最快能夠來到大家身邊的落地應(yīng)用。對于開發(fā)者來說,通過對具體案例流程的了解,就能夠快速的掌握開發(fā)所需要的能力,從而實現(xiàn)自主創(chuàng)新開發(fā)。
騰訊大數(shù)據(jù)與人工智能中心AI技術(shù)專家葉聰在沙龍活動中就以朋友圈一些爆款活動作為切入點,幫助開發(fā)者們梳理了當(dāng)前關(guān)于計算機(jī)視覺與技術(shù)的應(yīng)用。葉聰表示,騰訊云現(xiàn)在非常講究AI場景化,在很多的應(yīng)用中都集成了AI能力。
五四青年節(jié)的活動《重溫五四,你最像哪位青年?》就是騰訊首先開始做的。通過人臉檢測與分析技術(shù)、人臉檢索技術(shù),將用戶上傳的照片與特定形象進(jìn)行臉部層面的檢索對比,通過匹配分析找出數(shù)據(jù)庫中外貌特征與用戶最為相似的一張照片,這個創(chuàng)意為后續(xù)AI娛樂產(chǎn)品設(shè)計提供了參考。
相比于學(xué)術(shù)角度對計算機(jī)視覺的定義——如何讓計算機(jī)從圖像和視頻中獲取高級、抽象的信息,從工程角度來看,「使機(jī)器模仿人類的視覺能力變得自動化」的定義則更明了。葉聰介紹,計算機(jī)視覺使機(jī)器可以部分代替人力理解圖片中的信息。計算機(jī)視覺還包含一些分支,主要包括物體識別、對象檢測、語義分割、運動和跟蹤、三維重建、視覺問答、動作識別等等,同時新的分支還在不斷出現(xiàn)。
現(xiàn)在比較熱門的視覺應(yīng)用包括人臉識別、無人駕駛、語義分割等。語義分割在AI領(lǐng)域比較常見,一般指詞性的分割,或者詞的分割。而圖像分割里面的語義分割一般指的是把圖像里面的不同類型的對象進(jìn)行標(biāo)注和區(qū)分。
在機(jī)器識別領(lǐng)域,現(xiàn)在已經(jīng)有很多比較成熟的特征提取方法。比如邊緣檢測方法,圖片對象的局部對稱性,尺度不變特征,利用灰度的原理等等,這些算法都能夠?qū)崿F(xiàn)提取,但不存在最優(yōu)方案。在圖像分割和對象檢測領(lǐng)域也有一些其他算法,例如分水嶺算法,分水嶺顧名思義就是利用圖像的灰度特性把這個圖像整個灰度的曲線顯示出來。另外,對象檢測的常用算法叫主觀形狀模型,比如以人臉為標(biāo)準(zhǔn),人臉上有68個點,對這些點進(jìn)行變換,再去實現(xiàn)匹配目標(biāo)。
圖像識別領(lǐng)域的發(fā)展經(jīng)歷了CNN,R-CNN,F(xiàn)aster R-CNN等幾個階段?,F(xiàn)在圖像識別的流行趨勢會趨于大自然的發(fā)展邏輯,是一個大循環(huán)。那么,基于這些科學(xué)實驗基礎(chǔ),騰訊云是如何支持AI應(yīng)用的呢?以五四青年活動為例,它是解決圖像匹配的一個活動。首先,從訓(xùn)練數(shù)據(jù)開始,一般是民國時候的老照片,對它進(jìn)行提取和標(biāo)注數(shù)據(jù),因為每個照片都有標(biāo)注,就會生成模型。當(dāng)用戶玩游戲時上傳照片測試數(shù)據(jù)時,會進(jìn)行特征提取和建模,模型會返回一個分類,這個分?jǐn)?shù)不是執(zhí)行度,不完全可以參考。最后將會把一個分?jǐn)?shù)最大的值返回到前端,生成頁面,這是整個流程。
再以人臉融合類的應(yīng)用來看,比如軍裝照。它的流程首先會對圖像的人臉部分進(jìn)行關(guān)鍵點的定位,把人臉上的特征提取出來,然后會對圖片進(jìn)行一些旋轉(zhuǎn),把它跟模版圖進(jìn)行統(tǒng)一化。下一步會把上傳圖片的人臉部分根據(jù)特征值摳出來,它就會跟模版圖進(jìn)行融合。等融合后如果上傳照片的各種光線角度不完全一樣,再對圖片進(jìn)行優(yōu)化,把光影、曲線調(diào)得比較平緩,這樣就呈現(xiàn)了非常好的效果。
對于開發(fā)者來說,掌握了這些能力,在開發(fā)出一款有趣的應(yīng)用之后,如何實現(xiàn)商業(yè)化落地?直接把它放在網(wǎng)上就可以讓用戶下載使用嗎?實際上遠(yuǎn)沒有這么簡單?,F(xiàn)在的普遍做法是,都會采用云服務(wù),盡量不在物理集上部署。為什么需要在云上部署AI應(yīng)用?因為這些應(yīng)用一般都會有短時間達(dá)到特別高的峰值,持續(xù)一段時間會有很快的回落。如果通過自己的IT基礎(chǔ)設(shè)施來響應(yīng)這些需求,在成本上會非常巨大,難以承擔(dān),而利用公有云,可以把一些機(jī)器的成本釋放掉,這是目前從開發(fā)應(yīng)用到實現(xiàn)收益的一整套通用商業(yè)流程。
目前,騰訊云AI目前能夠支持的領(lǐng)域比較多。包括各種人臉合成、身份證識別、智能監(jiān)控、人臉軋機(jī)還有語音合成、關(guān)鍵詞搜索等方面。同時,騰訊云的機(jī)器學(xué)習(xí)的平臺可以幫助開發(fā)者們快速去實現(xiàn)模型。
最后,如何讓AI落地到具體場景中,除了技術(shù)層面,開發(fā)者們?nèi)绾未蚰ギa(chǎn)品讓用戶可以簡單的使用復(fù)雜的技術(shù)?通常來說,從有想法到落地是一個非常漫長的過程,它分非常多的環(huán)節(jié)。首先要有AI算法的專家,同時要有AI工程實踐經(jīng)驗豐富的人,最后,還要有更多的產(chǎn)品開發(fā)人員把它打磨成產(chǎn)品。
OCR的應(yīng)用集錦及背后技術(shù)
OCR是近年比較火熱的領(lǐng)域。像身份證識別、車牌識別等都需要運用到OCR技術(shù),而像身份證識別的場景又非常多。因此,OCR作為一項通用型的基礎(chǔ)技術(shù),有非常廣泛的用途及商業(yè)價值。在很多需要人力資源來完成文字識別的工作,比如快遞行業(yè)的運單識別,保險行業(yè)的資料識別,通過OCR技術(shù)的利用實現(xiàn)了較大程度的生產(chǎn)力解放。對于開發(fā)者來說,借助于OCR技術(shù)開放的API,即可完成在各種生活場景的應(yīng)用開發(fā)。
騰訊AI資深技術(shù)專家冀永楠介紹說,OCR的歷史最早可以追溯到上世紀(jì)六七十年代,當(dāng)時郵寄信件的郵編即是OCR服務(wù)的最早雛形。目前的OCR應(yīng)用可以分為兩個維度,一是表格式的OCR和通用的OCR;二是印刷體和手寫體OCR?,F(xiàn)在的階段,表格式相對容易、通用式相對困難;印刷體相對簡單,手寫體相對困難。
騰訊云現(xiàn)在能夠提供多個場景中的印刷體OCR服務(wù)。在通用型的OCR場景中,除了證件,還能夠識別駕照、車牌、銀行卡、名片等等。另外,OCR服務(wù)要求準(zhǔn)確,以及完備,即能夠識別中英文和字符。騰訊云正在由常用語言和字符,例如中英文等往外擴(kuò)散能力,將識別范圍更加擴(kuò)大。
目前,在銀行業(yè)等對數(shù)字高敏度的行業(yè),對OCR的應(yīng)用廣泛且要求極高。騰訊不僅是第一家將手寫體應(yīng)用在實際場景中的,而且數(shù)字的識別率也高達(dá)90%以上,單字的識別率在15毫秒以內(nèi),復(fù)雜漢字超過80%。騰訊云的OCR服務(wù)在權(quán)威測評中表現(xiàn)也非常出眾。在國際模式識別協(xié)會(IAPR)舉辦的文檔分析與識別、模式識別領(lǐng)域世界上最權(quán)威的國際學(xué)術(shù)會議ICDAR(International Conference on Document Analysis and Recognition,即國際文檔分析與識別大會)上,騰訊OCR識別在ICDAR2015 「Focused Scene Text」場景文字識別任務(wù)、ICDAR 2015「Robust Reading Competition」的自然場景文本檢測項目中均得到第一名。
騰訊云現(xiàn)在可提供基于各種場景下的OCR服務(wù)接口,開發(fā)者可以免費使用這些服務(wù)來搭建自己的應(yīng)用。比如,開發(fā)者實際需要開發(fā)的一個具體場景的軟件,需要用到手寫體識別或者做一個通用的OCR識別時,可以直接在騰訊云上調(diào)用對應(yīng)的服務(wù)來完成應(yīng)用開發(fā)。
騰訊云OCR的應(yīng)用場景很多,目前在快遞運單識別以及保單識別上有明確的目標(biāo)客戶。類似于這種項目一般是定制化服務(wù),都是針對性地解決一個具體的問題。騰訊云根據(jù)具體場景下的問題和具體的生產(chǎn)流程來開發(fā)一套系統(tǒng),或者開發(fā)一套流程來配合實際的業(yè)務(wù),來提高生產(chǎn)效率。
以快遞運單識別為例,快遞手寫運單必須入庫才能進(jìn)行投遞,人工識別錄入的效率很低,在運用騰訊云的OCR系統(tǒng)之后,每日處理量可達(dá)到一千萬單,相當(dāng)于三千多個人三班倒的工作效率。另一個案例是泰康核保,在通常的購買健康保險流程中,都會對購買者病史進(jìn)行審核,審核包括購買者之前的體檢資料以及指定醫(yī)院的體驗資料,通過這些資料分析,來判定購買者身體狀況?,F(xiàn)在的解決方案是使用騰訊云的OCR,同時與泰康的醫(yī)療專家共同設(shè)計醫(yī)學(xué)知識庫加入到定制化系統(tǒng)。
除了以上兩個場景,騰訊云在不同的OCR應(yīng)用中還有江蘇銀行、小米等客戶。包括工商管理總局的廣告監(jiān)督局也在使用騰訊云OCR的多款服務(wù)。
智慧工地:履約考勤系統(tǒng)的應(yīng)用實踐
在目前的智慧城市、智慧工地等領(lǐng)域的建設(shè)也充分應(yīng)用了數(shù)字化技術(shù)。為響應(yīng)交通運輸部公路品質(zhì)工程建設(shè)的號召,工程建設(shè)需要加強(qiáng)四新技術(shù)的應(yīng)用,包括新材料、新設(shè)備、新技術(shù)以及新工具的應(yīng)用。在工程項目相對靈活的突發(fā)的工作環(huán)境中,履約考勤系統(tǒng)往往承擔(dān)著較大的負(fù)荷,現(xiàn)在利用AI技術(shù),就可以實現(xiàn)履約考勤管理的智能化。而一般開發(fā)者也可以根據(jù)一般企業(yè)的需求利用AI技術(shù)來開發(fā)有特點的產(chǎn)品。
四川云檢科技發(fā)展有限公司研發(fā)總監(jiān)吳琛表示,針對智慧工地履約考勤系統(tǒng)的應(yīng)用實踐主要分為六個部分,包括前沿、產(chǎn)品分析、系統(tǒng)架構(gòu)、主要技術(shù)、功能分析、應(yīng)用展望。當(dāng)前的履約管理的作用是為項目建設(shè)工程、質(zhì)量保駕護(hù)航。在實際的應(yīng)用當(dāng)中,履約考勤的對象包括施工單位的項目經(jīng)理、總工、安全生產(chǎn)負(fù)責(zé)人、設(shè)計單位的駐地設(shè)計代表、試驗檢測工程師等一些重要的人員,它針對的是重要的人員而不是其他一般員工。
當(dāng)前主流的考勤方案大約有7種,包括指紋考勤、ID卡考勤、紙卡鐘考勤、人臉識別考勤、虹膜識別、指靜脈識別、攝像考勤機(jī)。這些方案在實際應(yīng)用中,在兼顧效率和避免冒名頂替方面都不是很理想。而因為工程建設(shè)與參建方的監(jiān)督與被監(jiān)督關(guān)系,決定了管理部門對履約人員信息的真實性有更高的要求。
吳琛介紹說,通過用騰訊云的AI技術(shù),增加的云端功能非常重要。比如,在施工現(xiàn)場普遍存在人員變更的情況,人員變更以前需要業(yè)主或者項目部自行變更,現(xiàn)在有了AI技術(shù),變更的信息可自動識別出來。目前考勤的智能化主要從六個方面考慮,第一是確保在云端;第二是基于AI;第三是基于云計算;第四是要連接大數(shù)據(jù);第五是需要是移動應(yīng)用;第六是支持智能設(shè)備。
同時,它還需要具備五個特點:一是具備人員人臉基本信息的采集和錄入功能;二是能夠基于人員人臉信息的自動識別、采集、比較;三是支持人員信息與人員身份證信息的核驗;四是支持考勤地點的設(shè)置及異??记谖恢玫呐袛?;五是支持關(guān)鍵崗位的異??记谛畔㈩A(yù)警以及關(guān)鍵崗位缺勤信息進(jìn)行預(yù)警,支持對履約人員信息變更進(jìn)行在線管理。具備這些能力,就能在云端對考勤的結(jié)果進(jìn)行驗證,實現(xiàn)智能化的考勤管理。
騰訊云的智慧考勤主要包括四個主要技術(shù)方案。第一是人臉對比,騰訊云的人臉對比是根據(jù)面部特征計算兩張人臉的相似度,自動進(jìn)行身份鑒別;第二是個人證核身的功能,騰訊云的人證核身也是人臉核身,通過用戶自拍視頻或者一張自拍照與另外一張用戶事先留存的照片進(jìn)行人臉驗證,確認(rèn)用戶身份,主要用來幫助提升業(yè)務(wù)辦理效率,降低人力成本;第三是活體檢測,騰訊云的活體檢測是通過人臉特征點定位跟蹤識別進(jìn)行3D人臉重建模型,判斷是否為真人,它支持多平臺,包括CPU、GPU計算模式,靈活部署;第四個是基于LBS的定位服務(wù),通過電信移動運營商的無線電通訊網(wǎng)絡(luò),GSM,CDMA網(wǎng)獲取移動終端用戶的位置信息,包括地理坐標(biāo)或者是大地坐標(biāo)。
吳琛介紹說,云檢智慧履約考勤系統(tǒng)目前能夠?qū)崿F(xiàn)考勤數(shù)據(jù)的動態(tài)分析,包括對缺崗異常的數(shù)據(jù)實現(xiàn)實時預(yù)警的功能。主要有四個功能:一是人臉識別考勤機(jī),主要作用是前端數(shù)據(jù)采集,包括人員信息登記,人臉考勤以及數(shù)據(jù)上傳;二是用到移動端的APP,主要用于人臉考勤、人證核身;三是履約考勤管理云平臺,主要是針對考勤管理、審批管理、統(tǒng)計分析、系統(tǒng)設(shè)置等;四是用到API,提供移動APP調(diào)用應(yīng)用程序的接口,主要是騰訊云技術(shù)服務(wù)以及人工智能當(dāng)中的人臉對比,人證核身的這類應(yīng)用。
除了智慧工地領(lǐng)域,人臉識別解決方案在很多場景中應(yīng)用非常廣泛。隨著技術(shù)的發(fā)展、市場擴(kuò)大,人臉識別技術(shù)在現(xiàn)實生活中發(fā)揮的價值及作用也越來越大。
游戲中的AI技術(shù)應(yīng)用
對游戲AI的理解因為身份的差異,其目標(biāo)各有不同。對游戲開發(fā)者而言,運用AI是為了增進(jìn)用戶體驗,增加玩家活躍度。現(xiàn)在幾乎每款游戲都有運用AI,比如說射擊類游戲會有地圖,如果有一個非常好的AI幫助玩家去探索地圖會非常節(jié)省時間,因此AI對于小游戲開發(fā)者來說非常重要。
騰訊高級研究員王亮介紹說,業(yè)界的游戲AI技術(shù)常用的方法一般是三種。一是行為樹;二是基于搜索方法;三是基于學(xué)習(xí)的方法。今年游戲行業(yè)最有影響的是Dota2,它在5個特定英雄等限制條件下的AI能力能夠超過90%的玩家,它就是采用強(qiáng)化學(xué)習(xí)的方法,其它的很多主流游戲都在嘗試使用強(qiáng)化學(xué)習(xí)解決。
以風(fēng)靡的王者榮耀為例,MOBA游戲AI的做法和遇到的問題有哪些?因為王者榮耀是一款實時對戰(zhàn)的游戲,以競技對戰(zhàn)為主,復(fù)雜程度表現(xiàn)在英雄角色會非常多,也會帶來很多關(guān)于AI的復(fù)雜問題。第一是MOBA類游戲操作序列及狀態(tài)空間非常大;第二是游戲包含很多知識,如何去表達(dá);第三是MOBA決策問題復(fù)雜度高。
對于這些問題,解決方案方案分為三個方面。一是引入框架進(jìn)行分層,對任務(wù)分層和場景切分;二是引入了多模態(tài)的特征表達(dá)方式;三是采用多深度學(xué)習(xí)模型結(jié)合。
了解了基本情況后,在游戲AI開發(fā)的時候還會遇到很多坑。在游戲開發(fā)階段需要什么樣的環(huán)境?第一個需要環(huán)境是模擬器的問題。目前主要是基于這個環(huán)境來調(diào)優(yōu)。AI接入可以使用基于服務(wù)器架構(gòu),游戲引擎跟算法引擎是分開的,而它們之間是通過通信的方式來進(jìn)行處理的,它的優(yōu)點是游戲引擎跟模型進(jìn)行偶合,并且支持在線學(xué)習(xí),因此可以不斷強(qiáng)化和更新版本。
就整個游戲AI領(lǐng)域來說,主要是強(qiáng)化學(xué)習(xí)。與之前最顯著的變化就是——以前是基于規(guī)則,現(xiàn)在主要基于學(xué)習(xí)來開發(fā)研究。而如果是基于深度學(xué)習(xí)的方式,就至少要提供相關(guān)的環(huán)境給開發(fā)人員,以及怎么更新迭代。另外,現(xiàn)在的游戲AI還是比較有難度,但同時也充滿機(jī)會。
乳腺癌識別中運用的AI技術(shù)
隨著時代的進(jìn)步和經(jīng)濟(jì)發(fā)展,人們康的健康意識越來越高,同時伴隨著AI技術(shù)的發(fā)展,AI醫(yī)療理所應(yīng)當(dāng)?shù)爻蔀榱嘶ヂ?lián)網(wǎng)行業(yè)內(nèi)的風(fēng)口。
騰訊覓影高級研究員江鋮表示,騰訊最近正式對外發(fā)布了AI乳腺癌癥診斷系統(tǒng)。選擇乳腺癌這個領(lǐng)域有兩個考慮,一是因為對于女性來說乳腺癌是所有腫瘤當(dāng)中發(fā)病率最高的一種,發(fā)病率約在16%-17%之間,嚴(yán)重危害女性的健康;二是因為乳腺癌雖然發(fā)病率很高,但是治愈率是較好。如果在較早期發(fā)現(xiàn)治愈的可能性非常高,對于美國來說目前五年的生存率是在89%,而中國只有83%。這主要是因為中國人口基數(shù)過多,有經(jīng)驗的看片醫(yī)生較為缺乏,而目前應(yīng)用AI技術(shù)就能夠有效緩解這個矛盾,最大限度地幫助患者和醫(yī)生。
現(xiàn)在對乳腺癌的診斷主要依賴超聲、鉬靶、核磁共振、病理和基因等,騰訊云的目標(biāo)是能夠把這些數(shù)據(jù)模態(tài)有機(jī)結(jié)合起來,形成一個完整的體系,從而提高對乳腺癌的診療技術(shù)。當(dāng)前最主流和有效的篩查診斷方式是鉬靶,騰訊的AI鉬靶乳腺癌診斷系統(tǒng)已經(jīng)發(fā)布,并已經(jīng)落地到30多家三甲醫(yī)院進(jìn)行試用。
騰訊云在乳腺鉬靶主要實現(xiàn)了三方面的功能。第一是實現(xiàn)了疑似病灶的定位;第二是提供乳房的良惡性判定;第三是能夠自動生成影像報告。
這三方面的功能是如何實現(xiàn)的呢?主要基于一個包括三個維度的技術(shù)框架。其中架構(gòu)前端是鉬靶影像的前處理層;中間層是AI學(xué)習(xí)模型;最后是通過醫(yī)生反饋對前兩部分進(jìn)行的動態(tài)更新。
在中間層AI學(xué)習(xí)模型上,騰訊云單獨設(shè)計的方案有四個突出優(yōu)點。第一是傳統(tǒng)的網(wǎng)絡(luò)輸入通常都是單圖輸入,而現(xiàn)在的方案可實現(xiàn)對左右乳進(jìn)行對比的四張圖同時輸入;第二是采用多尺度網(wǎng)絡(luò),使得圖片輸入網(wǎng)絡(luò)前無須縮放;第三是漸進(jìn)式的網(wǎng)絡(luò)構(gòu)建,這種方式類似大腦學(xué)習(xí)過程,它把疑難問題分解成若干個相對簡單的問題然后逐個解決,在構(gòu)建網(wǎng)絡(luò)時由局部到整體,由單幅圖像到多幅圖像;第四是自步學(xué)習(xí)的訓(xùn)練方式,類似于大腦由易到難的學(xué)習(xí)方式,先將訓(xùn)練的樣本按難易程度進(jìn)行分類,在訓(xùn)練過程當(dāng)中由易到難逐步把樣本加進(jìn)去,對模型進(jìn)行多輪訓(xùn)練,這可以讓模型達(dá)到最好效果。
除了基礎(chǔ)模型,根據(jù)醫(yī)生的反饋,對于新接入醫(yī)院的數(shù)據(jù)會對模型進(jìn)行遷移學(xué)習(xí),實現(xiàn)動態(tài)更新。在模型訓(xùn)練的過程中,有一個重要發(fā)現(xiàn)=——AI見過的疑難病例的數(shù)量和種類很大程度上決定了AI系統(tǒng)的上限。為此是定期從數(shù)據(jù)庫和線上數(shù)據(jù)中挖掘有價值的疑難病例,并進(jìn)行標(biāo)注。同時,其中的一部分病倒還會與三甲醫(yī)院專家討論,利用病理或者其他數(shù)據(jù)進(jìn)行交叉確認(rèn)。
現(xiàn)在,騰訊鉬靶AI模型已經(jīng)達(dá)到了非常高的精度。其中,腫塊探測方面可以達(dá)到90.2%@0.2FP;鈣化檢測精度更高,可以達(dá)到99%@0.2FP;對于良惡性分類,可以達(dá)到87%的敏感度和96%的特異度。
除了鉬靶外,對于病理方面也開展了相應(yīng)的研究。目前乳腺癌病理研究主要解決兩方面,第一個是功能組織學(xué)分級,即定義惡性腫瘤惡性的程度,它包含核分裂計數(shù)、核多行性打分、腺管形成程度三項內(nèi)容;第二是免疫組化,使用不同染色片進(jìn)行分子分型研究。對于已經(jīng)完成的有絲分裂部分,在學(xué)術(shù)界TUPAC專業(yè)比賽上,之前的冠軍F1 score分值為0.73,現(xiàn)在騰訊的鉬靶AI系統(tǒng)可以達(dá)到0.82,提升很明顯。這個精度的提升是歸功于三方面的技術(shù)。第一點是使用了計算機(jī)的難例挖掘方式。經(jīng)過多輪迭代然后在每一輪次對樣本進(jìn)行整理,由專家確認(rèn)較難的標(biāo)注,再放入樣本當(dāng)中進(jìn)一步學(xué)習(xí);第二點是圖像的歸一化,通過使用對抗網(wǎng)絡(luò)將圖像做歸一化,達(dá)到提升;第三點是在速度上改進(jìn),拋棄原始計算機(jī)視覺當(dāng)中將一整幅圖切分的方式,采用共享計算和模型壓縮的效果,讓一幅病理片可以達(dá)到0.5秒級的處理速度,基本上接近于實時。
在核磁共振方面,騰訊也進(jìn)行了相應(yīng)的研究,開發(fā)了一種半自動的高效病灶標(biāo)注工具。除此以外,騰訊還在超聲方向投入人力,拓展研究邊界,目前已經(jīng)完成了數(shù)據(jù)準(zhǔn)備工作。后期將繼續(xù)對各模態(tài)數(shù)據(jù)展開深入研究,致力于把多模態(tài)的數(shù)據(jù)有機(jī)結(jié)合起來,造?;颊吆歪t(yī)生。
江鋮的演講之后,已經(jīng)是傍晚時刻,現(xiàn)場開發(fā)者參與提問和交流的熱情依然不減。此次沙龍活動,現(xiàn)場五位專家的演講都聚焦在AI具體場景的應(yīng)用案例,不僅給開發(fā)者們帶來了理念上的啟迪,同時騰訊云開放的AI能力也能夠?qū)嵸|(zhì)性地幫助開發(fā)者們實現(xiàn)便捷開發(fā),把AI技術(shù)擴(kuò)散到更多的應(yīng)用場景中。
-
AI
+關(guān)注
關(guān)注
88文章
37050瀏覽量
290111 -
騰訊
+關(guān)注
關(guān)注
7文章
1682瀏覽量
50698
原文標(biāo)題:大伽「趣」說AI:騰訊云在多個場景中的AI落地實踐
文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論