?
產(chǎn)前超聲檢查能夠有效預(yù)防和降低出生缺陷,受到了越來(lái)越多家庭的重視。然而傳統(tǒng)的產(chǎn)前超聲檢查對(duì)于醫(yī)師的專業(yè)能力要求較高,且耗時(shí)耗力。針對(duì)這些問(wèn)題,深圳開(kāi)立生物醫(yī)療科技股份有限公司(以下簡(jiǎn)稱:開(kāi)立醫(yī)療)推出了基于人工智能(AI)技術(shù)的 S-Fetus 4.0 產(chǎn)科掃查助手1,能夠有效簡(jiǎn)化工作流程,減輕醫(yī)師負(fù)擔(dān),并為患者提供更好的診療服務(wù)。
為提升性能表現(xiàn),開(kāi)立醫(yī)療在基于英特爾 酷睿 i7 處理器的平臺(tái)上使用英特爾 oneAPI Base 工具包進(jìn)行跨架構(gòu)開(kāi)發(fā)與優(yōu)化,從而實(shí)現(xiàn)更高的經(jīng)濟(jì)性、跨架構(gòu)擴(kuò)展性和靈活性。
?
背景
智能超聲診斷面臨諸多挑戰(zhàn)
超聲診斷是一種將超聲檢測(cè)技術(shù)應(yīng)用于人體,通過(guò)測(cè)量了解生理或組織結(jié)構(gòu)的數(shù)據(jù)和形態(tài),進(jìn)而發(fā)現(xiàn)疾病、做出提示的一種診斷方法2,現(xiàn)已成為人類疾病診療、尤其胎兒產(chǎn)前篩查重要的影像學(xué)診療手段。但是,傳統(tǒng)超聲檢查高度依賴醫(yī)師經(jīng)驗(yàn)水平,且手動(dòng)操作效率低下,給醫(yī)師和醫(yī)院帶來(lái)諸多困擾。
為解決上述問(wèn)題,開(kāi)立醫(yī)療推出基于人工智能技術(shù)的智能診斷超聲解決方案,在方案開(kāi)發(fā)過(guò)程中遇到了如下挑戰(zhàn):
如何進(jìn)一步優(yōu)化性能
相關(guān)的深度學(xué)習(xí)算法眾多且需要協(xié)同工作,以幫助醫(yī)療機(jī)構(gòu)快速處理不同數(shù)據(jù)類型的任務(wù),并根據(jù)場(chǎng)景無(wú)等待地最優(yōu)執(zhí)行用戶發(fā)起的任務(wù)。這對(duì)于超聲終端的算力、算法優(yōu)化均帶來(lái)了較高要求。
如何應(yīng)對(duì)移動(dòng)應(yīng)用需求
目前搭載了 S-Fetus 4.0 產(chǎn)科掃查助手的開(kāi)立醫(yī)療超聲診斷系統(tǒng)為移動(dòng)型系統(tǒng),對(duì)于系統(tǒng)整體的功耗、尺寸有著較高的限制,這給獨(dú)立 GPU 的部署帶來(lái)了很大的挑戰(zhàn)。
如何面向不同場(chǎng)景實(shí)現(xiàn)跨架構(gòu)擴(kuò)展
S-Fetus 4.0 產(chǎn)科掃查助手需要跨多種架構(gòu)進(jìn)行遷移和擴(kuò)展,以應(yīng)對(duì)多種復(fù)雜場(chǎng)景。
解決
使用英特爾 oneAPI工具包
優(yōu)化超聲診斷
為應(yīng)對(duì)上述挑戰(zhàn),開(kāi)立醫(yī)療與英特爾合作,探索通過(guò)英特爾 oneAPI Base 工具包對(duì) S-Fetus 4.0 產(chǎn)科掃查助手進(jìn)行優(yōu)化。
硬件層面
在硬件層面,方案采用了基于第 11 代英特爾 酷睿 i7 處理器的算力基礎(chǔ)架構(gòu)。該處理器實(shí)現(xiàn)了更出色的執(zhí)行性能,搭載全新內(nèi)核和顯卡架構(gòu),并具備基于人工智能的智能性能,能夠?yàn)楦鞣N工作負(fù)載提供卓越性能。該處理器具備英特爾 深度學(xué)習(xí)加速(英特爾 DL Boost)技術(shù),可為 AI 引擎提供強(qiáng)大支持,為人工智能、數(shù)據(jù)分析等多種復(fù)雜負(fù)載提供出色的性能支撐。
第 11 代英特爾 酷睿 處理器還集成了英特爾銳炬 Xe 顯卡,充分利用該集成顯卡來(lái)提升工作負(fù)載的性能。此外,這一顯卡還能夠支持多種數(shù)據(jù)類型,并采用了低功耗架構(gòu)。
解決方案的數(shù)據(jù)處理流程如圖 1 所示。其中英特爾銳炬 Xe 顯卡提供數(shù)據(jù)密集計(jì)算核,負(fù)責(zé)實(shí)時(shí)識(shí)別追蹤流程,實(shí)現(xiàn)高頻實(shí)時(shí)執(zhí)行(每一幀圖像都要進(jìn)行處理或智能推理)。英特爾 酷睿 i7 處理器負(fù)責(zé)標(biāo)準(zhǔn)面決策及調(diào)度、自適應(yīng)切面特征提取、量化分析等流程,執(zhí)行業(yè)務(wù)邏輯或空閑期執(zhí)行 AI 推理。

圖1 基于英特爾 酷睿 處理器的
開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手方案架構(gòu)圖
軟件工具優(yōu)化
多模態(tài)數(shù)據(jù)優(yōu)化處理作為一個(gè)數(shù)據(jù)密集與邏輯判斷相結(jié)合的模塊,開(kāi)立醫(yī)療與英特爾使用英特爾 oneAPI 工具包,重點(diǎn)針對(duì)這一環(huán)節(jié)進(jìn)行了 4 個(gè)方面的優(yōu)化。優(yōu)化后,開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手可以靈活調(diào)用 CPU 和 iGPU 的資源,大幅提升了性能,在滿足業(yè)務(wù)需求的同時(shí),改善了超聲用戶體驗(yàn)。
優(yōu)化一
開(kāi)立醫(yī)療使用英特爾 VTune Profiler 對(duì)工作負(fù)載進(jìn)行分析,隨后通過(guò)英特爾 oneAPI 工具包中的 DPC++ 編譯器對(duì)代碼進(jìn)行重新編譯并生成向量化指令以提升性能。通過(guò)這種方式,將工作負(fù)載的處理速度從 141ms 大幅縮短到 33ms3。

圖2 標(biāo)量操作 Vs 向量操作
■ 優(yōu)化二
通過(guò)英特爾 VTune Profiler 進(jìn)一步發(fā)現(xiàn)性能瓶頸后,開(kāi)立醫(yī)療使用英特爾 Integrated Performance Primitives(英特爾 IPP)中的 API 對(duì)其進(jìn)行替換。通過(guò)這一步驟的優(yōu)化,開(kāi)立醫(yī)療將工作負(fù)載的處理速度從 33ms 進(jìn)一步縮短到 13.787ms4。
■ 優(yōu)化三
通過(guò)使用英特爾 IPP 替換源碼中的 openCV 函數(shù),應(yīng)用代碼在各代英特爾平臺(tái)上均能夠很好地運(yùn)行,并在大規(guī)模數(shù)據(jù)場(chǎng)景下表現(xiàn)出更好的可擴(kuò)展性。
■ 優(yōu)化四
S-Fetus 4.0 產(chǎn)科掃查助手應(yīng)用了英特爾 DPC++ Compatibility Tool,將現(xiàn)有的 CUDA 代碼高效地遷移到DPC++ 代碼,從而實(shí)現(xiàn)跨架構(gòu)運(yùn)行,大幅縮短了代碼遷移時(shí)間

圖3 英特爾 DPC++ Compatibility Tool 工作流程圖
通過(guò)上述優(yōu)化,開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手在基于英特爾 oneAPI DPC++ 的異構(gòu)平臺(tái)上的性能較優(yōu)化前的基準(zhǔn)性能數(shù)據(jù),實(shí)現(xiàn)了近 20 倍的性能提升(具體性能數(shù)據(jù)見(jiàn)圖 4)5。

圖4 使用英特爾 oneAPI 異構(gòu)平臺(tái)優(yōu)化前后的性能對(duì)比6
收益
卓越的性能與跨架構(gòu)擴(kuò)展能力
通過(guò)采用集成英特爾銳炬 Xe 顯卡的英特爾 酷睿 處理器提供底層算力,并使用英特爾 oneAPI 異構(gòu)平臺(tái)進(jìn)行優(yōu)化,開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手實(shí)現(xiàn)了性能、經(jīng)濟(jì)性和異構(gòu)擴(kuò)展性等方面的兼顧:
● 高性能:通過(guò)基于英特爾 oneAPI 工具包的英特爾 XPU 混合架構(gòu)開(kāi)發(fā),開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手實(shí)現(xiàn)了近 20 倍的性能提升,為高效的產(chǎn)科智能超聲診斷奠定了堅(jiān)實(shí)的基礎(chǔ)7。
● 更優(yōu)成本:得益于英特爾 酷睿 處理器的強(qiáng)大性能和靈活架構(gòu),以及全方位的優(yōu)化,開(kāi)立醫(yī)療只需使用 CPU + iGPU就可以實(shí)現(xiàn)預(yù)期的性能指標(biāo)。同時(shí),由于硬件的精簡(jiǎn),供電、散熱、空間等成本顯著降低,使得其可以搭載在尺寸更小的超聲診斷設(shè)備中,更靈活地應(yīng)對(duì)不同場(chǎng)景的需求。此外,CPU + iGPU 的組合也意味著更持久的電池續(xù)航時(shí)間,以及更高的穩(wěn)定性與可靠性。
● 異構(gòu)擴(kuò)展性:該方案能夠在 CPU、iGPU 等異構(gòu)化硬件上進(jìn)行統(tǒng)一編程,有效提升跨架構(gòu)編程的開(kāi)發(fā)效率,支持開(kāi)立醫(yī)療 S-Fetus 4.0 產(chǎn)科掃查助手靈活地在不同的硬件配置中運(yùn)行,同時(shí)確保流暢的用戶體驗(yàn)。
展望
加速 “AI + 醫(yī)療” 的落地
智能超聲診斷是 “AI + 醫(yī)療” 的重要場(chǎng)景,有助于大幅減少醫(yī)生工作量,提升醫(yī)療業(yè)務(wù)流程效率。為了推動(dòng) “AI + 醫(yī)療” 技術(shù)的落地,英特爾正在與開(kāi)立醫(yī)療等伙伴合作,通過(guò)包含 CPU、iGPU、專用加速器以及 FPGA 的 XPU 混合架構(gòu),以及英特爾 oneAPI 工具包等軟硬件產(chǎn)品,加速數(shù)字化創(chuàng)新,推動(dòng)更多智慧化產(chǎn)品與方案在醫(yī)療行業(yè)的落地。
原文標(biāo)題:英特爾助力開(kāi)立醫(yī)療推動(dòng)超聲產(chǎn)檢智能化
文章出處:【微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處?!?/p>
電子發(fā)燒友App














評(píng)論