Madhu Nair博士和Asha Das博士即將取得巨大突破,即利用人工智能(AI)模型在從患者組織樣本中獲取的掃描圖像中檢測乳腺癌細(xì)胞。
然而,這兩位來自印度的研究人員面臨著巨大的挑戰(zhàn)。通常,他們需要花費數(shù)月的時間,艱難地教他們的AI模型去準(zhǔn)確地識別癌細(xì)胞。而Das與她的團(tuán)隊經(jīng)常需要耗費數(shù)周來審閱高分辨率、百萬像素的圖像,并逐一標(biāo)記出癌變區(qū)域。
因此,該團(tuán)隊需要一個能夠在無人監(jiān)督的情況下,準(zhǔn)確、快速掃描這些圖像的解決方案。
針對這種情況,英特爾提供了幫助。
2022年,來自印度科欽科技大學(xué)人工智能與計算機視覺實驗室的研究人員Madhu Nair博士和Asha Das博士與英特爾工程、銷售及市場團(tuán)隊展開合作,利用英特爾?至強?可擴(kuò)展處理器,以及充分利用英特爾CPU加速功能的英特爾? TensorFlow優(yōu)化軟件套件,打造了一個全新的解決方案。
高需求之下,GPU力有不逮
目前,乳腺癌早期跡象的發(fā)現(xiàn)很大程度上依賴于放射科醫(yī)生以及負(fù)責(zé)手動掃描組織病理學(xué)結(jié)果醫(yī)生的專業(yè)知識。然而,僅僅依靠人眼存在弊端。根據(jù)美國國家癌癥研究所的數(shù)據(jù),約20%的乳腺癌跡象正在被遺漏。
而AI在這方面可以提供很好的幫助。隨著近期算力技術(shù)的突破,越來越多的醫(yī)院開始熱衷于使用AI來發(fā)現(xiàn)醫(yī)生可能錯過的跡象。12月,英特爾與賓夕法尼亞大學(xué)醫(yī)學(xué)院聯(lián)合宣布,其已幫助研究人員將癌性腦瘤的檢測率提高了33%。
Das表示,她的團(tuán)隊首先采用了基于GPU的解決方案以提升其深度學(xué)習(xí)模型。然而,他們發(fā)現(xiàn),由于處理大型圖像所需的計算量遠(yuǎn)遠(yuǎn)超過了系統(tǒng)的設(shè)計極限,其基于GPU的系統(tǒng)經(jīng)常會卡頓,甚至毫無原因地出現(xiàn)死機或重啟的情況,令人十分沮喪。
"我們的模型在計算上要求很高,我們試圖用GPU來訓(xùn)練模型的嘗試以失敗告終",Nair寫道,"我們耗費了數(shù)日進(jìn)行執(zhí)行,并且發(fā)現(xiàn)GPU很難完成更高分辨率圖像的訓(xùn)練,因此,我們不得不探尋更好的計算設(shè)施"。
英特爾通過硬件及軟件提供服務(wù)
2022年,Nair發(fā)現(xiàn)了英特爾或許能夠提供幫助。當(dāng)時,他與一位戴爾員工正在就另一個研究項目進(jìn)行會面,Nair提出了他所面臨的挑戰(zhàn),而戴爾則將Nair介紹給了英特爾印度團(tuán)隊。
幾個月后,他們部署了四臺服務(wù)器,在沒有任何深度學(xué)習(xí)加速器的情況下,作為單一的計算集群運行。這些服務(wù)器和存儲使用高速以太網(wǎng)網(wǎng)絡(luò)進(jìn)行連接。
在軟件方面,該聯(lián)合團(tuán)隊采用了英特爾? TensorFlow優(yōu)化,該軟件套件通過利用英特爾CPU的加速功能來提升TensorFlow的性能。
"我與英特爾團(tuán)隊分享了我們的問題,非常高興他們迅速理解了這項工作的重要性",Nair表示,"他們給了我們使用這種分布式架構(gòu)的機會。"
Asha Das博士,印度科欽科技大學(xué)人工智能與計算機視覺實驗室的研究員。利用英特爾的硬件和軟件,其與Madhu Nair博士打造了基于CPU的解決方案,能夠在醫(yī)療圖像上檢測出乳腺癌的早期跡象。
Madhu Nair博士,印度科欽科技大學(xué)人工智能與計算機視覺實驗室的研究員。利用英特爾的硬件和軟件,其與Asha Das博士打造了基于CPU的解決方案,能夠在醫(yī)療圖像上檢測出乳腺癌的早期跡象。
新的解決方案不僅準(zhǔn)確而且快速
這些結(jié)果正是研究人員所期待的,而且還有一個超乎預(yù)期的收獲:他們的模型不僅能標(biāo)記出癌細(xì)胞,還能區(qū)分出不同等級的癌癥。
而且它非常準(zhǔn)確:該解決方案達(dá)到了98%的準(zhǔn)確率--比其他模型好約10個百分點。(了解更多關(guān)于該解決方案的信息:CUSAT通過深度學(xué)習(xí)改善癌癥篩查結(jié)果)。
這是個一開始就設(shè)定的高標(biāo)準(zhǔn)。
此后,該團(tuán)隊在更多的數(shù)據(jù)集上訓(xùn)練其模型,研究人員預(yù)計這一準(zhǔn)確率將逐步上升。
"英特爾的架構(gòu)非常‘神奇’",Nair表示,"我們能夠在幾個小時內(nèi)完成訓(xùn)練,這其中有很多原因。因為服務(wù)器有192GB的內(nèi)存,比顯卡上的40GB或80GB還要多,而且我們能夠使用高分辨率的圖像,并將整個模型裝入內(nèi)存。此外,英特爾還幫助我們改進(jìn)模型,并與我們共同優(yōu)化,以保證其正常運行。"
Das指出,考慮到相較于其他模型所需的訓(xùn)練數(shù)據(jù)要少得多,這一準(zhǔn)確性結(jié)果更加令人印象深刻,而且極大縮短了反饋時間。她補充道:“我們對結(jié)果非常滿意?!?/p>
"我們能夠在只擁有20%被注釋數(shù)據(jù)的情況下,收獲98%的準(zhǔn)確率,這很了不起,而且很令人興奮。"
即將在你身邊的病理中心出現(xiàn)
接下來,對于這項技術(shù)而言,團(tuán)隊將等待以確保能獲得專利,并與愿意顛覆一個習(xí)慣于人工干預(yù)的市場領(lǐng)域的商業(yè)合作伙伴達(dá)成合作。對此,Das分享了一些可能需要咨詢多位病理學(xué)家的掃描結(jié)果,每位病理學(xué)家根據(jù)他們不同的經(jīng)驗提供自己的結(jié)論。
還有一個問題是準(zhǔn)確性。雖然98%的準(zhǔn)確率可能看起來很高,但對于實際應(yīng)用來說,它依然不夠精確。
現(xiàn)在,Das和Nair都已經(jīng)證明他們的模型能夠可靠地檢測乳腺癌細(xì)胞,他們正在研究將類似的方法,應(yīng)用于腦動脈瘤和對內(nèi)窺鏡檢查中的息肉分類。
Das指出:"我們還計劃擴(kuò)展這個模型,以檢測多器官癌癥",她補充說,因為乳腺癌經(jīng)常擴(kuò)散到手臂下的鄰近淋巴結(jié),所以她現(xiàn)在正在努力擴(kuò)展這個解決方案,以分析淋巴結(jié)圖像。
Nair表示:"我們很感謝英特爾的支持,而且也期待未來能展開更多類似的合作。"