阻止糖尿病引發失明,加速乳腺癌切片檢測!Google 深度神經網路助醫師、病患跟時間賽跑

 

在不遠的將來,機器學習(Machine Learning)與深度神經網路(Deep Neural Network, DNN)究竟能為和我們休戚與共的醫療檢測領域,帶來何等關鍵性的改變?

 

8 月 8 日,開源機器人俱樂部受邀參加 「Google 機器學習系列:醫療應用」媒體聚會,兼具化工、醫學、生物工程跨領域背景的 Google 研究團隊產品經理彭浩怡博士(Lily Peng)和 Google 台灣區分公司總經理簡立峰博士,為全世界和台灣本土科技與醫療相結合的未來,勾勒出清晰的藍圖。

 

 

Google 機器學習系列媒體聚會-醫療應用.png

 

 

具執業醫師資格的彭浩怡,畢業於美國史丹佛大學化學工程系,同時擁有加州大學舊金山分校醫學博士(M.D.)及加州大學柏克萊分校生物工程博士學位(Ph.D.)。今年 5 月,Google 年度開發者大會I/O 2017 前夕,她即代表介紹以 Google 開源機器學習系統 TensorFlow 在印度協助檢測糖尿病視網膜病變(Diabetic Retinopathy, DR)的成功案例。

 

彭浩怡指出,由於可供訓練的真實世界數據集(real-life data set)數量大幅增加,加上電腦運算能力向上提升,深度神經網路近年來成為視覺、語言識別及理解上的最被廣泛運用的方式。這一點從每年舉行的「ImageNet 圖像標籤挑戰」賽事趨勢可見端倪:2011 年是最後一次由「非深度神經網路技術支援的」團隊獲勝;2015 年,深度神經網路的圖樣辨識能力,更已達到與人類相仿的水準。

 

 

Google 深度神經網路醫療應用-Lily Peng.png

 

 

除精確度以外,卷積神經網路(Convolutional Neural Network, CNN)的學習結構,也讓影像辨識更有效率。傳統電腦視覺需經過「手動標示圖像特徵」、「淺分類」等多重「特徵工程(feature engineering)」關卡;卷積神經網路只需經過深度學習,即可得到相同的結果,讓研究團隊能夠大幅減少為圖像手動分類的過程,而能將時間花在資料準備、模型架構、數據優化的刀口上。

 

舉例而言,想建立一個能有效分辨熊貓圖片的辨識器,傳統可能要將圖像上白色、黑色分佈的數量一一輸入到淺分類中,曠日費時;現在利用卷積神經網路,只要相同物件超過 5,000 張圖像即可達成,也就是「熊貓」、「非熊貓」的圖像各準備 5,000 張以上,就能藉由深度學習建立起辨識模型。

 

彭浩怡同時分享在過去一年,兩個由 Google 知名的「20% 計劃」延伸、發表的「深度學習應用於醫學成像」的研究專案;其一是前述的糖尿病視網膜病變篩檢,其二則是淋巴結中的乳腺癌轉移檢測。

 

 

Google 深度神經網路醫療應用-糖尿病視網膜病變.png

 

 

全球糖尿病患者現已突破 4.15 億人,而 2015 年印度就已有將近 7,000 萬名成人罹患糖尿病。藉由每年篩檢視網膜眼底圖像,可以有效預防糖尿病引發的失明,然而,印度目前眼科醫師的缺口卻高達 12.7 萬人,導致有 45% 的印度糖尿病患者來不及獲得診斷,飽受失明折磨。

 

Google 研究團隊與美國 EyePACS 及印度三家眼科醫院 Aravind Eye Hospital、Sankara Nethralaya、Narayana Nethralaya 進行合作,匯集超過 128,000 張的視網膜眼底圖像,並在 2015 年聘請 54 名美國專業眼科醫師,以 3 至 7 名醫師為一單位來評估每張圖像是否有糖尿病相關眼疾,作為訓練演算法的深度學習模型數據。

 

之後,在兩個臨床實驗中,Google 研究團隊再將評估過的其中 12,000 張眼底圖像,交由 26 層的卷積神經網路判讀 ,並請另外 8 名美國眼科醫師獨立做出診斷,以驗證神經網路的判別成效。結果演算法的表現與專業醫師的判斷結果,達到高度一致:在統計學上,演算法的 F-Score 值(結合發現病灶的靈敏度 Sensitivity 和判讀準確與否的特異性 Specificity 的度量,最大值為 1)達到 0.95 分,還略高於眼科醫師的 F-Score 中位數 0.91 分!

 

 

Google 深度神經網路醫療應用-高靈敏性高特異性.png  

 

另一方面,由於時間有限、診斷差異性高、需要分析的資料量龐大,每 12 人的乳腺癌切片,就有 1 人可能被誤診,而前列腺癌在 7 人中則有 1 人可能被誤診,整體診斷準確率有時僅達 48%。

 

而在今年 3 月,Google 發表的淋巴結乳腺癌轉移檢測研究初步成果中,Google 研究團隊採用 Inception(又名 GoogLeNet)深度學習法,演算法的腫瘤定位準確值(FROC Score)可達 0.89,不僅超越了病理學家在無判讀時間限制下的腫瘤定位準確值 0.73,在判讀不同醫院、不同掃描儀獲得的圖像之間,泛化能力也相當突出。

 

 

Google 深度神經網路醫療應用-噪音降低.png

 

 

彭浩怡表示,這並不代表演算法將篡奪專業醫師及病理學家的診斷工作,而是人類與機器未來將有望優缺互補,共同為同一目標而努力。比如前述淋巴結乳腺癌轉移切片檢測實驗中,演算法的敏感度為 92%,但假陽性也有 8 處,而病理學家的敏感度雖為 73%,假陽性則是無懈可擊的 0 個;這代表演算法傾向於「過度診斷」,將非病灶也判斷成病灶,人類則較容易「漏診」。除此之外,欠缺人類醫師實務經驗和廣泛統整經驗的演算法,對於「非特定檢測任務」之外的「突發異常狀況(如發炎、自體免疫疾病)」的診斷也有困難。因此,未來要提供病患最理想的醫療檢測結果,最佳解仍是「人機合作」。

 

 

Google 深度神經網路醫療應用-乳腺癌腫瘤辨識.png

 

 

至於使用深度學習進行「非圖像識別」領域的醫療相關研究,Google 近期剛宣布與美國醫療機構合作的血液分析、基因定序發展計劃,都屬此類的例子。今年 2 月,史丹佛大學研究團隊也在 Nature 期刊上發表一篇題為 Dermatologist-level Classification of Skin Cancer with Deep Neural Networks 的論文 ,以 Google 的 TensorFlow 開源機器學習系統來進行皮膚癌的分類研究,代表這已是未來醫學研究的顯著趨勢。

 

除了神經網路技術的不斷精進,Google 目前也正努力尋求開發更好用的檢測硬體(如與尼康 Nikon 及 Alphabet 集團下的生技公司 Verily Life Sciences 合作,開發更易於使用的眼底攝影機),並基於醫療服務標準組織 Health Level Seven International 制定的醫療開放數據標準(Fast Healthcare Interoperability Resources, FHIR),積極推動「醫學資訊標準化」,力求讓醫學成像資訊統一格式,便於演算法的訓練。雖然前述實驗中的視網膜眼底圖像、腫瘤切片圖像,因為整體而言圖像規格差異不大,分析時沒有遇上太大的困難,但未來若要將深度學習推廣到更多疾病的檢測,標準化是必行之道。

 

彭浩怡表示,深度學習若要在未來有效輔助醫療,除了必須將判讀軟體的的功能框架、錯誤率與侷限範圍有效傳達給醫師(畢竟醫師仍然是負責作出最後診斷的人),還需通過「臨床驗證」、「建立信任」、「工作流程(Work Flow)與使用者介面(User Interface, UI)設計」三道關卡;而以上這兩項突破性研究成果,在能夠開始考慮商業發售與生產前,美國食品衛生管理署(FDA)平均也需要五年以上才可能通過審查,因此 Google 這部分的研究仍屬早期階段。即便如此,仍然值得我們期待。

 

 

Google 機器學習系列媒體聚會-醫療應用2.png

 

 

最後,Google 台灣區分公司總經理簡立峰,針對台灣發展深度神經網路醫療應用的優勢及必要性,提出以下幾項要點:

 

 

一、現行深度神經網路的訓練數據需求已經降低,如彭浩怡博士前述所言,只需要不到 13 萬張的視網膜眼底圖像,加上每類約 5,000 張的分類圖像,即可進行訓練,再加上省去繁複「特徵工程」的事前作業(也就是不需要請忙碌的醫師們,長期協助非醫療專業的工程師標示圖像),能有效降低「跨領域」合作門檻,促進交流。

 

二、所有疾病都有「本地特色」,國外適用的病理特徵不一定適用於本國。例如:亞洲糖尿病患者目前佔全球病患人口的 1/4,而台灣就有超過 195 萬名的糖尿病患,幾乎每 8 至 9 位台灣人就有一名糖尿病患者,相關研究有非常急切的需求。

 

另外,台灣長照人力短缺,加上眾多舊公寓「五樓以上無電梯」,使得年長者無法下樓運動、提早老化,如果將自動駕駛車的視覺、圖像識別技術,運用在智慧型輔具(如自動輪椅)的開發,相信能大幅提升老年人的行動力與自主性,有效延緩長照困境。

 

三、相對於國外各醫療院所行政體系獨立,醫療數據不易分享、取得,台灣健保制度下的「高資訊流通性」,讓用以訓練深度神經網路的真實世界數據集,相對更容易建立;倘若因法規因素暫時無法廣為實踐,也可考慮在各醫院體系內部先行。

 

 

簡立峰總結,人工智慧時代來臨,深度學習在預防醫學、輔助診斷上,都可預期產生顯著的效果,但將來的醫療並不是演算法 vs. 醫師的惡性競爭,而是共同合作、各展所長,為人類健康打造更理想的願景。

 

 

 

(以上各病理圖片及彭博士照片,皆來自本次 Google 台灣分公司提供的中文媒體素材,在此感謝!)

 


延伸閱讀

1.
你怕打針嗎?醫療版 Nao 機器人以身作則,教小孩如何打針不怕痛

2.
抽血機器人較人類更為迅速安全

3.
Project Tango: 讓行動裝置擁有人類視覺

4.
再見 GPS!智慧型手機當「大腦」,讓四旋翼自主飛行

[CP 值最好的 AI 人工智慧電腦熱賣中]
硬體採用最新最快的 Titan RTX, RTX-2080Ti-11G, 及 TESLA V100!
視窗圖控介面,易學易用。
硬體優勢:針對深度學習最佳化設計,且經過客戶端 24H 運作驗證。
軟體優勢:事先安裝人工智慧軟體及優化設定,每週提供最新 AI 演算法下載。
公司優勢:專業人工智慧機器人設計公司,資本額一億。
歡迎企業、學校、及公家機關大量採購。
可租用,歡迎來信或來電洽詢。
詳細資料請參閱以下網址: https://tw.leaderg.com/ai_computer