作者 | beyondma
出品 | CSDN博客
根據(jù)最新的新型冠狀病毒疫情通報(bào),截至2月2日22時(shí),國家衛(wèi)生健康委公布確診病例14489例,累計(jì)死亡病例304例,另有疑似病例19544例。為防止疫情擴(kuò)散,全國31省市自治區(qū)已全部啟動重大突發(fā)公共衛(wèi)生事件一級響應(yīng),筆者遙祝各位友人,平平安安,身體健康。做為一名IT從業(yè)者,筆者最佩服的就是信息融合的跨界能力,前文《300秒就完成第一超算1萬年的計(jì)算量,量子霸權(quán)真時(shí)代要來了嗎》曾經(jīng)介紹過,谷歌的科學(xué)家使用機(jī)器學(xué)習(xí)的方法來給量子計(jì)算機(jī)調(diào)優(yōu)參數(shù)。所以在閱讀疫情的相關(guān)材料后,筆者總結(jié)了一下,AI在很多方面應(yīng)該可以跨界,能幫上一些忙。
一、AI診斷醫(yī)學(xué)影像,可能被用于疾病初篩
我看到不明肺炎的診斷標(biāo)準(zhǔn)是:
發(fā)熱(≥38℃);
具有肺炎或急性呼吸窘迫綜合征的影像學(xué)特征;
發(fā)病早期白細(xì)胞總數(shù)降低或正常,或淋巴細(xì)胞分類計(jì)數(shù)減少;
經(jīng)抗生素規(guī)范治療3~5天,病情無明顯改善。
而且鐘南山院士等多名專家也介紹了,此次冠狀病毒肺炎在發(fā)病初起,血常規(guī)檢測結(jié)果幾乎沒有什么有價(jià)值的線索,但是醫(yī)學(xué)影像方面會有異常,由于影像診斷不是量化指標(biāo),很難像血結(jié)果那樣指向明確,人工判斷有一定的難度,而且也如鐘院士所言,冬季流感本來就高發(fā),如果血液檢測沒有定量的結(jié)果,那么僅靠人工進(jìn)行影像學(xué)的篩查,來判斷是否需要進(jìn)一步確診,可能會帶來一定不確定因素。
人工智能在處理醫(yī)學(xué)影像方面這些年來的進(jìn)展還是相當(dāng)不錯(cuò)的,2018年谷歌著名的AI女神李飛飛就曾經(jīng)發(fā)表過一篇針對胸片影像進(jìn)行深度學(xué)習(xí)檢測的論文《Thoracic Disease Identification and Localization with Limited Supervision》(下載地址:https://arxiv.org/pdf/1711.06373v6.pdf)
其模型工作原理也比較簡單,先用Resnet進(jìn)行特征提取,接下來通過全卷積網(wǎng)絡(luò)進(jìn)行分類,輸出每種分類的得分,再使用多實(shí)例學(xué)習(xí)來學(xué)習(xí)多種類型圖像,最后輸出 圖像類別以及對應(yīng)區(qū)域的位置。而且在醫(yī)療影像處理方面,國家大廠也是成績斐然。比如在前年的肺結(jié)節(jié)檢測大賽 (LUNA16)上,阿里云 ET 就在1186 個(gè)肺結(jié)節(jié)(75% 以上為小于 10mm 的小結(jié)節(jié))的樣本中, 在 7 個(gè)不同誤報(bào)率下發(fā)現(xiàn)的肺結(jié)節(jié)平均成功率達(dá)到 89.7%。(注:LUNA大賽中使用召回率,是指在樣本數(shù)據(jù)中成功發(fā)現(xiàn)的結(jié)節(jié)占比,這里使用成功率替代),下圖顯示了 ET 在不同誤報(bào)次數(shù)下的召回率情況。
在模型結(jié)構(gòu)設(shè)計(jì)上,ET 針對醫(yī)學(xué)影像的特性,采用多通道、異構(gòu)三維卷積融合算法、有效地利用多異構(gòu)模型的互補(bǔ)性來處理和檢測在不同形態(tài)上的肺結(jié)節(jié),提高了對不同尺度肺結(jié)節(jié)的敏感性;同時(shí)使用了帶有反卷積結(jié)構(gòu)的網(wǎng)絡(luò)和多任務(wù)學(xué)習(xí)的訓(xùn)練策略,提高了檢測的準(zhǔn)確度。
而去年年末,國內(nèi)頂級AI實(shí)驗(yàn)室騰訊優(yōu)圖,也將醫(yī)療 AI 深度學(xué)習(xí)預(yù)訓(xùn)練模型 MedicalNet (Github地址:https://github.com/Tencent/MedicalNet)正式對外開源,筆者看到這也是首個(gè)開源的能處理3D醫(yī)學(xué)影像的深度學(xué)習(xí)框架。
只要安裝CUDA,從github上將該項(xiàng)目克隆下來。
git clone https://github.com/Tencent/MedicalNet
然后到微云(https://share.weiyun.com/55sZyIx)下載相應(yīng)模型,解壓后既可進(jìn)行訓(xùn)練。
python train.py --gpu_id 0
雖然受時(shí)間限制,筆者還沒有跑完訓(xùn)練腳本。根據(jù)Github上的資料顯示,MedicalNet 提供的預(yù)訓(xùn)練網(wǎng)絡(luò)可遷移到任何 3D 醫(yī)療影像的 AI 應(yīng)用中,包括但不限于分割、檢測、分類等任務(wù)。尤其值得一提的是,MedicalNet 特別在小數(shù)據(jù)醫(yī)療影像 AI 場景,能加快網(wǎng)絡(luò)收斂,提升網(wǎng)絡(luò)性能,這個(gè)特性比較本次疫情確診樣本相當(dāng)稀缺的情況。
二、AI深度學(xué)習(xí),也許對防止超級傳染者有幫助
在鐘南山院士談到本次疫情的防控時(shí)特別提到了要小心超級傳染者的出現(xiàn),而超級傳染者是指一個(gè)人傳染10個(gè)人以上的患者,比如非典期間,廣東一男子染病50天,先后傳染130余人,包括18位親屬及幾十名醫(yī)務(wù)人員,再比如2015年中東呼吸綜合征(MERS)在韓國也出現(xiàn)了一名超級傳染者,先后傳染了數(shù)十幾醫(yī)護(hù)人員及親屬。而如果對于歷次呼吸道感染疫情的患者數(shù)據(jù)進(jìn)行匯總,將傳播能力進(jìn)行分類,這是一個(gè)機(jī)器學(xué)習(xí)的經(jīng)典任務(wù)。不過考慮到樣本的數(shù)量可能不夠,而且在病檔資料中該患者做為傳染源傳染人數(shù)的記錄可能也有缺失,所以利用AI防止超級傳播者的方案未必能夠奏效。最后筆者在這里也號召各位讀者多從技術(shù)角度想想辦法,共克時(shí)堅(jiān),共渡難關(guān)。相信一定能渡過此次疫情。
新時(shí)代鞋服物流與供應(yīng)鏈面臨的變革和挑戰(zhàn)03月07日 20:38
點(diǎn)贊:這個(gè)雙11,物流大佬一起做了這件事11月22日 21:43
物流管理機(jī)構(gòu)及政策分布概覽12月04日 14:10
盤點(diǎn):2017中國零售業(yè)十大事件12月12日 13:57
2017年中國零售電商十大熱點(diǎn)事件點(diǎn)評12月28日 09:58