每日經濟新聞 2023-09-22 14:49:20
◎醫療衛生領域的“不可能三角”理論認為,在既定的約束條件下,一個國家的醫療系統難以同時兼顧提高醫療服務質量、可及性和價格。但在王仕銳看來,生成式AI或給“不可能三角”提供了一個解法。生成式醫療AI可以接待上千萬的患者,做到隨時隨地、無限供應。
每經記者 陳星 王佳飛 每經編輯 文多
在生成式AI技術出現之前,AI看病更多是一個“空想”。往往在做完一連串選擇題后,患者才能拿到一個似是而非的診斷結果,甚至比不上去醫院排隊后的看病5分鐘。
但生成式AI給這一藍圖中的世界帶來了一絲可能性。今年5月,互聯網醫療平臺“醫聯”開發了國內首款醫療大語言模型——MedGPT(Med指醫學,GPT即基于Transformer網絡結構的預訓練語言模型)。醫聯創始人、CEO王仕銳接受《每日經濟新聞》記者獨家專訪時表示,這一模型或為解決醫療的“不可能三角”(醫療系統難以同時兼顧提高醫療服務質量、增加醫療服務可及性和降低醫療服務價格)帶來了新的答案。
今年6月30日,醫聯在醫院搭起了線下義診,將患者的主訴分別傳達給真人醫生與AI醫生,并完成開單診斷和出具治療方案全流程。最后,專家打分結果顯示,AI醫生與三甲主治醫生在比分結果上的一致性達到96%。
生成式AI聽懂了患者說話
在生成式AI出現之前,AI看病是一個“想象很美好、現實很骨感”的愿望。2018年,互聯網醫療平臺醫聯曾應用自然語言處理(NLP)、計算機視覺(CV)等AI技術,落地了一系列醫療應用場景。其中包括智能健康終端、智能分診等——這是智能醫助的“雛形”。
但彼時智能醫助的嘗試“是失敗的”。由于當時的診斷決策信息收集主要通過選擇題完成,長達四五十項的冗長內容,讓用戶和醫生都不買單。醫聯團隊意識到,AI或許就是打開醫療服務時間、空間和人力限制的大門,但苦于找不到打開這扇門的鑰匙。
在團隊一度受挫時,ChatGPT出現了。大語言模型就像“最后一塊拼圖”,醫聯團隊開發了MedGPT,并于今年5月正式發布。
7月20日的采訪中,王仕銳這樣描述MedGPT:“在我們看到的所有報道、學術期刊里,MedGPT(出現的價值)應該是:第一次有了一個AI醫生能夠像人類醫生一樣,對患者進行多輪問詢、鑒別診斷,出具檢測意見并且讀取報告,最后給到精確的治療方案。這個過程全程模仿真實場景,不僅是國內首個,應該也是全球首個。”
圖片來源:醫聯官網
“我現在每天都泡在這個事情里面,因為這就是未來。”王仕銳難掩興奮。
但在生成式AI出現以前,自然順暢的AI疾病診療流程曾被視為一個難以突破的瓶頸。
“其中最難的一點應該是AI技術對人類真實自然語義的理解。”王仕銳說道。自然語音處理不好,機器就聽不懂患者的話,只能通過冗長的選擇題排除可能存在的病因,最后下疑似診斷,用戶體驗隨之大打折扣。此外,即使機器能夠讀懂人類語言,也未必能夠像一個真的醫生一樣直接做排除法,用直覺和經驗進行判斷推論,這個過程我們稱之為思維鏈。如何從若干個可能性中找到一個最有可能性的診斷,是一個非常大的難題。
底層技術的革新首先突破了“讀懂”這一難關,基于Transformer架構的大語言模型出來之后,與自然語言的溝通能力、識別能力相關的問題就自然解決了。但在醫療領域,AI技術應用的準確性和一致性至關重要。要提升這一點,還需要更多算法及指令要求機器收斂判斷,避免誤診或過度診療。“比如醫學檢驗報告可能有影像、文字,包含不同劑量、單位、符號,涉及病理、生化各類指標,如何準確地讀取檢測報告涉及大量統一標準的工作。并且醫學標準指南也在不斷更新,所以這對于及時更新數據庫提出了較高的要求。”王仕銳說。
據了解,MedGPT主要由兩個系統組成:大模型系統與專家系統。其中,大模型完成了60%的工作,專家系統完成最終的40%,以此來不斷優化醫學的準確性、有效性。截至目前,MedGPT每個月仍要檢測超3000個病例,然后由100位人類醫生對每個病例的診斷進行打分反饋。“每個月收到的反饋有2000多條”。
“這些反饋包括但不限于——系統問多了,問題針對性不強,提到了國內沒有的藥品,沒有注意到患者的藥品偏好,檢測是不是必須一次性全部做完等等?,F在我們認為MedGPT還有很多有待優化的地方。”王仕銳坦言。
今年6月30日,醫聯做了這樣一件事——在醫院搭起了線下義診,由醫生助理與患者面對面溝通,將患者的主訴分別傳達給真人醫生與AI醫生,多輪溝通之后,“醫生們”為患者開具檢查單或診斷,患者現場完成檢查后復診,再由AI醫生及真人醫生提供臨床診斷及治療方案。
最后,來自北大人民醫院、中日友好醫院等醫院的7位專家教授,從多個評價維度對這些有效病例進行打分。結果顯示,真人醫生綜合得分為7.5分,AI醫生綜合得分為7.2分——AI醫生與三甲主治醫生在比分結果上的一致性達到了96%。
“如果從病種覆蓋度、智能化、準確性和銷量四個維度衡量,MedGPT的分數應該分別是9分、6分、8.5分和9分。”王仕銳介紹。
測評現場 圖片來源:醫聯官網
機器永遠不會比人類更關心人類
美國耶魯大學教授William Kissick曾提出醫療衛生領域的“不可能三角”理論,這一理論是指,在既定的約束條件下,一個國家的醫療系統難以同時兼顧提高醫療服務質量、增加醫療服務可及性和降低醫療服務的價格。
但在王仕銳看來,生成式AI或給“不可能三角”提供了一個解法。
他認為,生成式醫療AI可以接待上千萬的患者,做到隨時隨地、無限供應。隨著持續訓練,醫療AI的水平還會以月為單位提升,“現在我們認為MedGPT基本上達到了10年至15年臨床經驗的醫生水平,未來每個月可能會提升一到兩年的臨床經驗。”由此,醫療服務的可及性和服務質量得以借助AI這一工具得到兼顧。
在成本上,王仕銳表示,現在使用MedGPT完成一次完整的就診流程成本不超過1美元,此后每18個月成本會減半。
對于互聯網醫療而言,生成式AI帶來了新的可能性。王仕銳表示,互聯網醫療即將進入數字醫療時代。初始狀態時,互聯網醫療是以平臺作為鏈接,實現信息的匯聚和分發,但對“不可能三角”的幫助是有限的。AI的爆發使互聯網醫療從鏈接者變為了生產力的創造者,是一個能夠覆蓋更多患者的原始生產力,這才能真正地解決問題。
但AI始終無法避開的一個問題是——AI與人的關系。在醫療領域,則是AI技術與人類醫生的關系是什么樣的?
王仕銳認為,人類醫生有兩個層面永遠無法被替代。
圖片來源:視覺中國
第一個層面是只有人類醫生才能夠做真正的深度研究。醫學要進步要依靠解決疑難雜癥、罕見病、新發疾病,而以目前的AI技術水平來說,還需要真正的人類醫學專家去設定背后的算法規則。臨床指南、案例研究,這件事情必須人類醫學從業者去完成。但反過來,AI可以幫助人類醫學專家快速地搜集疾病案例和數據,將其匯聚起來供專家參考和攻克。
第二個層面是針對大量的基層、年輕醫務工作者,醫療AI可以扮演數據庫、知識庫的角色。
王仕銳介紹:“現在培養一個合格的醫生要花費很多年,本科到博士加上規培要花費數十年,千辛萬苦才能達到合格的水平。借助醫療AI,年輕醫生可以迅速成長起來并提升診療效率。”
在采訪最后,王仕銳說:“機器永遠不會比人類更關心人類。機器可以扮演得力的助手,但最后確認診療方案的、在方案上簽字的,一定是我們具有行醫資格的專業醫生,他們要為患者兜底”。
記者|陳星 王佳飛
編輯|文多
視頻編輯|韓陽
視覺設計|帥靈茜
統籌編輯|易啟江
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP