亚洲狠狠,一级黄色大片,日韩在线第一区视屏,韩国作爱视频久久久久,亚洲欧美国产精品专区久久,青青草华人在线视频,国内精品久久影视免费

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

國(guó)內(nèi)首個(gè)腦血管專病大模型亮相 對(duì)話參與醫(yī)生:最初心里沒有底,后來(lái)AI證明我是錯(cuò)的

每日經(jīng)濟(jì)新聞 2024-09-13 22:55:44

◎醫(yī)師邳靖陶模擬了一個(gè)復(fù)雜的臨床場(chǎng)景,大模型給出的治療方案和預(yù)想的“標(biāo)準(zhǔn)答案”有所出入。而當(dāng)邳靖陶用“標(biāo)準(zhǔn)答案”去匹配臨床指南時(shí),讓他印象深刻的結(jié)果出現(xiàn)了:是自己的診療思路存在盲區(qū)。

每經(jīng)記者 林姿辰    每經(jīng)編輯 張海妮    

距離谷歌大模型(Med-PaLM 2)拿下美國(guó)醫(yī)學(xué)執(zhí)照考試已經(jīng)快兩年了,人工智能(AI)夠資格成為臨床醫(yī)生的“假想敵”了嗎?

今年7月,一篇發(fā)表于Nature Medicine的論文顯示,即使是目前最先進(jìn)的大語(yǔ)言模型(LLM)也無(wú)法為所有患者做出準(zhǔn)確診斷,且診斷正確率(73%)明顯差于人類醫(yī)生(89%);在極端情況(膽囊炎診斷)下,LLM的正確率僅為13%。

但對(duì)于北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心醫(yī)師邳靖陶來(lái)說(shuō),他今年剛被AI“上了一課”。8月下旬,邳靖陶參與的靈犀醫(yī)學(xué)腦血管病專病大模型正式發(fā)布,該模型由其所在醫(yī)院的神經(jīng)中心武劍教授團(tuán)隊(duì)主導(dǎo)研發(fā),是國(guó)內(nèi)首個(gè)基于專病的醫(yī)學(xué)人工智能模型。

“大模型的能力說(shuō)強(qiáng)也強(qiáng),說(shuō)弱也弱,我們不能讓它天馬行空地自由發(fā)揮。”邳靖陶表示,專病大模型與ChatGPT的最大不同,是要將AI杜撰的似是而非的診療建議扼殺在搖籃里,避免災(zāi)難性后果。

清華大學(xué)附屬北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心教授武劍 圖片來(lái)源:受訪者提供 

專病大模型對(duì)標(biāo)基層最缺的??茖<?/h2>

作為國(guó)內(nèi)四大慢病之一,腦血管病的首次發(fā)病者約有2/3是60歲以上的老年人,其具有“高發(fā)病率、高患病率、高死亡率、高復(fù)發(fā)率”的特點(diǎn)。而截至2021年,我國(guó)65歲以上的老年人口已經(jīng)超過(guò)2億人,腦血管病醫(yī)生短缺、水平參差不齊的問(wèn)題尤為突出。

“基層醫(yī)院不缺全科醫(yī)生,但缺專科專家或?qū)2<?,這就是大模型要解決的問(wèn)題。”邳靖陶介紹,腦血管病專病大模型是醫(yī)療機(jī)構(gòu)與科技企業(yè)的合作產(chǎn)物。具體來(lái)說(shuō),新華三集團(tuán)提供技術(shù)人員、AI算法和算力,北京清華長(zhǎng)庚醫(yī)院和清華大學(xué)提供大數(shù)據(jù)和臨床需求,共同打造一款面向臨床醫(yī)生的輔助診斷工具。

武劍教授曾表示,醫(yī)學(xué)人工智能在緩解醫(yī)療資源緊張和提升醫(yī)療服務(wù)水平方面,具有巨大的潛力和優(yōu)勢(shì)。其核心在于對(duì)海量健康數(shù)據(jù)的深度挖掘和智能分析,這能夠大幅提升臨床診斷和治療的準(zhǔn)確性與效率。

目前,這個(gè)大模型的核心功能是分析和提取病歷中的關(guān)鍵信息,并與臨床知識(shí)庫(kù)相匹配,最終提供符合臨床指南的標(biāo)準(zhǔn)化治療建議。

一方面,臨床醫(yī)生可以輸入脫敏(不包括患者個(gè)人信息)的臨床病程信息,由大模型生成最終的治療方案。期間,如果大模型察覺到病程信息存在疏漏,會(huì)提醒醫(yī)生及時(shí)補(bǔ)充,保證病歷記錄的標(biāo)準(zhǔn)化。

另一方面,臨床醫(yī)生也可以輸入患者主訴(如主要癥狀和持續(xù)時(shí)間等信息)等簡(jiǎn)單信息,大模型將通過(guò)選擇性交互引導(dǎo)問(wèn)診方向,根據(jù)醫(yī)生點(diǎn)擊的選項(xiàng),逐步完善臨床診療過(guò)程,提升醫(yī)生的循證能力。

想讓大模型“聽話”,得說(shuō)它“聽得懂”的話

在邳靖陶看來(lái),與ChatGPT等通用大模型相比,專病大模型的專業(yè)性體現(xiàn)在思維鏈和知識(shí)庫(kù)兩方面。以腦血管病專病大模型為例,其數(shù)據(jù)來(lái)源包括兩大部分:一部分是經(jīng)過(guò)脫敏處理的臨床資料,涉及疾病的特定特征,發(fā)病情況以及診療過(guò)程等綜合信息。另一部分是公開獲取的臨床指南、大量神經(jīng)病學(xué)和神經(jīng)科學(xué)的教科書和參考書籍,這些構(gòu)成了數(shù)據(jù)庫(kù)的核心內(nèi)容。值得注意的是,大模型并不能直接接收這些知識(shí),而是需要經(jīng)臨床醫(yī)生和工科團(tuán)隊(duì)之手,將臨床指南的框架和重點(diǎn)內(nèi)容重新整理,轉(zhuǎn)化為計(jì)算機(jī)能夠理解的語(yǔ)言和流程后,再輸給大模型。

“如果不加限制地直接投喂,大模型會(huì)發(fā)散到其他方面,生成一些新的理解。但臨床指南已經(jīng)是最高級(jí)別的標(biāo)準(zhǔn)化診療推薦,在此基礎(chǔ)上的任何修改都是錯(cuò)誤的,也不是我們想要的。”邳靖陶告訴記者,想讓大模型“聽話”,除了要投喂計(jì)算機(jī)能“聽懂”的知識(shí),更關(guān)鍵的是教給它一套臨床醫(yī)生的“思維鏈”,并依托這一能力對(duì)不同患者的臨床資料進(jìn)行推理。

例如,一位腦血管病醫(yī)生的診療流程大致包括詢問(wèn)病史,進(jìn)行體格檢查,考慮輔助檢查,綜合分析后給出準(zhǔn)確診斷等環(huán)節(jié)?;谠\斷結(jié)果,醫(yī)生會(huì)考慮患者的具體病因和其他基礎(chǔ)疾病情況,結(jié)合標(biāo)準(zhǔn)化的診療建議,制定規(guī)范化的治療方案。

在這個(gè)過(guò)程中,不同的患者主訴指向不同的詢問(wèn)方向。但問(wèn)題是,大模型的思維雖然“發(fā)散”,但不具備自主搭建思維鏈的能力,所以需要工科團(tuán)隊(duì)深刻理解臨床診療場(chǎng)景,將醫(yī)生的臨床思維轉(zhuǎn)換為機(jī)器可以理解的思維。而這個(gè)過(guò)程讓臨床醫(yī)生和技術(shù)團(tuán)隊(duì),都經(jīng)歷了交叉學(xué)習(xí)的歷練。

“Gap(差距)主要是語(yǔ)言交流上的障礙,比如我們不理解思維鏈,他們不理解不同疾病間的關(guān)系。但這不會(huì)對(duì)我們的研究造成實(shí)質(zhì)性影響,只要了解對(duì)方領(lǐng)域的基礎(chǔ)知識(shí),就能掃清困難。”邳靖陶說(shuō)。

圖片來(lái)源:受訪者提供 

AI給出預(yù)期相反的診斷,最后發(fā)現(xiàn)醫(yī)生錯(cuò)了

邳靖陶透露,目前腦血管病專病大模型正在北京清華長(zhǎng)庚醫(yī)院神經(jīng)中心進(jìn)行臨床驗(yàn)證。此前,他和同事們?cè)褂谜鎸?shí)病例或模擬復(fù)雜臨床場(chǎng)景,對(duì)大模型進(jìn)行過(guò)內(nèi)部測(cè)試。這項(xiàng)測(cè)試建立在前期簡(jiǎn)單測(cè)試的基礎(chǔ)之上,旨在評(píng)估大模型對(duì)不同復(fù)雜程度、不同語(yǔ)言風(fēng)格和不同級(jí)別醫(yī)生的病歷的理解能力。 

其中,最困擾邳靖陶的一個(gè)問(wèn)題是,如果大模型出現(xiàn)了錯(cuò)誤,怎么保證臨床醫(yī)生不受干擾呢?換言之,臨床醫(yī)生應(yīng)該怎么處理自己和大模型之間的關(guān)系?

這一矛盾在首次內(nèi)部測(cè)試時(shí)就出現(xiàn)了。當(dāng)時(shí),邳靖陶模擬了一個(gè)復(fù)雜的臨床場(chǎng)景,大模型給出的治療方案和預(yù)想的“標(biāo)準(zhǔn)答案”有所出入。隨后,技術(shù)人員介入并回溯了大模型的推理過(guò)程,試圖找出可能的錯(cuò)誤,卻無(wú)功而返。

而當(dāng)邳靖陶用“標(biāo)準(zhǔn)答案”去匹配臨床指南時(shí),讓他印象深刻的結(jié)果出現(xiàn)了:是自己的診療思路存在盲區(qū)。

“一開始這個(gè)模型設(shè)計(jì)出來(lái),到底能不能用于臨床,能不能起到提升和改善(診療效率)的作用,其實(shí)我心里也沒有底。但是這件事兒之后,給了我特別大的底氣。”邳靖陶總結(jié)這次經(jīng)歷,發(fā)現(xiàn)患者的臨床癥狀是一個(gè)綜合結(jié)果。例如,患者可能因?yàn)樯窠?jīng)系統(tǒng)問(wèn)題住院,但心血管、腎臟、肝臟狀況也在發(fā)生變化。盡管醫(yī)生接受過(guò)規(guī)范化的專科培訓(xùn),但診療思維仍可能存在盲點(diǎn),無(wú)法保證每次都能提供全面的診療方案。

另外,臨床指南是不斷更新的,并非所有醫(yī)生都能及時(shí)更新知識(shí)。當(dāng)醫(yī)生的知識(shí)更新滯后時(shí),大模型可以幫助彌補(bǔ)這些紕漏。

不過(guò),閱讀指南并做出判斷,仍是臨床醫(yī)生不能丟棄的基本功。邳靖陶表示,如果醫(yī)生發(fā)現(xiàn)大模型提供的診療方案與自己的判斷不符,不應(yīng)簡(jiǎn)單地接受或拒絕,而應(yīng)深入探究原因。這一思考過(guò)程有助于醫(yī)生提高臨床診療能力,是大模型作為臨床輔助診斷工具的終極愿景。畢竟,雖然大模型可以提供結(jié)論,但對(duì)診療過(guò)程負(fù)責(zé)的仍是臨床醫(yī)生本人。

“專病-???全科”是臨床大模型必經(jīng)之路

2023年7月,谷歌Research和DeepMind共同打造的全球首個(gè)全科醫(yī)療大模型Med-PaLM M正式發(fā)布。資料顯示,這個(gè)大模型具備臨床語(yǔ)言、影像和基因組學(xué)的理解能力,用于臨床指日可待。

而根據(jù)《2023醫(yī)療健康A(chǔ)I大模型行業(yè)研究報(bào)告》,截至2023年10月,國(guó)內(nèi)累計(jì)公開的大模型數(shù)量達(dá)到238個(gè),其中,醫(yī)療大模型近50個(gè),涉及患者問(wèn)診、醫(yī)生助手、藥物研發(fā)、健康科普等多個(gè)領(lǐng)域。據(jù)邳靖陶觀察,許多醫(yī)療大模型的開發(fā)從“全科”出發(fā),直接構(gòu)建一個(gè)涵蓋所有??频拇笮腿颇P停┯脩糇稍兏鞣N疾病。

但在參與構(gòu)建腦血管病專病大模型后,武劍教授團(tuán)隊(duì)對(duì)這一模式表示懷疑。他們發(fā)現(xiàn),把一種疾病的臨床指南梳理清楚頗具難度,打造對(duì)應(yīng)的思維鏈也耗時(shí)耗力,短期內(nèi)很難用同樣的方法訓(xùn)練出全科模型。換言之,目前的全科大模型能夠做到醫(yī)學(xué)科普,但很難在特定??祁I(lǐng)域提供有效的臨床指導(dǎo)。因此,武劍教授團(tuán)隊(duì)的研發(fā)思路是以專病為起點(diǎn),再走向全科。

“如果針對(duì)腦血管病的專病大模型走通了,我們可以把成功經(jīng)驗(yàn)復(fù)制到其他神經(jīng)系統(tǒng)疾病上;如果神經(jīng)系統(tǒng)疾病覆蓋全面了,就成了??拼竽P停簧窠?jīng)科的經(jīng)驗(yàn)再?gòu)?fù)制到其他科,就會(huì)形成一個(gè)真正的全科醫(yī)療大模型。”邳靖陶表示,在武劍教授看來(lái),國(guó)內(nèi)發(fā)病人數(shù)越多、疾病負(fù)擔(dān)越大的疾病,其專病大模型的臨床需求和研發(fā)空間就會(huì)越大,例如國(guó)家發(fā)病率最高的四大慢病——高血壓、糖尿病、冠心病、腦血管病都有非常廣闊的大模型開發(fā)空間。

而在腦血管病專病大模型的發(fā)布會(huì)上,武劍教授已經(jīng)通過(guò)招募令的形式,呼吁全國(guó)神經(jīng)系統(tǒng)疾病領(lǐng)域的專家,以及人工智能領(lǐng)域的專業(yè)人士攜手把握創(chuàng)新技術(shù)的改革可能,改善臨床診療現(xiàn)狀。他曾表示,如果能打破學(xué)術(shù)壁壘,醫(yī)療大模型的重復(fù)性工作是完全可以避免的。

“這不是我們一個(gè)人能做的事情。”邳靖陶說(shuō)。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 大模型 Ai 醫(yī)療 人工智能

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0