發(fā)布時間: 2025-09-22 16:56:05
2025年9月5日,《J Multidiscip Healthc》雜志上發(fā)表了一篇題為《Predicting 28-Day Mortality in Critically Ill Patients Receiving Continuous Renal Replacement Therapy: A Novel Interpretable Machine Learning Approach》的文章。本研究旨在開發(fā)和驗證一種可解釋的機(jī)器學(xué)習(xí)(ML)模型,以預(yù)測接受連續(xù)腎臟替代治療(CRRT)的危重患者28天全因死亡率,促進(jìn)早期風(fēng)險分層和臨床決策。
▼▼▼▼▼▼▼▼
一、研究背景
CRRT是重癥患者常用的挽救生命的治療方式,不僅用于急性腎損傷(AKI),還廣泛應(yīng)用于中毒、膿毒癥、急性胰腺炎等非腎臟疾病。盡管CRRT能顯著改善患者預(yù)后,但其死亡率仍高達(dá)30%–70%,因此早期識別高?;颊卟嵤└深A(yù)至關(guān)重要。以往研究多局限于AKI患者,且缺乏外部驗證和模型可解釋性。隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)在臨床預(yù)測中展現(xiàn)出優(yōu)勢,但其“黑箱”特性限制了臨床應(yīng)用。本研究旨在構(gòu)建一個可解釋的ML模型,預(yù)測接受CRRT的所有重癥患者28天全因死亡率,并通過SHAP方法提供模型解釋,以輔助臨床決策。
二、數(shù)據(jù)來源
訓(xùn)練隊列的數(shù)據(jù)來源于來自美國MIMIC-IV數(shù)據(jù)庫(v2.0)中2008–2019年間接受CRRT的1224例患者。納入標(biāo)準(zhǔn)為接受CRRT的患者。排除標(biāo)準(zhǔn)為:1)年齡小于18歲或大于89歲;2)多次住院或ICU入院;3)住院時間少于48小時。訓(xùn)練隊列按8:2比例劃分為訓(xùn)練集和內(nèi)部驗證集,并采用5折交叉驗證。外部驗證隊列來自河北醫(yī)科大學(xué)第四醫(yī)院重癥醫(yī)學(xué)科2020年1月至2021年12月期間收治138例CRRT患者。患者入組流程圖見圖1。
三、研究方法
本研究采用SQL語言通過Navicat軟件從MIMIC數(shù)據(jù)庫中提取數(shù)據(jù)。對缺失值超過30%的變量予以剔除,對缺失較少的變量采用K近鄰(KNN)法插補(bǔ)。異常值采用封頂法處理,將低于1%分位數(shù)和高于99%分位數(shù)的值分別替換為相應(yīng)分位數(shù)值,并剔除零方差或近零方差變量及處理多重共線性問題。特征工程采用三種機(jī)器學(xué)習(xí)算法:LASSO(最小絕對收縮和選擇算子)回歸用于線性稀疏和模型簡化,SVM-RFE(支持向量機(jī)遞歸特征消除)用于捕捉非線性關(guān)系,Boruta算法通過比較真實特征與隨機(jī)陰影變量以確定統(tǒng)計顯著性,最終選取三種方法共同選定的特征。模型構(gòu)建采用九種機(jī)器學(xué)習(xí)算法(包括GP(高斯過程)、GBM(梯度提升機(jī))、XGBoost(極限梯度提升)等),通過網(wǎng)格搜索和10折交叉驗證調(diào)優(yōu)超參數(shù),并以受試者工作特征曲線下面積(AUC)為主要指標(biāo)在內(nèi)部驗證集中選擇最佳模型,同時通過決策曲線分析(DCA)及其他性能指標(biāo)(如準(zhǔn)確率、敏感度等)評估模型臨床效用。為提高模型可解釋性,采用基于博弈論的SHAP方法進(jìn)行全局和局部解釋。為便于臨床使用,最終模型將以網(wǎng)頁計算器形式呈現(xiàn)。
四、結(jié)果
1.基線特征
單因素分析結(jié)果顯示(表1),生存組與非生存組在多方面存在顯著差異。非生存組患者年齡稍大,慢性腎臟?。–KD)、2型糖尿病、膿毒癥、膿毒性休克、心臟驟停及急性腎損傷(AKI)的患病率更高。實驗室指標(biāo)如乳酸、pH、氧合指數(shù)、血小板計數(shù)、白細(xì)胞計數(shù)、國際標(biāo)準(zhǔn)化比值(INR)、凝血酶原時間(PT)、部分凝血活酶時間(PTT)、天門冬氨酸氨基轉(zhuǎn)移酶(AST)和總膽紅素也存在顯著差異。此外,非生存組的序貫器官衰竭評估(SOFA)和急性生理學(xué)評估III(APIII)評分均顯著高于生存組。
2.特征篩選
本研究采用三種機(jī)器學(xué)習(xí)方法進(jìn)行特征篩選,并取其交集。LASSO回歸篩選出40個顯著特征(圖2A、2B)。SVM-RFE選出前30個重要特征,Boruta算法篩選出22個顯著特征(圖2C)。通過維恩圖取三者交集,共得15個特征(圖2D)。鑒于最大紅細(xì)胞分布寬度(RDW)比最小RDW更重要、凝血酶原時間(PT)比國際標(biāo)準(zhǔn)化比值(INR)更具顯著性,最終剔除INR和最小RDW,保留13個特征用于建模。
3.模型性能比較
研究采用九種機(jī)器學(xué)習(xí)(ML)方法構(gòu)建模型,并通過網(wǎng)格搜索優(yōu)化超參數(shù)?;谑茉囌吖ぷ魈卣髑€下面積(AUC)比較,高斯過程(GP)模型在訓(xùn)練集(AUC=0.841)和內(nèi)部驗證集(AUC=0.794)中均表現(xiàn)最佳,優(yōu)于其他ML模型及傳統(tǒng)評分系統(tǒng)。其他評估指標(biāo)(表2、表3)和決策曲線分析(DCA,圖3C、D)同樣顯示GP模型具有最高的預(yù)測性能和臨床凈收益,盡管其在內(nèi)部驗證集中的收益略有下降??傮w而言,GP模型展現(xiàn)出最優(yōu)的預(yù)測效能。
4.可解釋性分析
對GP模型進(jìn)行了全局可解釋性分析。結(jié)果顯示,紅細(xì)胞分布寬度(RDW)、年齡、乳酸、膿毒性休克和血管活性藥物使用是影響CRRT患者28天全因死亡率的五個最重要預(yù)測因子(圖4B)。SHAP摘要圖(圖4A)表明,較高的RDW、年齡、乳酸水平、存在膿毒性休克和使用血管活性藥物與較高的死亡率相關(guān)。SHAP值大于零表示特征增加死亡風(fēng)險,小于零則降低風(fēng)險。此外,SHAP力力圖(圖4C、4D)提供了個體化預(yù)測的局部解釋,通過顯示各特征對特定患者預(yù)測結(jié)果的貢獻(xiàn)方向和幅度,直觀呈現(xiàn)模型如何基于特征值將預(yù)測結(jié)果從基線值調(diào)整至最終輸出值。
5.外部驗證
該外部驗證隊列基線特征如表4所示,生存組與非生存組在年齡、最大凝血酶原時間、肌酐峰值、膿毒性休克、血管活性藥物使用及有創(chuàng)機(jī)械通氣需求方面存在顯著差異。GP模型在外部驗證中AUC達(dá)0.78,圖5展示了其ROC曲線、決策曲線(DCA)及其他評估指標(biāo),結(jié)果表明模型具有良好的預(yù)測性能和臨床適用性。
五、總結(jié)
本研究成功構(gòu)建了一個基于高斯過程(GP)的可解釋機(jī)器學(xué)習(xí)模型,能夠準(zhǔn)確預(yù)測接受CRRT的重癥患者28天全因死亡率,并在內(nèi)部和外部驗證中均表現(xiàn)出良好的預(yù)測性能和泛化能力。通過SHAP方法提供了全局和局部解釋,明確了關(guān)鍵預(yù)測因子(如RDW、年齡、乳酸、膿毒性休克和血管活性藥物使用),增強(qiáng)了模型的臨床可信度和實用性。
上一篇:治療≠預(yù)防:孕期生殖道感染管理新挑戰(zhàn)——論協(xié)同感染與殘余早產(chǎn)風(fēng)險
下一篇:09.15-09.21臨床預(yù)測模型研究頂刊快報