国产日韩精品SUV,中国精学生妹品射精久久,久久久久免费毛A片免费一瓶梅,狠狠色综合激情丁香五月

語言 ?
中文EN

一種可解釋的機器學(xué)習(xí)方法,用于預(yù)測結(jié)節(jié)性硬化癥兒童的耐藥性癲癇

發(fā)布時間:  2025-09-01 11:04:58



2025年8月4日,Jie Fu等人在《Front Neurol》雜志上發(fā)表了一篇題為《An interpretable machine learning approach for predicting drug-resistant epilepsy in children with tuberous sclerosis complex》的文章。本文旨在開發(fā)并驗證一種可解釋的機器學(xué)習(xí)(ML)算法,用于預(yù)測結(jié)節(jié)性硬化癥(TSC)兒童發(fā)生耐藥性癲癇(DRE)的風(fēng)險。


一、研究背景

TSC是一種罕見的累及多器官系統(tǒng)的遺傳性疾病,約70–90%的患者會出現(xiàn)癲癇發(fā)作,其中約60%最終發(fā)展為DRE,嚴重影響患者的神經(jīng)認知發(fā)育和生活質(zhì)量。盡管已有研究嘗試使用機器學(xué)習(xí)預(yù)測癲癇治療結(jié)局,但多數(shù)模型依賴于多序列磁共振成像(MRI)或復(fù)雜深度學(xué)習(xí)架構(gòu),且缺乏可解釋性,限制了其臨床適用性。因此,本研究致力于構(gòu)建一個結(jié)構(gòu)簡單、可解釋性強、基于常規(guī)臨床特征的預(yù)測模型,以助力早期識別高風(fēng)險患兒并指導(dǎo)個體化干預(yù)。


二、數(shù)據(jù)來源

數(shù)據(jù)來源于2018年1月至2024年3月期間在北京大學(xué)人民醫(yī)院兒科住院的TSC患兒的回顧性臨床資料。共納入88例符合國際TSC共識組(2021年)診斷標(biāo)準(zhǔn)且經(jīng)ILAE指南確診為癲癇的兒童,所有患者均具備完整的病史、腦電圖(EEG)及頭顱MRI或CT影像資料,且隨訪時間不少于1年。收集的變量包括性別、發(fā)病年齡、家族史、基因變異類型、發(fā)作類型、嬰兒痙攣癥(IESS)病史、EEG表現(xiàn)、神經(jīng)影像學(xué)表現(xiàn)、抗癲癇藥物(ASM)使用數(shù)量、mTOR抑制劑使用情況以及發(fā)育遲緩等。


三、研究方法

研究使用遞歸特征消除(RFE)進行變量篩選,通過10次十折交叉驗證評估特征子集性能;構(gòu)建9種ML模型,包括隨機森林(RF)、支持向量機(SVM)、梯度提升機(GBM)、極端梯度提升(XGB)、樸素貝葉斯(NB)、K近鄰(KNN)、神經(jīng)網(wǎng)絡(luò)(NNET)、決策樹(DT)、邏輯回歸(LR),并采用重復(fù)10折交叉驗證進行超參數(shù)調(diào)優(yōu);使用“caret”包實現(xiàn)模型訓(xùn)練與評估;模型性能通過AUC、陽性預(yù)測值(PPV)、陰性預(yù)測值(NPV)等指標(biāo)進行系統(tǒng)評估;校準(zhǔn)能力通過Hosmer-Lemeshow檢驗及校準(zhǔn)曲線分析;臨床效用通過決策曲線分析(DCA)評估;采用SHapley Additive exPlanations(SHAP)方法進行全局與局部模型解釋。統(tǒng)計分析使用R 4.4.1,符合正態(tài)分布的連續(xù)變量以均數(shù)±標(biāo)準(zhǔn)差表示,非正態(tài)分布的以中位數(shù)(上下四分位數(shù))表示;分類變量以頻數(shù)(百分比)表示。


四、結(jié)果

1.基線特征

在88例TSC相關(guān)癲癇患兒中,50例(56.8%)發(fā)展為DRE,38例(43.2%)經(jīng)藥物治療后實現(xiàn)無發(fā)作。DRE組癲癇發(fā)作中位年齡早于無發(fā)作組。兩組在TSC1/TSC2基因突變分布上無顯著差異。DRE組在IESS病史、癲癇性痙攣(ES)、局灶性發(fā)作合并ES、EEG多灶性放電、皮質(zhì)結(jié)節(jié)數(shù)量≥3個及室管膜下結(jié)節(jié)(SEN)方面均顯著高于無發(fā)作組,而mTOR抑制劑使用率較低,所有差異均具有統(tǒng)計學(xué)意義(p < 0.05)。表 1 描述了所有患者的人口統(tǒng)計學(xué)和臨床特征。研究設(shè)計如圖 1 所示。



本研究中,88例TSC患者的ASMs使用情況如圖2所示。所有患者均接受了至少一種ASM治療,最常用的五種藥物分別為:氨己烯酸、丙戊酸、奧卡西平、左乙拉西坦和拉莫三嗪。


2.獨立風(fēng)險因素分析

基于全隊列數(shù)據(jù),單因素邏輯回歸分析(p < 0.05)初步識別出8個與DRE可能相關(guān)的因素。進一步通過多因素逐步邏輯回歸分析,最終確定4個具有統(tǒng)計學(xué)意義(p < 0.05)的獨立危險因素:IESS病史、EEG發(fā)作間期多灶性放電、多發(fā)性皮質(zhì)結(jié)節(jié)以及使用≥3種ASMs(表2)。


3.列線圖的構(gòu)建與性能評估

基于邏輯回歸分析結(jié)果構(gòu)建列線圖(圖3)。該模型原始AUC為0.897(圖4A)。經(jīng)1000次Bootstrap內(nèi)部驗證后,列線圖的AUC為0.827(圖4B),顯示出良好的預(yù)測性能和穩(wěn)定性。校準(zhǔn)曲線顯示預(yù)測與觀察結(jié)果之間具有良好一致性,平均絕對誤差(MAE)為0.052(圖4C)。決策曲線分析(DCA)表明,當(dāng)閾值概率超過0.2時,列線圖相較于“全治療”或“全不治療”策略具有更高的臨床凈獲益,支持其在預(yù)測DRE方面具備臨床實用性(圖4D)。



4.預(yù)測變量篩選

本研究采用遞歸特征消除(RFE)方法進行變量篩選,旨在識別對模型性能貢獻最顯著的變量子集。附圖1展示了各機器學(xué)習(xí)模型基于RFE的特征選擇過程,附圖2以條形圖形式呈現(xiàn)了所選特征的顯著性評分,反映了其對模型預(yù)測的相對貢獻度。

5.模型的構(gòu)建和性能比較

本研究采用重復(fù)10折交叉驗證構(gòu)建了9種機器學(xué)習(xí)模型。圖5A和5B分別展示了內(nèi)部交叉驗證前后各模型的ROC曲線,所有模型的詳細性能指標(biāo)見附表4。RF模型表現(xiàn)出最高的特異性和AUC,其AUC為0.862;GBM模型次之,AUC為0.847;SVM模型位列第三,AUC為0.818。(圖5B,C)Hosmer-Lemeshow檢驗顯示RF(p = 0.077)和SVM(p = 0.064)模型具有較優(yōu)的擬合優(yōu)度(附圖3)。決策曲線分析(DCA)表明,RF模型在所有閾值概率(0–1.0)下均獲得最高的臨床凈獲益,其次為XGB和GBM模型(圖5D)。所以RF模型展現(xiàn)出最佳的整體性能。


6.模型解釋

基于驗證結(jié)果,本研究選擇預(yù)測性能最優(yōu)的RF模型進行SHAP可解釋性分析。SHAP摘要圖(圖6A)直觀展示了各特征對預(yù)測結(jié)果的影響方向及程度,其中EEG表現(xiàn)對預(yù)測DRE的影響最大,特別是發(fā)作間期多灶性或全面性放電與更高的DRE風(fēng)險相關(guān)。圖6B展示了一名無發(fā)作TSC患者的預(yù)測結(jié)果中各變量的貢獻度,圖6C則顯示了7個特征實際值與對應(yīng)SHAP值的關(guān)系。SHAP值大于零的特征均提高了DRE的預(yù)測概率,表明其與DRE風(fēng)險增加顯著相關(guān)。 



五、總結(jié)

基于隨機森林的預(yù)測模型能夠以較高準(zhǔn)確度識別TSC患兒中DRE的高風(fēng)險個體,且通過SHAP方法增強了模型的可解釋性與臨床適用性。該模型為早期干預(yù)和個體化治療提供了科學(xué)依據(jù),尤其適用于資源有限的環(huán)境下基于常規(guī)臨床特征進行風(fēng)險分層。



上一篇:08.18-08.24臨床預(yù)測模型研究頂刊快報

下一篇:青年人高血壓發(fā)病風(fēng)險預(yù)測模型的建立與驗證



郵編:400000
聯(lián)系電話:13651835632
電子郵件:zhoubaihao910@126.com
地址:重慶市沙坪壩區(qū)龍湖光年4號樓
Copyright ? 2022 重慶嘉舟生物科技有限公司 All Rights Reserved 渝ICP備2022013225號