發(fā)布時間: 2025-05-29 17:11:40
2025年4月26日,Sangsang Qi等人在《BMC Pregnancy and Childbirth》雜志上發(fā)表了一篇題為《Building a machine learning-based risk prediction model for second-trimester miscarriage》的文章。本研究旨在構建一種基于機器學習的風險預測模型,用于準確預測孕婦在妊娠中期(14+0至27+6周)發(fā)生流產(chǎn)的風險。
圖1 預測模型流程圖
研究背景
妊娠中期流產(chǎn)(STM)是常見的不良妊娠結局,占所有流產(chǎn)的2%-3%,但其對患者身心健康的長期影響常被低估?,F(xiàn)有研究多聚焦于妊娠早期流產(chǎn)或早產(chǎn),而妊娠中期流產(chǎn)的預測模型研究較少。傳統(tǒng)統(tǒng)計方法在復雜因素分析中存在局限性,機器學習(ML)因其處理非線性關系和特征交互的優(yōu)勢,成為構建預測模型的有力工具。本研究基于臨床實際需求,結合炎癥標志物、宮頸長度等潛在風險因素,探索建立高精度、可解釋的妊娠中期流產(chǎn)預測模型。
數(shù)據(jù)來源
研究回顧性收集了2020年1月至2023年10月期間在寧波大學婦女兒童醫(yī)院住院、診斷為“先兆流產(chǎn)且孕周為14+0至27+6周的2006例患者數(shù)據(jù)。排除標準包括入院時已確診“難免流產(chǎn)”、嚴重系統(tǒng)性疾病、胚胎染色體異常及失訪病例。數(shù)據(jù)涵蓋30項臨床特征,包括年齡、孕周、陰道出血、宮頸長度、白細胞計數(shù)(WBC)、C反應蛋白(CRP)等。
研究方法
研究采用分層隨機抽樣將數(shù)據(jù)分為訓練集(70%)和驗證集(30%)。通過Boruta算法篩選關鍵特征,結合多元邏輯回歸進一步確定最終10個預測變量(如宮頸長度、陰道出血、CRP等)。針對數(shù)據(jù)不平衡問題,使用SMOTE過采樣技術平衡正負樣本。構建了包括邏輯回歸(LR)、支持向量機(SVM)、隨機森林(RF)、XGBoost等7種機器學習模型,并基于準確率、召回率、ROC-AUC、PR-AP等指標評估性能。通過SHAP方法解釋模型預測邏輯,并開發(fā)了在線可視化工具。
結果
研究人群的基線特征
2020年1月至2023年10月,寧波大學附屬婦幼醫(yī)院共收治了2172例妊娠 14+0周至 27+6周被診斷為“先兆流產(chǎn)”的患者。根據(jù)排除標準,我們排除了166例患者:其中2例患有精神障礙,153例反復住院,11例因特殊原因自動出院。最終,我們的研究共納入2006例患者;其中395例(19.69%)患者發(fā)生自然流產(chǎn)。作者考慮了30個潛在預測變量進行分析,并統(tǒng)計分析了所有納入病例中每個因素的缺失值。宮頸長度(4.99%)、CRP(3.54%)、異常羊水量(1.94%)、孕前BMI(0.25%)、白細胞計數(shù)(0.15%)、中性粒細胞百分比(0.15%)的缺失數(shù)據(jù)占個人數(shù)據(jù)的5%以下,如圖2所示。我們使用數(shù)值變量的平均值和分類變量的眾數(shù)來填充缺失值。
圖2 缺失值分析
本研究考察了30個可能導致STM的風險變量。為了避免眾多特征之間的共線性,創(chuàng)建了相關性熱力圖來預測STM的風險特征。相關性熱力圖是一種可視化工具,它以熱圖的形式顯示特征之間的相關系數(shù),并用顏色陰影表示特征之間的相關程度。圖3展示了納入研究中風險特征的相關性分析,Spearman相關系數(shù)小于0.6,表明納入特征之間的相關性較低。
圖3 相關性熱力圖
特征選擇
Boruta是一種基于隨機森林分類器的特征選擇算法。在我們的研究中,Boruta進行了500次迭代,選擇結果總結在圖4中。以下特征與STM風險相關:孕婦年齡、腹痛、陰道出血、陰道分泌物、宮頸長度、宮內(nèi)手術次數(shù)、絨毛膜下血腫、子宮肌瘤、白細胞、中性粒細胞百分比、CRP、貧血和胎盤異常。
圖4 Boruta特征篩選
圖5顯示了13個特征的多變量分析。選擇具有統(tǒng)計學顯著差異(P <0.05)的特征作為最終特征。最終理想的10個特征為:腹痛、陰道出血、陰道分泌物、宮頸長度、絨毛膜下血腫、子宮肌瘤、白細胞、中性粒細胞比例、C反應蛋白、胎盤異常。統(tǒng)計結果顯示,發(fā)生STM的風險為19.69%,明顯低于無流產(chǎn)的概率,說明數(shù)據(jù)樣本不平衡。本研究利用SMOTE過采樣技術生成少數(shù)樣本,確保孕中期陽性樣本與陰性樣本比例為1:1,且數(shù)據(jù)結構平衡 ,生成SMOTE后數(shù)據(jù)集。
圖5 多因素分析
模型構建與評估
本研究采用了七種不同的機器學習技術建立模型:LR、KNN、SVM、DT、RF、XGBoost和ANN。圖6展示了這七種模型在訓練隊列和驗證隊列中的ROC-AUC和PR-AP性能。表1比較了準確率、精確率、召回率和F1分數(shù),并使用圖7中描繪的雷達圖從多個維度比較了每個模型的性能數(shù)據(jù),以增強結果的清晰度和視覺吸引力。在七種模型中,有三個模型都表現(xiàn)出較高的預測性能:LR模型(AUC = 0.843)、SVM(AUC = 0.835)和 XGBoost(AUC = 0.833)AUC大于0.8表示預測性能良好。KNN(AUC = 0.751)、DT(AUC = 0.721)、RF(AUC = 0.796)和ANN(AUC = 0.771)模型的預測能力中等。RF模型的精確度最高,為0.653,其次是XGBoost(精確度為 0.529)。但XGBoost的PR和準確度最高,分別為0.650和0.817。
圖6 ROC曲線與召回曲線
表1 各模型預測性能比較
圖7 機器學習模型性能分析的雷達圖
當使用臨床決策曲線分析(DCA)評估預測模型的臨床有效性時,XGBoost模型在特定范圍內(nèi)獲得的凈收益大于其他模型(圖8),表明XGBoost模型具有良好的臨床實用性。校準曲線分析顯示,XGBoost模型的表現(xiàn)優(yōu)于其他模型,其Brier Score最低(驗證組中為0.132)。
圖8 臨床決策曲線和召回曲線
前瞻性驗證
對預測模型進行臨床評估,前瞻性收集了2024年1月至3月寧波大學附屬婦幼保健院符合納入和排除標準的120例患者資料,其中18例(15.0%)患有 STM。模型準確率為0.858,精確率為0.519,召回率為0.778,F(xiàn)1得分為0.622,ROC-AUC為0.883,PR-AP為0.702,結果如表2所示。
表2 XGBoost的前瞻性驗證
SHAP 模型解釋
SHAP分析顯示,宮頸長度是預測中期流產(chǎn)的最關鍵因素,其縮短顯著增加風險(如長度<20mm時風險升高14.5倍)。其他重要特征依次為C反應蛋白(CRP)、中性粒細胞百分比、陰道出血及陰道分泌物。模型解釋表明:宮頸縮短、炎癥標志物升高(如CRP>2.27mg/L)、陰道出血等正向驅動流產(chǎn)預測;而宮頸長度正常(如≥30mm)、無出血等特征則降低風險。通過可視化案例,SHAP直觀展示了各特征對個體預測結果的貢獻方向與強度,為臨床決策提供可解釋依據(jù)。
圖9 SHAP可解釋性分析
網(wǎng)頁應用程序
此外,還為臨床醫(yī)生構建了一個基于網(wǎng)絡的工具來使用所提出的模型(網(wǎng)址為 https://qisangsang.shinyapps.io/STMRISK/)(圖10)。
圖10 網(wǎng)頁計算器
結論
研本研究成功構建了基于XGBoost算法的中期流產(chǎn)風險預測模型,其性能優(yōu)于傳統(tǒng)統(tǒng)計方法,并通過SHAP實現(xiàn)可視化解釋。模型整合了易獲取的臨床指標,為早期識別高危孕婦提供了實用工具。
上一篇:機器學習算法用于預測早發(fā)心肌梗死患者中射血分數(shù)保留型心力衰竭