Machine-Learning-Roadmap

Einordnung

Das regelbasierte Ampel-System von HyponaTrack basiert auf evidenzgestützten Schwellenwerten und einem klinischen Risiko-Score. Parallel dazu soll ein Machine-Learning-Ansatz (ML) evaluiert werden, um perspektivisch die Prädiktionsgenauigkeit zu verbessern. Dieses Kapitel beschreibt den ML-Stufenplan, die Literaturgrundlage und die Implikationen für die Datenerhebung.

Literaturgrundlage

Eine systematische PubMed-Recherche (03/2026) identifizierte 12 relevante Arbeiten zu ML-Modellen bei Hyponatriämie. Die wichtigsten Ergebnisse sind in Tabelle 1 zusammengefasst.

Studie	Jahr	Kontext	Bestes Modell	AUC
Kinoshita et al. (Kinoshita et al., 2024)	2024	Therapie-Response 6h-Prognose	SVR	R² = 0,92
Lin et al. (Lin et al., 2025)	2025	Verzögerte Hyponatriämie post-TSS	XGBoost	0,821
Fuse et al. (Fuse et al., 2023)	2023	Verzögerte Hyponatriämie post-TSS	Random Forest	0,759
Voglis et al. (Voglis et al., 2020)	2020	Postop. Hyponatriämie (Machbarkeit)	Boosted GLM	0,843
Jung et al. (Jung et al., 2025)	2025	OXC-induzierte Hyponatriämie	XGBoost	0,83
Andersson et al. (Andersson et al., 2025)	2025	Thiazid-induzierte Hyponatriämie	Causal Forest	—

Tabelle 1: Übersicht der ML-Modelle zur Hyponatriämie-Prädiktion (PubMed-Recherche 03/2026).

Zentrale Erkenntnisse

Bevorzugte Algorithmen: XGBoost war in 3 von 9 Studien das beste Modell, gefolgt von Random Forest (2/9) und Support Vector Machine/Regression (2/9). Alle Studien mit AUC > 0,80 nutzten Ensemble-Methoden oder Gradient Boosting.

SHAP-Erklärbarkeit: Fünf Studien setzten SHapley Additive exPlanations (SHAP) ein, um die Feature-Importance zu visualisieren. Dies ist für die klinische Akzeptanz essenziell — ein “Black Box”-Modell wird im klinischen Alltag nicht angenommen.

Studienübergreifende Prädiktoren:

Serum-Natrium (Baseline und Verlauf) — in allen Studien der stärkste Prädiktor
Alter — in 5/9 Studien relevant
Begleitmedikation (Diuretika, Antikonvulsiva) — in 3/9 Studien
Laborparameter (Kalium, Chlorid, Hämoglobin, CRP) — in 4/9 Studien
Urinparameter (Volumen, Natrium) — in 2/9 Studien

Zentrale Lücke

Alle existierenden ML-Modelle nutzen ausschließlich stationäre Daten. Keines integriert ambulante Monitoring-Zeitreihen (Gewichtstrend, Aktivitätsverlauf, Symptom-Score-Dynamik). HyponaTrack erfasst erstmals diese longitudinalen Daten und kann so eine neuartige Datenbasis für eine kombinierte Risikostratifizierung schaffen.

Implikationen für die Datenerhebung

Der Abgleich der Literatur-Prädiktoren mit dem HyponaTrack-Datenmodell zeigt, dass die meisten ML-relevanten Features bereits erhoben werden (Tabelle 2).

Literatur-Prädiktor	HyponaTrack-Feld	Status
Serum-Na⁺ Baseline, POD 1/2/7	`praeOpNatrium`, `podNatriumTag1/2`, `pod7Natrium`	Vollständig
Alter, Geschlecht, BMI	`age`, `sex`, `bmi`	Vollständig
Gewichtsverlauf 2x/Tag	`weightMorning`, `weightEvening`	Vollständig
Symptom-Score 2x/Tag	`symptomEntry` (gewichtet)	Vollständig
Flüssigkeitszufuhr	`fluidIntakeML`	Vollständig
Risiko-Medikamente	`risikoMedikamenteCSV`	Vollständig
OP-Dauer, Blutverlust, CSF-Leck	`opDauerMin`, `blutverlustMl`, `liquorverlustIntraOP`	Vollständig
Aktivität, HRV, Schlaf	`stepCount`, `hrvSDNN`, `sleepDurationMinutes`	Vollständig
Serum-Kalium	`pod7Kalium`	Ergänzt (POD7-Labor)
Serum-Chlorid	`pod7Chlorid`	Ergänzt (POD7-Labor)
Serum-Na⁺ POD 5	`podNatriumTag5`	Ergänzt (nur Hochrisiko)
Urinvolumen (24h)	Proxy: Urin-SG + Gewichtsdelta	Indirekt
Na⁺-Zufuhr (Ernährung)	—	Nicht praktikabel ambulant

Tabelle 2: Abdeckung der Literatur-Prädiktoren im HyponaTrack-Datenmodell.

Ergänzung: POD-5-Zwischenlabor für Hochrisiko-Patienten

Basierend auf der Literaturanalyse wird für Patienten mit Risiko-Score \(\geq\) 5 (Klasse Mittel oder Hoch) eine zusätzliche ambulante Blutentnahme an POD 5 (\(\pm\) 1 Tag) empfohlen:

Parameter: Serum-Na⁺, K⁺, Cl⁻ (Routinelabor, ca. 5 Minuten)
Begründung: Der Na⁺-Abfall beginnt typischerweise POD 5–9 (kritisches Zeitfenster). Ohne Zwischenmessung fehlt das Ground-Truth-Label für ML-Training in der vulnerabelsten Phase.
Aufwand: Betrifft ca. 30–40 % der Kohorte. Messort: Hausarzt oder Ambulanz.
Ethik-Amendment: Erforderlich für die zusätzliche Blutentnahme.

Ergänzung: Kalium und Chlorid bei POD-7-Kontrolle

Kinoshita et al. (2024) nutzen Serum-K⁺ und Serum-Cl⁻ als Prädiktoren in ihrem SVR-Modell (R² = 0,92). Diese werden bei der ohnehin stattfindenden POD-7-Blutentnahme zusätzlich bestimmt — ohne relevanten Mehraufwand.

ML-Stufenplan

Abbildung 1: Vier-Phasen-Stufenplan zur ML-Integration in HyponaTrack

Phase 1: Regel-System stärken (n = 0–20)

Das bestehende evidenzbasierte Eskalationssystem (RiskEngine + EscalationEngine) wird eingesetzt
Priorität: Threshold-Kalibrierung nach den ersten 20 Patienten mittels ROC-Optimierung der GELB-/ROT-Schwellen
Die Python-Pipeline (03_algorithmus_performance.qmd) ist dafür bereits vorbereitet
Kein ML in dieser Phase — die Stichprobe ist zu klein für belastbare Ergebnisse

Phase 2: Shadow-Validierung (n \(\geq\) 40)

Ein einfaches ML-Modell läuft im Shadow-Modus parallel zum Regel-System, ohne Einfluss auf Patienten-Alerts:

Modell: Logistische Regression (interpretierbar, wenig Daten nötig, klinisch akzeptiert, class-weight-balanced)
Features: Na⁺-Baseline, Na⁺ POD 1/2, Alter, Geschlecht, Risiko-Score, Gewichtsdelta POD 3–5, Symptom-Score-Trend
Zielvariable: DPH (Na⁺ < 135 mmol/l an POD 7)
Validierung: Leave-One-Out Cross-Validation (bei kleinem n sinnvoller als Train/Test-Split)
Auswertung: AUC Regel-System vs. ML, Seite an Seite
Keine App-Änderung nötig — rein in der Python-Analyse-Pipeline (07_ml_shadow.qmd)

Phase 3: Erweiterte ML-Evaluation (n \(\geq\) 80)

XGBoost + SHAP (bestes Modell in 3/9 Literatur-Studien, AUC 0,82–0,83)
Vergleich: Regel-basiert vs. Logistische Regression vs. XGBoost
Feature-Importance-Analyse \(\rightarrow\) Feedback-Loop in das Regel-System (z. B. neue Schwellenwerte für identifizierte Hochrisiko-Features)
Zeitreihen-Features: 3-Tages-Gewichtstrend, Symptom-Score-Beschleunigung, Aktivitätsdelta

Phase 4: Vollständiges ML-System (n > 200, Folgestudie)

SVR-Regressionsmodell nach Kinoshita-Vorbild: Na⁺-Verlaufsprognose alle 6 h aus klinisch verfügbaren Parametern (Fluid-Intake, Urin-Output-Proxy, Serum-Na/K/Cl)
Causal Forest nach Andersson-Vorbild: Therapieentscheidungs-Unterstützung — nicht nur “Wie hoch ist das Risiko?”, sondern “Welche Intervention reduziert das Risiko am meisten?”
Prospektive Validierung in einer unabhängigen Kohorte (externes Zentrum)

Analyse-Pipeline

Die Shadow-ML-Pipeline ist als Quarto-Notebook implementiert (07_ml_shadow.qmd) und umfasst:

Feature Engineering: Aggregation der Daily-Monitoring-Daten (POD 3–6) zu Patienten-Level-Features (Mittelwert, Maximum, Trend)
Imputation: Fehlende Werte durch Median-Imputation (erwartete Missingness: 10–40 % je nach Parameter)
Standardisierung: Z-Transformation für faire Koeffizientenvergleiche
Modell-Training: LOOCV mit Logistischer Regression, Random Forest und Gradient Boosting
Vergleich: ROC-Kurven und Performance-Metriken (Sensitivität, Spezifität, PPV, NPV) gegen das Regel-System
Feature-Importance: Standardisierte Koeffizienten der Logistischen Regression

Die Pipeline läuft derzeit mit synthetischen Demodaten (n = 30) und ist bereit für echte Studiendaten nach Studienstart.

Literatur

Andersson, N. W., Jakobsen, K. D., Hviid, A., Feenstra, B., Melbye, M., Wohlfahrt, J., & Lund, M. (2025). Predicting high excess risk of hyponatraemia among thiazide users. European Journal of Preventive Cardiology. https://doi.org/10.1093/eurjpc/zwaf474

Fuse, Y. et al. (2023). Machine learning models predict delayed hyponatremia post-transsphenoidal surgery using clinically available features. Pituitary, 26, 543–553.

Jung, G., Lee, J., Gho, S.-M., Han, Y., Choi, B., Cho, J. W., Kim, J., & Lee, G. (2025). Predicting oxcarbazepine-induced hyponatremia in adult epilepsy patients: A multicenter machine learning analysis using real-world CDM data. Seizure: European Journal of Epilepsy, 133. https://doi.org/10.1016/j.seizure.2025.10.004

Kinoshita, T., Oyama, S., Hagiwara, D., Azuma, Y., & Arima, H. (2024). A machine learning approach for predicting treatment response of hyponatremia. Endocrine Journal, 71(4). https://doi.org/10.1507/endocrj.EJ23-0561

Lin, Y. et al. (2025). Machine learning algorithms for predicting delayed hyponatremia after transsphenoidal surgery for patients with pituitary adenoma. Scientific Reports, 14, 83319.

Voglis, S., Niftrik, C. H. B. van, Staartjes, V. E., Brandi, G., Tschopp, O., Regli, L., & Serra, C. (2020). Feasibility of machine learning based predictive modelling of postoperative hyponatremia after pituitary surgery. Pituitary, 23(5), 543–551. https://doi.org/10.1007/s11102-020-01056-w