Machine-Learning-Roadmap

Einordnung

Das regelbasierte Ampel-System von HyponaTrack basiert auf evidenzgestützten Schwellenwerten und einem klinischen Risiko-Score. Parallel dazu soll ein Machine-Learning-Ansatz (ML) evaluiert werden, um perspektivisch die Prädiktionsgenauigkeit zu verbessern. Dieses Kapitel beschreibt den ML-Stufenplan, die Literaturgrundlage und die Implikationen für die Datenerhebung.

Literaturgrundlage

Eine systematische PubMed-Recherche (03/2026) identifizierte 12 relevante Arbeiten zu ML-Modellen bei Hyponatriämie. Die wichtigsten Ergebnisse sind in Tabelle 1 zusammengefasst.

Studie Jahr Kontext Bestes Modell AUC
Kinoshita et al. (Kinoshita2024?) 2024 Therapie-Response 6h-Prognose SVR R² = 0,92
Lin et al. (Lin et al., 2025) 2025 Verzögerte Hyponatriämie post-TSS XGBoost 0,821
Fuse et al. (Fuse et al., 2023) 2023 Verzögerte Hyponatriämie post-TSS Random Forest 0,759
Voglis et al. (Voglis2020?) 2020 Postop. Hyponatriämie (Machbarkeit) Boosted GLM 0,843
Jung et al. (Jung2025?) 2025 OXC-induzierte Hyponatriämie XGBoost 0,83
Andersson et al. (Andersson2025?) 2025 Thiazid-induzierte Hyponatriämie Causal Forest
Tabelle 1: Übersicht der ML-Modelle zur Hyponatriämie-Prädiktion (PubMed-Recherche 03/2026).

Zentrale Erkenntnisse

Bevorzugte Algorithmen: XGBoost war in 3 von 9 Studien das beste Modell, gefolgt von Random Forest (2/9) und Support Vector Machine/Regression (2/9). Alle Studien mit AUC > 0,80 nutzten Ensemble-Methoden oder Gradient Boosting.

SHAP-Erklärbarkeit: Fünf Studien setzten SHapley Additive exPlanations (SHAP) ein, um die Feature-Importance zu visualisieren. Dies ist für die klinische Akzeptanz essenziell — ein “Black Box”-Modell wird im klinischen Alltag nicht angenommen.

Studienübergreifende Prädiktoren:

  • Serum-Natrium (Baseline und Verlauf) — in allen Studien der stärkste Prädiktor
  • Alter — in 5/9 Studien relevant
  • Begleitmedikation (Diuretika, Antikonvulsiva) — in 3/9 Studien
  • Laborparameter (Kalium, Chlorid, Hämoglobin, CRP) — in 4/9 Studien
  • Urinparameter (Volumen, Natrium) — in 2/9 Studien

Zentrale Lücke

Alle existierenden ML-Modelle nutzen ausschließlich stationäre Daten. Keines integriert ambulante Monitoring-Zeitreihen (Gewichtstrend, Aktivitätsverlauf, Symptom-Score-Dynamik). HyponaTrack erfasst erstmals diese longitudinalen Daten und kann so eine neuartige Datenbasis für eine kombinierte Risikostratifizierung schaffen.

Implikationen für die Datenerhebung

Der Abgleich der Literatur-Prädiktoren mit dem HyponaTrack-Datenmodell zeigt, dass die meisten ML-relevanten Features bereits erhoben werden (Tabelle 2).

Literatur-Prädiktor HyponaTrack-Feld Status
Serum-Na⁺ Baseline, POD 1/2/7 praeOpNatrium, podNatriumTag1/2, pod7Natrium Vollständig
Alter, Geschlecht, BMI age, sex, bmi Vollständig
Gewichtsverlauf 2x/Tag weightMorning, weightEvening Vollständig
Symptom-Score 2x/Tag symptomEntry (gewichtet) Vollständig
Flüssigkeitszufuhr fluidIntakeML Vollständig
Risiko-Medikamente risikoMedikamenteCSV Vollständig
OP-Dauer, Blutverlust, CSF-Leck opDauerMin, blutverlustMl, liquorverlustIntraOP Vollständig
Aktivität, HRV, Schlaf stepCount, hrvSDNN, sleepDurationMinutes Vollständig
Serum-Kalium pod7Kalium Ergänzt (POD7-Labor)
Serum-Chlorid pod7Chlorid Ergänzt (POD7-Labor)
Serum-Na⁺ POD 5 podNatriumTag5 Ergänzt (nur Hochrisiko)
Urinvolumen (24h) Proxy: Urin-SG + Gewichtsdelta Indirekt
Na⁺-Zufuhr (Ernährung) Nicht praktikabel ambulant
Tabelle 2: Abdeckung der Literatur-Prädiktoren im HyponaTrack-Datenmodell.

Ergänzung: POD-5-Zwischenlabor für Hochrisiko-Patienten

Basierend auf der Literaturanalyse wird für Patienten mit Risiko-Score \(\geq\) 5 (Klasse Mittel oder Hoch) eine zusätzliche ambulante Blutentnahme an POD 5 (\(\pm\) 1 Tag) empfohlen:

  • Parameter: Serum-Na⁺, K⁺, Cl⁻ (Routinelabor, ca. 5 Minuten)
  • Begründung: Der Na⁺-Abfall beginnt typischerweise POD 5–9 (kritisches Zeitfenster). Ohne Zwischenmessung fehlt das Ground-Truth-Label für ML-Training in der vulnerabelsten Phase.
  • Aufwand: Betrifft ca. 30–40 % der Kohorte. Messort: Hausarzt oder Ambulanz.
  • Ethik-Amendment: Erforderlich für die zusätzliche Blutentnahme.

Ergänzung: Kalium und Chlorid bei POD-7-Kontrolle

Kinoshita et al. (2024) nutzen Serum-K⁺ und Serum-Cl⁻ als Prädiktoren in ihrem SVR-Modell (R² = 0,92). Diese werden bei der ohnehin stattfindenden POD-7-Blutentnahme zusätzlich bestimmt — ohne relevanten Mehraufwand.

ML-Stufenplan

roadmap p1 Phase 1 n < 20 ───────────── Regel-System Threshold-Kalibrierung ROC-Optimierung p2 Phase 2 n ≥ 40 ───────────── Shadow-ML Log. Regression (LOOCV) Parallel zum Ampel-System p1->p2 Kalibrierungsphase abgeschlossen p3 Phase 3 n ≥ 80 ───────────── XGBoost + SHAP Feature-Importance Feedback in Regeln p2->p3 Pilotstudie abgeschlossen p4 Phase 4 n > 200 ───────────── SVR-Verlaufsprognose Causal Forest Prospektive Validierung p3->p4 Folgestudie gestartet
Abbildung 1: Vier-Phasen-Stufenplan zur ML-Integration in HyponaTrack

Phase 1: Regel-System stärken (n = 0–20)

  • Das bestehende evidenzbasierte Eskalationssystem (RiskEngine + EscalationEngine) wird eingesetzt
  • Priorität: Threshold-Kalibrierung nach den ersten 20 Patienten mittels ROC-Optimierung der GELB-/ROT-Schwellen
  • Die Python-Pipeline (03_algorithmus_performance.qmd) ist dafür bereits vorbereitet
  • Kein ML in dieser Phase — die Stichprobe ist zu klein für belastbare Ergebnisse

Phase 2: Shadow-Validierung (n \(\geq\) 40)

Ein einfaches ML-Modell läuft im Shadow-Modus parallel zum Regel-System, ohne Einfluss auf Patienten-Alerts:

  1. Modell: Logistische Regression (interpretierbar, wenig Daten nötig, klinisch akzeptiert, class-weight-balanced)
  2. Features: Na⁺-Baseline, Na⁺ POD 1/2, Alter, Geschlecht, Risiko-Score, Gewichtsdelta POD 3–5, Symptom-Score-Trend
  3. Zielvariable: DPH (Na⁺ < 135 mmol/l an POD 7)
  4. Validierung: Leave-One-Out Cross-Validation (bei kleinem n sinnvoller als Train/Test-Split)
  5. Auswertung: AUC Regel-System vs. ML, Seite an Seite
  6. Keine App-Änderung nötig — rein in der Python-Analyse-Pipeline (07_ml_shadow.qmd)

Phase 3: Erweiterte ML-Evaluation (n \(\geq\) 80)

  • XGBoost + SHAP (bestes Modell in 3/9 Literatur-Studien, AUC 0,82–0,83)
  • Vergleich: Regel-basiert vs. Logistische Regression vs. XGBoost
  • Feature-Importance-Analyse \(\rightarrow\) Feedback-Loop in das Regel-System (z. B. neue Schwellenwerte für identifizierte Hochrisiko-Features)
  • Zeitreihen-Features: 3-Tages-Gewichtstrend, Symptom-Score-Beschleunigung, Aktivitätsdelta

Phase 4: Vollständiges ML-System (n > 200, Folgestudie)

  • SVR-Regressionsmodell nach Kinoshita-Vorbild: Na⁺-Verlaufsprognose alle 6 h aus klinisch verfügbaren Parametern (Fluid-Intake, Urin-Output-Proxy, Serum-Na/K/Cl)
  • Causal Forest nach Andersson-Vorbild: Therapieentscheidungs-Unterstützung — nicht nur “Wie hoch ist das Risiko?”, sondern “Welche Intervention reduziert das Risiko am meisten?”
  • Prospektive Validierung in einer unabhängigen Kohorte (externes Zentrum)

Analyse-Pipeline

Die Shadow-ML-Pipeline ist als Quarto-Notebook implementiert (07_ml_shadow.qmd) und umfasst:

  1. Feature Engineering: Aggregation der Daily-Monitoring-Daten (POD 3–6) zu Patienten-Level-Features (Mittelwert, Maximum, Trend)
  2. Imputation: Fehlende Werte durch Median-Imputation (erwartete Missingness: 10–40 % je nach Parameter)
  3. Standardisierung: Z-Transformation für faire Koeffizientenvergleiche
  4. Modell-Training: LOOCV mit Logistischer Regression, Random Forest und Gradient Boosting
  5. Vergleich: ROC-Kurven und Performance-Metriken (Sensitivität, Spezifität, PPV, NPV) gegen das Regel-System
  6. Feature-Importance: Standardisierte Koeffizienten der Logistischen Regression

Die Pipeline läuft derzeit mit synthetischen Demodaten (n = 30) und ist bereit für echte Studiendaten nach Studienstart.

Literatur

Fuse, Y. et al. (2023). Machine learning models predict delayed hyponatremia post-transsphenoidal surgery using clinically available features. Pituitary, 26, 543–553.
Lin, Y. et al. (2025). Machine learning algorithms for predicting delayed hyponatremia after transsphenoidal surgery for patients with pituitary adenoma. Scientific Reports, 14, 83319.