Machine-Learning-Roadmap
Einordnung
Das regelbasierte Ampel-System von HyponaTrack basiert auf evidenzgestützten Schwellenwerten und einem klinischen Risiko-Score. Parallel dazu soll ein Machine-Learning-Ansatz (ML) evaluiert werden, um perspektivisch die Prädiktionsgenauigkeit zu verbessern. Dieses Kapitel beschreibt den ML-Stufenplan, die Literaturgrundlage und die Implikationen für die Datenerhebung.
Literaturgrundlage
Eine systematische PubMed-Recherche (03/2026) identifizierte 12 relevante Arbeiten zu ML-Modellen bei Hyponatriämie. Die wichtigsten Ergebnisse sind in Tabelle 1 zusammengefasst.
| Studie | Jahr | Kontext | Bestes Modell | AUC |
|---|---|---|---|---|
| Kinoshita et al. (Kinoshita2024?) | 2024 | Therapie-Response 6h-Prognose | SVR | R² = 0,92 |
| Lin et al. (Lin et al., 2025) | 2025 | Verzögerte Hyponatriämie post-TSS | XGBoost | 0,821 |
| Fuse et al. (Fuse et al., 2023) | 2023 | Verzögerte Hyponatriämie post-TSS | Random Forest | 0,759 |
| Voglis et al. (Voglis2020?) | 2020 | Postop. Hyponatriämie (Machbarkeit) | Boosted GLM | 0,843 |
| Jung et al. (Jung2025?) | 2025 | OXC-induzierte Hyponatriämie | XGBoost | 0,83 |
| Andersson et al. (Andersson2025?) | 2025 | Thiazid-induzierte Hyponatriämie | Causal Forest | — |
Zentrale Erkenntnisse
Bevorzugte Algorithmen: XGBoost war in 3 von 9 Studien das beste Modell, gefolgt von Random Forest (2/9) und Support Vector Machine/Regression (2/9). Alle Studien mit AUC > 0,80 nutzten Ensemble-Methoden oder Gradient Boosting.
SHAP-Erklärbarkeit: Fünf Studien setzten SHapley Additive exPlanations (SHAP) ein, um die Feature-Importance zu visualisieren. Dies ist für die klinische Akzeptanz essenziell — ein “Black Box”-Modell wird im klinischen Alltag nicht angenommen.
Studienübergreifende Prädiktoren:
- Serum-Natrium (Baseline und Verlauf) — in allen Studien der stärkste Prädiktor
- Alter — in 5/9 Studien relevant
- Begleitmedikation (Diuretika, Antikonvulsiva) — in 3/9 Studien
- Laborparameter (Kalium, Chlorid, Hämoglobin, CRP) — in 4/9 Studien
- Urinparameter (Volumen, Natrium) — in 2/9 Studien
Zentrale Lücke
Alle existierenden ML-Modelle nutzen ausschließlich stationäre Daten. Keines integriert ambulante Monitoring-Zeitreihen (Gewichtstrend, Aktivitätsverlauf, Symptom-Score-Dynamik). HyponaTrack erfasst erstmals diese longitudinalen Daten und kann so eine neuartige Datenbasis für eine kombinierte Risikostratifizierung schaffen.
Implikationen für die Datenerhebung
Der Abgleich der Literatur-Prädiktoren mit dem HyponaTrack-Datenmodell zeigt, dass die meisten ML-relevanten Features bereits erhoben werden (Tabelle 2).
| Literatur-Prädiktor | HyponaTrack-Feld | Status |
|---|---|---|
| Serum-Na⁺ Baseline, POD 1/2/7 | praeOpNatrium, podNatriumTag1/2, pod7Natrium |
Vollständig |
| Alter, Geschlecht, BMI | age, sex, bmi |
Vollständig |
| Gewichtsverlauf 2x/Tag | weightMorning, weightEvening |
Vollständig |
| Symptom-Score 2x/Tag | symptomEntry (gewichtet) |
Vollständig |
| Flüssigkeitszufuhr | fluidIntakeML |
Vollständig |
| Risiko-Medikamente | risikoMedikamenteCSV |
Vollständig |
| OP-Dauer, Blutverlust, CSF-Leck | opDauerMin, blutverlustMl, liquorverlustIntraOP |
Vollständig |
| Aktivität, HRV, Schlaf | stepCount, hrvSDNN, sleepDurationMinutes |
Vollständig |
| Serum-Kalium | pod7Kalium |
Ergänzt (POD7-Labor) |
| Serum-Chlorid | pod7Chlorid |
Ergänzt (POD7-Labor) |
| Serum-Na⁺ POD 5 | podNatriumTag5 |
Ergänzt (nur Hochrisiko) |
| Urinvolumen (24h) | Proxy: Urin-SG + Gewichtsdelta | Indirekt |
| Na⁺-Zufuhr (Ernährung) | — | Nicht praktikabel ambulant |
Ergänzung: POD-5-Zwischenlabor für Hochrisiko-Patienten
Basierend auf der Literaturanalyse wird für Patienten mit Risiko-Score \(\geq\) 5 (Klasse Mittel oder Hoch) eine zusätzliche ambulante Blutentnahme an POD 5 (\(\pm\) 1 Tag) empfohlen:
- Parameter: Serum-Na⁺, K⁺, Cl⁻ (Routinelabor, ca. 5 Minuten)
- Begründung: Der Na⁺-Abfall beginnt typischerweise POD 5–9 (kritisches Zeitfenster). Ohne Zwischenmessung fehlt das Ground-Truth-Label für ML-Training in der vulnerabelsten Phase.
- Aufwand: Betrifft ca. 30–40 % der Kohorte. Messort: Hausarzt oder Ambulanz.
- Ethik-Amendment: Erforderlich für die zusätzliche Blutentnahme.
Ergänzung: Kalium und Chlorid bei POD-7-Kontrolle
Kinoshita et al. (2024) nutzen Serum-K⁺ und Serum-Cl⁻ als Prädiktoren in ihrem SVR-Modell (R² = 0,92). Diese werden bei der ohnehin stattfindenden POD-7-Blutentnahme zusätzlich bestimmt — ohne relevanten Mehraufwand.
ML-Stufenplan
Phase 1: Regel-System stärken (n = 0–20)
- Das bestehende evidenzbasierte Eskalationssystem (RiskEngine + EscalationEngine) wird eingesetzt
- Priorität: Threshold-Kalibrierung nach den ersten 20 Patienten mittels ROC-Optimierung der GELB-/ROT-Schwellen
- Die Python-Pipeline (
03_algorithmus_performance.qmd) ist dafür bereits vorbereitet - Kein ML in dieser Phase — die Stichprobe ist zu klein für belastbare Ergebnisse
Phase 2: Shadow-Validierung (n \(\geq\) 40)
Ein einfaches ML-Modell läuft im Shadow-Modus parallel zum Regel-System, ohne Einfluss auf Patienten-Alerts:
- Modell: Logistische Regression (interpretierbar, wenig Daten nötig, klinisch akzeptiert, class-weight-balanced)
- Features: Na⁺-Baseline, Na⁺ POD 1/2, Alter, Geschlecht, Risiko-Score, Gewichtsdelta POD 3–5, Symptom-Score-Trend
- Zielvariable: DPH (Na⁺ < 135 mmol/l an POD 7)
- Validierung: Leave-One-Out Cross-Validation (bei kleinem n sinnvoller als Train/Test-Split)
- Auswertung: AUC Regel-System vs. ML, Seite an Seite
- Keine App-Änderung nötig — rein in der Python-Analyse-Pipeline (
07_ml_shadow.qmd)
Phase 3: Erweiterte ML-Evaluation (n \(\geq\) 80)
- XGBoost + SHAP (bestes Modell in 3/9 Literatur-Studien, AUC 0,82–0,83)
- Vergleich: Regel-basiert vs. Logistische Regression vs. XGBoost
- Feature-Importance-Analyse \(\rightarrow\) Feedback-Loop in das Regel-System (z. B. neue Schwellenwerte für identifizierte Hochrisiko-Features)
- Zeitreihen-Features: 3-Tages-Gewichtstrend, Symptom-Score-Beschleunigung, Aktivitätsdelta
Phase 4: Vollständiges ML-System (n > 200, Folgestudie)
- SVR-Regressionsmodell nach Kinoshita-Vorbild: Na⁺-Verlaufsprognose alle 6 h aus klinisch verfügbaren Parametern (Fluid-Intake, Urin-Output-Proxy, Serum-Na/K/Cl)
- Causal Forest nach Andersson-Vorbild: Therapieentscheidungs-Unterstützung — nicht nur “Wie hoch ist das Risiko?”, sondern “Welche Intervention reduziert das Risiko am meisten?”
- Prospektive Validierung in einer unabhängigen Kohorte (externes Zentrum)
Analyse-Pipeline
Die Shadow-ML-Pipeline ist als Quarto-Notebook implementiert (07_ml_shadow.qmd) und umfasst:
- Feature Engineering: Aggregation der Daily-Monitoring-Daten (POD 3–6) zu Patienten-Level-Features (Mittelwert, Maximum, Trend)
- Imputation: Fehlende Werte durch Median-Imputation (erwartete Missingness: 10–40 % je nach Parameter)
- Standardisierung: Z-Transformation für faire Koeffizientenvergleiche
- Modell-Training: LOOCV mit Logistischer Regression, Random Forest und Gradient Boosting
- Vergleich: ROC-Kurven und Performance-Metriken (Sensitivität, Spezifität, PPV, NPV) gegen das Regel-System
- Feature-Importance: Standardisierte Koeffizienten der Logistischen Regression
Die Pipeline läuft derzeit mit synthetischen Demodaten (n = 30) und ist bereit für echte Studiendaten nach Studienstart.