Shadow-ML-Validierung

Logistische Regression vs. Regel-basiertes Ampel-System

Autor:in

HyponaTrack-Studienteam

Veröffentlichungsdatum

6. Juli 2026

Beispieldaten

Die folgenden Auswertungen basieren auf synthetischen Demodaten (n = 30) zur Demonstration der ML-Pipeline — keine echten Patientendaten. Bei echten Daten sollte n >= 40 betragen, bevor Ergebnisse interpretiert werden.

Literatur-Evidenz

Basierend auf der PubMed-Recherche (03/2026, 12 relevante Paper) zu ML-Modellen bei Hyponatriämie. Schlüsselreferenzen:

Kinoshita et al. 2024: SVR-Modell, R^2 = 0.92, 6h-Intervall-Prognose
Sci Rep 2025: XGBoost AUC 0.821, SHAP-Erklärbarkeit
Jung et al. 2025: Multicenter XGBoost AUC 0.83
Andersson et al. 2025: Causal Forest, 4-Kovariaten-Modell

1. Fragestellung

Kann ein einfaches ML-Modell (Logistische Regression) die DPH-Prädiktion des regel-basierten Ampel-Systems übertreffen — insbesondere hinsichtlich Sensitivität und Vorlaufzeit?

Shadow-Modus: Das ML-Modell läuft parallel zum Regel-System, aber ohne Einfluss auf Patienten-Alerts. Beide Systeme werden retrospektiv verglichen.

2. Feature Engineering

ML-Datensatz: n = 30, DPH = 12 (40.0%)
Features: 28

3. Modell-Training (Leave-One-Out Cross-Validation)

Bei kleinem n ist LOOCV sinnvoller als ein Train/Test-Split (vgl. Voglis 2020, n=207).

4. Performance-Vergleich

5. ROC-Kurven

6. Feature-Importance (Logistische Regression)

7. Interpretation & Naechste Schritte

============================================================
SHADOW-ML ZUSAMMENFASSUNG
============================================================

Datensatz: n = 30, DPH-Rate = 40.0%

Metrik                  Regel-System    Log. Regression
-------------------------------------------------------
Sensitivität                 100.0%             58.3%
Spezifitaet                   11.1%             83.3%
PPV                           42.9%             70.0%
NPV                          100.0%             75.0%
AUC                              ---              0.866

HINWEIS: Bei n < 40 sind diese Ergebnisse NICHT belastbar.
Die Pipeline ist bereit fuer echte Daten nach Studienstart.

Empfohlene Phasen:
  Phase 1 (n < 20):  Nur Regel-System, Threshold-Kalibrierung
  Phase 2 (n >= 40): Shadow-ML aktivieren, AUC-Vergleich
  Phase 3 (n >= 80): XGBoost + SHAP, Feature-Importance Feedback
  Phase 4 (n > 200): SVR-Verlaufsprognose (Kinoshita-Modell)

Klinische Einordnung

Das ML-Modell läuft im Shadow-Modus — es hat keinen Einfluss auf die Patientenversorgung. Erst nach prospektiver Validierung an einer unabhängigen Kohorte (Phase 4) kann eine Integration in das Warnsystem erwägt werden.