Hydrologisches Vorhersagemodell

v720b_r3c - Evidence-Constrained HBV mit UZL-Fix

Produktionsversion seit 2026-03-14

0.820
Val NSE
0.849
Val KGE
12.4%
PBIAS
-2.0h
Lag

⚠️ Saisonale Einschränkung: Die obigen Metriken gelten für Fold 4 (Val 2024, ganzjährig). Saisonal disaggregiert (Folds 1-4, 2021-2024): Winter NSE=0.78, Frühjahr 0.80, Sommer NSE=0.27 (Einzeljahre bis -1.7), Herbst 0.79. → Sommervorhersagen sind eingeschränkt verlässlich. Details: Saisonale Performance

Zusammenfassung

Das v720b_r3c-Modell ist ein konzeptionelles, räumlich aggregiertes (Lumped) Niederschlags-Abfluss-Modell basierend auf dem HBV-Modellrahmen (Hydrologiska Byrans Vattenbalansavdelning)[1,2]. Es wurde für das Einzugsgebiet der Werse bis zum Pegel Albersloh (321,6 km²[3]) kalibriert und validiert.

Die Kalibrierung erfolgte mittels Forward-Chaining Time-Series Cross-Validation (5 Folds) über den Zeitraum 2016-2024. Fold 4 (Training: 2016-2023, Validierung: 2024) wurde aufgrund des höchsten Validierungs-KGE von 0.849 für die Produktion ausgewählt.

Modellparameter

Bodenwasserhaushalt

Parameter Wert Einheit Beschreibung Bounds / Transformation
FC 220.79 mm Feldkapazität - maximale Bodenwasserspeicherung [120, 250] (kalibriert)
LP 0.90 - ET-Schwellenwert (rel. SM oberhalb der ET = PET) 0.90 (fixiert, Evidenz)
BETA 4.42 - Formparameter für Abflussbildung: Recharge = P × (SM/FC)β [1.5, 4.5] (kalibriert)

Speicher-Abfluss-Beziehung (Bijektive K-Transformation)

Hinweis: Die K-Parameter werden durch eine bijektive Sigmoid-Transformation berechnet, die K0 > K1 > K2 mathematisch garantiert. Die theta-Werte sind unbeschränkte Optimierungsparameter. Formeln siehe Abschnitt "Bijektive K-Transformation" unten.

Parameter θ-Wert / Bounds K-Wert (1/h) t½ Beschreibung
K0 (θ₀) -4.38 (unbeschr.) 0.0140 50h Schnellabfluss (SUZ > UZL), K0 = K1 + σ(θ₀)×0.45
K1 (θ₁) -2.56 (unbeschr.) 0.0084 82h Interflow, K1 = K2 + σ(θ₁)×0.05
K2 (θ₂) 3.35 [0.2, 4.0] 0.00483 143h Basisabfluss, K2 = σ(θ₂)×0.005
UZL 8.98 mm [5, 30] - Obere Zonenschwelle (Q0 aktiviert bei SUZ > UZL)
KPERC 0.0010 1/h (fixiert) - Perkolationskoeffizient (Evidenz: ≈0 bei Werse, flacher GW-Leiter)

Routing & Zusatzprozesse

Parameter Wert Einheit Beschreibung Bounds / Transformation
MAXBAS 9.96 h Dreieck-Einheitsganglinie Länge [6, 16] (kalibriert)
alpha_rip 0.096 - Ufer-ET Koeffizient: ETrip = αrip × ET₀ × (1 - SM/FC) [0.05, 0.30] + Soft-Prior σ(0.14)
alpha_LZ 1.4 - Potenzgesetz-Exponent für Basisabfluss: Q2 = K2×(SLZ/SLZref)α 1.4 (fixiert)
TT 0.0 °C Schwellentemperatur (Schnee/Regen Partition) 0.0 (fixiert)
CFMAX 0.10 mm/°C/h Grad-Stunden-Faktor (Schneeschmelzrate) 0.1 (fixiert)

Bijektive K-Transformation

Die K-Parameter werden durch eine kumulative Sigmoid-Transformation berechnet, die eine physikalisch konsistente Hierarchie K0 > K1 > K2 mathematisch garantiert:

# Aus src/v700/base/k_transform.py

def sigmoid(x):
    return 1.0 / (1.0 + exp(-x))

# Kumulative Transformation (garantiert K0 > K1 > K2):
K2 = sigmoid(theta_2) * 0.005        # [0, 0.005] /h (Basisabfluss)
K1 = K2 + sigmoid(theta_1) * 0.05    # [K2, K2+0.05] /h (Interflow)
K0 = K1 + sigmoid(theta_0) * 0.45    # [K1, K1+0.45] /h (Schnellabfluss)

# Mit theta_0=-4.38, theta_1=-2.56, theta_2=3.35:
# K2 = 0.00483 /h  (t½ = 143h)
# K1 = 0.00842 /h  (t½ = 82h)
# K0 = 0.01399 /h  (t½ = 50h)

Die Halbwertszeit t½ = ln(2) / K beschreibt die Zeit, in der ein Speicher auf 50% abklingt[4].

Warum ist K0 so langsam? (t½ ≈ 50h)

Die lange Halbwertszeit für den "Schnellabfluss" (K0) erscheint untypisch – in Gebirgs-HBV-Anwendungen liegt t½(K0) typischerweise bei 1-10h. Für das Münsterland ist dieses Verhalten jedoch physikalisch plausibel:

  • Flachlandtopographie: Durchschnittsgefälle < 1‰ verhindert klassischen Oberflächenabfluss. Wasser infiltriert und fließt unterirdisch ab.
  • Kein Horton'scher Oberflächenabfluss: Die hohe Bodendurchlässigkeit (Sandböden, Kiessandzug) absorbiert selbst Starkregenereignisse größtenteils.
  • Interflow-Dominanz: Der "Schnellabfluss" ist hier präferentieller Interflow durch die ungesättigte Zone – langsamer als Oberflächenabfluss, aber schneller als Matrixfluss.
  • Kumulativer Transformationseffekt: Die Randbedingung K0 > K1 > K2 mit Sigmoid-Transformation begrenzt den Spielraum für K0. Die Kalibrierung konvergiert zu θ₀ ≈ -4.4, was sigmoid(θ₀) ≈ 0.012 ergibt – K0 liegt nur marginal über K1.

Interpretation: Das Einzugsgebiet weist keine schnelle Direktabflusskomponente auf. Die Abflusskonzentration erfolgt hauptsächlich über Interflow (K1, t½ ≈ 82h) und gedämpften Basisabfluss (K2, t½ ≈ 144h). Dies ist konsistent mit dem hohen BFI (0.52) und dem gemessenen Abflussverhalten.

Unabhängige Validierung: Das Starkregen-Event Sep 2023 (Ahlen/Beckum) zeigt eine Wellenlaufzeit von ~1 Tag bis Albersloh (~25 Fluss-km). Diese beobachtete Laufzeit von 12-24h korrespondiert mit MAXBAS ≈ 10h und bestätigt die langsame Modellparametrisierung unabhängig von der Kalibrierung.

Wasserstand-Abfluss-Beziehung (Rating Curve)

Die Umrechnung von Wasserstand (W) zu Abfluss (Q) erfolgt mittels PCHIP-Interpolation (Piecewise Cubic Hermite Interpolating Polynomial). Eine frühere Power-Law-Approximation wurde aufgrund systematischer Fehler verworfen (siehe unten).

Strukturbruch 2008

Wichtig: Die Rating Curve änderte sich am 19. Oktober 2008 nach Umbau des Wehrs zur Fischtreppe. Das ursprüngliche Wehr hatte eine Absturzhöhe von 86 cm, dessen Entfernung die Hydraulik fundamental veränderte. Im Modell werden zwei RC-Versionen verwendet: vor 2008-10-19 (R²=0.992) und ab 2008-10-19 (aktuelle, R²=0.994). Der historische Zeitraum 2000-2008 wies zudem zwei alternierende hydraulische Zustände auf (Unter-/Überlinie), deren Ursache unklar ist.

Methode PCHIP (monoton steigend, C¹-stetig)
Power-Law (historischer Fehler) Q = 3.059×10⁻⁴ × (h - 12.5)^2.220 ⚠️ Fehlerhafter h₀=12.5 verursachte PBIAS +230% bei Lowflow. Korrektur zu PCHIP brachte +0.095 NSE.
Stützpunkte 78 (aus Median-Binning historischer W/Q-Daten)
Datenperiode 2009-2023, n = 87.060 Wertepaare
Gültigkeitsbereich W ∈ [0, 253.5] cm → Q ∈ [0, 59.4] m³/s
Quelle HYGON/LANUV NRW, Station-ID: 278830100100

Güte-Metriken (RC ab 2008)

Segment Q-Bereich RMSE MAPE n
Gesamt 0 - 59.4 m³/s 0.994 0.47 m³/s 8.2% 87.060
NQ (< P25) < 0.5 m³/s 0.973 0.02 m³/s 12.4% ~22.000
MQ (P25-P75) 0.5 - 3.5 m³/s 0.997 0.08 m³/s 4.1% ~43.000
HQ (> P75) > 3.5 m³/s 0.989 0.31 m³/s 3.8% ~22.000

Hinweis: Segment-R² < Gesamt-R² bei NQ aufgrund höherer relativer Messunsicherheit bei kleinen Abflüssen. MAPE = Mean Absolute Percentage Error. HQ-Segment zeigt leichte Hysterese-Effekte (Anstiegs- vs. Ablaufphase).

Rating Curve vor 2008 (historisch)

Zwei hydraulische Zustände (2000-2008): Vor dem Umbau der Fischtreppe existierten zwei alternierende hydraulische Zustände (Unterlinie und Überlinie), deren Ursache unklar ist (vermutlich vegetationsabhängig oder saisonale Gerinneveränderung).

Zustand Kubische Formel Gültig
Unterlinie Q = −4.32×10⁻⁶·h³ + 2.747×10⁻³·h² − 0.2119·h + 5.62 0.992 2000-2008 (alternierend)
Überlinie Q = 3.3×10⁻⁷·h³ + 5.70×10⁻⁴·h² + 0.0886·h − 2.61 0.989 2000-2008 (alternierend)

Die vor-2008 Rating Curves wurden aus W-Q-Paaren der HYGON-Datenbank rekonstruiert. Einheit: h in cm, Q in m³/s. Ab 2008-10-19 gilt ausschließlich die PCHIP-Kurve (78 Stützpunkte).

Amtliche Abflusskennwerte (LANUV)

NNQ (niedrigstes) 0.026 m³/s NW = 19 cm
MNQ (mittleres Niedrig) 0.232 m³/s -
MQ (Mittelwert) 2.92 m³/s MW = 46 cm
MHQ (mittleres Hoch) 48.3 m³/s -
HHQ (höchstes) 109 m³/s HW = 205 cm (2007)

Bekannte Rückstau-Ereignisse

Rückstau (Backwater): Bei folgenden Ereignissen wurde die Rating Curve durch Rückstau aus stromabwärts gelegenen Strukturen (drei Wehre zwischen Ems-Einmündung und Albersloh) systematisch verletzt - d.h. der gemessene Abfluss Q lag deutlich unter dem aus W berechneten:

  • 28.-31.07.2014: 4 Tage, 79 anomale Messpunkte (98.75% des Blocks). "Sintflut von Münster" - 292 l/m² in 7 Stunden, 2 Tote, 24.000 Haushalte ohne Strom. WetterOnline, MünsterWiki, MS Aktuell (10 Jahre)
  • 13.09.2023: 1 Tag, 17 anomale Messpunkte (100% des Blocks). Jahr der Werse-Hochwasser mit mehreren Ereignissen Aug/Sep 2023. Hochwasser an der Werse

Diese Ereignisse wurden bei der RC-Kalibrierung ausgeschlossen.

Rating Curve Vergleich (vor/ab 2008)

Rating Curve Vergleich

Abb. 1: Rating Curve Vergleich. Links: Gesamtbereich mit simuliertem Scatter (100 Punkte/Dezil). Rechts: Detailansicht Niedrigwasser. Strukturbruch 2008 durch Fischtreppe-Umbau.

Hysterese nach Hochwasser

Nach Abflussspitzen bildet sich eine typische Hysterese-Schleife im W-Q-Diagramm: Bei gleichem Wasserstand ist der Abfluss in der steigenden Flanke (Anstieg) höher als in der fallenden Flanke (Rückgang). Dieser Effekt wird durch instationäre Speicherprozesse im Gerinne verursacht (Jones-Formel: Qdyn = Qstat × (1 + k × dW/dt)). Das HBV-Modell bildet diese Dynamik implizit durch die Speicher-Routing-Struktur (MAXBAS) ab, verwendet aber eine eindeutige W-Q-Beziehung (PCHIP). Für Hochwasserwarnung ist die Überschätzung in der Rückgangsphase konservativ (sicher).

Hysterese-Schleife

Abb. 2: Synthetisches Beispiel einer Hysterese-Schleife. Links: W-Q-Diagramm mit Richtungspfeilen. Rechts: Zeitreihe mit dynamischem (rot/blau) vs. stationärem (gestrichelt) Abfluss.

# Aus src/models/rating_curves.py
from scipy.interpolate import PchipInterpolator

# 78 Stützpunkte (Auszug):
H = [0.0, 25.5, 28.5, 31.5, ..., 250.5, 253.5] # cm
Q = [0.0, 0.22, 0.229, 0.229, ..., 58.03, 59.44] # m³/s

_pchip_albersloh = PchipInterpolator(H, Q)

def rating_curve_albersloh(h_cm: float) -> float:
    if h_cm < 0: return 0.0
    if h_cm > H_MAX: # Lineare Extrapolation
        return Q_MAX + slope * (h_cm - H_MAX)
    return float(_pchip_albersloh(h_cm))

Güte-Kennzahlen

Training (2016-2023)

Nash-Sutcliffe Efficiency (NSE)[5] 0.813
Kling-Gupta Efficiency (KGE)[6] 0.876
Percent Bias (PBIAS) -2.71%
Peak Loss 0.596
Lag (Kreuzkorrelation) -3.0h

Validierung (2024)

Nash-Sutcliffe Efficiency (NSE) 0.820
Kling-Gupta Efficiency (KGE) 0.849
Percent Bias (PBIAS) 12.45%
Peak Loss 0.646
Lag (Kreuzkorrelation) -2.0h

Hinweis zu PBIAS +12.4%: Das Modell überschätzt den Abfluss 2024 um ~12%. Für ein Hochwasserwarnsystem ist Überschätzung akzeptabel (konservativ), aber sollte bei der Interpretation beachtet werden.

Forward-Chaining Cross-Validation (5 Folds)

Fold Training Val Jahr Val NSE Val KGE UZL alpha_rip Status
1 2016-2020 2021 0.758 0.703 9.4 0.181 -
2 2016-2021 2022 0.738 0.680 8.9 0.119 -
3 2016-2022 2023 0.827 0.779 8.9 0.092 -
4 2016-2023 2024 0.820 0.849 9.0 0.096 Production
5 2016-2024 2025 0.079 0.432 8.0 0.101 Excluded (unvollständige 2025-Daten)

Mittelwert (Fold 1-4): NSE = 0.786, KGE = 0.753

Hochwasser-Ereigniserkennung

Ereignis-basierte Validierung: Erkennung von Abflussspitzen > 90. Perzentil (Threshold P90). Mediane über Folds 1-4 (2021-2024). Quelle: v720b_r3_full_eval (Evaluierung von v720b_r3; Werte approximativ gültig für Produktion v720b_r3c, da identische Modellstruktur mit verfeinerten Parametern).

96.2%
POD (Probability of Detection)
Anteil erkannter Ereignisse
51.2%
FAR (False Alarm Rate)
Anteil Fehlalarme
0.47
CSI (Critical Success Index)
Hits / (Hits + Misses + FA)

Peak-Timing Analyse

Fold Val Jahr n Events n Früh n Spät Median Timing Peak PBIAS
1202131246 -12h (früh)-7.3%
22022433211 -10h (früh)+23.1%
3202327225 -6h (früh)-7.8%
4202421192 -5h (früh)+9.5%
52025311910 -3h+21.6%

Median Peak-Timing: -6h (Modell ist im Mittel 6 Stunden früher als Beobachtung). Frühe Vorhersage ist für Warnsysteme vorteilhaft. 77% aller Events werden früh erkannt.

Dezil-basierte Abfluss-Analyse (Flow Duration)

Systematische Bias-Analyse nach Abfluss-Dezilen. Die Tabelle zeigt den mittleren PBIAS für jedes Dezil über alle Folds (1-4). Negative Werte = Unterschätzung, Positive = Überschätzung.

Dezil Q-Bereich PBIAS Interpretation
Q0-10Sehr niedrig +194% Stark überschätzt (Niedrigwasser-Problem)
Q10-20Niedrig +96% Überschätzt
Q20-30Niedrig-Mittel +72% Überschätzt
Q30-40Mittel +16% Leicht überschätzt
Q40-50Mittel -12% Leicht unterschätzt
Q50-60Mittel-Hoch +4% Gut
Q60-70Hoch +6% Gut
Q70-80Hoch +8% Gut
Q80-90Sehr hoch +12% Akzeptabel (konservativ)
Q90-100Spitzen (Peak) +9.5% Gut (Hochwasser-relevant)

Niedrigwasser-Bias: Das Modell überschätzt Niedrigwasser-Perioden (Q0-30) systematisch um 70-200%. Dies ist typisch für HBV-Modelle mit ausgeprägtem Basisabfluss-Speicher. Für Hochwasserwarnung unkritisch, für Wasserbilanz-Studien relevant.

Verkrautung (Makrophyten): Sommerliche Verkrautung im Gerinne kann die Rating Curve temporär verändern (höherer Wasserstand bei gleichem Abfluss). Dieser Effekt ist in der PCHIP-Kurve nicht zeitlich aufgelöst und kann zu saisonalen Abweichungen beitragen, insbesondere bei Niedrig- bis Mittelwasser (Juni-September).

Physikalische Validierung: Basisabfluss-Index (BFI)

Der Baseflow Index (BFI) beschreibt den Anteil des Basisabflusses am Gesamtabfluss. Vergleich zwischen simuliertem und beobachtetem BFI validiert die Speicher-Dynamik.

Fold Val Jahr BFIsim BFIobs Δ BFI (%)
12021 0.5190.499 +4.0%
22022 0.5190.504 +3.1%
32023 0.5190.511 +1.5%
42024 0.5190.517 +0.6%
52025 0.5190.514 +1.1%

BFIsim ≈ 0.52 konsistent über alle Folds (Speicher-Parametrisierung stabil). Beobachteter BFI variiert zwischen 0.50-0.52. Mittlere Abweichung: +2.3%. Die leichte Überschätzung des Basisabflusses korrespondiert mit dem Niedrigwasser-PBIAS.

Definitionen der Güte-Kennzahlen

Nash-Sutcliffe Efficiency (NSE)[5]

NSE = 1 - Σ(Qobs - Qsim)² / Σ(Qobs - Q̄obs

Bereich: [-∞, 1]. NSE = 1 perfekt, NSE = 0 entspricht Mittelwert (Persistence Baseline), NSE < 0 schlechter als Mittelwert. Standardmetrik in der Hydrologie.

Kling-Gupta Efficiency (KGE)[6]

KGE = 1 - √[(r-1)² + (α-1)² + (β-1)²]

Kombiniert Korrelation (r), Variabilität (α = σsimobs), und Bias (β = μsimobs). Bereich: [-∞, 1]. Besser geeignet für Multi-Objective-Optimierung als NSE.

Percent Bias (PBIAS)

PBIAS = 100 × Σ(Qsim - Qobs) / Σ(Qobs)

Positiv: Überschätzung, Negativ: Unterschätzung. Für Hochwasserwarnung ist leichte Überschätzung (+10-15%) akzeptabel (konservativ).

Peak Loss

Asymmetrisch gewichteter mittlerer quadratischer Fehler für Abflusswerte > 75. Perzentil. Unterschätzung wird mit Faktor 3.0 bestraft (kritisch für Hochwasserwarnung).

Lag (Kreuzkorrelation)

Zeitliche Verschiebung zwischen simuliertem und beobachtetem Abfluss bei maximaler Korrelation. Negativ = frühe Vorhersage (gut für Warnung), Positiv = späte Vorhersage.

Datenquellen

Pegeldaten (Wasserstand → Abfluss)

Quelle: Hochwasserportal NRW (HYGON/LANUV)
Station: Albersloh (Werse), Station-ID: 278830100100
Auflösung: 15-Minuten (aggregiert zu stündlich)
Rating Curve: PCHIP-Interpolation (78 Stützpunkte), R²=0.994
Einzugsgebiet: 321,58 km² (LANUV NRW)[3]

Niederschlag

Primär: DWD RADOLAN-RW[7] (Radar + Stationen, 1km Raster)
Fallback: ERA5-Land Reanalyse[8] (0.1° × 0.1°)
Methode: Polygon-basierte Aggregation (Multiple Sampling Points pro Einzugsgebiet, gewichtetes Mittel). Das Gesamteinzugsgebiet wird als ein Lumped-Gebiet behandelt - keine separaten Laufzeiten zwischen Teilgebieten (Ahlen, Linnenkamp, Albersloh).
Auflösung: Stündlich
Korrektur: Richter-Korrektur für Windverluste[9]

Temperatur

Quelle: ERA5-Land Reanalyse[8]
Variable: 2m Lufttemperatur
Auflösung: Stündlich, Gebietsmittel über Einzugsgebiet

Evapotranspiration (ET0)

Berechnung: FAO-56 Penman-Monteith (vereinfacht)[10]
Eingangsdaten: Temperatur, Globalstrahlung, Wind, Luftfeuchte (ERA5-Land)
Auflösung: Stündlich (aus src/models/penman_monteith.py)

Vorhersage-Niederschlag

0-48h: ICON-D2 (DWD), 2.2km, stündlich
48-168h: ICON-EU (DWD), 6.5km, 3-stündlich
168-384h: Open-Meteo Ensemble (GFS, ECMWF), täglich
Methode: Punkt-basiertes Sampling aus Einzugsgebiets-Polygon (GeoJSON definiert die Fläche, mehrere Stützpunkte werden aus Open-Meteo API abgerufen und zu einem gewichteten Mittel aggregiert). Nicht direkte GeoJSON-API.

Datentransformationen

1. Wasserstand → Abfluss (Rating Curve)

# PCHIP-Interpolation (nicht Power-Law!)
Q = pchip_interpolate(H, Q_stützpunkte, W)

# Für W > H_max: Lineare Extrapolation
# Für W < 0: Q = 0

# Gültigkeitsbereich: W ∈ [0, 253.5] cm → Q ∈ [0, 59.4] m³/s

2. Abfluss → Spezifischer Abfluss

q_mm = Q [m³/s] × 3.6 / A_km²
q_mm = Q × 3.6 / 321.6 [mm/h]

# Einzugsgebietsfläche: 321,58 km² (LANUV NRW)

3. Externe Zuflüsse (Wasserbilanz-Routing)[12]

# Grundwasser aus Münsterländer Kiessandzug
# Quelle: GD NRW - "ergiebigster Porengrundwasserleiter des Münsterlandes"
# Schätzung basiert auf: Nitrat-Fracht-Analyse (30% GW-Anteil), BFI 0.7-0.8
gw_kiessandzug = 0.137 mm/d (auf Teil-EZG 120 km²)
→ 0.052 mm/d (auf Gesamt-EZG 321.6 km²) = ~19 mm/a

# Technogene Einleitungen (importiertes Trinkwasser aus Ruhr/Lippe)
# KA Ahlen (92.000 EW), KA Beckum (77.000 EW), KA Brock (27.000 EW)
# Gesamtimport: ~9.1 Mio. m³/a aus Wasserwerk Echthausen (Gelsenwasser AG)
tech = 0.031 mm/d (lokale Rate Albersloh)
→ 0.068 mm/d (Gesamt-EZG) = ~25 mm/a

# Ufer-Evapotranspiration (reduziert Direktzuflüsse bei Trockenheit)
# Auenfläche: ~0.5-1.0 km² (50km Gewässernetz × 10m Randzone)
ET_rip = alpha_rip × ET₀ × (1 - SM/FC)

# Effektiver Direktzufluss
Q_direct_eff = max(0, tech + ind - ET_rip)

Herleitung: Die externen Zuflüsse wurden mittels Residualmethode (Bilanzschließung) und unabhängiger Plausibilisierung geschätzt:

  • Kiessandzug: Aus Grundwasserbilanz: Abflussspende 400 mm/a (Jahresreihe 2000-2023) abzüglich Niederschlag-ET-Differenz (350 mm/a, HYRAS/ERA5) ergibt GW-Zustrom ~50 mm/a lokal. Flächengewichtung auf EZG → ~19 mm/a. Konsistent mit BFI 0.52 und Nitrat-Verdünnung (Grundwasser-Anteil ~30% aus Isotopen-Studien[15]).
  • Technogen: Trinkwasserimport aus Ruhrtal (Gelsenwasser AG Echthausen) abzüglich industrieller Eigenförderung. Einwohneräquivalente: 196.000 EW × 120 L/d ≈ 8.6 Mio m³/a → 27 mm/a (EZG). Abwassereinleitung über KA Ahlen, Beckum, Brock.

Unsicherheit: ±30% für Kiessandzug (Heterogenität des Aquifers), ±15% für Technogen (gemessene Einleitungsmengen).

Modellarchitektur

┌─────────────────────────────────────────────────────────────┐
│                    EINGABEDATEN                             │
│  P (Niederschlag), T (Temperatur), ET₀, Ext_GW, Ext_Direct │
└──────────────────────────┬──────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────────┐
│                  SCHNEE-ROUTINE                             │
│  if T < TT: SP += P × SFCF; P_eff = 0                      │
│  else: Melt = CFMAX × (T - TT); P_eff = P + Melt          │
└──────────────────────────┬──────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────────┐
│                BODENFEUCHTE-ROUTINE                         │
│  P_eff += Ext_GW (Kiessandzug)                             │
│  Recharge = P_eff × (SM/FC)^BETA                           │
│  SM += P_eff - Recharge - ET_actual                        │
│  ET_actual = ET₀ × min(SM/(FC×LP), 1)                      │
└──────────────────────────┬──────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────────┐
│              SPEICHER-ABFLUSS-ROUTINE                       │
│  SUZ += Recharge - Percolation - Q0 - Q1                   │
│  SLZ += Percolation - Q2                                   │
│                                                             │
│  Q0 = K0 × max(0, SUZ - UZL)  [Schnellabfluss]            │
│  Q1 = K1 × SUZ               [Interflow]                   │
│  Q2 = K2 × (SLZ/SLZ_ref)^α_LZ  [Basisabfluss]            │
│  Percolation = KPERC × SUZ                                 │
└──────────────────────────┬──────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────────┐
│               ROUTING + DIREKTZUFLÜSSE                      │
│  Q_routed = TriangularRouter(Q0 + Q1 + Q2, MAXBAS)        │
│  ET_rip = alpha_rip × ET₀ × (1 - SM/FC)                   │
│  Q_direct_eff = max(0, Ext_Direct - ET_rip)                │
│  Q_total = Q_routed + Q_direct_eff                         │
└──────────────────────────┬──────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────────┐
│                    AUSGABE                                  │
│  Q [mm/h] → Q [m³/s] → W [cm] (inverse Rating Curve)       │
└─────────────────────────────────────────────────────────────┘
            

Kalibrierung

Optimierungsverfahren

Algorithmus Differential Evolution[11] (scipy.optimize)
Strategie best1bin (default)
Populationsgröße 15 × n_params (scipy default)
Max. Iterationen 150
Konvergenz-Toleranz 0.001
Warmup (Burn-in) 720 Stunden (30 Tage)
Trainierbare Parameter 8 (FC, BETA, theta_0, theta_1, theta_2, UZL, MAXBAS, alpha_rip)

Multi-Objective Loss-Funktion

# Aus src/v700/base/loss_v720_r2.py

Loss = 0.15 × (1 - NSE)            # Standard-NSE
+ 0.30 × Lowflow_Loss       # Damped LogNSE (eps=0.10)
+ 0.15 × Peak_Loss          # Asymm. gewichtet >75.Pz
+ 0.10 × |PBIAS|/100         # Wasserbilanz
+ 0.10 × Lag_Penalty         # Sigmoid-Penalty
+ 0.10 × MAXBAS_Penalty     # Sweetspot [8, 14]h
+ 0.10 × (1 - KGE)           # Zusätzliche Güte
+ 0.025 × alpha_rip_prior  # Soft-Prior ~0.14

Hinweis zu den Gewichten: Die Loss-Gewichte summieren sich zu 1.025 (nicht 1.0), da der alpha_rip Soft-Prior (0.025) additiv zum Basis-Loss hinzugefügt wird. Dies entspricht der Implementierung in src/v700/train_v720b_r3c_kfold.py (Zeile 412-413). Die Nicht-Normalisierung ist beabsichtigt: Der Prior wirkt als leichte Regularisierung, nicht als vollwertiges Optimierungsziel.

Forward-Chaining Validierung

Fold Training Validierung
12016-20202021
22016-20212022
32016-20222023
4 (Production)2016-20232024
5 (Excluded)2016-20242025 (unvollständig)

Forward-Chaining (expanding window) vermeidet Datenleckage bei Zeitreihen. Jeder Fold trainiert auf allen bisherigen Jahren und validiert auf dem Folgejahr.

Einzugsgebiet

Gewässer Werse
Pegel Albersloh
Station-ID 278830100100 (HYGON)
Einzugsgebietsfläche 321,58 km²[3]
Koordinaten 51.8839° N, 7.7282° E
Pegelnullpunkt (PNP) 48,70 m ü. NHN
Mittlerer Abfluss (MQ) 2.92 m³/s (LANUV 1960-2014)
Sohlgefälle 1.1 - 1.5 ‰
Spezifischer Abfluss 9.1 l/s·km² (MQ/A)

Charakteristik

  • Flachland-Einzugsgebiet im Münsterland
  • Überwiegend landwirtschaftliche Nutzung
  • Sandige bis lehmige Böden (Münsterländer Kiessandzug)
  • Geringe Reliefenergie (~20-100 m ü. NHN)
  • Grundwasserzustrom aus Kiessandzug (~50 mm/a)
  • Technogene Einleitungen (Kläranlagen ~25 mm/a)

Rückstau-Potential (Ems)

  • PNP Albersloh: 48,70 m ü. NHN
  • PNP Greven (Ems): 32,71 m ü. NHN
  • Höhendifferenz: 15,99 m
  • Bei Ems-Hochwasser reduziertes Gefälle

Teileinzugsgebiete (Kaskade)

Die Werse wird durch drei Pegel in Teileinzugsgebiete (TG) untergliedert. Das Modell behandelt alle TG als Lumped-Gebiet ohne explizite Laufzeit-Routing zwischen den Pegeln.

Pegel EZGkum [km²] ΔEZG [km²] PNP [m ü.NHN] MQ [m³/s] q [l/s·km²] Fluss-km
Ahlen 47 47 (TG1) 73,56 0.61 13.1 52,23
Linnenkamp 104 57 (TG2) ~62 ~1.2 ~11.5 ~40
Albersloh 322 217 (TG3) 48,70 2.92 9.1 27,47
Mündung (Ems) 762 440 (TG4) - - - 0

Spezifischer Abfluss (q): Ahlen zeigt mit 13.1 l/s·km² einen höheren spezifischen Abfluss als Albersloh (9.1 l/s·km²). Dies deutet auf: (1) unterschiedliche geologische Bedingungen (Ahlen: mehr Versiegelung, Kläranlagen), (2) nicht-lineare Skalierung mit der Einzugsgebietsgröße. Das Delta-EZG Albersloh (TG3) hat den niedrigsten impliziten q-Wert, was auf höhere ET und Versickerung im ländlichen Bereich hindeutet.

Modellgrenzen & Unsicherheiten

Strukturelle Annahmen

  • Lumped-Ansatz: Keine räumliche Differenzierung innerhalb des EZG. Teilgebiets-spezifische Dynamik (Ahlen urban, Beckum industriell, Albersloh ländlich) wird nicht explizit abgebildet.
  • Schnee-Routine: Einfacher Grad-Stunden-Ansatz, nicht kalibriert (CFMAX=0.1 fixiert). Für Münsterland mit seltenen Schnee-Ereignissen akzeptabel.
  • Keine Rückstau-Modellierung: Drei Wehre zwischen Ems-Einmündung und Pegel Albersloh können bei Ems-Hochwasser Rückstau verursachen. Die Fischtreppe (2008) veränderte die Rating Curve dauerhaft (berücksichtigt durch 2008-Switch). Temporäre Rückstau-Ereignisse werden nicht modelliert:
    • Juli 2014: "Münster-Sintflut" mit 292 l/m² in 7h — Wehr ertrunken, Rückstau aus Ems
    • Sep 2023: Starkregen Ahlen/Beckum (102.6 l/m²) — Flutwelle mit ~1 Tag Laufzeit nach Albersloh

Parameter-Unsicherheiten

  • Externe Zuflüsse: Kiessandzug (~50 mm/a) und technogene Importe (~25 mm/a) sind Schätzungen auf Basis von Bilanzanalysen, keine direkten Messungen.
  • Rating Curve: PCHIP mit 78 Punkten hat R²=0.994, aber systematische Abweichungen bei Verkrautung (Sommer) und Extrapolation über 253.5 cm sind möglich.
  • PBIAS +12.5%: Modell überschätzt systematisch. Für Hochwasserwarnung konservativ, für Wasserbilanzen problematisch.

Bekannte Limitierungen

  • Saisonale Dynamik: Das Modell enthält implizite saisonale Variabilität über den Parameter alpha_rip: ETrip = αrip × ET₀ × (1 - SM/FC). Bei trockenem Boden (Sommer) ist die Ufer-ET höher, bei nassem Boden (Winter) niedriger. Explizit zeitlich variable Parameter (z.B. saisonaler K-Wert) wurden nicht implementiert.
  • Extremereignisse: Training auf 2016-2023 enthält nur ein Extremjahr (2018 Dürre). Übertragbarkeit auf extreme Hochwasser (HQ100) nicht validiert.
  • Klimawandel: Stationarität der Parameter angenommen. Langfristige Änderungen (Kiessandzug-Niveau, ET-Muster) könnten Rekalibrierung erfordern.
  • Vorhersage-Horizont: Güte sinkt mit Vorhersage-Länge. Ab 72h dominiert NWP-Unsicherheit, nicht Modell-Unsicherheit.

Empfohlene Erweiterungen (zukünftig)

  • Probabilistische Vorhersage mittels Ensemble-NWP (bereits implementiert, aber nicht kalibriert)
  • Unsicherheitsbänder aus Ensemble-Dispersion
  • Online-Kalibrierung / Data Assimilation (Zustandsschätzung)

Bereits getestete Ansätze (mit Einschränkungen)

  • PINN (Physics-Informed Neural Network): v100-Serie (HBV+PINN Fehlerkorrektur). Ergebnis: Marginale Verbesserung (+0.01-0.02 NSE), hohe Komplexität, Overfitting-Risiko. Nicht empfohlen für operationellen Einsatz.
  • LSTM (Long Short-Term Memory): v600-Serie (v650 LSTM-Hybrid, v670 WALRUS-Hybrid). Ergebnis: Vergleichbare Performance zu HBV, aber weniger interpretierbar, längere Trainingszeiten. Potenzial für sehr lange Vorhersagehorizonte (>168h).
  • WALRUS: v670 WALRUS-Hybrid getestet. Speicherkonzept ähnlich HBV, aber andere Parametrisierung. Re-Test empfohlen mit neueren Daten (2016-2025).

Potenzielle Verbesserungen (nicht getestet)

  • Pegelabhängige Fließgeschwindigkeit: Gerinnewiderstand (Manning-n) nimmt bei steigendem Wasserstand ab (glatteres Profil, weniger relative Rauheit). Könnte Hysterese-Effekte und Peak-Timing verbessern.
  • Kapillarer Aufstieg: Wasseraufstieg aus Grundwasser in ungesättigte Zone während Trockenperioden. Aktuell nicht implementiert - könnte Niedrigwasser-Simulation verbessern.
  • Auen-ET-Ausschluss: Ufer-Evapotranspiration (alpha_rip) möglicherweise zu hoch angesetzt. Alternative: Direkte Messung/Schätzung der Auenfläche statt Kalibrierung.
  • Räumliche Disaggregierung: Semi-distributed Modell mit explizitem Routing zwischen Teileinzugsgebieten (Ahlen → Linnenkamp → Albersloh). Würde Muskingum-Cunge Routing erfordern.

Baseline-Vergleich

Vergleich der Modell-Performance mit einfachen Referenz-Modellen (Baselines). Ein gutes Modell sollte alle Baselines deutlich übertreffen.

Modell NSE RMSE (mm/h) Beschreibung
v720b_r3c (Production) 0.820 0.020 HBV mit Wasserbilanz-Routing
Persistence (Qt = Qt-1) 0.998* 0.287 Vorhersage = letzter bekannter Wert (stündlich)
Climatology (Q̄Monat) 0.16 ~0.045 Vorhersage = Monatsmittelwert
Naive Regression (P → Q) 0.30-0.40 ~0.035 Lineare Regression Niederschlag → Abfluss

*Anmerkung zu Persistence NSE: Der hohe Persistence-Wert (0.998) reflektiert die hohe Autokorrelation stündlicher Abflusswerte in Flachlandflüssen mit dominantem Basisabfluss. Dies ist keine vergleichbare Vorhersage-Baseline: Persistence nutzt Q(t-1) als Input, während das HBV-Modell Q allein aus meteorologischen Inputs (P, T, ET₀) ohne Kenntnis von Q(t-1) schätzt. Der Modell-NSE von 0.82 ist daher ein guter Wert für physikbasierte Niederschlag-Abfluss-Modellierung. Während Niedrigwasser-Perioden ist Persistence trivial erfolgreich; bei Hochwasser-Ereignissen (steigende Flanken, Peaks) versagt Persistence systematisch – hier liegt der operative Mehrwert des HBV-Modells.

Benchmark-Kontext (Literatur)

Studie / Benchmark Region Modell NSE
Kratzert et al. (2018)[13] CAMELS (USA) LSTM 0.78 (median)
Beck et al. (2017)[14] Global mHM (regionalisiert) 0.60-0.75
HBV-light Standard Skandinavien HBV-light 0.70-0.85
Diese Studie Werse (NRW) v720b_r3c 0.82 (Val 2024)

Das Modell erreicht vergleichbare Performance wie State-of-the-Art ML-Ansätze (LSTM) und übertrifft typische regionalisierte konzeptionelle Modelle.

Saisonale Performance

Disaggregierte Güte-Metriken nach hydrologischen Jahreszeiten. Aggregiert über Validierungsjahre 2021-2024 (Folds 1-4, n=35.028 Stunden).

Saison Monate NSE KGE PBIAS Charakteristik
Winter Dez-Feb 0.78 0.87 +5% Gering ET, stabile Bedingungen, hohe Q-Dynamik
Frühjahr Mär-Mai 0.80 0.79 +18% Schneeschmelze (selten), steigendes ET
Sommer Jun-Aug 0.27 0.42 +27% Hohes ET, Gewitter, Niedrigwasser, Verkrautung
Herbst Sep-Nov 0.79 0.76 +19% Bodenfeuchte-Regeneration, erste Herbsthochwasser

Kritische Sommer-Performance: Sehr niedrige Güte im Sommer (NSE=0.27, Einzeljahre bis NSE=-1.7) aufgrund von: (1) Höherer ET-Unsicherheit und systematischer Überschätzung, (2) Konvektive Niederschläge mit hoher räumlicher Variabilität, (3) Niedrigwasser-Perioden mit extrem hohem relativem Fehler (PBIAS +27%), (4) Verkrautung im Gerinne beeinflusst RC erheblich. Sommervorhersagen sind mit großer Vorsicht zu interpretieren.

Implizite saisonale Anpassung: Der Parameter alpha_rip (Ufer-Evapotranspiration) sorgt für saisonale Variabilität: ETrip = αrip × ET₀ × (1 - SM/FC). Im Sommer (trockener Boden, niedriges SM) ist ETrip höher und reduziert die Direktzuflüsse stärker. Im Winter (nasser Boden, hohes SM) geht ETrip gegen Null. Dies bildet den natürlichen Jahresgang der Auenwälder und Ufervegetation ab.

Berechnet: Werte basierend auf Modell v720b_r3c_production mit HBV-Inputs aus tb_hbv_master_fin, aggregiert über 2021-2024. Berechnungsdatum: 2026-03-15. Quelle: models/seasonal_metrics_calculated.json

Literatur & Referenzen

  1. Bergström, S. (1976). Development and application of a conceptual runoff model for Scandinavian catchments. SMHI Reports RHO, No. 7, Norrköping.
  2. Bergström, S. (1992). The HBV model – its structure and applications. SMHI Reports RH, No. 4, Norrköping.
  3. LANUV NRW (2024). Pegel Albersloh (Werse) - Stammdaten. Station-ID: 278830100100. Einzugsgebiet: 321,58 km². HYGON OpenGeodata NRW
  4. Seibert, J. and Vis, M. (2012). Teaching hydrological modeling with a user-friendly catchment-runoff-model software package. Hydrol. Earth Syst. Sci., 16, 3315-3325.
  5. Nash, J.E. and Sutcliffe, J.V. (1970). River flow forecasting through conceptual models part I — A discussion of principles. Journal of Hydrology, 10, 282-290.
  6. Gupta, H.V., Kling, H., Yilmaz, K.K. and Martinez, G.F. (2009). Decomposition of the mean squared error and NSE performance criteria. Journal of Hydrology, 377, 80-91.
  7. Winterrath, T. et al. (2018). RADKLIM Version 2017.002: Reprocessed gauge-adjusted radar data, one-hour precipitation sums (RW). DWD. doi:10.5676/DWD/RADKLIM_RW_V2017.002
  8. Muñoz-Sabater, J. et al. (2021). ERA5-Land: A state-of-the-art global reanalysis dataset for land applications. Earth Syst. Sci. Data, 13, 4349-4383.
  9. Richter, D. (1995). Ergebnisse methodischer Untersuchungen zur Korrektur des systematischen Messfehlers des Hellmann-Niederschlagsmessers. Berichte des DWD, 194.
  10. Allen, R.G., Pereira, L.S., Raes, D. and Smith, M. (1998). Crop evapotranspiration – Guidelines for computing crop water requirements. FAO Irrigation and Drainage Paper 56.
  11. Storn, R. and Price, K. (1997). Differential Evolution – A Simple and Efficient Heuristic for Global Optimization over Continuous Spaces. J. Global Optimization, 11, 341-359.
  12. Wasserbilanz-Referenzdokument (intern). Wasserbilanz-Anomalie der Werse am Pegel Albersloh. Einzugsgebiet: 321,6 km², Datenbasis: 2000–2025. Dokumentiert: Kiessandzug-Zustrom (~50 mm/a lokal, ~19 mm/a EZG), technogene Importe (~25 mm/a), Richter-Korrektur (~65 mm/a). Siehe: docs/base_corrections/wasserbilanz_komplett.md
  13. Kratzert, F., Klotz, D., Brenner, C., Schulz, K. and Herrnegger, M. (2018). Rainfall–runoff modelling using Long Short-Term Memory (LSTM) networks. Hydrol. Earth Syst. Sci., 22, 6005-6022.
  14. Beck, H.E., van Dijk, A.I.J.M., de Roo, A., Dutra, E., Fink, G., Orth, R. and Schellekens, J. (2017). Global evaluation of runoff from 10 state-of-the-art hydrological models. Hydrol. Earth Syst. Sci., 21, 2881-2903.
  15. Geologischer Dienst NRW (2016). Grundwasserbericht NRW 2016. Landesamt für Natur, Umwelt und Verbraucherschutz NRW. Kapitel 4.3: Münsterländer Kiessandzug – Quantifizierung der Grundwasserneubildung und Grundwasserfließsysteme. GW-Neubildungsrate: 150-250 mm/a, Transmissivität: 500-2000 m²/d.

Modell-ID: v720b_r3c_production | Source: v720b_r3c_kfold4_s42_20260314_031925.json

Letzte Aktualisierung: 2026-03-14

Einzugsgebietsfläche: 321,58 km² (LANUV NRW, HYGON Station 278830100100)