rapport - nve · 2020. 10. 19. · rapport nr. 10/2020 lokal og regional flomfrekvensanalyse utgitt...

92
RAPPORT Nr. 10/2020 Lokal og regional flomfrekvensanalyse Kolbjørn Engeland, Per Glad, Byman Hikanyona Hamududu, Hong Li, Trond Reitan og Seija Maria Stenius

Upload: others

Post on 29-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • RAPPORTNr. 10/2020

    Lokal og regional flomfrekvensanalyse

    Kolbjørn Engeland, Per Glad, Byman Hikanyona Hamududu, Hong Li, Trond Reitan og Seija Maria Stenius

  • Rapport nr. 10/2020

    Lokal og regional flomfrekvensanalyse

    Utgitt av: Norges vassdrags- og energidirektorat

    Forfatter: Kolbjørn Engeland, Per Glad, Byman Hikanyona Hamududu, Hong Li, Trond Reitan, Seija Maria Stenius

    Forsidefoto: Aldo Dyrvik, NVE

    ISBN: 978-82-410-2014-8

    ISSN: 1501-2832

    Trykk: NVEs hustrykkeri

    Opplag: 40

    Sammendrag: Robuste og pålitelige beregninger av dimensjonerende flom er grunnlaget for å sikre samfunnet mot flomskader. Målene med denne rapporten er å anbefale metoder for å beregne dimensjonerende flom basert på lokale flomdata samt å utvikle ligninger for å beregne medianflom, vekstkurve og forholdstallet mellom kulminasjonsflom og døgnmiddelflom i umålte felt, evaluere de prediktive egenskapene, samt å sammenligne med eksisterende metoder. Det er tatt i bruk Bayesianske metoder som gjør det mulig å kvantifisere usikkerhet i flomberegninger. Resultatene oppsummeres i anbefalinger av hvordan dimensjonerende flom bør beregnes avhengig av tilgjengelige data.

    Emneord: Lokal flomfrekvensanalyse; Regional flomfrekvensanalyse, Historiske flomdata, Bayesiansk estimering

    Norges vassdrags- og energidirektorat

    Middelthunsgate 29

    Postboks 5091 Majorstuen

    0301 Oslo

    Telefon: 22 95 95 95

    E-post: [email protected]

    Internett: www.nve.no

    mars, 2020

    mailto:[email protected]://www.nve.no/

  • Innhold Forord ................................................................................................... 5

    Sammendrag ........................................................................................ 6

    1 Innledning ...................................................................................... 9

    2 Data .............................................................................................. 12

    2.1 Flomdata ...................................................................................... 12

    2.1.1 Flomdata fra vannføringsstasjoner ...................................... 12

    2.1.2 Flomdata fra vannkraftmagasin ........................................... 14

    2.1.3 Historisk flom-informasjon ................................................... 15

    2.2 Feltegenskaper ............................................................................ 17

    2.2.1 Fysiografiske egenskaper ................................................... 17

    2.2.2 Klimatiske egenskaper ........................................................ 18

    3 Statistiske fordelinger for flomdata ........................................... 21

    4 Lokal flomfrekvensanalyse ........................................................ 22

    4.1 Metoder ....................................................................................... 22

    4.1.1 Estimeringsmetoder ............................................................ 22

    Á priori informasjon på modellparametre ...................................... 23

    4.1.2 Valg av fordeling og estimeringsmetode .............................. 23

    4.1.3 Bruk av historiske data ........................................................ 25

    4.1.4 Estimering av dimensjonerende kulminasjonsflom .............. 27

    4.1.5 Valg av plotteposisjon ......................................................... 28

    4.2 Resultater og diskusjon ................................................................ 29

    4.2.1 Valg av fordeling og estimeringsmetode .............................. 29

    4.2.2 Bruk av historiske data ........................................................ 32

    4.2.3 Estimering av dimensjonerende kulminasjonsflom .............. 35

    4.2.4 Valg av plotteposisjon ......................................................... 36

    4.3 Konklusjoner og anbefalinger for lokal flomfrekvensanalyse ........ 36

    5 Regional flomfrekvensanalyse .................................................. 37

    5.1 Eksisterende retningslinjer ........................................................... 37

    5.2 Regresjonsanalyser ..................................................................... 40

    5.2.1 Estimering og evaluering av modeller .................................. 40

  • 5.2.2 Skrittvis klassisk lineær-regresjon ........................................41

    5.2.3 Bayesiansk regresjon ...........................................................42

    5.2.4 Logistisk regresjon ...............................................................42

    5.3 Regional flomfrekvensanalyse ......................................................42

    5.3.1 Indeksflom ...........................................................................43

    5.3.2 Regionale flomfrekvenskurver ..............................................43

    5.3.3 Kombinering av lokale data og regional informasjon ............45

    5.3.3.1 Regionale á priori-fordelinger basert på regional modell .45

    5.3.3.2 Kombinert lokal-regional modell ......................................46

    5.3.3.3 Evaluering av beste praksis for å kombinere lokal og regional

    informasjon ...................................................................................47

    5.3.4 Forholdet mellom kulminasjons- og døgnmiddelflom. ...........48

    5.3.5 Samlet analyse ....................................................................49

    5.4 Resultater .....................................................................................50

    5.4.1 Indeksflom ...........................................................................50

    5.4.2 Regionale flomfrekvenskurver ..............................................51

    5.4.3 Usikkerhet i flomberegninger i umålte felt .............................51

    5.4.4 Kombinering av lokale data og regional informasjon ............52

    5.4.4.1 Á priori-fordeling for lokal analyse basert på regional modell

    52

    5.4.4.2 Kombinert lokal-regional modell ......................................52

    5.4.4.3 Evaluering av beste praksis for å kombinere lokal og regional

    informasjon ...................................................................................53

    5.4.5 Forholdet mellom kulminasjons- og døgnmiddelflom ............55

    5.4.5.1 Innledende analyser .......................................................55

    5.4.6 Samlet analyse ....................................................................59

    5.5 Sammenligning med eksisterende metoder ..................................59

    5.5.1 Døgnmiddelflom ...................................................................59

    5.5.2 Kulminasjonsflom .................................................................61

    5.5.3 Sammenligning med Z-felt ...................................................64

    5.6 Diskusjon ......................................................................................71

  • 5.7 Konklusjon og anbefalinger for regional flomfrekvensanalyse ...... 74

    6 Anbefalinger for lokal og regional flomfrekvensanalyse ......... 77

    7 Referanser ................................................................................... 79

    8 Appendiks A ................................................................................ 84

    Internett: www.nve.no

  • 5

    Forord I perioden 2014 – 2018 ble prosjektene «Flomkart for Norge» (internt NVE FoU prosjekt)

    og FlomQ (Eksternt prosjekt finansiert av EnergiNorge og Norges forskningsråd)

    gjennomført. Hovedmålet for prosjektene er å utvikle nye metoder for beregning av

    dimensjonerende flom, utvide datagrunnlaget for flomberegninger samt implementere

    resultatene i verktøy og veiledere.

    Denne rapporten gir en oversikt over analyser som er utført og underliggende data som er

    brukt for å etablere modeller for både lokal og regional flomfrekvensanalyse.

    I denne rapporten tas nye typer flomdata i bruk: tilsigsflommer beregnet fra magasindata

    og historiske flommer beregnet fra flommerker og flomsteiner slik at man har god

    kontroll på vannhøyder og flomvolum. Det er også utviklet nye metoder for å kombinere

    korte lokale dataserier med informasjon fra en regional modell. Rapporten kommer også

    med konkrete anbefalinger for hvordan resultatene skal tas inn i en oppdatert veileder for

    flomberegninger

    Resultatene er eller vil bli implementert i NEVINA (regional analyse) og flomanalyse-

    programmet i Start-systemet (lokal analyse) og vil danne grunnlag for ny veileder som

    utarbeides i 2020.

    Oslo, mars 2020

    Hege Hisdal Stein Beldring

    Avdelingsdirektør Seksjonssjef

  • 6

    Sammendrag Robuste og pålitelige beregninger av dimensjonerende flom er grunnlaget for å sikre

    samfunnet mot flomskader. Målene med denne rapporten er å anbefale metoder for å

    beregne dimensjonerende flom basert på lokale flomdata samt å utvikle ligninger for å

    beregne medianflom, vekstkurve og forholdstallet mellom kulminasjonsflom og

    døgnmiddelflom i umålte felt, evaluere de prediktive egenskapene, samt å sammenligne

    med eksisterende metoder. Det er tatt i bruk metoder som gjør det mulig å kvantifisere

    usikkerhet i flomberegninger. Vi brukte årlig maksimal flom fra 529 vannføringsstasjoner

    fra den nasjonale hydrologiske databasen "Hydra II'' (Engeland m.fl. 2016). Variabler

    som beskriver enten fysiografiske egenskaper eller klima for oppstrøms nedbørfelt ble

    benyttet som kovariater i alle analysene. Klimavariablene ble hentet ut fra SeNorge

    datasettet, mens de fysiografiske egenskapene ble hentet ut fra standard GIS-datasett for

    Norge.

    Basert på resultatene i rapporten, anbefales følgende tilnærming for flomfrekvensanalyse

    Døgnmiddelflom:

    • Har man ingen lokale data, bruk regresjonsligninger fra ny regional modell. Det

    er etablert regresjonsligninger for median-flommen, samt skala- og

    formparameterne i en GEV-fordeling basert på feltegenskaper. Dette kan f.eks.

    gjøres i NEVINA. Med de nye regresjonsligningene er det en usikkerhet på */

    1.72 i umålte felt (95% konfidensintervall) for estimatet av medianflom og går

    opp til */ 1.78, 1.82 og 1.87 for hhv 50-, 200- og 1000-års-flom. Denne

    usikkerheten er betydelig, men sammenligningen med resultater oppnådd i

    tilsvarende studier er resultatene presentert i denne rapporten blant de beste som

    er oppnådd.

    • Har man færre enn 10 år med data, bruk forenklet lokal+regional modell der

    skala- og formparameteren i GEV-fordelingen blir beregnet fra

    regresjonsligninger og medianflommen beregnes som et vektet gjennomsnitt av

    estimatene fra regresjonsligning og lokale flomdata. Dette kan f.eks. gjøres i

    NEVINA ved å manuelt legge inn en kort flomserie (blir implementert i 2020).

    • Har man 10 år med data eller mer, bruk full lokal+regional modell. Da brukes en

    Bayesiansk tilnærming for å estimere parametrene i GEV-fordelingen basert på

    lokale flomdata, der lokal á priori informasjon brukes for både indeksflom og

    vekstkurve. Á priori informasjonen kommer fra den nye regionale modellen der

    feltegenskaper går inn i flere regresjonsligninger. Flomanalyse-programmet i

    Start-systemet på NVE vil få denne løsningen implementert våren 2020.

    • Metode for å ta i bruk historisk flominformasjon er utviklet. Denne baserer seg på

    at man må kjenne alle flommer som overskrider en viss terskel over en gitt

    periode, enten antallet flommer eller størrelsen på flommene. Det anbefales å

    utføre beregninger både med og uten historisk informasjon der denne er

    tilgjengelig. Det anbefales at tilgjengelig historisk informasjon deles med NVE

    slik at data kan legges inn i Hydra II. Metoden er implementert i Flomanalyse-

    programmet i Start-systemet på NVE.

  • 7

    Kulminasjonsflom:

    Det er mange mulige måter å kombinere lokale og regionale data på når man jobber med

    kulminasjonsflommer. Vi har ikke en endelig fasit på hvordan dette bør gjøres og man

    bør derfor prøve ut forskjellige tilnærminger. Merk at RFFA_NIFS og RFFA_2018 som

    oftest stemmer bra overens på estimat av indeksflommen, men de regionale vekstkurvene

    er forskjellige og generelt gir RFFA_NIFS høyere kulminasjonsflommer enn

    RFFA_2018.

    • Har man ingen lokale kulminasjonsdata, anbefales det for felt med areal under 60

    km2 å bruke eksisterende formelverk fra RFFA_NIFS. For større felt anbefales

    det å bruke det nye formelverket presentert i denne rapporten (RFFA_2018).

    • Har man færre enn 10 år med kulminasjonsdata, for felt med areal under 60 km2,

    bruk forenklet lokal+regional NIFS-modell der middelflommen beregnes som et

    vektet gjennomsnitt av estimatene fra regresjonsligning og lokale flomdata og

    kombineres med vekstkurven fra NIFS. Dette kan f.eks. gjøres i NEVINA ved å

    manuelt legge inn en kort flomserie (blir implementert i 2020).

    • Har man færre enn 10 år med kulminasjonsdata, for felt med areal over 60 km2,

    bruk forenklet lokal+regional RFFA_2018-modell der middelflommen beregnes

    som et vektet gjennomsnitt av estimatene fra regresjonsligning og lokale

    flomdata for døgn og kombineres med vekstkurven fra RFFA_2018. Dette kan

    f.eks. gjøres i NEVINA ved å manuelt legge inn en kort flomserie (blir

    implementert i 2020). Deretter beregnes en skaleringsfaktor basert på

    observasjoner av kulminasjon- og døgnflommer.

    • Har man ingen år med kulminasjonsdata og færre enn 10 år med døgndata, for

    felt med areal over 60 km2, bruk forenklet lokal+regional RFFA_2018-modell der

    middelflommen beregnes som et vektet gjennomsnitt av estimatene fra

    regresjonsligning og lokale flomdata for døgn og kombineres med vekstkurven

    fra RFFA_2018. Dette kan f.eks. gjøres i NEVINA ved å manuelt legge inn en

    kort flomserie (blir implementert i 2020). Deretter beregnes en skaleringsfaktor

    fra RFFA_2018

    • Har man færre enn 25 år med kulminasjonsdata og mer enn 50 år med døgndata,

    kan man bruke full lokal+regional modell for døgndata (i Flomanalyse-

    programmet i Start-systemet på NVE) og beregne en skaleringsfaktor mellom

    kulminasjons- og døgnflommer basert på lokale data.

    • Har man mer enn 25 år med lokale kulminasjonsdata anbefales det å bruke lokal

    Bayesiansk analyse. I løpet av 2020 blir det implementert en egen á priori-

    fordeling for kulminasjonsflommer i Flomanalyse-programmet i Start-systemet

    på NVE. Resultatene bør sammenlignes med regional vekst-kurve og/eller lengre

    tidsserier med sammenlignbare feltegenskaper.

    • Har man mellom 10 og 25 år med lokale data, bør man sammenligne

    tilnærmingene beskrevet ovenfor.

  • 8

  • 9

    1 Innledning Bakgrunnen for denne rapporten er behovet for å revidere metoder for beregning av

    dimensjonerende flom i Norge. Et viktig virkemiddel for å redusere risikoen for

    flomskader på bygninger, veier, jernbane og annen infrastruktur, er å sette krav til hvor

    store flommer de skal tåle, e.g. en dimensjonerende flom. Ifølge damsikkerhetsforskriften

    (Lovdata 2010), skal damsikkerhet evalueres for flommer med 500 eller 1000 års

    gjentaksintervall eller for påregnelig maksimalflom (PMF), avhengig av konsekvensen av

    dambrudd. I henhold til byggteknisk forskrift (TEK17, 2017), skal viktige bygninger og

    infrastruktur motstå eller være beskyttet mot flommer med 20, 200 eller 1000 års

    gjentaksintervall, avhengig av konsekvensene av flom. Flomsonekart som brukes for

    arealplanlegging er også basert på beregninger av dimensjonerende flom.

    Forskriftene krever at dimensjonerende flom blir oppgitt som størrelse på T-års flommen

    der T er gjentaksintervall (f.eks. 20, 200, 500 og 1000-år). Gjentaksintervallet beskriver

    hvor ofte en flomstørrelse overskrides i snitt, dvs. at 200-års flommen overskrides i snitt

    hvert 200 år. Gjentaksintervall og sannsynlighet er omvendte proporsjonale verdier. Det

    vil for eksempel si at en flom som har et gjentaksintervall på 200-år har en sannsynlighet

    på 1/200 = 0.5% for å overskrides hvert år. Tilsvarende har en 1000-års flom en

    sannsynlighet på 1/1000 = 1 ‰ for å overskrides hvert år. Merk at selv om 200-

    årsflommer overskrides i snitt hvert 200 år, opptrer den ikke med jevne 200 år imellom. I

    prinsippet kan det oppstå to 200-årsflommer i samme elv i løpet av ett år, men

    sannsynligheten er liten.

    Er det tilstrekkelig med vannføringsdata tilgjengelige der dimensjonerende flom skal

    estimeres, brukes lokal flomfrekvensanalyse. Dette gjøres vanligvis ved å ta ut årlige

    maksimalflommer og tilpasse en statistisk fordeling. I Kobierska m.fl. (2017) ble valg av

    fordeling og metode for å tilpasse fordelinger utforsket. Bruk av Generell

    ekstremverdifordeling (GEV) kombinert med Bayesiansk estimering med en á priori-

    fordeling på formparameter ble anbefalt.

    For å beregne dimensjonerende flom for steder uten målinger brukes regional

    flomfrekvensanalyse som baserer seg på å bruke en etablert sammenheng mellom

    dimensjonerende flom og feltegenskaper. Retningslinjer for regional flomfrekvensanalyse

    for USA er gitt i Stedinger & Griffis (2008, 2011), for Australia i Ball m. fl. (2016) og

    Europa Castellarin m. fl. (2012). Den mest vanlige tilnærmingen for å beregne

    dimensjonerende flom er indeksflom metoden (Dalrymple et al, 1960) der først

    indeksflommen beregnes i et umålt felt basert på feltkarakteristika. Deretter brukes en

    standard vekstkurve for å beregne den ønskede flomstørrelsen. Innenfor indeksflom

    metoden er det flere tilnærminger for hvordan data deles inn i del-grupper som er

    homogene. De tre tilnærmingene som brukes er (i) faste geografiske regioner (ii) regioner

    basert på feltegenskaper, (iii) eller en «Region of Influence» (RoI) tilnærming der man

    kun bruker de feltene som ligner mest på feltet man skal beregne flommer for (Castellarin

    et al, 2012). I Østerrike brukes Top-Kriging for å interpolere flomstørrelser langs

    elvenettet.

    NVE har utarbeidet flere veiledere for å beregne dimensjonerende flommer. Den første

    landsomfattende flomstudien ble skrevet av Reinhardt Søgnen (Søgnen, 1942). Den gir en

    oversikt over flomforholdene ved over 250 vannmerker der sammenhengen mellom de

  • 10

    største observerte flommene og feltparametre analyseres. Studiet presenterer også

    empiriske formler for beregning av midlere og maksimale flomstørrelser uten at de var

    knyttet til noe spesielt gjentaksintervall.

    Den første regionale flomfrekvensanalysen i Norge ble utarbeidet på slutten av 70-tallet

    av Wingård m.fl (1978). Den gir formelverk for estimat av flommer med opp til

    gjentaksintervall 10 000 år for et hvert punkt i de norske vassdragene. Analysen baserer

    seg på treparameterfordelinger opp til 250 års gjentaksintervall og regionale vekstkurver

    over det. For å estimere middelflommen i felt uten målinger ble det utarbeidet formler

    basert på topografiske parametre. Norge ble inndelt i 11 regioner, og analysen var

    begrenset til døgnmiddelflom.

    Den andre (og nyeste) regionale flomfrekvensanalysen er rapportert i Sælthun m.fl.

    (1997) og inngår i den eksisterende veilederen for flomberegninger (Midttømme m fl.

    20ll). Anbefalinger er oppsummert i Tabell l. Tilnærmingen er basert på bruk av årlige

    maksimale flommer, og lengden på lokale data avgjør hvilken tilnærming som anbefales.

    Minst 30 år med lokale observasjoner er nødvendig for lokal flomfrekvensanalyse og

    minst 50 års data skal være tilgjengelig for å kunne bruke tre-parameter fordelinger.

    Gumbel (to parametre) og generell ekstrem verdi (GEV) (tre parametre) er de foretrukne

    fordelingene. I Sælthun m.fl. (1997) etableres også regresjonsligninger for forholdstallet

    mellom midlere kulminasjonsflom og midlere døgnmiddelflom på den ene siden og

    feltkarakteristika på den andre siden. Framgangsmåten som benyttes er å knytte dette

    forholdet til feltparametre ved hjelp av multippel regresjon. Det høyeste forholdstallet er

    nærmere 3 om høsten, mens maksimum ligger på 2 for vårflommene. Det vises også at

    for de fleste stasjonene har gjentaksintervallet forholdsvis liten innflytelse på

    forholdstallet.

    Tabell 1. Anbefaling for beregning av dimensjonerende flom fra Midttømme m.fl.(2011)

    Dataseriens

    lengde

    Beregning av indeksflom Beregning av vekstkurve

    >50 år Ikke brukt Fra 2- eller 3-parameterfordelinger tilpasset lokale

    data

    30–50 år Ikke brukt Fra 2-parameterfordelinger tilpasset lokale data

    10–30 år Fra lokale data Fra lange serier i området

  • 11

    etablere vekstkurven. Merk at i denne tilnærmingen deles ikke Norge inn i regioner, men

    regresjonsligningene brukes for å få en vekstkurve som endrer seg fra sted til sted.

    I Thorarinsdottir m.fl. (2018) etableres en alternativ modell for regional

    flomfrekvensanalyse der man ikke benytter indeksflom tilnærmingen. I stedet lar man

    hver av de tre parametrene i GEV-fordelingen spesifiseres som en lineær funksjon av

    forklaringsvariablene i et Bayesiansk rammeverk, og alle de lineære modellene estimeres

    samtidig. I denne tilnærmingen tas det også hensyn til modellusikkerhet ved å etablere et

    stort antall alternative regresjonsmodeller og tilordne hver modell en sannsynlighet.

    Sluttresultatet av denne analysen er ikke ett sett med ligninger som i Glad m.fl. (2014) og

    Sælthun m. fl. (1997), men et stort sett med ligninger. I denne modellen deles ikke Norge

    inn i regioner, men de samme regresjonsligningene brukes i hele landet.

    Datagrunnlaget og regresjonsligningene for den regionale flomfrekvensanalysen som

    brukes som standard i dag (Sælthun m.fl. 1997), ble utviklet for over 20 ar siden. Siden

    den gangen har vi 20 år mer med data. I tillegg er andre metoder for regional analyse blitt

    enklere tilgjengelig. Det er derfor viktig å videreutvikle og oppdatere ligninger for

    regional flomfrekvensanalyse for å gi robuste og pålitelige flomestimat.

    Hovedmålet med denne rapporten er å anbefale metode for å beregne dimensjonerende

    flom i både målte og umålte felt ved bruk av hhv lokal og regional flomfrekvensanalyse.

    Følgende delmål er definert for lokal flomfrekvensanalyse:

    • Anbefale fordeling for lokal flomfrekvensanalyse

    • Anbefale beregningsmetode for lokal flomfrekvensanalyse

    • Anbefale metode for bruk av historisk data ved lokal flomfrekvensanalyse

    • Anbefale hvordan kulminasjonsflommer skal brukes i lokal flomfrekvensanalyse

    • Kvantifisere usikkerhet i flomestimat.

    For regional flomfrekvensanalyse har vi brukt en indeksflom tilnærming, Følgende

    delmål er definert:

    • Velge feltegenskaper som bestemmer indeksflom i umålte felt og estimere

    regresjonsligning for å beregne indeksflom i umålte felt

    • Estimere flomfrekvensfordeling for å beregne dimensjonerende flom i umålte felt

    • Estimere ratio mellom døgnmiddelflom og kulminasjonsflom i umålte felt.

    • Sammenligne resultatene fra den nye modellen med resultater fra eksisterende

    modeller.

    • Evaluere den nye modellen på et nytt datasett med tilsigsflommer.

    • Anbefale hvordan man kan kombinere lokale data med regional vekskurve for å

    oppnå robuste flomberegninger.

    • Kvantifisere usikkerhet i flomestimat.

  • 12

    I de følgende kapitlene vil vi presentere data, både flomdata og feltegenskaper. Deretter

    beskrives metodene vi har brukt for å etablere de ulike regresjonsmodellene. I Kapittel 5

    vises resultatene fra den regionale flomfrekvensmodellen og sammenlignes med resultater

    fra tidligere studier. Deretter diskuteres resultatene og vi konkluderer.

    2 Data

    2.1 Flomdata

    2.1.1 Flomdata fra vannføringsstasjoner

    Vi brukte årlig maksimal flom fra 529 vannføringsstasjoner fra den nasjonale

    hydrologiske databasen "Hydra II''. Figur 1 viser antall år med flomdata for de utvalgte

    stasjonene med døgndata og findata. Figur 2 viser median døgnflom for datasettet. Av de

    529 stasjonene er 266 fortsatt i drift og er plassert i felt med lav eller ingen

    reguleringsgrad og kan gi ny flominformasjon. For døgndata har 523 stasjoner minst 5 år

    med data, 490 stasjoner minst 10 år med data, 280 stasjoner minst 30 år og 103 stasjoner

    har 50 år eller mer med data. Lengste dataserie er på 124 år. Det er 327 stasjoner med

    findata hvorav 263 fortsatt er aktive. 309 stasjoner har minst fem år med data. For de 310

    stasjonene er gjennomsnittlig serielenge 25 år. 271 stasjoner har minst l0 år med data. 3

    stasjoner har minst 50 år med data. Lengste tidsserien er på 52 år.

    Alle flomdata er fra stasjoner og perioder der det oppstrøms feltet har en reguleringsgrad

    som er 5% eller lavere. Reguleringsgrad er definert som forholdet mellom regulerbart

    magasinvolum og midlere årsavrenning. Alle data ble kvalitetskontrollert, inkludert

    kvalitetsvurdering av felthydrolog og en gjennomgang av kvalitet på vannføringskurve

    for store vannføringer. Datautvalget er beskrevet i detalj i Engeland m.fl. (2016).

    Figur 1. Lengde på døgndataserier (venstre) og findata (høyre). (Fra Engeland m. fl., 2016)

    Lengde på dataserier (år)

    An

    tall

    0 20 60 100

    04

    08

    01

    20

    Lengde på dataserier (år)

    An

    tall

    0 10 20 30 40 50

    02

    04

    06

    0

  • 13

    Figur 2. Medianflom (l/s/km2) for flomfeltene.

    I dette studiet ønsket vi også å beregne forholdstallet mellom kulminasjonsflom og

    døgnmiddelflom. Basert på dataserier med både kulminasjonsflommer og

    døgnmiddelflommer, beregnet vi forholdstallet mellom medianflommen for

    døgnmiddelflom og medianflommen for kulminasjonsflommen. I Figur 3 (til venstre)

    vises histogram over dette forholdstallet for alle stasjoner. Forholdstallet varierer mellom

    l.0 og 3.0. Ser man derimot på forholdstallet mellom to aktuelle flomhendelser, ser vi at

    kulminasjonsflommen kan være opptil 8 ganger større enn døgnmiddelflommen (Figur 3

    ,til høyre).

    Figur 3. Eksempel på histogram over forholdstallet mellom kulminasjons- og

    døgnmiddelflom for medianflommen (til venstre) og største forholdstall for enkeltflommer

    (til høyre).

  • 14

    2.1.2 Flomdata fra vannkraftmagasin

    Nye datasett for årlige maksimalflommer samt metode for å beregne disse er presentert i

    Jørgensen Bakke og Holmqvist (2018). Metoden for å beregne årlige maksimalflommer

    baserer seg på samme prinsipp som tradisjonelle tilsigsberegninger, men har en

    omfattende kvalitetskontroll av hver enkelt beregning og datagrunnlaget. Spesielt gjelder

    dette kvalitet til vannstandsdataene i magasinet, magasinkurven, overløpsformelen, samt

    at man har all informasjon om data for vann ut av magasinet gjennom tappeluker,

    tappetuneller osv. Magasindata inneholder ofte en del støy, så for å få gode flomdata er

    det essensielt å gå manuelt inn og vurdere dataene som ligger bak enhver beregnet

    flomverdi. Som en ekstra kontroll av beregnete flommer, ble det vurdert om flomdato og

    –størrelse er rimelig utfra værdata og nærliggende vannføringsstasjoner med lignende

    feltkarakteristikker.

    Jørgensen Bakke og Holmqvist (2018) starter med et innledende utvalg på 208 magasiner

    der det er veldig liten eller ingen oppstrøms reguleringer. Det endelige datasettet består av

    1339 årsflomverdier fra til sammen 91 magasiner (Figur 4) med minst fem år med

    flomverdier. Magasinene har en stor variasjon i beliggenhet, nedbørfeltegenskaper og

    flomstørrelser.

    Figur 4. Oversikt over datasett for årlige maksimalflommer beregnet fra magasindata.

  • 15

    2.1.3 Historisk flom-informasjon

    Systematiske observasjoner av vannstander og vannføring startet på slutten av 1800-tallet

    i Norge. For å få informasjon om flomhendelser før dette, kan historiske kilder være

    nyttige. Kilder til historiske data inkluderer: annaler, minnebøker, memoarer,

    bygdebøker, korrespondanse (brev), offisielle økonomiske og administrative dokumenter,

    kilder av religiøs karakter, flom-merker (Brázdil m.fl., 2010, 2012). I flere europeiske

    land er det sentrale registreringer av historiske flomdata (Brázdil m.fl., 2006, Kjeldsen

    m.fl., 2014). I Norge er en sentral database under utvikling, og en informativ oversikt er

    gitt i Roald (2013). En viktig informasjonskilde for historiske oversvømmelser i Norge er

    offisielle økonomiske og administrative dokumenter der flomskader for enkeltgårder har

    ført til reduksjon av skatt. En systematisk analyse av disse dataene har potensial til å vise

    både størrelsesordenene og utbredelsen av store historiske oversvømmelser (Roald,

    2013).

    For å ta i bruk historisk flom-informasjon i en flomfrekvensanalyse, er det viktig å kunne

    ta ut flomhøyder som man kan bruke for å beregne flomvannstander. Flom-merker på

    steiner, svaberg, bygninger, broer etc. er derfor svært nyttige (se eksempler i Figur 5).

    Også beskrivelser av hvor høyt vannet har stått i terrenget er nyttig.

    Vi har samlet inn informasjon om historiske flommer ved noen utvalgte målestasjoner

    som vist i tabell 2.

    Figur 5. Eksempel på historisk flominformasjon. Flommerke på kirkeveggen i Voss som

    indikerer hvor høyt vannet stod i 1604. Foto: Jakob Håheim (til venstre). Flomsteinen ved

    Norsk skugmuseum på Elverum (til høyre).

  • 16

    Tabell 2. Historiske flommer ved utvalgte vannføringsstasjoner. Merk at for stasjon 62.5 ble

    vannstanden i Vangsvatnet senket etter perioden 1865-70 slik at flomnivåer ble ca 6 fot (1.9

    meter) lavere. For flommene før 1860 er vannføringen avrundet til nærmeste 50 m3/s

    grunnet usikkerhet i både observert vannstand og omregning fra vannstand til vannføring.

    Snr. År Vannst. Vannf.

    (m3/s)

    Informasjon Kilde

    62.5 1604 55,47 900 Avmerket på kirkevegg Holmqvist (2015)

    62.5 1719 54,21 700 Omtrent som i 1743 Holmqvist (2015)

    62.5 1743 54,21 700 Vann til koret i kirken Holmqvist (2015)

    62.5 1745 53,90 650 Vann opp i kirken Holmqvist (2015)

    62.5 1790 54,21 700 Omtrent som i 1743 Holmqvist (2015)

    62.5 1864 51,63 400 Postvei oversvømt Holmqvist (2015)

    62.5 1873 51,63 600 Postvei oversvømt Holmqvist (2015)

    62.5 1884 52,29 703 16 tm høyere enn i 1873 Holmqvist (2015)

    22.4 1864 1200 Flommerker ved

    Øyslebø

    Engeland m.fl.

    (2018b)

    22.4 1892 1300 Flommerker ved

    Øyslebø

    Engeland m.fl.

    (2018b)

    2.604 1675 3,35 3141 Flomstein på Elverum Hegge (1969)

    2.604 1717 3,22 2963 Flomstein på Elverum Hegge (1969)

    2.604 1724 3,19 2919 Flomstein på Elverum Hegge (1969)

    2.604 1749 3,16 2875 Flomstein på Elverum Hegge (1969)

    2.604 1773 3,38 3187 Flomstein på Elverum Hegge (1969)

    2.604 1789 3,86 3900 Flomstein på Elverum GLB, (1947).

    2.604 1827 3,06 2736 Flomstein på Elverum Hegge (1969)

    2.604 1846 2,95 2592 Flomstein på Elverum Hegge (1969)

    2.604 1850 3,24 2989 Flomstein på Elverum Hegge (1969)

    2.25 1789 1585 Flommerker / flomstein Klæboe (1938)

    2.25 1860 1524 Flommerker / flomstein Kleiven (1908)

    12.80 1789 >550 Flommerker / flomstein Otnes (1983)

    12.80 1860 550 Flommerker / flomstein Otnes (1983)

    15.1 1860 6.0m 1285 Kristensen (1911)

  • 17

    2.2 Feltegenskaper

    2.2.1 Fysiografiske egenskaper

    Fysiografiske feltegenskaper viser rene geografiske egenskaper som areal,

    høydeforskjeller og ulike typer arealdekke. Alle egenskaper ble tatt ut fra NVE sin GIS-

    database. I denne studien ble det tatt ut noen nye feltparametre. Det inkluderer total

    elvelengde, total elvelengde uten innsjøer, dreneringstetthet, definert som total elvelengde

    delt på feltareal. Liste over hvilke egenskaper som er brukt er vist i Tabell 3, mens Figur

    6 viser histogram over viktige feltegenskaper for de 529 feltene som er med i studiet.

    Tabell 3. Fysiografiske feltegenskaper

    Navn Enhet Forklaring Kilde

    YLat DD y-koordinat for feltets utløp, Desimalgrader HydraII

    XLong DD x-koordinat for feltets utløp, Desimalgrader HydraII

    Yutm m y-koordinat for feltets utløp, utm33 HydraII

    Xutm m x-koordinat for feltets utløp, utm33 HydraII

    A km2 Totalt feltareal HydraII

    FL km Feltlengde HydraII

    EL km Hovedelvas lengde HydraII

    EG m/km Elvegradient HydraII

    EG,1085 m/km Elvegradient HydraII

    ABRE % Prosentandel av feltet dekket med isbre (0-100) HydraII

    AJORD % Prosentandel av feltet dekket med dyrket mark (0-100) HydraII

    AMYR % Prosentandel av feltet dekket med myr (0-100) HydraII

    ASJO % Prosentandel av feltet som dekket med innsjøer (0-100) HydraII

    ASKOG % Prosentandel av feltet som er dekket med skog (0-100) HydraII

    ASF % Prosentandel av feltet som er snaufjell (0-100) HydraII

    AU % Prosentandel av feltet som er urbant (0-100) HydraII

    ASE % Effektiv innsjøprosent basert på beliggenhet (0-100) HydraII

    H10 -

    H90

    m.o.h 10% persentil for hypsografisk kurve HydraII

    HMAX m.o.h Høyeste høyde i feltet HydraII

    HMIN m.o.h Laveste høyde i feltet HydraII

    HF m Høydeforskjell HydraII

    YG,Lat DD y-koordinat for feltets tyngdepunkt, Desimalgrader ArcGis

    XG,Long DD x-koordinat for feltets tyngdepunkt, Desimalgrader ArcGis

    YG,UTM M y-koordinat for feltets tyngdepunkt, utm33 ArcGis

  • 18

    Navn Enhet Forklaring Kilde

    YG,UTM M x-koordinat for feltets tyngdepunkt, utm33 ArcGis

    O M Feltets omkrets ArcGis

    FS Grader Midlere helning for gridceller innenfor feltet ArcGis

    ETL km Total lengde for alle elver innenfor feltet ArcGis

    ETL,net km Total lengde for alle elver eksklusive innsjøer ArcGis

    AP km Areal/Omkrets*1000 ArcGis

    D m/km2 Total elvelengde / Areal ArcGis

    Dnet m/km2 Total elvelengde eksklusive innsjøer/Areal ArcGis

    Figur 6. Histogram for noen vanlige feltparametere for de 529 stasjonene brukt i analysen

    2.2.2 Klimatiske egenskaper

    Basert på SeNorge 2.0 datasettet ble det tatt ut klimatologiske og hydrologiske

    egenskaper for de 529 stasjonene som vist i Tabell 4. Merk at flere av disse egenskapene

    ikke er direkte observasjoner, men interpolerte eller modellerte produkter. Det er derfor

    viktig å vite hvilke produkter om er brukt (navn og versjon). Figur 7 viser kart over

    flomgenererende prosess (regn versus snøsmelting) samt ekstrem nedbør, snøsmelting og

    avrenning. Beregning av flomgenererende prosess er beskrevet i Engeland m.fl. (2016).

    Figur 8 viser kart over middelnedbør, temperatur og avrenning.

    Areal (km2)

    Anta

    ll

    040

    80

    120

    4 64 4096

    Feltlengde (km)

    Anta

    ll

    040

    80

    120

    3 9 81

    Lengde hovedelv (km)

    Anta

    ll

    040

    80

    120

    3 27 243

    Gradient hovedelv (m/km)

    Anta

    ll

    040

    80

    120

    2 8 64

    Eff. sjøp

    Anta

    ll

    0 5 10 20

    0100

    200

    300

    Hmax (moh)

    Anta

    ll

    0 1000 2500

    020

    40

    60

    80

    Hmin (moh)

    Anta

    ll

    0 400 800

    050

    100

    200

    Hdiff (m)

    Anta

    ll

    0 1000 2000

    020

    40

    60

    80

    Perimeter (m)

    Anta

    ll

    040

    80

    120

    10000 1e+06

    Midlere helning o

    Anta

    ll

    5 15 25

    020

    60

    Total elvelengde (km)

    Anta

    ll

    050

    100

    150

    1000 1e+06

    Dreneringstetthet (m/km2)

    Anta

    ll

    0 2000 4000

    050

    100

    A (km2) FL (km) EL (km) EG (m/km)

    Areal (km2)

    Anta

    ll

    040

    80

    120

    4 64 4096

    Feltlengde (km)

    Anta

    ll

    040

    80

    120

    3 9 81

    Lengde hovedelv (km)

    Anta

    ll

    040

    80

    120

    3 27 243

    Gradient hovedelv (m/km)

    Anta

    ll

    040

    80

    120

    2 8 64

    Eff. sjøp

    Anta

    ll

    0 5 10 20

    0100

    200

    300

    Hmax (moh)

    Anta

    ll

    0 1000 2500

    020

    40

    60

    80

    Hmin (moh)

    Anta

    ll

    0 400 800

    050

    100

    200

    Hdiff (m)

    Anta

    ll

    0 1000 2000

    020

    40

    60

    80

    Perimeter (m)

    Anta

    ll

    040

    80

    120

    10000 1e+06

    Midlere helning o

    Anta

    ll

    5 15 25

    020

    60

    Total elvelengde (km)

    Anta

    ll

    050

    100

    150

    1000 1e+06

    Dreneringstetthet (m/km2)

    Anta

    ll

    0 2000 4000

    050

    100

    ASE (%) HMAX (m.o.h.) HMIN (m.o.h.) HF (m)

  • 19

    Tabell 4. Liste over klimatiske egenskaper som ble beregnet for hvert nedbørfelt.

    Navn Enhet Forklaring Kilde

    QNV m3/s Middelvannføring 1961-1990 Beldring m.fl. (2002)

    QN l/s/km2 Normalavrenning 1961-1990 Beldring m.fl. (2002)

    PJan - PDes mm/måned Middelnedbør januar 1961-1990 SeNorge 2.0

    PN mm/år Årsmiddelnedbør 1961-1990 SeNorge 2.0

    PMed1Max -

    PMed5Max

    mm/døgn Median av årlig maksimal 1 – 5

    døgnnedbør

    SeNorge 2.0

    TJan - TDes oC Middeltemperatur i januar -

    desember for 1961-1990

    SeNorge 2.0

    TN oC Årsmiddeltemperatur for 1961-

    1990

    SeNorge 2.0

    WJan - WDec mm/måned Midlere regn og snøsmelting for

    januar - desember for 1961-1990

    SeNorge 2.0

    WN mm/år Årlig midlere regn og

    snøsmelting for 1961-1990

    SeNorge 2.0

    WMed1Max -

    WMed5Max

    mm/døgn Median for årlig maksimal 1-5

    døgns regn og snøsmelting

    SeNorge 2.0

    QN,SN mm/år Avrenning 1961-1990 SeNorge 2.0

    FP 0-1 Gjennomsnitt for andel bidrag

    fra regn til døgnflommer

    SeNorge 1.0

    M200time mm/time 200 års timesnedbør Dyrrdal m.fl. (2014)

    M200dogn mm/døgn 200 års døgnnedbør Førland m.fl. (2015)

    M200dognGrid mm/døgn 200 års døgnnedbør Lussana (MET)

    Figur 7. Flomgenererende prosess (a), Median for årlig maksimal 2 døgns regn og

    snøsmelting (b) og estimert døgnnedbør med 200 års gjentaksintervall basert på MET sine

    manuelle målestasjoner (c).

  • 20

    Figur 8. Klimatologiske karakteristika. Nedbør for februar, juli og hele året (a-c), midlere

    temperatur for februar, juli og hele året (d-f), og summen av snøsmelting og regnnedbør for

    februar, og juli (g-h) samt midlere årsavrenning (i).

  • 21

    3 Statistiske fordelinger for flomdata

    Ekstremverdi-teoremet, også kjent som Fisher–Tippett teoremet sier at den største verdien

    fra et utvalg av uavhengige og identisk fordelte tilfeldige variabler vil følge en Generell

    ekstremverdi (GEV) fordelingen (f.eks., Fisher & Tippett 1928; Embrechts m. fl. 1997):

    𝐹(𝑥) = {𝑒𝑥𝑝 {− [1 + 𝑘 (

    𝑥−𝑚

    𝛼)]−1 𝑘⁄

    }

    𝑒𝑥𝑝 {−𝑒𝑥𝑝 (−𝑥−𝑚

    𝛼)}

    𝑘 ≠ 0𝑘 = 0

    (1)

    der m er en lokasjonsparameter, α en skalaparameter og k en formparameter.

    Middelverdien eksisterer hvis k < 1.0 og variansen hvis k < 0.5. Hvis k = 0 har vi en

    Gumbel-fordeling. For tilfelle k > 0 har vi en fordeling med en tung hale, mens for k < 0

    er det en lett hale i fordelingen.

    Den generelle logistiske (GL) fordelingen (Hosking & Wallis 1997) anbefales for

    flomfrekvensanalyse i Storbritannia (Robson & Reed 1999) og ble nylig anbefalt for å

    estimere flom for små umålte felt i Norge (Glad m. fl. 2014). Denne fordelingen er en re-

    parametrisering av den log-logistiske fordelingen (Ahmad m. fl. 1988), og ligner på GEV

    som vist i ligning (2):

    𝐹(𝑥) = {{1 + [1 + 𝑘 (

    𝑥−𝑚

    𝛼)]−1 𝑘⁄

    }−1

    {1 + 𝑒𝑥𝑝 (−𝑥−𝑚

    𝛼)}−1

    𝑘 ≠ 0𝑘 = 0

    (2)

    der m er en lokasjonsparameter, α en skalaparameter og k en formparameter.

    Gamma-fordelingen er en fleksibel to-parameter fordeling som ofte brukes på

    hydrologiske og meteorologiske variabler:

    𝐹(𝑥) =1

    Γ(𝑘)𝛾 (𝑘,

    𝑥

    𝛼) (3)

    der Γ er den fullstendige gamma-funksjonen og γ er den lave ufullstendige

    gammafunksjonen.

    Pearson type III fordelingen er en gamma-fordeling med en ekstra lokasjonsparameter:

    𝐹(𝑥) =1

    Γ(𝑘)𝛾 (𝑘,

    𝑥−𝑚

    𝛼) (4)

    der m er en lokasjons-parameter, α en skala-parameter, og k en form-parameter. Hvis

    m = 0, blir P3-fordelingen forenklet til Gamma-fordelingen. P3-fordelingen blir brukt på

    log-transformerte flomverdier i USA (Stedinger & Griffis 2008; Dawdy m.fl., 2012) og

    Australia (Haddad & Rahman 2008). Á priori-fordelinger blir foreslått i Reis & Stedinger

    (2005).

    Man vil ofte beregne en dimensjonerende flom basert på gjentaksintervall.

    Gjentaksintervallet er definert som den inverse av årlig overskridelsessannsynlighet:

  • 22

    𝑇 = 1

    1−𝐹 (5)

    Sammenhengen mellom gjentaksintervall T og kumulativ fordeling F er gitt ved:

    𝐹 = 1 −1

    𝑇 (6)

    Der T er gjentaksintervall i år. En 200-års flom vil ha en årlig

    overskridelsessannsynlighet på 0.005 og ha en underskridelssannsynlighet på 0.995. Har

    man estimert lokasjons- skala- og formparametrene i GEV- eller GL-fordelingen, kan

    dimensjonerende flom beregnes slik for GEV-fordelingen (ligning 7) og GL-fordelingen

    (ligning 8)

    𝑥(𝑇) =

    {

    𝑚 −𝛼

    𝑘[1 − (𝑙𝑛 (

    𝑇

    𝑇−1))−𝑘

    ]

    𝑚 − 𝛼 [𝑙𝑛 (𝑙𝑛 (𝑇

    𝑇−1))]

    𝑘 ≠ 0𝑘 = 0

    (7)

    𝑥(𝑇) = {𝑚 +

    𝛼

    𝑘[1 − {1 (𝑇 − 1)⁄ }−𝑘]

    𝑚 − 𝛼𝑙𝑛{1 (𝑇 − 1)⁄ }

    𝑘 ≠ 0𝑘 = 0

    (8)

    For Gamma- og P3-fordelingene er det ikke noen eksplisitt uttrykk for kvantil-

    funksjonen, og de må løses numerisk (f.eks. Best & Roberts 1975), eller kan være oppgitt

    i tabeller (f.eks. for P3-fordelingen se US Water Resources Council 1982).

    4 Lokal flomfrekvensanalyse I dette kapittelet vil vi presentere metoder, resultater og konklusjoner for delmål knyttet

    til lokal flomfrekvensanalyse.

    4.1 Metoder

    4.1.1 Estimeringsmetoder

    Noen vanlige statistiske fordelinger brukt for årlige maksimal-flommer er presentert i

    kapittel 3. Når man har tilstrekkelig med lokale data, kan parametrene i fordelingene

    estimeres. Fire standard metoder brukes i dag. Ligninger for metodene er presentert i

    appendiks A, og i følgende avsnitt vil de bli kort oppsummert.

    For å estimere fordelingsparametre med moment-metoden, beregner man først

    middelverdi- standardavvik og skjevhetskoeffisient (hvis fordelingen har tre parametre).

    Basert på disse 2(3) momentene kan man så estimere de 2(3) parametrene i fordelingen.

    På den måten sikrer man at estimerte moment fra data og fordelingen har samme moment.

    Ligninger er vist i appendiks.

    I stedet for ordinære moment kan man estimere l-moment basert på data. L-moment

    baserer seg på lineære kombinasjoner av data, og flere studier viser at l-moment er mer

  • 23

    robuste en vanlige moment, spesielt når man har små datasett. Ligninger er vist i

    appendiks A.

    Maximum-likelihood-metoden baserer seg på å maksimere sannsynligheten for de

    observerte dataene. Dette gjør man ved å beregne en rimelighetsfunksjon for modell-

    parametre gitt data. Denne funksjonen er definert som produktet av

    sannsynlighetstetthetsfunksjonen evaluert for hver observasjon. Rimelighetsfunksjonen

    kan bli vanskelig å håndtere rent numerisk, så vi bruker som regel logaritmen av

    funksjonen (log-likelihood). Denne funksjonen skal maksimeres med hensyn på

    modellparametre ved å bruke en numerisk algoritme.

    Bayesiansk metode baserer seg på å Bayes teorem som kombinerer á-priori kunnskap om

    fordelingsparametre (f.eks., Kuczera 1982; Gaume m. fl. 2010) eller flomkvantiler (Coles

    & Tawn 1996) med informasjon fra data gitt ved rimelighetsfunksjonen. Da kan en á-

    posteriori fordeling for parametre, p(θ│x), beregnes slik:

    𝑝(𝜃|𝑥) =𝑝(𝜃)𝑙(𝜃|𝑥)

    ∫𝑝(𝜃)𝑙(𝜃|𝑥)𝑑𝜃 (9)

    Med den Bayesianske tilnærmingen er det også enkelt å beregne prediktive fordelinger og

    usikkerhetsintervall for flomkvantiler.

    Á priori informasjon på modellparametre

    For de fleste analysene presentert i dette delkapittelet brukte vi ikke-informative á-priori

    fordelinger for parametrene unntatt for form-parameterene i GEV- og GL-fordelingene.

    Disse ble antatt å være normalfordelte som hhv N(0, 0.2) and N(0.15, 0.175). Den ikke-

    informative á-priori fordelingen for lokasjonsparametrene var proporsjonal med en

    konstant, mens skala-parametrene var proporsjonale til en konstant på log-skala. Á-priori

    fordelingen for form-parameteren i GEV-fordelingen er brukt i Renard m.fl. (2013), mens

    á priori-fordelingen for form-parameteren i GL-fordelingen ble anslått basert på

    spredningsplott for L-moment for flomdata fra Storbritania (Robson & Reed 1999).

    4.1.2 Valg av fordeling og estimeringsmetode

    Vi ønsket å undersøke systematisk hvilken kombinasjon av statistisk fordelingsfunksjon

    og estimeringsmetode som bør anbefales og spesielt undersøke om anbefalinger bør være

    avhengig av lengde på dataserier. Metoden som brukes her er beskrevet i detalj i

    Kobierska m.fl. (2018).

    Datasettet beskrevet i kapittel 2 om flomdata ble brukt, og derav inngikk 280 stasjoner

    med mer enn 30 år med data i analysen. Vi brukte en tilnærming basert på gjentatte

    tilfeldige utvalg (dvs. bootstrapping) for evaluering:

    (i) For hver stasjon s med data Qs

    (ii) For l = 30, 35 ,.., 90 år

    (iii) Trekk med tilbakelegging m = 50 sett med lengde l: Q*l,s,m

    (iv) Tilpass fordelingsfunksjonen 𝐹𝑙,𝑠,𝑚 og estimer flomkvantiler 𝐹𝑙,𝑠,𝑚−1 (1 −

    1

    𝑇) for de

    fem statistiske fordelingene til data med fire ulike estimeringsmetoder (T angir her

    gjentaksintervall).

  • 24

    (v) Beregne evalueringskriterier (for stasjon s, sett m, lengde l, de fem

    fordelingsfunksjonene og fire estimeringsmetodene), (se nedenfor for detaljer).

    (vi) For hvert kriterium, beregnet et gjennomsnitt over de 50 settene og alle stasjoner.

    (vii) Vis evalueringskriteriene som funksjon av l for alle kombinasjoner av fordelinger

    og estimeringsmetode for utvalgte gjentaksintervall T.

    Evalueringskriteriene måler hvor godt modellene klarer å beregne flomkvantiler. Vi

    brukte kriterier som beskriver stabilitet og pålitelighet.

    Stabilitet måler en egenskap kun ved fordelingene og kan derfor evalueres for alle

    flomkvantiler. Vi brukte variasjonskoeffisient (CV) for flomkvantiler for hvert felt s, hver

    samplestørrelse l, og hvert gjentaksintervall T over alle sample m = 1,…, 50: CVT,l,s,*.

    Deretter beregnet vi en gjennomsnittlig CV over alle felt for hver samplestørrelse og

    gjentaksintervall: CVT,l,*,*.

    Pålitelighet med tanke på hvor godt fordelinger passer til data, ble målt ved bruk av test-

    statistikk fra Kolmogorov-Smirnov og Anderson-Darling testene brukt for å sammenligne

    fordelinger estimert på de settene som trekkes i (iii) med det opprinnelige flomdatasettet.

    Pålitelighet med tanke på hvor godt modellene predikerer flomkvantiler ble målt ved

    Brier Score (BS) og Quantile Score (QS). Brier score (Brier 1950) ble brukt for å

    evaluere predikert T-års flom ved å sammenligne den predikerte sannsynligheten for

    overskridelse av en terskel 𝑢𝑇,𝑠 (gitt ved 1 − 𝐹𝑙,𝑠,𝑚(𝑢𝑇,𝑠)) med om terskelen faktisk ble

    overskredet for et uavhengig datasett (gitt ved 𝕀{𝑥𝑠,𝑖 > 𝑢𝑇,𝑠}):

    𝐵𝑆𝑙,𝑠,𝑚(𝐹𝑙,𝑠,𝑚|𝑢𝑇,𝑠) =1

    𝑛𝑠∑ (1 − 𝐹𝑙,𝑠,𝑚(𝑢𝑇,𝑠) − 𝕀{𝑥𝑠,𝑖 > 𝑢𝑇,𝑠})

    2𝑛𝑠𝑖=1 (11)

    der 𝑢𝑇,𝑠 er terskelen definert ved et gjentaksintervall T og 𝕀 er en indikator-funksjon som

    er 1 hvis 𝑥𝑠,𝑖 > 𝑢𝑇,𝑠 og ellers 0.

    Kvantil-score (QS) sammenligner observert flom 𝑥𝑠,𝑖 fra et uavhengig datasett med den

    estimerte flomkvantilen 𝐹𝑙,𝑠,𝑚−1 (𝑝𝑇 = 1 − 1 𝑇⁄ ) for et gitt gjentaksintervall T. Forskjellen

    gis en liten vekt hvis flommen er lavere en den estimerte kvantilen:

    𝑄𝑆𝑙,𝑠,𝑚(𝐹𝑙,𝑠,𝑚|𝑇) =1

    𝑛𝑠∑ [(𝑥𝑠,𝑖 − 𝐹𝑙,𝑠,𝑚

    −1 (𝑝𝑇)) ((𝑝𝑇) − 𝕀{𝑥𝑠,𝑖 ≤ 𝐹𝑙,𝑠,𝑚−1 (𝑝𝑇)})]

    𝑛𝑠𝑖=1 (12)

    For både BS og QS brukte vi forskjellige sett (av de m =50 tilgjengelige settene) for å

    estimere fordelingene F og for evalueringen (x i ligning 11 og 12). Dette sikret at vi

    evaluerte prediktive egenskaper. Siden vi brukte dataserier med lengde på minst 30 år, ble

    BS og QS evaluert for gjentaksintervall opp til 30 år (2, 5, 15, 20, and 30). Terskelen 𝑢𝑇,𝑠

    i ligning 11 ble estimert for hver stasjon ved å bruke Hazens plotte-posisjon for

    observerte data (Makkonen 2008):

    �̂�′(𝑖) =𝑖−0.5

    𝑛 (13)

    der i er rangen til observasjonen 𝑄(𝑖) (sortert i stigende rekkefølge), n er antall

    observasjoner, and �̂�′(𝑖) er den estimerte kumulative sannsynligheten for observasjon

    𝑄(𝑖). I følge Stedinger m.fl. (1993) er Hazen plotteposisjon et tradisjonelt valg og er ikke

    knyttet til en spesiell fordeling.

  • 25

    Pålitelighet ble til sist målt ved å bruke l-moment ratio diagram der estimat av l-moment

    ratioene 2, 3, and 4 (l-moment sine mål for variasjonskoeffisient, skjevhet, og kurtosis)

    sammenlignes med den teoretiske sammenhengen for parametriske fordelinger. Slike

    plott ble introdusert av Hosking (1990), tilnærminger for flere fordelinger er presentert i

    Hosking & Wallis (1997). Fordelen med denne evalueringen er at den gir en visuell

    vurdering av hvor godt empiriske data passer til teoretiske fordelinger. Dette er dessuten

    en standard tilnærming brukt i regional flomfrekvensanalyse (f.eks. Peel m.fl. 2001).

    4.1.3 Bruk av historiske data

    For å kunne bruke historisk informasjon i ekstremverdianalyser, må vi kjenne til alle

    flommer som overskrider en høy terskel over en gitt periode. Vi kan enten kjenne til

    størrelsen på flommene over terskelen eller antall flommer over terskelen. Eksempler på

    bruk av historiske data i flomfrekvensanalyse er presentert i Engeland m.fl. (2018a,

    2018b) og Støren m.fl. (2018). I denne rapporten baserer vi oss først og fremst på

    resultatene fra Engeland m.fl. (2018a).

    For å estimere parametrene til GEV-fordelingen, brukte vi en Bayesiansk tilnærming som

    beskrevet I Engeland m.fl. (2018a), Gaál m.fl.. (2010) og Stedinger & Cohn (1986).

    Metoden er illustrert i Figur 9.

    Figur 9. Bruk av historiske data i flomfrekvensanalyse i et Bayesiansk rammeverk for

    estimering av parametre der total rimelighetsfunksjon er sammensatt av (i)

    rimelighetsfunksjon for n år med systematiske data (ls); (ii) rimelighetsfunksjon for t

    historiske flommer (la1-3) som overskrider terskelen x0 i historisk periode h og (iii)

    rimelighetsfunksjon for årene med ingen flommer over terskelen (lb).

  • 26

    Rimelighetsfunksjonen for systematiske data er gitt ved:

    𝑙𝑠 = ∏ 𝑓(𝑥𝑖|𝑚, 𝛼, 𝑘)𝑛𝑖=1 (14)

    der f(xi) er tetthetsfunksjonen for GEV-fordelingen evaluert for observasjonen xi. med

    parameterverdier 𝑚,𝛼, 𝑘

    For flommer i en historisk periode med lengde h er det antatt at alle t flommer som

    overskrider en terskel x0 for en periode er kjent. Rimelighetsfunksjonen for de h-t årene

    uten flommer som overskrider x0 i perioden h er da:

    𝑙𝑏 = [𝐹(𝑥0|𝑚, 𝛼, 𝑘)]ℎ−𝑡 (15)

    der F er GEV-fordelingen som gitt i (1).

    Vi må nå legge til hva vi vet om flommene som overskrider terskelen x0. I det enkleste

    tilfellet vet vi kun at t flommer overskrider x0, da er rimelighetsfunksjonen gitt som:

    𝑙𝑎1 = [1 − 𝐹(𝑥0|𝑚, 𝛼, 𝑘)]𝑡 (16)

    Alternativt, kan vi anta at flommene som overskrider x0 er gitt ved et intervall med en

    øvre xU og nedre xL grense:

    𝑙𝑎2 = ∏ [𝐹(𝑥𝑈,𝑗|𝑚, 𝛼, 𝑘) − 𝐹(𝑥𝐿,𝑗|𝑚, 𝛼, 𝑘)]𝑡𝑗=1 (17)

    Hvis vi kjenner størrelsen på alle flommene som overskrider terskelen x0:

    𝑙𝑎3 = ∏ 𝑓(𝑦𝑗|𝑚, 𝛼, 𝑘)𝑡𝑗=1 (18)

    Den totale rimelighetsfunksjonen er gitt som produktet av de tre leddene:

    𝑙𝑖 = 𝑙𝑠 ∙ 𝑙𝑏 ∙ 𝑙𝑎𝑖 (19)

    Á posteriori fordelingen for parametrene ble estimert med en MCMC algoritme

    implementert i R-pakken nsRFA (Viglione 2012).

    Viktige utfordringer er å fastsette terskelen x0 og lengden h, for perioden med historisk

    informasjon. For hvert felt, satte vi terskelen til den laveste observerte historiske

    flommen som anbefalt i Prosdocimi (2017). For å beregne lengden på den historiske

    perioden beregnet vi først midlere tidsintervall tm mellom historiske hendelser. Vi satte

    starten på den historiske perioden til å være tm år før første historiske flommen, og slutten

    på den historiske perioden til å være året der systematiske vannføringsobservasjoner

    starter (Prosdocimi, 2017).

    Vi utførte et simulerings-eksperiment for å evaluere merverdien i å bruke historiske data.

    Nye datasett Q* med lengde n (samme lengde som Q) ble trukket tilfeldig k ganger med

    tilbakelegging fra Q. Fra Q* tok vi så ut et delsett 𝑄𝑠∗ med lengde s = 5-75 år for å

    beregne likelihood-komponenten ls i ligning 14. For å lage historisk informasjon, brukte

    vi de resterende dataene fra Q* (dvs de som ikke er med i 𝑄𝑠∗ ) og kaller dem 𝑄ℎ

    ∗ der

    lengden h = n-s. Fra 𝑄ℎ∗ tok vi ut så ut 𝑄𝑡

    ∗ som er t flommer over en valgt terskel Q0. 𝑄𝑡∗

    ble brukt for å beregne de to likelihood-komponentene (lb og la) i ligning (15-18). Kun

    realisasjoner av Q* der minst et datapunkt i 𝑄ℎ´∗ overskred terskelen Q0 ble brukt.

    Tilnærmingen er illustrert i Figur 10.

  • 27

    Figur 10: Illustrasjon av tilnærming for å evaluere merverdien i historiske data. Øverste plot

    viser opprinnelige datasett Q, her fra Bulken med lengde n = 123 år. Nederste plot viser

    tilfeldig trukket datasett Q* med lengde n = 123. Delsettet 𝑸𝒔∗ med lengde s = 5-75 år er til

    høyre. Delsettet 𝑸𝒉∗ er til venstre. Fra 𝑸𝒉

    ∗ tok vi ut historiske flommer𝑸𝒕∗ over en terskel Q0.

    Figuren illustrerer to mulige terskler og for den høyeste terskelen er de historiske flommene

    markert som lilla, mens for den laveste terskelen er de historiske flommene enten turkise

    eller lilla.

    Eksperimentet hadde to deler. Den første var å analysere hvor følsomme de estimerte

    flomkvantilene var for bruk av historiske data. Dette gjorde vi ved å estimere

    flomkvantlier både med og uten historiske data og vi lot lengden på den historiske

    perioden (h i ligning 15) ligge fast (h = n-s). Den andre delen av eksperimentet var å

    analysere hvor følsomme estimat av flomkvantiler var for hvordan lengden på den

    historiske perioden ble beregnet. Dette ble gjort siden vi ikke alltid vet når den historiske

    perioden skal starte. Vi brukte følgende tre tilnærminger for å beregne lengden på den

    historiske perioden: (i) sette h til den kjente lengden (h = n-s) (ii) sette h til tidsspennet fra

    den første historiske hendelsen til slutten av den historiske perioden og (iii) følge

    Prosdocimi (2017) og sette h til tidsspennet fra den første historiske hendelsen til slutten

    av den historiske perioden pluss midlere tidsintervall mellom historiske flommer. Merk at

    for (ii) og (iii) ble h estimert for hvert sample 𝑄ℎ´∗ .

    Simulerings-eksperimentet gav oss k estimat av flomkvantiler. For å evaluere merverdien

    i bruk av historiske data, beregnet vi midlere absolutt feil (MAF) og midlere relativ feil

    (MRF) for estimerte flomkvantiler, der vi brukte estimat basert på hele den tilfeldig

    trukne dataserien Q* som referanse. På denne måten kunne vi analysere den isolerte

    effekten av å bruke deler av Q* som historisk informasjon. I tillegg målte vi stabilitet ved

    å beregne variasjonskoeffisient for alle flomestimat basert på ulike utvalg for å lage Q*

    (vi hadde 50 forskjellige utvalg).

    4.1.4 Estimering av dimensjonerende kulminasjonsflom

    Presentasjonen av dataene i kapittel 2 viser at dataserier for kulminasjonsflommer er

    betydelig kortere enn dataserier for døgnflommer. Når vi skal estimere dimensjonerende

  • 28

    flommer ønsker vi å bruke flest mulig data for å redusere estimeringsusikkerheten. Vi

    trenger derfor en robust anbefaling for hvordan vi kan kombinere relativt lange serier med

    døgnflommer med kortere serier for kulminasjonsflommer. Dette gjorde vi ved å velge ut

    de 26 seriene med mer enn 40 år med findata vist i tabell 5.

    Tabell 5. Liste over stasjoner med mer enn 40 år med kulminasjonsflommer. Kolonnene med

    serielengde viser lengde på hhv kulminasjonsflom og døgnflom serier.

    St. nr. lengde St. nr. lengde St. nr. lengde

    2.279 45 / 53 22.22 44 / 45 124.2 53 / 107

    2.323 48 / 49 26.20 46 / 49 127.13 45 / 47

    6.10 51 / 52 26.21 48 / 49 133.7 49 / 104

    12.171 44 / 51 42.2 46 / 48 150.1 55 / 56

    12.178 45 / 48 50.1 55 / 97 151.15 49 / 51

    15.49 50 / 57 62.10 45 / 56 153.1 47 / 103

    16.66 50 / 70 75.23 53 / 54 163.6 52 / 72

    19.73 46 / 51 83.7 49 / 54 163.7 46 / 50

    19.96 44 / 45 111.9 44 / 45

    For å evaluere ulike strategier for å estimere dimensjonerende kulminasjonsflom, brukte

    vi følgende framgangsmåte.

    1) Estimere dimensjonerende flommer basert på GEV-fordeling med alle

    kulminasjonsflomverdier.

    2) Trekke ut – med tilbakelegging kulminasjonsflomserier med lengde 5,10,15 ,…,

    50 år. 1000 trekninger for hver serielengde

    3) Trekke ut – med tilbakelegging, døgnmiddelflomserier med lengde 50, 60, ,….,

    100 år. 1000 trekninger for hver serielengde

    4) Sammenligne metoder for å estimere dimensjonerende kulminasjonsflom:

    a. Estimerer GEV-fordelingen for det trukne datasettet med

    kulminasjonsflommer. (steg 2 ovenfor)

    b. Estimerer GEV-fordeling for det trukne datasettet med døgndata (steg 3)

    og beregne indeksflom ratio for kulminasjons- og døgnmiddelflom.

    c. Lokal indeksflom fra kulminasjonsflommer pluss regional vektskurve (Se

    kapittel 5 i denne rapporten)

    5) Sammenligning av estimatene fra 1 og 4 der 1 brukes som fasit.

    6) Evaluere om resultatene fra 3 er avhengig av lengde på tidsserier

    4.1.5 Valg av plotteposisjon

    I hydrologi brukes plotteposisjon for å beregne en empirisk fordeling for observerte

    flomdata. Dette gjøres ved å sortere data i synkende rekkefølge. For en tidsserie med n

    flommer er plotteposisjonen Gi = 1-Fi for datapunktet xi med rank i er vist i Tabell 4

  • 29

    sammen med gjentaksintervallet Ti for den høyeste observasjonen(i = 1), (husk at Ti = 1 /

    Gi) . I dette studiet fokuserte vi på tre plotteposisjoner: Weibull, Gringerton og Hazen.

    Gringerton plotteposisjon er optimalisert for å gi best mulig kvantil-estimat for Gumbel-

    fordelte data. Weibull plotteposisjon skal gi best mulig estimat av overskridelses-

    sannsynlighet for alle fordelinger. Hazen er et tradisjonelt valg.

    Tabell 6: Plotteposisjoner. Fra Stedinger m.fl. (1993)

    Navn Ligning Tmaks

    Weibull i / (n+1) n+1

    Median (i-0.3175) / ( n+0.365) 1.47*n+0.5

    APL (i-0.35)/ n 1.54n

    Blom (i -3/8)/ ( n+1/4) 1.60n+0.4

    Cunnane (i-0.40) / ( n+0.2) 1.67n+0.3

    Gringerton (i-0.44) / ( n+0.12) 1.79n+0.2

    Hazen (i-0.5) / n 2n

    Den empiriske fordeling definert ved plotteposisjon ble tidligere brukt for å tilpasse en

    sannsynlighetsfordeling til observerte data. I dagens praksis brukes denne til å avgjøre

    hvilken teoretisk fordeling som passer best til observasjoner. Dette valget er subjektivt

    siden man gjør en visuell vurdering. Valget av plotteposisjon kan avgjøre hvilken

    fordeling som velges. For å undersøke hvilken plotteposisjon som fører til flest riktige

    valg av fordeling, og hvor subjektive slike valg er, ble det gjennomført en

    spørreundersøkelse på en workshop om flomberegninger. Her vil vi oppsummere deler

    av undersøkelsen. De fleste deltakerne var enten kjent med flomfrekvensanalyser eller

    eksperter i flomfrekvensanalyser. Undersøkelsen ble avholdt i plenum der figurer ble vist

    på en stor skjerm, og deltakerne skulle fylle inn sine egne svar i et google-skjema. Vi

    simulerte data fra fem fordelinger, tre datasett fra hver fordeling, totalt 15 datasett. Alle

    fordelinger ble tilpasset hvert datasett og plotteposisjon ble brukt for å visualisere de

    simulerte dataene. Deltakerne skulle da svare på hvilken fordeling de synes passer best til

    de simulerte dataseriene. Ingen informasjon ble gitt om plotteposisjon, og deltakerne fikk

    ikke mulighet til å snakke sammen. Resultatene ble analysert i etterkant.

    4.2 Resultater og diskusjon

    4.2.1 Valg av fordeling og estimeringsmetode

    I Figur 11 vises resultatene for de ulike evalueringskriteriene som funksjon av lengde på

    dataserier. Merk at de laveste verdiene viser en beste prestasjonen for de ulike kriteriene.

    I Figur 12 vises kun den estimeringsmetoden som gav de beste resultatene for de ulike

    fordelingsfunksjonene. Merk at for evaluering av pålitelighet (AD, KS, QS og BS) utelot

    vi ML-metoden for 3-parameter fordelingene siden den kunne gi veldig ustabile

    resultater, mens for evaluering av stabilitet (CV) utelot vi moment-metoden siden den

    kunne gi de mest upålitelige resultatene.

  • 30

    Figur 11. AD, KS, BS, QS og CV som funksjon av serielengde beregnet som et snitt over 280

    stasjoner. Lave verdier indikerer de beste tilpasningene.

    Figur 12. Evalueringskriterier som funksjon av lengde på dataserier. Lave verdier indikerer

    de beste tilpasningene. For hver fordeling vises resultater for den estimeringsmetoden som

    gav lavest verdi for evalueringskriteriene.

    30 40 50 60 70 80 90

    1.0

    1.5

    2.0

    Anderson-Darling

    Serielengde (år)

    AD

    MLMLL-moment

    BayesianskL-moment

    30 40 50 60 70 80 90

    0.1

    10.1

    30.1

    5

    Kolmogorov-Smirnov

    Serielengde (år)

    KS

    MLMLL-moment

    BayesianskL-moment

    30 40 50 60 70 80 90

    0.0

    482

    0.0

    488

    Brier-score

    Serielengde (år)

    BS

    L-momentMLBayesiansk

    L-momentL-moment

    30 40 50 60 70 80 90

    0.0

    435

    0.0

    445

    0.0

    455 Kvantil-score

    Serielengde (år)

    QS

    O-momentO-momentL-moment

    L-momentL-moment

    30 40 50 60 70 80 90

    0.0

    50.1

    00.1

    50.2

    0

    Variasjonskoeffisient

    Serielengde (år)

    CV

    MLMLBayesiansk

    L-momentML

    GumbelGammaGEVGLPearson

  • 31

    Figur 11 og 12 viser at uavhengig av estimeringsmetode, forbedres tilpasningen med

    lengde på dataserier, og vi får den beste tilpasningen for de lengste dataseriene (90 år).

    Basert på resultatene i dette kapittelet ser vi at

    • GEV- og GL-fordelingene er de mest pålitelige, der GEV er mer stabil enn GL

    for dataserier kortere enn 60 år.

    • L-moment og Bayesiansk metode anbefales for å estimere parametre for alle 3-

    parameter fordelinger.

    • Maksimum-likelihood metoden bør ikke brukes for 3-parameter fordelinger siden

    resultatene blir veldig ustabile.

    • Brukes Gumbel-fordelingen, anbefales l-moment metoden foran Bayesiansk

    metode.

    • Det er ingen klar terskel for når man skal gå over fra 2-parameter til 3-parameter

    fordeling. For Anderson-Darling, Kolmogorov-Smirnov og Kvantil-score

    kriteriene er Gumbel-fordelingen like god som GEV-fordelingen for korte

    serielengder (kortere enn ca 50 år). For Brier-score er GL-fordelingen alltid best

    og GEV-fordelingen alltid nestbest og presterer bedre en Gumbel-fordelingen for

    alle serielengder. GL- og GEV-fordelingene veksler mellom å prestere best for de

    ulike evalueringskriteriene.

    • Resultatene indikerer at vi bør fortsette med eksisterende praksis for valg av

    fordeling, dvs. bruke Gumbel-fordelingen for serielengder mellom 30 og 50 år,

    og GEV-fordelingen for serielengder lengre enn 50 år.

    Figur 13. L-moment ratio diagram for de 280 stasjonene med mer enn 30 år med data.

    I Figur 13 vises l-moment ratio diagrammet. Vi ser at ved å beregne glidende

    middelverdier for l-skjevhet, ligger punktene nærmest den teoretiske sammenhengen for

    GEV-fordelingen. Dette tyder på at skal man velge fordeling for et nytt datasett, er GEV-

    fordelingen det beste valget.

  • 32

    4.2.2 Bruk av historiske data

    Bruk av historiske data ble kun systematisk evaluert på flomdata fra Bulken der vi har

    brukt 123 år med observerte flommer og historisk informasjon for flommer tilbake til

    1604. Resultatene for den første delen av eksperimentet er vist i Figur 14-16 der midlere

    absolutt feil (MAF) (Fig. 14), midlere relativ feil (MRF) (Fig.15) og variasjonskoeffisient

    (CV) (Fig. 16) er plottet som funksjon av lengde på systematiske data. Merk at for alle

    disse figurene reduseres lengden på den historiske perioden når lengden på systematiske

    data økes. Derfor vil styrken på likelihood-leddet ls øke mens styrken for leddene lb og la

    minker med lengde på systematiske data. Terskler på 420 m3/s og 500 m3/s ble brukt for å

    evaluere hvor følsomme resultatene er med hensyn på terskel. Den høyeste terskelen ble

    overskredet ca. 8 ganger i løpet av 123 år og representerer ca. en 15-års flom. Den

    laveste terskelen ble overskredet 24 ganger i løpet av 123 år og representerer en 5-års

    flom. Estimat av 20, 50 og 100 års flommer basert på hele datasettet ble brukte som

    referanse for å beregne MAF og MRF i Figur 14 og 15. I Figur 16 vises CV for

    gjentaksintervall på 20, 200 og 500 år.

    Fra Figur 14 ses en reduksjon i MAF ved bruk av historisk informasjon, og reduksjonen i

    MAF er størst når lengden på systematisk data er kortest. Resultatene viser at merverdien

    i historiske data er størst når lengden på systematiske data er kort, spesielt når man

    kjenner størrelsen på de historiske flommene. Når bare informasjon om antall flom over

    en terskel er kjent, gir en høy terskel mer informasjon enn en lav terskel. MRF reflekterer

    bias i estimeringen. Fra Figur 15 ser vi at bruk av bare systematiske data har en tendens

    til å undervurdere flomkvantilene når vi har færre enn 20 år med systematiske data, og

    ved å bruke informasjon om antall flommer som overskrider en grense, overvurderes

    flomkvantilene når vi har færre enn 50 år med data. Imidlertid gir bruk av informasjon

    om antall flommer som overstiger en terskel lavest MRF. Figur 16 viser at vi oppnår

    størst stabilitet når lengden på systematiske data er lengst og når vi kjenner størrelsen på

    de historiske flommene. Reduksjonen i CV er størst når den systematiske

    utvalgsstørrelsen er den korteste.

    Figur 17 viser sensitiviteten til evalueringskriteriene med hensyn på den estimerte

    lengden av den historiske perioden. De historiske dataene ble opprettet kun for høyeste

    terskel (500 m3/s), og den estimerte fordeling med alle 123 års AMS-data ved Bulken ble

    brukt som "sannheten". Resultatene i Figur 17 viser at evalueringskriteriene er følsomme

    for hvordan lengden på den historiske perioden er estimert. Bruker man korteste mulig

    lengde på historisk periode, dvs at den starter året for den tidligste historiske

    flomhendelsen fører til en overestimering av returnivåer. Legger man til midlere

    tidsintervall mellom historiske hendelser (i.e. midlere ventetid) oppnår man best resultat.

    Dette bekrefter resultatene fra Prosdocimi (2017).

  • 33

    Figur 14. Midlere absolutt feil (MAF) som en funksjon av lengde på systematiske data.

    Øverste rad viser resultat for laveste terskel på 420 m3/s nederste rad viser resultat for

    høyeste terskel på 500 m3/s.

    Figur 15. Midlere relativ feil (MRF) som en funksjon av lengde på systematiske data.

    Øverste rad viser resultat for laveste terskel på 420 m3/s nederste rad viser resultat for

    høyeste terskel på 500 m3/s.

  • 34

    Figur 16. Variasjonskoeffisienten (CV) som en funksjon av lengde på systematiske data.

    Øverste rad viser resultat for laveste terskel på 420 m3/s nederste rad viser resultat for

    høyeste terskel på 500 m3/s.

    Figur 17. Midlere absolutt feil (MAF), midlere relativ feil (MRF), og variasjonskoeffisient

    (CV) for estimerte flomkvantiler som en funksjon av lengde på systematiske data. Tre

    forskjellige metoder ble brukt for å anslå lengden på den historiske perioden. En terskel på

    500 m3/s ble brukt for å etablere historisk informasjon.

  • 35

    4.2.3 Estimering av dimensjonerende kulminasjonsflom

    I dette delkapittelet evalueres hvordan vi kan kombinere relativt lange serier med

    døgnflommer med kortere serier for kulminasjonsflommer. Dette gjorde vi ved å velge ut

    de 26 seriene med mer enn 40 år med findata. I Figur 18 vises RMSNE (Root Mean

    Square Normalized Error) for 100-års flommen som et gjennomsnitt over 1000 trekninger

    av data og over alle 26 felt med tilstrekkelig lange dataserier. Vi ser at for serier lengre

    enn 25 år, vil det, i snitt, lønne seg å utføre en lokal tilpasning av GEV-fordelingen. Men

    det er store variasjoner mellom stasjonene hvor lang tidsserie med kulminasjonsflommer

    man må ha for at det lønner seg å tilpasse data direkte til kulminasjonsflom-data.

    Figur 18. RMNSE for 100-års flommen som funksjon av serielengde for

    kulminasjonsflomverdier når man har brukt døgnmiddelflomserier med lengde 50 (a), 60

    (b), 70 (c), 80 (d), og 90 (e) år. (f) Histogram som viser hvor lange tidsserier for

    kulminasjonsflomverdier som behøves for at det lønner seg å gjøre en lokal tilpasning til

    GEV-fordelingen i stedet for å bruke lange døgnmiddelflom-serier kombinert med

    skaleringsfaktor fra middel til kulminasjonsflom.

  • 36

    4.2.4 Valg av plotteposisjon

    Basert på spørreundersøkelsen i Figur 19 viser Histogram for hvilken fordeling som ble

    valgt som riktig fordeling for ulike plotteposisjoner og underliggende sanne fordelinger.

    Resultatene viser at det er store variasjoner mellom personer for hvilken fordeling som

    foretrekkes. Men, i snitt, gir Gringorten plotteposisjon riktig valg av fordeling, og det

    anbefales at denne brukes som plotteposisjon.

    Figur 19. Histogram over valg av fordeling som ble anslått å gi best tilpasning til data ved

    bruk av tre ulike plotteposisjoner.

    4.3 Konklusjoner og anbefalinger for lokal flomfrekvensanalyse

    I dette delkapittelet har vi systematisk evaluert ulike problemstillinger knyttet til lokal

    flomfrekvensanalyse. Basert på disse analysene, kan vi komme med følgende

    anbefalinger:

    i. Bruk 3-parameterfordeling (GEV) for mer enn 50-år med data

    ii. Bruk Gumbel-fordeling for 30-50 år med data

    iii. Bruk Bayesiansk metode med informativ á-priori fordeling eller l-moment

    metode for å beregne parametrene i de statistiske fordelingene.

    iv. Bruk Gringerton plotteposisjon

    v. Test ut hvor følsomme resultatene er for bruk av historiske data. Har man sikker

    informasjon om historiske flommer, bør denne brukes.

    GEV

    Weib

    ull

    0.0

    0.3

    0.6

    Gringort

    en

    0.0

    0.3

    0.6

    Hazen

    0.0

    0.3

    0.6

    All

    0.0

    0.3

    0.6

    GL

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    Gumbel

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    LN3

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    P3

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    Gumb GEV GL P3 LN3

    GEV

    Weib

    ull

    0.0

    0.3

    0.6

    Gringort

    en

    0.0

    0.3

    0.6

    Hazen

    0.0

    0.3

    0.6

    All

    0.0

    0.3

    0.6

    GL

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    Gumbel

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    LN3

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    P3

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    0.0

    0.3

    0.6

    Gumb GEV GL P3 LN3

  • 37

    vi. Har man mer enn 25-30 år med kulminasjonsflomdata, bør man tilpasse Gumbel-

    eller GEV-fordeling direkte til disse dataene selv om man har lengre tidsserier

    med døgndata.

    Merk at anbefaling (i)-(iii) blir revurdert i kapittel 5 der alternativ formulering av á-priori

    fordeling blir undersøkt.

    Det er flere tema som bør undersøkes videre. Noen viktige punkter inkluderer:

    • Kan en Bayesiansk analyse der dimensjonerende flom estimeres som et

    Bayesiansk modellgjennomsnitt basert på flere flomfrekvensfordfelinger, gi mer

    pålitelige og robuste flomestimat?.

    • Ved noen stasjoner er det enkelte år som har eksepsjonelt lave flommer. Hvordan

    skal man ta hensyn til disse i en lokal analyse?

    • Bruke 24-timers glidende middel istedenfor klokkedøgn i lokal

    flomfrekvensanalyse.

    • Bruk av flommer over terskler (POT) som et alternativ til årlige

    maksimalflommer.

    • Hvordan behandle lave uteliggere i en flomberegning. I Norge kan lave

    uteliggere spesielt opptre i felt dominert av snøsmelteflommer.

    5 Regional flomfrekvensanalyse

    5.1 Eksisterende retningslinjer NVE har i dag to veiledere/retningslinjer som gir råd til utførelse av

    flomfrekvensanalyser i Norge. Den ene er presentert i «Retningslinjer for

    flomberegninger» (Midttømme m. fl., 2011) som er utarbeidet for flomberegninger for

    dammer og bygger på den regionale flomfrekvensanalysen etablert av Sælthun m.fl.

    (1997) (RFFA_1997). Den andre er presentert i «Veileder for flomberegninger i små

    uregulerte felt» (RFFA_NIFS) (Stenius m.fl., 2015) som omhandler små nedbørfelt

    (nedbørfelt < ca 50km2). I tillegg har Norsk regnesentral utarbeidet en regional modell

    innenfor FlomQ-prosjektet (RFFA_NR) (Thorarinsdottir m.fl., 2018)

    I RFFA_1997 gjøres det separate analyser for vår- og høstflommer. Landet deles inn i

    ulike geografiske regioner (Figur 20), det er ulike regioner for vår- og høstflommer.

    Videre er det utviklet regresjonsligninger som beskriver sammenhengen mellom

    middelflom og feltegenskaper (Tabell 6). Videre brukes frekvensfaktor for å beregne

    dimensjonerende flomstørrelser (Tabell 7). Det er en regresjonsligning og en vekstkurve

    for hver region, og resultatet er midlere døgnmiddelflom. Videre brukes det

    regresjonsligninger for å beregne størrelsen på kulminasjonsflommen (Tabell 8).

  • 38

    Figur 20. Inndeling i regioner bruk i RFFA_1997

    Tabell 6. Regresjonsligninger for beregning av middelflom (l/s/km2) i RFFA_1997.

    Regresjonsligninger for indeksflom QM (l/s/km2)

    V1 QM = exp (0,2722 • lnEG - 0,1406 • lnASE + 0,1006 • lnASF + 0,6172 • lnQN + 2,11)

    V2 QM = exp (0,0930 • lnEG - 0,0816 • lnASE + 0,0281 • lnASF + 0,5076 • lnQN + 3,59)

    V3 QM = exp (0,3066 • lnEG - 0,0220 • lnASE + 0,0939 • lnASF + 0,3252 • lnQN + 3,09)

    V4 QI = exp(0,1848 • lnEG - 0,0137 • lnASE + 0,0873 • lnASF + 0,5143 • lnQN + 2,77)

    H1 QI = exp (1,2805 • lnQN - 0,2267 • ln(A/FL) - 0,0664 • ASE + 0,0053 • EG + 1,00)

    H2 QI = exp (1,2910 • lnQN - 0,1602 • ln(A/FL) - 0,0508 • ASE + 0,0065 • EG + 0,65)

    H3 QI = exp (1,2014 • lnQN - 0,0819 • ln(A/FL) - 0,0268 • ASE + 0,0013 • EG + 1,07)

    K1 QM = exp (1,5212 • ln QN - 1,1516 • lnPN - 0,0569 • ASE - 0,0093 • FL + 8,80)

    K2 QM = exp (1,1524 • ln QN - 0,0463 • ASE + 1,57)

    Bre QM = exp (0,0119 • QN - 0,0848 • ASE - 0,0165 • LF + 5,81)

  • 39

    Tabell 7. Frekvensfaktorer for beregning av dimensjonerende flom i RFFA_1997.

    Q5/QM Q10/QM Q20/QM Q50/QM Q100/QM Q200/QM Q500/QM Q1000/QM

    V1 1,2 1,4 1,6 1,9 2,1 2,3 2,5 2,7

    V2 1,2 1,4 1,5 1,7 1,9 2,0 2,2 2,3

    V3 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,5

    V4 1,3 1,5 1,8 2,1 2,3 2,6 2,9 3,1

    H1 1,3 1,6 1,8 2,2 2,5 2,8 3,2 3,5

    H2 1,3 1,6 2,0 2,4 2,7 3,0 3,6 3,9

    H3 1,3 1,7 2,0 2,6 3,0 3,4 4,2 4,7

    K1 1,2 1,4 1,7 2,0 2,2 2,4 2,7 3,0

    K2/bre 1,2 1,4 1,6 1,9 2,1 2,3 2,5 2,7

    Tabell 8. Regresjonsligninger for forholdstallet mellom kulminasjonsflom og

    døgnmiddelflom i RFFA_1997. Qmom er kulminasjonsflom og Qdøgn er døgnmiddelflom.

    Regresjonsligninger for forholdstallet

    Vårflom Qmom/Qdøgn = 1.72 – 0.17 • log10 A – 0.125 • (ASE)0.5

    Høstflom Qmom/Qdøgn = 2.29 – 0.29 • log10 A – 0,270• (ASE)0.5

    I RFFA_NIFS (Stenius m.fl. 2015) er det presentert et formelverk for flomberegninger i

    små nedbørfelt basert på regional flomfrekvensanalyse utført for 149 nedbørfelt under ca

    50 km2. Resultatet fra analysen var at de styrende parametrene for beregning av

    middelflom og vekstkurver var areal, normalavrenning og effektiv sjøprosent. I analysen

    ble 16 fordelingsfamilier testet og fordelingen som ga best resultater var GL-fordelingen

    (se kapittel 2.1 i Glad m. fl., 2014).

    𝑄𝑀 = 18.97 ∙ 𝑄𝑁𝑉0.864 ∙ 𝑒𝑥𝑝(−0.251 ∙ √𝐴𝑆𝐸) (20)

    𝑄𝑇

    𝑄𝑀= 1 + 0.308 ∙ 𝑄𝑁

    −0.137 [Γ(1 + 𝑘)Γ(1 − 𝑘) − (𝑇 − 1)−𝑘] 𝑘⁄ (21)

    𝑘 = −1 + 2 [1 + 𝑒𝑥𝑝(0.391 + 1.54 ∙ 𝐴𝑆𝐸 100⁄ )]⁄ (22)

    der 𝑄𝑀 er middelflom og 𝑄𝑇 er T-års flom.

    I Thorarinsdottir m.fl. (2018) presenteres RFFA_NR som er en regional modell for

    flomberegninger i umålte felt der man har bygget opp regionale modeller for alle

    parameterne i den generelle ekstremverdifordelingen uten å gå om en indeksflomanalyse.

    En Bayesiansk tilnærming er brukt der man ender opp med flere ulike modeller som får

    tilordne sannsynligheter. Estimerte flomstørrelser vil bli et vektet snitt av flomstørrelser

    beregnet for hver modell. Modellen kan ikke oppgis som et sett med ligninger, men

    Tabell 9 gir en oversikt over de viktigste kovariatene i modellen.

  • 40

    Tabell 9. Andel modeller (0 – 100 %) der ulike feltparametre ble inkludert.

    m α k

    YLat 53 99 6

    XLong 84 100 8

    ASE 98 100 2

    QN 6 11 9

    FP 3 22 58

    A 2 5 12

    PApr 42 75 5

    PAug 100 100 5

    SMars 8 16 4

    (H90 – H20)/FL 45 12 3

    ASF 22 8 2

    A/FL 12 95 11

    5.2 Regresjonsanalyser Regresjonsanalyser brukes for å estimere en lineær sammenheng mellom en avhengig

    variabel og forklaringsvariabler. I etterkant skal regresjonsmodellen brukes for å

    predikere den avhengige variabelen for nye tilfeller der forklaringsvariablene er

    tilgjengelige. I dette studiet utførte vi regresjonsanalyser for to avhengige variabler:

    medianen for årets største døgnmiddelflom qind (l/s/km2), og forholdstallet mellom

    median kulminasjons- og døgnmiddelflom φ = qind,m/qind,d . Målet med en

    regresjonsanalyse er å finne den enkleste modellen som gir best mulig prediksjon. Vi

    brukte en trening-test-validering-inndeling som beskrevet i 5.2.1. for å oppnå dette. I

    dette studiet brukte vi to tilnærminger for å estimere regresjonsparametre og velge ut

    forklaringsvariabler, skrittvis klassisk lineær-regresjon og Bayesiansk lineær-regresjon.

    5.2.1 Estimering og evaluering av modeller

    For å spesifisere hvilke forklaringsvariabler som skal være med i den beste

    regresjonsmodellen, må man velge et kriterium som evaluerer hvor godt en modell passer

    til data, sette strategi for å etablere den enkleste modellen som gir best prediksjonsevne

    og velge framgangsmåte for å velge ut forklaringsvariabler. Root-mean-square-error

    (RMSE), dvs avviket mellom en predikert og observert verdi, er et ofte brukt mål på hvor

    god en modell er. Modellen med minst RMSE blir foretrukket. Bruk av RMSE som

    evalueringskriterium baserer seg på en antagelse av normalfordelt støy.

    For å etablere den enkleste modellen som har best prediksjonsevne, valgte vi en strategi

    der vi evaluerer modellen på uavhengige observasjoner, dvs observasjoner som ikke ble

    brukt for å bestemme modellparametre. Vi delte datagrunnlaget opp i tre sett: et

    treningssett, et valideringssett og et testsett bestående av hhv 458, 35 og 35 felt.

    Treningssettet ble brukt for å velge beste modell, dvs velge forklaringsvariabler og

    estimere tilhørende regresjonskoeffisienter. Både klassisk og Bayesiansk regresjon ble

    brukt. Disse to regresjonsmetodene har ulike kriterier for å velge forklaringsvariabler som

    gir beste modell. Kriteriene kan justeres slik at de straffer i ulik grad for

    modellkompleksitet. For hver regresjonsmetode gis ulik straff for modellkompleksitet slik

    at vi kan teste ut hvor streng straff vi bør bruke.

  • 41

    Valideringssettet ble brukt for velge det kriteriet (dvs. straffen for modellkompleksitet) og

    den regresjonsmetoden (Klassisk eller Bayesiansk) som gir best prediksjon ved å beregne

    RMSE. Men for å i tillegg ha mulighet til å forenkle modellen, returneres også den

    enkleste modellen (fra den beste modellen returnert for ulike verdier av

    justeringsparameteren) som er innenfor 10% av beste valideringssett-RMSE.

    Testsettet ble brukt for å velge regresjonsmetode (klassisk eller Bayesiansk) og få et mål

    på hvor godt man venter at modellen oppfører seg i umålte felt. Også her ble RMSE brukt

    som mål.

    Valideringssettet og testsettet ble plukket ut manuelt ut fra følgende kriterier: geografisk

    fordelt så jevnt som mulig samtidig som datakvalitet og feltparameteregenskaper ble

    vurdert. Vurderingen ble utført slik at ulike typer av feltegenskaper er representert i

    valideringssettet, så langt det lot seg gjøre samtidig som datakvaliteten ble vurdert så god

    som mulig.

    Etter at modellen er valgt og evaluert foretas en ny estimering der hele datasettet benyttes

    for å estimere regresjonskoeffisienter for de utvalgte forklaringsvariablene. Dette gir

    regresjonsparametrene som best oppsummerer hele datasettet.

    For å analysere forholdstallet φ ble stasjonene delt opp i et analysesett (271 stasjoner) og

    et valideringssett (44 stasjoner).

    5.2.2 Skrittvis klassisk lineær-regresjon

    I klassisk lineær regresjonsanalyse brukes minste kvadraters metode for å estimere

    regresjonsparametre, dvs. at man minimerer summen av kvadratavvikene mellom

    regresjonsligningen og observasjonene av den avhengige variabelen.

    Skrittvis regresjon brukes for å systematisk søke etter modellen som gir best mulig

    prediksjon av den avhengige variabelen, dvs. hvilke forklaringsvariabler som må være

    med i den endelige regresjonsmodellen. Vi brukte framlengs skrittvis regresjon der vi for

    hvert skritt søkte etter hvilken ny forklaringsvariabel som gir den største forbedringen i

    modellprediksjon. I tillegg undersøkte vi for hver iterasjon et baklengs skritt for å teste

    om en av de al