+ All Categories
Home > Documents > Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931...

Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931...

Date post: 18-Nov-2020
Category:
Upload: others
View: 5 times
Download: 0 times
Share this document with a friend
68
Kontrola kvality dat Kontrola kvality dat Homogenizace Homogenizace č č asových asových ř ř ad ad Petr Štěpánek Český hydrometeorologický ústav, p. Brno
Transcript
Page 1: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Kontrola kvality dat Kontrola kvality dat Homogenizace Homogenizace ččasových asových řřadad

Petr Štěpánek

Český hydrometeorologický ústav, p. Brno

Page 2: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

KlimatologickKlimatologickéé studiestudie

� naměření a sběr dat

Page 3: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

KlimatologickKlimatologickéé studiestudie

� pořízení dat� kontrola kvality dat a homogenizace

-1 .0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

Page 4: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

KlimatologickKlimatologickéé studiestudie

� pořízení dat� homogenizace� analýza dat

-3 .0

-2 .0

-1 .0

0 .0

1 .0

2 .0

1 8 4 8 1 8 6 8 18 8 8 1 9 08 1 9 2 8 19 4 8 1 96 8 1 9 88

Page 5: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Zpracování dat

Mezikvart. odchylka Porovnání se sousedy

Alexanderssonův test Bivariační test t-test Mann-Whitney-Pettit

pomocí korelací pomocí vzdáleností

Dopln ěníchyb ějících hodnot

Oprava dat

Vyhodnocenínehomogenit

Referenční řady

Testování homogenity

Navazání řadsousedních stanic

Kontrola kvality -vychýlené hodnoty

Měsíční, sezonní a roční průměry

Několikiterací

Pravděpodobnost

Page 6: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Kontrola kvality datKontrola kvality datNalezenNalezeníí vychýlených hodnotvychýlených hodnot

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

-4.0

-2.0

0.0

2.0

4.0

6.0

8.0

10.0

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000

Page 7: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� 1. Limitní hodnoty získané z mezikvartilové odchylky– řada pom ěrů (logaritm ů) mezi testovanou a referen ční řadou– referen ční řada vytvo řená jako pr ůměr 5 nejvíce korelovaných stanic, max.

vzdálenost 35 km

– hranice: koeficient (násobek) = 3.0

Kontrola kvality datKontrola kvality datNalezenNalezeníí vychýlených hodnotvychýlených hodnot

� 2. Porovnání hodnot s hodnotami sousedních stanic – porovnání s … nejbližšími stanicemi– řady standardizovaných pom ěrů (logaritmy pom ěrů)

– počet případů překračujících 95% meze spolehlivosti– výpo čet očekávané hodnoty ze standardizovaných řad

Page 8: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Příklad:Porovnání hodnot s hodnotami sousedních stanic

ID YEAR MONTHST_BASE REMARK ST_1 ST_2 ST_3 ST_4 ST_5 Rat1_STND Rat2_STND Rat3_STND Rat4_STND Rat5_STND CDF_MAX No_sign.

B1BLAT01 211.0 Altitudes,limits225.0 280.0 176.0 190.0 240.0 1.960 1.960 1.960 1.960 1.960B1HLUK01 st_1, distance:6.8B1VELV01 st_2, distance: 8.9B1STRZ01 st_3, distance: 10.4B1BZEN01 st_4, distance: 12.2B1RADE01 st_5, distance: 13.3

B1BLAT01 1961 1 14.5 21.7 16.9 15.5 23.7 19.6 1.140 -0.365 0.769 1.817 0.911 0.965B1BLAT01 1961 2 39.2 33.7 63.1 40.9 39.5 49.0 -0.646 0.467 0.233 -0.088 0.312 0.950B1BLAT01 1961 3 15.1 20.4 21.0 14.9 21.2 22.2 0.560 0.389 0.516 1.344 1.180 0.911B1BLAT01 1961 4 57.7 56.1 34.5 34.7 105.3 44.6 -0.042 -2.589 -1.295 2.145 -1.126 1.000 2B1BLAT01 1961 5 73.5 62.6 95.9 96.3 71.1 114.6 -0.601 0.891 1.322 0.239 1.718 0.957B1BLAT01 1961 6 148.3 208.3 158.3 79.4 101.2 76.2 1.305 -0.135 -1.805 -0.915 -2.374 1.000 1B1BLAT01 1961 7 77.5 89.2 106.9 102.3 86.0 123.2 0.475 0.988 1.549 0.604 1.658 0.951B1BLAT01 1961 8 29.3 23.4 42.8 34.2 30.9 35.6 -0.654 0.829 0.567 0.212 0.372 0.951B1BLAT01 1961 9 12.4 12.2 16.3 10.3 13.3 12.2 0.125 0.769 -0.202 0.862 0.148 0.885B1BLAT01 1961 10 56.0 51.7 77.6 74.1 81.4 82.7 -0.406 0.651 1.419 1.770 1.182 0.962B1BLAT01 1961 11 60.8 54.5 99.5 65.0 55.8 79.6 -0.643 1.751 0.775 -0.505 1.479 0.960B1BLAT01 1961 12 45.5 32.5 48.4 35.3 33.6 45.1 -1.565 -1.319 -1.066 -1.436 -0.641 0.995B1BLAT01 1962 1 12.5 26.3 8.7 12.5 11.3 13.0 2.264 -2.377 0.492 -0.493 -0.106 1.000 2B1BLAT01 1962 2 28.9 27.3 55.4 37.1 26.6 46.7 -0.178 1.064 0.977 -0.371 1.217 0.915B1BLAT01 1962 3 49.5 47.0 55.9 43.7 44.4 49.4 -0.540 -0.427 -0.293 -0.369 -0.394 0.938B1BLAT01 1962 4 44.1 51.3 70.8 49.6 43.2 54.5 0.575 0.666 0.555 0.282 0.247 0.774B1BLAT01 1962 5 113.2 111.6 129.3 115.5 137.7 110.7 0.000 0.294 0.495 0.918 0.038 0.841B1BLAT01 1962 6 29.2 24.1 23.9 39.5 18.6 29.6 -0.504 -1.225 1.036 -1.138 0.131 0.987B1BLAT01 1962 7 143.1 157.1 103.3 84.7 177.8 115.8 0.284 -2.197 -1.579 0.947 -0.881 0.999 1B1BLAT01 1962 8 51.1 58.4 13.9 14.1 18.8 14.9 0.614 -3.961 -3.217 -2.477 -3.306 1.000 4B1BLAT01 1962 9 39.6 39.9 36.0 35.8 36.8 33.3 0.191 -0.815 0.145 0.061 -0.329 0.965B1BLAT01 1962 10 44.5 43.8 55.5 47.7 45.4 50.2 -0.070 0.298 0.674 0.162 0.447 0.858

Page 9: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

NavNaváázanzaníí mměřěřeneníí sousednsousedníích stanicch stanic

Page 10: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� Výběr sousedů do 5 km� Mezera mezi dvěma řadami: maximálně 4 roky� Výsledná řada: dlouhá minimálně 30 roků� Záznam do metadat, zohledn ění při homogenizace

NavNaváázanzaníí mměřěřeneníí sousednsousedníích stanic ch stanic (p(přřííklad)klad)

Page 11: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogeniHomogenizacezaceččasovýchasovýchřřadad

� Quality control� Homogenization� Data Analysis

Page 12: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaceHomogenizace

� změna podmínek na stanici

nehomogenity

Page 13: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

DetekceDetekcenehomogenitnehomogenit

� Testy absolutní homogenity

Praha - Klementinum

-4,0

-3,0

-2,0

-1,0

0,0

1,0

2,0

3,0

1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991

Page 14: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

DetekceDetekcenehomogenitnehomogenit

� Testy absolutní homogenity� Testy relativní homogenity

Diference Praha - Klementinum a průměrovaná řada okolí ČR

-2,0

-1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991

Page 15: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaceHomogenizace–– postup postup (testov(testovááni relativnni relativníí homogenity)homogenity)

� Tvorba referen čních řad

-3 .0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947-1 .0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947-1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

Page 16: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaceHomogenizace

� Tvorba referen čních řad� Testování homogenity

- 1 . 0

- 0 . 8

- 0 . 6

- 0 . 4

- 0 . 2

0 . 0

0 . 2

0 . 4

0 . 6

0 . 8

1 9 1 1 1 9 1 5 1 9 1 9 1 9 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9 3 9 1 9 4 3 1 9 4 7

0

5

10

15

20

25

30

35

40

1911 1914 1917 1920 1923 1926 1929 1932 1935 1938 1941 1944 1947

- 1 . 0

- 0 . 8

- 0 . 6

- 0 . 4

- 0 . 2

0 . 0

0 . 2

0 . 4

0 . 6

0 . 8

1 9 1 1 1 9 1 5 1 9 1 9 1 9 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9 3 9 1 9 4 3 1 9 4 7

0

5

10

15

20

25

30

35

40

1911 1914 1917 1920 1923 1926 1929 1932 1935 1938 1941 1944 1947

Page 17: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaceHomogenizace

� Tvorba referen čních řad� Testování homogenity� Posouzení nehomogenit v řadách

- Metadata - fyzikáln ě zdůvodnitelné(“nezpochybnitelné”) nehomogenity

-1 .0

-0 .8

-0 .6

-0 .4

-0 .2

0 .0

0 .2

0 .4

0 .6

0 .8

1 9 1 1 1 9 1 5 1 9 1 9 1 9 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9 3 9 1 9 4 3 1 9 4 7

Page 18: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaceHomogenizace

� Tvorba referen čních řad� Testování homogenity� Posouzení homogenity řad

� Oprava řad

- Metadata - fyzikáln ě zdůvodnitelné(“nezpochybnitelné”) nehomogenity

-1 .0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

Page 19: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� nehomogenizovat v ůbec� použít statistické testy a v ěřit, že

jejich výsledky jsou „svaté“� ?

MoMožžnnéé ppřříístupy k homogenizacistupy k homogenizaci

Page 20: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Spolehlivost detekce nehomogenit Spolehlivost detekce nehomogenit

Page 21: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

InhomogeneitiesInhomogeneitiesDetecting Detecting byby SNHT SNHT (p=0.05, 950 series)(p=0.05, 950 series)

� generated series of random numbers(properties of air temperature series for year, summer and winter, CZ)

� introduced steps with various amount of change in level

� various position of the steps� various lengths of the series

Page 22: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Schopnost detekce nehomogenit Schopnost detekce nehomogenit SNHT SNHT (p=0.05, 950 series)(p=0.05, 950 series)

0

20

40

60

80

100

120

,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 1,0

Velikost změny v průměru /C

De

tekc

e /

% pří

padů

>2210

Chy

ba d

etek

ce /r

oky

Změna:

- velikost nehomogenity

- délka řad

- poloha v řadě

Page 23: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� většinou jsou metadata nekompletní

jsme tedy závislí pouze na výsledcích statistických test ů

ProblProbléémy pmy přři vyhodnocovi vyhodnocováánníínehomogenitnehomogenit

� ale správná detekce nehomogenitpomocí test ů je často problematická(spln ění všech podmínek aplikace test ů, problémy v řadách, …)

Page 24: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Statistické zpracování velkého množstvívýsledk ů testování pro každou testovanou řadu (ensemble)

NavrNavržženenéé řřeeššeneníí

pravd ěpodobnost dané nehomogenity -poměr počtu detekovaných nehomogenit na počtu všech teoreticky možných detekcí ( pro každý rok, skupinu rok ů, celé období)

Page 25: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Jak zvýJak zvýššit spolehlivost testovit spolehlivost testováánníí homogenity homogenity ((bezbezmetadatmetadat))

� měsíční, sezónní, ro ční průměry� různé referen ční řady� různé testy homogenity� 40-ti leté úseky� několik krok ů - iterací

Page 26: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Zpracování dat

Mezikvart. odchylka Porovnání se sousedy

Alexanderssonův test Bivariační test t-test Mann-Whitney-Pettit

pomocí korelací pomocí vzdáleností

Dopln ěníchyb ějících hodnot

Oprava dat

Vyhodnocenínehomogenit

Referenční řady

Testování homogenity

Navazání řadsousedních stanic

Kontrola kvality -vychýlené hodnoty

Měsíční, sezonní a roční průměry

Několikiterací

Pravd ěpodobnost

Page 27: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Výhody statistickVýhody statistickéého zpracovho zpracováánníí

� známe závažnost každé nehomogenity (pravd ěpodobnost)

� můžeme ohodnotit kvalitu m ěření dané stanice jako celku (sou čet všech nehomogenit)

Page 28: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady

� Quality control� Homogenization� Data Analysis

Page 29: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady

Regionálníprůměr

-40.0

-30.0

-20.0

-10.0

0.0

10.0

20.0

30.0

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39

Page 30: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady

Regionálníprůměr

Průměr stanic s

nejvyššími korelacemi

-3 .0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

Page 31: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady

Regionálníprůměr

Průměr nejbližších

stanic

Průměr stanic s

nejvyššími korelacemi

Page 32: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady

Regionálníprůměr

- ref. řada je nejméněkorelovaná s test. řadou

+ možné nehomogenityjsou nejlépe potlačeny

Průměr stanic s

nejvyššími korelacemi

+ vytvořená ref. řada se nejvíce podobá test. řadě

-podobné nehomogenitys testovanou řadou(řady prvních diferencí)

Průměr nejbližších

stanic

+ zachována geografická blízkost

- různé klimaticképodmínky

pros and cons

Page 33: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Referenční řady se liší

-10

-8

-6

-4

-2

0

2

4

6

8

10

1950 1954 1958 1962 1966 1970 1974 1978 1982 1986

AVG

correlat ions

distance

diference testované a jejích referenčních řad

Page 34: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Example:

Proposed list of stations used for creating reference seriesID_1 ID_2 BEGIN END LENGTHREMARK CORREL DISTANCE ALT_1 ALT_2

B1BLAT01 1961 2000 40 5st. (l:0.88 211B1HLUK01 1961 2000 40 y. comm.p 0.931 6.78 211 225B1VELV01 1961 2000 40 y. comm.p 0.921 8.94 211 280B1STRZ01 1961 2000 40 y. comm.p 0.910 10.39 211 176B1UHBR01 1961 2000 40 y. comm.p 0.901 17.11 211 222B1RADE01 1961 2000 40 y. comm.p 0.884 13.32 211 240

B1BOJK01 1961 2000 40 5st. (l:0.89 302B1STRN01 1961 2000 40 y. comm.p 0.920 16.55 302 385B1STHR01 1961 2000 40 y. comm.p 0.917 7.29 302 412B1LUHA01 1961 2000 40 y. comm.p 0.908 9.62 302 254B1VIZO01 1961 2000 40 y. comm.p 0.895 21.20 302 315B1UHBR01 1961 2000 40 y. comm.p 0.891 11.68 302 222

B1BRBY01 1961 1994 34 5st. (l:0.87 350B1BOJK01 1961 2000 34 y. comm.p 0.888 16.54 350 302O3ZDEC01 1961 2000 34 y. comm.p 0.886 18.34 350 520O3HUSL01 1961 2000 34 y. comm.p 0.881 23.66 350 450B1HLHO01 1961 2000 34 y. comm.p 0.875 17.36 350 340B1STHR01 1961 2000 34 y. comm.p 0.873 18.59 350 412

B1BUCH01 1961 2000 40 5st. (l:0.86 280B1STME01 1961 2000 40 y. comm.p 0.919 7.29 280 235B2KYJO01 1961 2000 40 y. comm.p 0.879 16.54 280 195B2KORC01 1961 2000 40 y. comm.p 0.873 11.72 280 305B1BZEN01 1961 2000 40 y. comm.p 0.869 12.44 280 190B1NAPA01 1961 2000 40 y. comm.p 0.869 17.08 280 205

Selectionaccording to correlations

Page 35: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Testy homogenity

Alexanderssonůvtest (SNHT)

� Quality control� Homogenization� Data Analysis

Alexandersson Standart Normal Homogeneity Test (Single shift test)

Reference series:

qi = }/]//{[1

2

1

2∑∑

==

k

jj

k

j

jjiji XYXY ρρ

qi = }/][{1

2

1

2∑∑

==

+−−k

jjjji

k

jji YXXY ρρ

Null and alternative hypothesis:

H0 : zi ∈N(0,1), i ∈ {1,..,n} . H1 : zi ∈ N(µ 1,1), i ∈ {1,..,a} ,

zi ∈ N(µ 2,1), i ∈ {a+1,..,n} , for 1 ? a < n a µ1 ? µ 2 .

zi = (qi -

q)/sq , zi ∈ N(0,1)

Test statistic:

T 0 = }{Tmax11

ana −<≤ = })({max

22

21

11zanza

na−+

−<≤

where z

1 = ∑=

a

íiz

a 1

1 , (

z1 ? µ 1) ,

z

2 = ∑+=−

n

aíiz

an 1)(

1 , (

z2 ? µ 2) .

0

5

10

15

20

25

30

35

40

1911 1914 1917 1920 1923 1926 1929 1932 1935 1938 1941 1944 1947

kumulativní odchylky diferencítestované a referenční řady

Page 36: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Testy homogenity

AlexanderssonSNHT

BivariateTest

Bivariate Test

Null and alternative hypothesis: H0 : vectors {xi,yi} bivariate normal distributed N(µ x, µ y, σx

2, σy2, ρ)

H1 : pro 0<i0<n a d ? 0 - N(µ x, µ y, σx

2, σy2, ρ) pro i ? i0

N(µ x, µ y+d, σx2, σy

2, ρ) pro i > i0. Test statistic:

T0 = }{Tmax ini<

where: Xi = ∑=

i

jjxi

1

/1 , Yi = ∑=

i

jjyi

1

/1 , nXX = , nYY =

Sx= ∑=

−n

jj Xx

1

2)( , Sy = ∑=

−n

jj Yy

1

2)( , Sxy= ∑=

−−n

jjj YyXx

1

))(( ,

Fi = )/()( 2 inniXXS ix −−− , i<n ,

Di = [ ]iixyix FinnXXSYYS )(/)()( −−−− ,

Ti = [ ] )/()( 22xyyxii SSSFDini −−

0

5

10

15

20

25

30

35

40

1911 1914 1917 1920 1923 1926 1929 1932 1935 1938 1941 1944 1947

Page 37: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Testy homogenity

AlexanderssonSNHT

Vincent Technique

BivariateTest

Easterling and Peterson Test statistic: U = [(RSS1-RSS2)/3]/[RSS2/(n-4)] ? F(3,n-4)

t-test: differences of levels before and after a discontinuity

-1 .0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

dvoufázová lineární regrese

Page 38: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Testy homogenity

AlexanderssonSNHT

Vincent Technique

BivariateTest

40-ti leté úseky řad(30-40 let na jednu nehomogenitu, Auer et al., 2001)

Page 39: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Posouzení nehomogenit(výstupy ze softwarů)

� Quality control� Homogenization� Data Analysis

Test Ref I II III IV V VI VII VIII IX X XI XII Win Spr Sum Aut Year

A avg 1927 1929 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927A 1930A corr 1927 1927 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927A 1939 1938 1939 1940 1922 1937 1937 1935A dist 1927 1928 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927A 1930 1940 1918B avg 1927 1928 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927B 1922B corr 1927 1927 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927B 1936 1938 1939 1944 1922 1935 1937 1937 1935B 1937B dist 1927 1928 1927 1927 1927 1928 1927 1926 1926 1926 1926 1926 1927 1927 1927 1926 1927B 1930 1940 1931 1913 1918V corr 1927 1926V 1937 1922 1935V 1937V dist 1927 1927 1927V 1918

Čáslav, 3. část, 1911-1950, n=40

Page 40: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Posouzení nehomogenitBegin End Length

InHomogeneity

Number% detected

inhom% possible

inhomEnd

Missing

1911 1950 40 140 100 120

1927 60 43 511926 37 26 321928 9 6 8 4

1937 7 5 61922 4 3 31935 4 3 31918 3 2 31930 3 2 31939 3 2 31940 3 2 3 21938 2 1 21913 1 1 1 3 31929 1 1 11931 1 1 11936 1 1 11944 1 1 1

1926 1927 2 97 69 831926 1931 6 111 79 951935 1940 6 20 14 17

1911 1920 10 4 3 31921 1930 10 114 81 97

1931 1940 10 21 15 181941 1950 10 1 1 1

Page 41: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

VyhodnocenVyhodnoceníí nehomogenitnehomogenit

� Použití n ěkolika výstup ů (sumace po čtu detekcí v daném roce, použití metadat, grafy pom ěrů, …)

ID ELEMYEAR_INHOMBEGINEND YEAR_COUNTY_POSSIBL YEAR_ENDMISSVALSX_BEGIN_DAX_END_DATEX_BEGINX_ENDLATITUDELONGITUDEALTITUDEB_FULLNAMEREMARKC_OBSERVERC_IDx B1BOJK01 x 1985 41 14.24 12 23.3.1984 31.3.2003 # # Bojkovicechange

B1BOJK01 x 1985 41 14.24 12 23.3.1984 31.12.9999 # # obs Vladimˇr Maz lekB1BOJK01B1BYSH01 x 1978 37 12.85

? B1BYSH01 x 1979 33 11.46? B1BYSH01 x 1980 43 14.93? B1HLHO01 x 1965 31 10.76 4 1

B1HOLE01 x 1976 33 11.46B1KROM01 x 1977 1978 31 10.76

x B1RADE01 x 1994 44 15.28 2 1.1.1994 31.12.9999 # # RadýjovchangeB1RADE01 x 1994 44 15.28 2 1.1.1994 31.12.9999 # # obs Josef Pˇ§aB1RADE01

x B1RYCH01 x 1973 49 17.01 1.5.1973 28.2.1991 # # VyÜkov, Rychtß°ov, changeB1RYCH01 x 1973 49 17.01 1.9.1972 28.2.1991 # # obs Marie Hor kov B1RYCH01

xx? B1STRZ01 x 1987 53 18.40B1STRZ01 x 1988 30 10.42B1UHBR01 x 1983 31 10.76 18.2.1984 31.1.1999 # # UherskchangeB1UHBR01 x 1983 31 10.76 18.2.1984 12.5.1993 # # obs Josef KudelaB1UHBR01

x B1UHBR01 x 1984 77 26.74 18.2.1984 31.1.1999 # # UherskchangeB1UHBR01 x 1984 77 26.74 18.2.1984 12.5.1993 # # obs Josef KudelaB1UHBR01B1VELI01 x 1978 31 10.76

? B1VELI01 x 1977 1978 44 15.28? B1VKLO01 x 1984 29 10.07x B1VYSK01 x 1999 32 11.11 -1 1.4.1998 31.12.9999 # # VyÜkov, Dukelskß 12change

B1VYSK01 x 1999 32 11.11 -1 1.4.1998 31.12.9999 # # obs VojtB1VYSK01B2BOSK01_rx 1968 33 11.46B2BREC01 x 1968 35 12.15B2BRUM01 x 1989 51 17.71 1.2.1989 31.3.1994 # # BrumovchangeB2BRUM01 x 1989 51 17.71 1.2.1989 31.3.1994 # # obs Marta Paýˇzkov B2BRUM01

-1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1911 1915 1919 1923 1927 1931 1935 1939 1943 1947

Page 42: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

OpravaOpravanehomogenitnehomogenit

I II III IV V VI VII VIII IX X XI XII

� z diferencí (poměrů) mezi opravovanou a referenční řadou

� pomocí referenční řady vypočtené jako průměrz nejlépe korelovaných stanic k dané stanici

� shlazení měsíčních hodnot oprav (1-2-1) (eliminace náhodných chyb)

Page 43: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Příklad:

Oprava nehomogenit - vyhodnocení

Page 44: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

DoplnDoplněěnníí chybchyběějj ííccííchch hodnothodnot

� Před homogenicí: vliv na správnou detekcinehomogenit

� Po homogenizaci: p řesnější - neovlivn ěné případnýmiposuny v řadách

Závislost testovanéna referenční řadě

Page 45: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

- pomocí lineární regrese

- referenční řada jakoprůměr nejlépe korelovaných stanic

DoplDoplnněěnníí chybchyběějj ííccíích hodnotch hodnot

- výpočet „očekávané hodnoty“ při porovnání se sousedy

Page 46: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaHomogenizaceceččasových asových řřadad

v v ČČeskeskéé republicerepublice

Page 47: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� měsíční průměry teploty vzduchu� téměř 200 stanic m ěřící v různém období v

průběhu p řístrojových m ěření� testování zm ěny v úrovní (pr ůměru)

Homogenizace teplotnHomogenizace teplotníích ch řřadad

0

50

100

150

200

250

300

186418741884 189419041914 19241934 19441954 1964197419841994

1976

1916-1920

1940-44

1942-44

1945-47

1948-1960

1961

Jahrbücher der k. k. Zentral-Anstalt für Meteorologie und Erdmagnetismus 1848-1915. Wien.

Bericht der meteorologischen Commission des naturforschenden Vereines in Brünn 1881-1911. Brünn 1882-1917.

Ročenka povětrnostních pozorování meteorologických stanic 1916-1960. Praha 1934-1966.

Počet klimatických stanic v ČR od roku 1864

Page 48: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

ProstorovProstorovéé rozlorozložženeníí stanic stanic ČČRR End of measurement

měření / roky

End of measurement měření / roky

0

20

40

60

80

100

120

140

17

71

17

81

17

91

18

01

18

11

18

21

18

31

18

41

18

51

18

61

18

71

18

81

18

91

19

01

19

11

19

21

19

31

19

41

19

51

19

61

19

71

19

81

19

91

Počet

0102030405060708090100

Prů

m. m

in. v

zdál

enos

t /km

počet

počet 61-90

prům. min. vzdál.

Konec měření:

Page 49: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

HomogenizaHomogenizacece-- ppřřehledehled

Počet testovaných řad – původní data

Přehled počtu zpracovávaných řad při homogenizaci (ČR)Charakteristika Data

původní opravenáPočet stanic 192 174Počet 40-ti letých úseku řad 348 307Počet oprav 231Počet testovaných řad celkem 40716 35919Počet významných nehomogenit (p=0.05) 32445 13802Podíl význ. nehomogenit na počtu řad 79,7% 38,4%

Test Měsíce Sezóny Typy ref. 40-ti leté Počet řad a rok řad úseky řad pro test

A 12 5 3 348 17748B 12 5 3 348 17748V 5 3 348 5220

Celkem 40716

Page 50: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

VelkVelkéé mnomnožžstvstvíí nehomogenitnehomogenitpo opravpo opravěě??

� 40% nehomogenních řad po homogenizaci (80% p řed)

� Šumová složka řad: nehomogenity pro

skok menší než 0.5 °C jsou správn ě

detekovány v mén ě než 50% případů

0

20

40

60

80

100

120

.1 .2 .3 .4 .5 .6 .7 .8 .9 1 .0

Amount of change /C

Ca

se

s/

% >2

2

1

0

Fault

/year

s

Page 51: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

0

500

1000

1500

2000

2500

I II III IV V VI VII VIII IX X XI XII

Before After

0

500

1000

1500

2000

2500

3000

3500

Win Spr Sum Aut Year

Before After

PoPoččet významných et významných nehomogenitnehomogenitdetekovaných pdetekovaných přřed a po homogenizaci ed a po homogenizaci (p=0.05)(p=0.05)

Page 52: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

0.0

0.2

0.4

0.6

I II III IV V VI VII VIII IX X XI XII

°C

0.90

0.92

0.94

0.96

0.98

1.00

I II III IV V VI VII VIII IX X XI XII

Before After

Korelační koeficienty mezi testovanými a referenčními řadamipřed a po homogenizaci (median)

Velikost opravy homogenizovaných řad (absolutní hodnoty) -median

Page 53: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� Změna měřících podmínek na stanici (přemístěníatd.) se projevuje především v létě

� v zimě: menší role aktivního povrchu, převládajícirkulační faktory, v létě: větší role aktivního povrchu, převládají radiační faktory

NehomogenityNehomogenityv lv lééttěě versus v zimversus v ziměě

Page 54: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

PPřřechod na automatickechod na automatickáá mměřěřeneníí --konsekvencekonsekvence

� Zatím je p říliš brzy na opravu řad - je k disposici málo hodnot (ale nehomogenity způsobené p řechodem na AMS jsou již detekovatelné)

� Nemohou se p řipojit nová m ěření

Page 55: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� měsíční sumy (+sezónní a roční sumy), sezónní a ročnípočty srážkových dnů (s denními úhrny srážek ≥ 0,1, 1,0, 5,0 a 20,0 mm)

� období 1961-2003� 589 stanic

– 566 řad s měřeními delšími více než 30 let (přerušení měření nesmělo být delsí než 4 roky)

– 23 řad vytvořené kombinací sousedních stanic– 457 stanic má měření delší více než 40 let

� průměrná minimální vzdálenost: 7.5 km

Homogenizace srHomogenizace sráážžkových kových řřadad

Page 56: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

ProstorovProstorovéé uspouspořřááddáánníí poupoužžitých itých srsráážžkomkoměěrnýchrnýchstanic stanic ČČR R mměřěřííccíích vch v obdobobdobíí 19611961--20002000

Page 57: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

PoPoččet pouet použžitých stanic (s minimitých stanic (s minimáálnlníí ddéélkou pozorovlkou pozorováánníí30 let) a pr30 let) a průůmměěrnrnáá minimminimáálnlníí vzdvzdáálenost tlenost těěchto stanic chto stanic vv jednotlivých letech v obdobjednotlivých letech v obdobíí 19611961--2000.2000.

440

460

480

500

520

540

560

580

6001

96

1

19

64

19

67

19

70

19

73

19

76

19

79

19

82

19

85

19

88

19

91

19

94

19

97

20

00

Poč

et s

tani

c

7.4

7.5

7.6

7.7

7.8

7.9

8.0

8.1

8.2

8.3

Vzd

álen

ost /

km

Počet stanic Minimální vzdálenost

Průměrná minimální vzdálenost použitých stanic: 7.5 km

Page 58: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

0.0

20.0

40.0

60.0

80.0

100.0

120.0

140.0

160.0

1 2 3 4 5

Stations selection

Alti

tude

diff

eren

ce /

m

Tvorba referenčníchřad:

Statistika pro výběry nejlépe korelovaných stanic (pro všechny testovanéřady)

Vzdálenosti:- coincidence with selection

by means of distances

- but still a little bit different

0.800

0.820

0.840

0.860

0.880

0.900

0.920

0.940

1 2 3 4 5 allOrder of selected stations

Cor

rela

tion

coef

ficie

nt

0.0

5.0

10.0

15.0

20.0

25.0

1 2 3 4 5 allOrder of selected stations

Dis

tanc

es /

km

Boxplots:

- Median

- Upper and lower quartiles

(for 589 testes series)

Rozdíl v nadm. výšce(absolutní hodnoty)

Page 59: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Korelační koeficienty mezi testovanými a referenčními řadami(referenční řada počítána podle korelací)

0.750

0.800

0.850

0.900

0.950

1.000

I II III IV V VI VII VIII IX X XI XIIMonth

Cor

rela

tion

coef

ficie

nt

Boxplots:

- Median

- Upper and lower quartiles

(for 589 testes series)

Page 60: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Výsledky testovVýsledky testováánníí homogenityhomogenity

� Počet detekovaných nehomogenit (stat. významných)

0

1000

2000

3000

4000

5000

6000

I II III IV V VI VII VIII IX X XI XIIMonth

Num

ber

of d

etec

tions

Page 61: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Velikost opravy (poměry - standardizace na >1.0 )(referenční řada počítána podle korelací)

Boxplots:

- Median

- Upper and lower quartiles

(for 589 testes series)

1.000

1.050

1.100

1.150

1.200

1.250

1.300

I II III IV V VI VII VIII IX X XI XII

Am

ou

nt o

f ch

an

ge

(st

an

dar

diz

ed

)

-0.005

0.000

0.005

0.010

0.015

0.020

0.025

I II III IV V VI VII VIII IX X XI XII

Cor

rela

tion

incr

ease

Vzrůst korelačních koeficientů

Page 62: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� Změna měřících podmínek na stanici (přemístěníatd.) se projevuje především v zimě

� v zimě: větší chyby při měření (tuhé srážky – vítr, …)

NehomogenityNehomogenityv lv lééttěě versus v zimversus v ziměě

Page 63: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

ZZáávvěěr, pr, poznoznáámkymky

� kontrola kvality dat p řed samotnou homogenizací je velmi d ůležitá

� použití stanic z okolí ČR (měřící především v zá čátcích přístrojových pozorování)

� testování v n ěkolika iteracích– několik iterací testování homogenity a opravy řad (3 iterace byly v tomto

případě dosta čující)

– problém homogenity referen čních řad je tímto vy řešen:• jednak jsou možné nehomogenity eliminovány použitím p růměrů několika

sousedních stanic • pokud toto není spln ěno: p ří dalším kroku (iteraci) by sousedé měly být již

homogenní

� doporu čeno testovat jednotlivé klimatické termíny� problémy spojené s automatizací m ěření v posledních letech

Page 64: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

� roční chod počtu statisticky významných detekcínehomogenit a velikostí oprav nehomogenit

� ensembly: pomocí pravděpodobnosti danénehomogenity (závažnosti) – kvalitnějšívyhodnocení, ohodnocení měření dané stanice jako celku (případně různých období měření)

� …

ZZáávvěěrr

Page 65: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Software pouSoftware použžitý pro zpracovitý pro zpracováánníí datdat

� LoadData - aplikace pro staženi dat z centrálnídatabáze (nap ř. Oraclu)

� ProClimDB software pro zpracování celédatabáze (nalezení vychýlených hodnot, navázánísousedních řad, tvorba refere čních řad, příprava dat pro testování homogenity, …)

� AnClim software pro testování homogenity

http://http://www.klimahom.comwww.klimahom.com/software/software

Page 66: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

AnClim softwareAnClim software

AnClim softwareAnClim software

Page 67: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

ProcDataProcDatasoftwaresoftware

ProProClimDBClimDB softwaresoftware

Page 68: Kontrola kvality dat Homogenizace časových řad · 1771 1791 1811 1831 1851 1871 1891 1911 1931 1951 1971 1991. ... 0 .8 1 9 1 1 19 1 5 19 1 9 19 2 3 1 9 2 7 1 9 3 1 1 9 3 5 1 9

Recommended