Nová IT infrastruktura pro uvolňování dat NZISMartin Komenda, Petr Panoška, Ivo Šnábl, Ladislav Dušek
NZIS Open 2019 Nová IT infrastruktura pro uvolňování dat NZIS
NZIS
koncept
Režimy
zpracování
Schéma publikace
Ukázky z praxe
2
NZIS Open 2019
Koncept otevřených dat v NZIS
Legislativa – IT infrastruktura – Dostupnost
Nová IT infrastruktura pro uvolňování dat NZIS3
NZIS Open 2019
Otevřenost dat …
NEZNAMENÁ přímé publikování primárních záznamů.
se NEVZTAHUJE pouze na primární záznamy databází.
NEPŘEDSTAVUJE pouze poskytování anonymním neidentifikovaným uživatelům.
Nová IT infrastruktura pro uvolňování dat NZIS4
Data Informace Znalosti
Nová klasifikace datových sad podle dostupnosti
NZIS Open 2019
Primární řádkové záznamy databází publikované bez úpravy
Datová sada A
Nová IT infrastruktura pro uvolňování dat NZIS
o Výjimečný režim publikování dat
o Primárně pro charakteristiky „neživých objektů bez vazby
k osobním údajům
o Např. poskytovatelé dle jejich definice v zákoně, přístroje,
koupaliště či jakékoli látky / léky a jejich primární charakteristiky
Národní registr poskytovatelů zdravotních služeb, Mapa zdravotnické techniky
6
NZIS Open 2019
Částečně agregovaná a transformovaná data
Datová sada B
Nová IT infrastruktura pro uvolňování dat NZIS
o Autorské dílo včetně standardizovaného recenzního řízení
a schvalovacího procesu
o Vyloučení identifikace fyzické či právnické osoby
o Povinné dodržení standardizované metodiky pro tvorbu datové
sady
Regionální zpravodajství NZIS, Národní registr hrazených zdravotních služeb
7
NZIS Open 2019
Statistické ukazatele vztažené na skupinu záznamů
Datová sada C
Nová IT infrastruktura pro uvolňování dat NZIS
o Referenční statistiky doplněné o metodiku a interpretaci významu
o Charakteristika subjektů / objektůo Region či časová perioda, kohorta pacientů, skupina zdravotních výkonů, kategorie
poskytovatelů, apod.
o Přehledové statistiky, metodiky a postupy výpočtu jako nedílná
součást
Analytický report „na míru“
8
NZIS Open 2019
Režimy zpracování datových sad
Nová IT infrastruktura pro uvolňování dat NZIS9
NZIS Open 2019 Nová IT infrastruktura pro uvolňování dat NZIS
Volně dostupná
primární data
(bez úprav)
Datová sada A
Primární data
zveřejnitelná
po nezbytných úpravách
Datová sada B
Data vyžadující
referenční interpretaci – referenční statistiky
Datová sada C
Popisné charakteristikyposkytovatelů zdravotních služeb,
přístrojová technika a její parametry, charakteristiky vody v koupalištích.
Úpravy ve formě označení chybějících hodnot,
korekce chybných záznamů, agregace skupin záznamů
přes věkové kategorie pacientů, dopočet nových proměnných.
Nemocniční mortalita jako údaj vyžadující sofistikované
analytické zpracování a interpretaci.
Publikace statistik bude řízena prováděcím předpisem.
10
NZIS Open 2019
Bez omezení přístupu k definovaným datovým sadám A, B, C
Otevřený režim publikace
Nová IT infrastruktura pro uvolňování dat NZIS
o Data otevřená pro účely transparentnosti o kontrola hospodaření s veřejnými prostředky, kontrola výkonnosti institucí, smlouvy, …
o Data jako komplexní zdroj informací o stavu a chování populaceo populační charakteristiky, epidemiologické statistiky, utilizace výkonů, medikací, výkonnostní
parametry, …
o Plně agregovaná data pro vědecké a analytické účely o sekundárně vytvořené datové sady popisující skupiny objektů či subjektů či jednotlivé záznamy
neumožňující identifikaci fyzické osoby (např. anonymizované záznamy o porodu, hospitalizaci,
operaci, …)
11
NZIS Open 2019
Přístup k definovaným datovým sadám B, C (institucionálně, smluvně podložená analýza)
Regulovaný režim publikace
Nová IT infrastruktura pro uvolňování dat NZIS
o Data jako přímý zdroj informací o institucích, plátcích,
poskytovatelích, ….o vybavení, personální kapacity, ekonomické ukazatele, …
o Data určená pro zpracování s cílem ovlivnit chování cílových
subjektů o data o kvalitě péče, účinnosti terapie, …
12
NZIS Open 2019
Schéma publikace datových sad NZIS
Nová IT infrastruktura pro uvolňování dat NZIS13
NZIS Open 2019
Datové sady NZIS
o Nelze identifikovat konkrétní fyzické osoby
o Nelze identifikovat konkrétní právnické osoby (pokud zákon
nestanoví jinak)
o Sekundární úpravy povedou k anonymizaci datové sady
o Účel publikace datových sad musí odpovídat účelu NZIS
o Standardizovaný proces schvalování a publikace
Nová IT infrastruktura pro uvolňování dat NZIS14
NZIS Open 2019
Schéma vzniku a publikace datové sady
Nová IT infrastruktura pro uvolňování dat NZIS
Návrh
konceptu
Posouzení konceptu
Návrh analytické přípravy
Vytvoření datové sady
RecenzePublikace datové sady
Státní organizace, externí subjekty (zdravotní pojišťovny, odborné společností a výzkumné instituce)
Účel, dostupnost dat, procesu přípravy, právní pohled
Metodika, analytické zpracování
Schéma, metodika tvorby, metadatový popis
Ochrana osobních údajů, věcný obsah, IT řešení
Národní katalog otevřených dat
www.uzis.cz
15
NZIS Open 2019
Schéma vzniku a publikace datové sady
Autorské dílo včetně plnohodnotné oponentury
Řádná citace a použití dle dané licence
Otevřený nebo regulovaný přístup
Nová IT infrastruktura pro uvolňování dat NZIS16
NZIS Open 2019
Datové sady
Nová IT infrastruktura pro uvolňování dat NZIS17
NZIS Open 2019
Datová sada: Typ A
Poskytovatelé zdravotních služeb
Nová IT infrastruktura pro uvolňování dat NZIS
Datová sada NRPZS
ve formátu otevřených dat
Open API 2.0
https://nrpzs.uzis.cz/
18
NZIS Open 2019
Struktura dat
Poskytovatelé zdravotních služeb
Nová IT infrastruktura pro uvolňování dat NZIS19
o MistoPoskytovaniId
o ZdravotnickeZarizeniId
o Kod
o NazevZarizeni
o DruhZarizeni
o Obec
o Psc
o Ulice
o CisloDomovniOrientacni
o Kraj
o KrajCode
o Okres
o OkresCode
o SpravniObvod
o PoskytovatelTelefon
o PoskytovatelFax
o PoskytovatelEmail
o PoskytovatelWeb
o Ico
o TypOsoby
o PravniFormaKod
o KrajCodeSidlo
o OkresCodeSidlo
o ObecSidlo
o PscSidlo
o UliceSidlo
o CisloDomovniOrientacniSidlo
o OborPece
o FormaPece
o DruhPece
o OdbornyZastupce
o Lat
o Lng
NZIS Open 2019
Návrh a vytvoření datové sady
Nová IT infrastruktura pro uvolňování dat NZIS
Export databáze.jsonschéma
.csvdistribuce
Publikace datové sady
Validace výstupu + doplňování informací do registru
20
NZIS Open 2019
Datová sada poskytovatelů ZS v katalogu
Nová IT infrastruktura pro uvolňování dat NZIS21
NZIS Open 2019
Datová sada: Typ B (C)
Zdravotnické ukazatele
Nová IT infrastruktura pro uvolňování dat NZIS
Datové sady
ve formátu otevřených dat
https://pzu.uzis.cz/
22
NZIS Open 2019
Návrh a vytvoření datových sad
o Definice číselníkůo Kraje, ORP, pohlaví, věková skupina, typ hodnot
o Publikace v rámci katalogu otevřených dat
o Export z databázeo .csv formát
Nová IT infrastruktura pro uvolňování dat NZIS
Transformace dat
Agregace ukazatelů
.json schéma .csv distribucePublikace datové sady
23
NZIS Open 2019
Agregovaný ukazatel Standardizovaná incidence zhoubných nádorů tlustého střeva (C18)
Představení datových sad
Nová IT infrastruktura pro uvolňování dat NZIS
o Ukazatele
o 70408 - Standardizovaná incidence (evr.stand.)
ZN tlustého střeva (C18) - muži + ženy
o 70418 - Standardizovaná incidence (evr.stand.)
ZN tlustého střeva (C18) - muži
o 70428 - Standardizovaná incidence (evr.stand.)
ZN tlustého střeva (C18) - ženy
o 70409 - Standardizovaná incidence (ESP 2013)
ZN tlustého střeva (C18) - muži + ženy
o 70419 - Standardizovaná incidence (ESP 2013)
ZN tlustého střeva (C18) - muži
o 70429 - Standardizovaná incidence (ESP 2013)
ZN tlustého střeva (C18) - ženy
o Definiceo Standardizovaná míra incidence zhoubným novotvarem
tlustého střeva. Standardizace provedena metodou
přímé standardizace = incidence teoretické evropské
populace vypočtená z jednotlivých měr incidencí
konkrétní (české) populace. MKN 10: C18.
o Klíčová slovao zhoubné novotvary, standardizovaná incidence, nádory
tlustého střeva, evr.standard, ESP 2013
o Zdrojo Údaje do roku 2015 převzaty z aplikace: DPS kraj, DPS
Okres. Od roku 2016 je zdrojem pro údaje: NOR, ÚZIS
ČR.
24
NZIS Open 2019
Národní síť zdravých měst
Představení datových sad
Nová IT infrastruktura pro uvolňování dat NZIS
Demografie Střední délka života
(4 ukazatele – 1 skupina ukazatelů)
Mortalita Standardizovaná mortalita
Standardizovaná mortalita na poranění a otravy
(12 + 12 ukazatelů – 2 skupiny ukazatelů)
Zdravotní stav Úrazy domácí + ostatní na 100 000 obyvatel
Úrazy dopravní na 100 000 obyvatel
Úrazy na 100 000 obyvatel
Úrazy pracovní na 100 000 obyvatel
Úrazy sportovní na 100 000 obyvatel
(desítky ukazatelů – 5 skupin ukazatelů)
Registr novotvarů Standardizovaná incidence ZN průdušnice, průdušky a plíce (C33-34)
Standardizovaná incidence ZN rektosigmoidálního spojení, konečníku a řitního kanálu (C19-21)
Standardizovaná incidence ZN tlustého střeva (C18)
Standardizovaná incidence zhoubných novotvarů a novotvarů in situ, bez C44
(4 ukazatele – 4 skupiny ukazatelů)
25
NZIS Open 2019
Představení datových sad
Nová IT infrastruktura pro uvolňování dat NZIS
Zdroj: https://5stardata.info/en/
26
NZIS Open 2019
Systém pro uvolňování a publikaci dat NZIS
Platforma pro katalogový systém
Nová IT infrastruktura pro uvolňování dat NZIS
Cesta k referenčním standardizovaným datům
27