+ All Categories
Home > Documents > Otevírání dat v ČSÚ - NZIS Open 20201 980 Počet obyvatel s trvalým pobytem MJ: Osoba...

Otevírání dat v ČSÚ - NZIS Open 20201 980 Počet obyvatel s trvalým pobytem MJ: Osoba...

Date post: 29-Jan-2021
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
39
ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 1 Ing. Martin Černý, Ing. Eduard Durník Konference NZIS OPEN 13. 12. 2019 Otevírání dat v ČSÚ
Transcript
  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 1

    Ing. Martin Černý, Ing. Eduard Durník

    Konference NZIS OPEN13. 12. 2019

    Otevírání dat v ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 2

    ■ ČSÚ a statistická data■ Datové výstupy ČSÚ■ Otevřená data ČSÚ■ Datové sady různých typů■ Využití a vizualizace OD

    OBSAH

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 3

    ■ Zákon č. 89/1995 Sb., o státní statistické službě■ Působnost Českého statistického úřadu

    ■ zabezpečuje získávání a zpracování údajů pro statistické účely■ poskytuje statistické informace státním orgánům, orgánům územní

    samosprávy a veřejnosti■ vytváří a spravuje statistické klasifikace, statistické číselníky a

    statistické registry a poskytuje z nich informace■ vydává, zveřejňuje a poskytuje statistické informace, včetně

    metodiky jejich zjišťování, informuje veřejnost o sociálním, ekonomickém a ekologickém vývoji České republiky i jednotlivých správních celků

    ■ zajišťuje zpracování výsledků voleb a referenda

    PŮSOBNOST ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 4

    Klíčový proces SIS■ Požadavky – o jaké statistické informace je zájem■ Příprava – jak informace sehnat a zpracovat■ Sběr – získání vstupních dat (výkazy, šetření v domácnostech,

    administrativní zdroje dat)■ Zpracování – kontroly, dopočty, agregace■ Diseminace (šíření) - poskytování statistických informaci – web,

    katalog produktů, otevřená data

    STATISTICKÝ INFORMAČNÍ SYSTÉM ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 5

    ■ Zpravodajské jednotky (respondenti) – ekonomické subjekty, domácnosti

    ■ Základní šetření – např. demografie, bytová výstavba■ Výběrová šetření – např. průmysl, výběrová šetření pracovních sil

    ■ odhady nejsou dostatečně spolehlivé pro menší územní celky ■ Administrativní zdroje dat – školství, zdravotnictví, …■ Censy - Sčítání lidu, domů a bytů, Agrocensus■ Volební výsledky■ Informace z registrů

    ZDROJ STATISTICKÝCH DAT

    ČSÚ NEPROVÁDÍ PRŮZKUMY VEŘEJNÉHO MÍNĚNÍ ANI PŘEDVOLEBNÍ PRŮZKUMY!!!

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 6

    ■ Web ČSÚ (www.czso.cz) – portál, který obsahuje ■ Katalog produktů ČSÚ – seznam všech plánovaných výstupů■ Datové výstupy podle oblastí statistik

    ■ Data převážně v Excel a PDF souborech■ Sady otevřených dat

    DATOVÉ VÝSTUPY ČSÚ (1)

    ■ Odkazy na dalších výstupy ČSÚ ■ Webové stránky krajských správ ČSÚ■ Databáze – VDB, národní účty, zahraniční obchod, demografie■ Klasifikace, číselníky■ Výkazy■ Volby

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 7

    KATALOG PRODUKTŮ ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 8

    ■ Veřejná databáze ČSÚ (vdb.czso.cz) agregované (ne individuální) statistické údaje určené ke zveřejnění■ STATISTIKY – připravené výstupy s možností změny parametrů■ VŠE O ÚZEMÍ – přehled informací o zvoleném území■ VLASTNÍ VÝBĚR – možnost sestavení vlastní tabulky■ UKAZATELE – seznam použitých statistických ukazatelů

    DATOVÉ VÝSTUPY ČSÚ (2)

    ■ Data v podobě zobrazených tabulek, grafů, map ve webovém prohlížeči s možností ručního stažení aktuálně zobrazeného výstupu do Excelu, XML a PDF

    ■ Rozsah zobrazených výstupů, tedy i rozsah dat ke stažení, je omezený – z důvodu online zobrazení v prohlížeči

    ■ Stažení celé časové řady je možné jen pro některé tabulky

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 9

    VDB – STATISTIKY

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 10

    xxx

    STATISTICKÝ ÚDAJ A METAINFORMACE

    1 980

    Počet obyvatel s trvalým pobytem

    MJ: Osoba

    Pohlaví: ŽenaVěk: 20‐24

    let

    Klatovy (okres)

    31.12.2018

    Veřejný údaj Zveřejnit od 30.4.2019Úloha BILOBYV

    STATISTICKÝ ÚDAJ

    VĚCNÁ DIMENZE ÚZEMNÍ DIMENZE

    ČASOVÁ DIMENZE

    DOPLŇUJÍCÍ METAINFORMACE

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 11

    VDB – DATA A METAINFORMACE

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 12

    ■ Statistický metainformační systém (SMS)■ veřejná aplikace iSMS - https://apl.czso.cz/iSMS/■ klasifikace, číselníky, ukazatele■ vazby mezi položkami číselníků■ doba platnosti každé položky■ různé typy textů (plný, zkrácený) v jazykových mutacích■ možnost exportu do otevřených formátů (XML, CSV)■ kódy ze SMS identifikují statistická data v celém procesu SIS,

    včetně zveřejnění dat ve VDB

    DATOVÉ VÝSTUPY ČSÚ (3)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 13

    APLIKACE iSMS

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 14

    ■ Volební portál – www.volby.cz■ výsledky voleb i ve formě otevřených dat

    DATOVÉ VÝSTUPY ČSÚ (4)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 15

    ■ Databáze národních účtů – makroekonomické údaje■ výběr 1 tabulky z nabídky a nastavení rozsahu období■ zobrazení v prohlížeči s možností uložení do Excelu

    ■ Databáze zahraničního obchodu■ dotazovací systém pro výpočet agregací a vytvoření vlastní tabulky■ možnost uložení vytvořeného dotazu■ zobrazení v prohlížeči s možností exportu do Excelu

    ■ Databáze demografických údajů za obce ČR■ sada Excel souborů za jednotlivé okresy

    ■ Databáze demografických údajů za vybraná města■ velký Excel soubor s indexem

    ■ další databázehttps://www.czso.cz/csu/czso/databaze-registry

    DALŠÍ DATOVÉ VÝSTUPY ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 16

    ■ Dostupnost OD ČSÚ https://www.czso.cz/csu/czso/otevrena_data■ Evidence OD v Katalogu produktů ČSÚ

    https://www.czso.cz/csu/czso/otevrena-data-v-katalogu-produktu-csu

    ■ Evidence OD v Národním katalogu otevřených dathttps://data.gov.cz/datové-sady?poskytovatel=Český statistický úřadAktualizace NKOD s využitím API ČSÚ (dle specifikace CKAN API v. 3)

    OTEVŘENÁ DATA ČSÚ

    ■ Typologie datových sad v ČSÚ■ Statistická data (DSS) – zdrojem Veřejná databáze ČSÚ■ Metadata (DSM) – číselníky, vazby mezi položkami číselníků;

    velký potenciál pro propojená data, zdrojem iSMS■ Volební výsledky (DSV) – zdrojem databáze s volebními

    výsledky a webová stránka www.volby.cz■ Informace o úřadu (DSO) – volná pracovní místa

    - dynamicky generovaný výstup do JSON, CSV a XML

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 17

    DATOVÉ SADY TYPU DSS■ Zdrojem dat je Veřejná databáze ČSÚ■ Datová sada je produktem v Katalogu produktů■ Registrace do NKOD pomocí lokálního API

    Jednotná struktura datového souboru■ Každý statistický údaj na samostatném řádku■ Údaj identifikován kódy SMS (číselníky a ukazatele ČSÚ)■ Texty pro interpretaci kódů ■ Datové schéma ve formátu JSON

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 18

    DATOVÁ SADA V KATALOGU ČSÚ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 19

    DOKUMENTACE DATOVÉ SADY

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 20

    SCHÉMA DATOVÉHO SOUBORU (JSON)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 21

    DATOVÝ SOUBOR (CSV)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 22

    DATOVÉ SADY TYPU DSM■ Zdrojem dat je databáze SMS

    ■ Číselníky zveřejněné v aplikaci iSMS■ Vazby mezi položkami zveřejněných číselníků

    ■ Zpřístupnění aktuálních dat přes exportní funkci iSMS■ Jednotná struktura pro číselníky■ Jednotná struktura pro vazby mezi položkami číselníků■ XML formát■ CSV formát (zatím bez JSON schématu)■ Vybrané číselníky a vazby registrovány v NKOD

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 23

    DATOVÝ SOUBOR (XML)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 24

    DATOVÉ SADY TYPU DSV■ Zdrojem dat je volební databáze a www.volby.cz■ Členění pro jednotlivé volby a roky■ Data za různé územní úrovně až do volebních okrsků■ Parametrizované odkazy pro výběr dat za určitá území■ Registry a číselníky součástí ZIP archivu■ Některá data spojená do ZIP archivu■ Data ve formátech XML, CSV i Excel■ Dokumentace a popis datových struktur ve formátech

    PDF, HTML, XSD, JSON■ Registrace vybraných dat do NKOD přes lokální API

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 25

    DSV – PŘEHLED SOUBORŮ

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 26

    DSO – PRACOVNÍ MÍSTA (JSON)

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 27

    API NAD OTEVŘENÝMI DATY ČSÚWWW.API.STORE/CZSO.CZ/

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 28

    Celkem 594 datových sad registrovaných v NKOD■ statistická data – 78 DS

    ■ číselníky – 126 DS

    ■ vazby mezi číselníky – 214 DS

    ■ volební data – 176 DS

    POČTY DATOVÝCH SAD K 13. 12. 2019

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 29

    Měsíční DS■ Hosté a přenocování v hotelích podle zemí■ Index průmyslové produkce■ Index stavební produkce■ Indexy spotřebitelských cen■ Indexy tržeb v odvětví dopravy, maloobchodu a služeb■ Konjunkturální průzkumy■ Pohyb zboží přes hranice podle vybraných zemí■ Stavební povolení (ČR, kraje)■ Uchazeči o zaměstnání dosažitelní a podíl nezaměstnaných osob

    podle obcí■ Výroba masa na jatkách

    PUBLIKAČNÍ PLÁN NA ROK 2020

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 30

    Čtvrtletní DS■ Hosté a přenocování v hromadných ubytovacích zařízeních

    podle zemí (ČR, kraje)■ Stavební zakázky■ Zaměstnanci a průměrné hrubé měsíční mzdy podle odvětví■ Zaměstnaní a nezaměstnaní podle výsledků výběrového šetření

    pracovních sil za kraje

    PUBLIKAČNÍ PLÁN NA ROK 2020

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 31

    Roční DS■ Cizinci podle státního občanství, věku a pohlaví (ČR, okresy)■ Dokončené byty v obcích■ Ekonomické subjekty podle odvětví převažující činnosti za správní obvody Prahy a

    obcí s rozšířenou působností■ Ekonomické subjekty podle vybraných právních forem za správní obvody Prahy a

    obcí s rozšířenou působností■ Euroregiony v České republice■ Hospodářská zvířata podle krajů■ Kapacity hromadných ubytovacích zařízení (ČR, kraje, okresy, SO ORP, obce, SO

    Prahy, městské části)■ Naděje dožití v okresech a správních obvodech ORP■ Náklady na ochranu životního prostředí a ekonomický přínos těchto aktivit (ČR, kraje)

    PUBLIKAČNÍ PLÁN NA ROK 2020

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 32

    ■ Návštěvnost hromadných ubytovacích zařízení (ČR, kraje, okresy, ORP)■ Obyvatelstvo k 31. 12. podle pohlaví v obcích■ Obyvatelstvo podle pětiletých věkových skupin a pohlaví v krajích a okresech■ Osevní plochy zemědělských plodin podle krajů■ Pohyb obyvatel za ČR, kraje, okresy, SO ORP a obce■ Pracovní neschopnost pro nemoc a úraz podle okresů a krajů■ Produkce podnikových a komunálních odpadů podle krajů■ Průměrná hrubá měsíční mzda a medián mezd v krajích■ Příjmy domácností zaměstnanců a důchodců■ Regionální účty za regiony soudržnosti a kraje■ Sklizeň zemědělských plodin podle krajů■ Statistická data pro územně analytické podklady (ORP, obce)■ Školy a školská zařízení (ČR a kraje)

    PUBLIKAČNÍ PLÁN NA ROK 2020

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 33

    ■ Těžba dřeva podle druhů dřevin a typu nahodilé těžby■ Ukazatele výzkumu a vývoje podle krajů■ Velikostní skupiny obcí (ČR, kraje, okresy, ORP)■ Vybavenost domácností informačními a komunikačními technologiemi (ČR, kraje)■ Základní ukazatele národních účtů■ Zařízení sociálních služeb podle obcí■ Zemřelí podle příčin smrti a pohlaví v ČR, krajích a okresech

    PUBLIKAČNÍ PLÁN NA ROK 2020

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 34

    ■ monitoring stahování souborů uložených na webu ČSÚ■ aplikace vytvořené na Hackathonu veřejné správy

    https://www.hackujstat.cz/

    VYUŽITÍ DAT A JEJICH VIZUALIZACE

    ■ vizualizace velkého množství dat, např. příčiny úmrtnosti■ v okresech Jihočeského kraje

    https://public.flourish.studio/visualisation/966068/■ v Praze – https://public.flourish.studio/visualisation/967269/

    ■ vizualizace statistických dat v mapě: ■ proudy dojížďky ze SLDB2011

    https://public.flourish.studio/visualisation/995652/

    ■ pokročilé analýzy dat:■ Porovnání krajů – https://www.czso.cz/csu/czso/porovnani-kraju

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 35

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 36

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 37

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 38

    ■ 4 skupiny statistik: ekonomické, environmentální, demografické, sociální

    ■ porovnání 14 krajů ■ v časové řadě od roku 2000■ 3 úhly pohledu: vývoj, pořadí krajů, souvislosti

    POROVNÁNÍ KRAJŮhttps://www.czso.cz/csu/czso/porovnani-kraju

  • ČESKÝ STATISTICKÝ ÚŘAD | Na padesátém 81, 100 82 Praha 10 | czso.cz 39

    Děkuji za pozornost

    Ing. Martin Černý[email protected]


Recommended