1
Použití datových skladů v pojistné matematice
Mgr. Patrik Hinca 10.10.2003
2
Obsah přednášky
1. Datové sklady
• Historie datových skladů
• Vytváření datových skladů
• Základní pojmy v datových skladech
• Používaní datových skladů
2. Datové sklady v pojistné matematice
• Datové sklady jako zdroj dat
• Vytváření reportů
• Praktická ukázka
3
Historie datových skladů
• Nástup elektronických technologii >> shromažďování dat
• Začátek 70. let vznik relačních databází
• Následně definice SQL
• 80. léta vznik velkých serverových databází
• 1986 uvedena první client-server aplikace
• začátek 90. let oddělování specifických dat pro MIS a DSS
• polovina 90. let vznik datových skladů
• konec 90. let rozvoj datových skladů – e-businnes, systém datamartů, data mining,
4
Integrace dat
Marketing
Finance
Odborné odd.
Účetnictví
Výstup
Výstup
Výstup
Výstup
Kdo je klient?
5
Integrace datKdo je klient?
DWH
Výstup
Marketing
Finance
Účetnictví
Odborné odd.
6
Co je datový sklad?
• Samostatný informační systém postaven na již pořízených datech určen především k jejich analýze dat
• Hlavní výhody DWH
• primární je integrace dat
• rychlý přístup k datem, dynamický přístup (ad-hoc)
• uložistě historických dat
• zdroj dat pro analýzy (MIS, DSS)
• charakterizace klienta
• read-only systém (uživatel pouze čte) – validita dat
• snížení nákladů na pořízení dat
7
Pohled na data z hlediska systému
80. léta až první polina 90. let
SmlouvaSmlouva
druhá polina 90. let až současnost
KlientKlient
Současnost a blízká budoucnost
DomácnostDomácnost
8
Výstavba datového skladu
Primární systém 1
Primární systém 2
Primární systém 3
Staging areaETL
DM1
DM2
DM3
DM4
DWH E-commerceDSS aplikace
CRM Data mine
9
Struktura datového skladu
DWH
Data na nízké úrovni
Agregační data
Metadata
Strukturované indexy
Logická struktura dat
Operative data store
Exploration data store
10
Obsah datového skladu
• fakt – měřitelná hodnota (platby, zůstatky)
• metrika – agregační funkce faktu (suma, průměr, počet)
• mezisoučty – souhrny na definovaných úrovních
• atribut – agregační úroveň dat (tarif, kraj, rok počátku)
• dimenze – seskupení atributů stejného hlediska (geografická dimenze, časová dimenze)
• filtr – výběrové kritérium
• seskupení – samostatné skupiny prvků atributu
• transformace – definice úrovní pro porovnávání (měsíce)
• uživatelské prvky – doplňkové funkce, analytické nástroje
11
Jádro datového skladu
DWH Správce
Uživatel
METADATA
12
Jádro datového skladu
• řídí veškerou činnost nad datovým skladem
• vytváří metadata a tím i logickou strukturu dat
• jako jediný má přímý přístup k datům DWH
• řídí požadavky koncových uživatelů (priority, SQL generátor)
• kontroluje bezpečnost přístupu
• analytický nástroj (mutlidimenzionální analýzy, statistické analýzy, analýzy časových řad)
• úprava dat pro koncového uživatele (dokument, graf, tabulka)
• zpracování odezvy uživatele
13
Uživatelé datového skladu
• Administrátor
• kontroluje činnost DWH
• řídí uživatele (práva, definice skupin)
• Architekt
• vytváří logický model DWH
• aplikační model DWH (objekty, funkce, nástroje pro analýzy)
• Report creator
• vytváří standardní výstupy DWH (reporty, grafy, dokumenty)
• Analytik
• vytváří pokročilé výstupy DWH
• provádí „průzkum dat“, Data Mining
• Koncový uživatel
• Vývojář
14
Používání datového skladu
• statické výstupy – předem definované výstupy
• dynamické výstupy – ad-hoc analýza dat (provrtávání)
• parametrické výstupy – report s volitelnými vstupními parametry
• dokumenty – sestava několika nezávislých reportů, tabulek grafů, možnost vkládaní vlastních komentářů
• elektronické výstupy – email/fax, SMS, Pager
• hlasové výstupy – voice mail, eCall centrum
• operativní výstupy – registrace odpovědí a jejich analýzy
15
Datové sklady
v pojistné matematice
Část II
16
DWH – zdroj dat
• potřeba pojistného matematika
- data na nízké úrovni
- výpočet hodnot pro jednotlivé smlouvy (rezervy, rozklad pojistného, technické změny)
- určité statistiky souhrnného charakteru (odhad rizik, úmrtnosti, rizikového kapitálu)
- statistické analýzy kmene (vývoj škodního procenta, vývoj úmrtnosti, porovnání s plánem)
- finanční analýzy (předpisy, zaplacené pojistné, vývoj rizikového kapitálu)
- odvozené statistiky (solventnost, hodnota kmene)
17
DWH – základní dimenze
• produktová skupina – produkt – tarif – kámen tarifu
• rok – kvartál – měsíc – týden – den (časové údaje, datum podpisu, počátku, konce, narození)
• stát – region – kraj – okres – obec – část obce
• firma – obchodní region – agentura – agent (makléř)
• stav smlouvy – metoda – forma – status
• uplynutá doba v letech – kvartálech – měsících (doba do konce smlouvy)
• riziková skupina – typ rizika – riziko
• domácnost (rodina) – klient – smlouva
18
Vytváření reportů – bez využití DWH
DWH
Data nízké úrovně APLIKACE
DWH
APLIKACE
VÝSTUP
VÝSTUP
19
Vytváření reportů s využitím DWHAgregovaný
mezivýsledekAPLIKACE
VÝSTUP
DWH
VÝSTUP
Pomocná databáze obsahující aplikační
funkčnost
20
Ukázka použití DWH
21
D O T A Z Y