+ All Categories

Obsah

Date post: 14-Jan-2016
Category:
Upload: sorena
View: 38 times
Download: 0 times
Share this document with a friend
Description:
Obsah. Relační algebra Operace relační algebry Rozšíření relační algebry Hodnoty null Úpravy relací Stručný úvod do SQL SQL a relace Základní příkazy SQL Hodnoty null a tříhodnotová logika v SQL Příkazy SQL pro modifikaci obsahu databází. Téma 10 – Re lační model dat a jazyk SQL. - PowerPoint PPT Presentation
53
Relační model dat a jazyk SQL 1 A3B33OSD (J. Lažanský) verze: Jaro 2014 Obsah Téma 10 – Relační model dat a jazyk SQL 1. Relační algebra 2. Operace relační algebry 3. Rozšíření relační algebry 4. Hodnoty null 5. Úpravy relací 6. Stručný úvod do SQL 7. SQL a relace 8. Základní příkazy SQL 9. Hodnoty null a tříhodnotová logika v SQL 10. Příkazy SQL pro modifikaci obsahu databází
Transcript
Page 1: Obsah

Relační model dat a jazyk SQL 1A3B33OSD (J. Lažanský)verze: Jaro 2014

Obsah

Téma 10 – Relační model dat a jazyk SQL

1. Relační algebra2. Operace relační algebry3. Rozšíření relační algebry 4. Hodnoty null5. Úpravy relací 6. Stručný úvod do SQL7. SQL a relace8. Základní příkazy SQL9. Hodnoty null a tříhodnotová logika v SQL 10. Příkazy SQL pro modifikaci obsahu databází

Page 2: Obsah

Relační model dat a jazyk SQL 2A3B33OSD (J. Lažanský)verze: Jaro 2014

K čemu relace?

• Viděli jsme tabulky. Pročpotřebujeme něco jiného?

• Je k tomu řada důvodů:– Potřeba rigorózního

matematického modelu– Model umožní formalizaci

databázových operací– Přesný model je potřebný k tvorbě deklarativně

formulovaných dotazů a k optimalizaci jejich provádění

• Hlavní myšlenkou je popsat databázi jako souhrn logických predikátů nad konečnou množinou predikátových proměnných a definovat tak omezení na přípustné hodnoty a kombinace hodnot

Page 3: Obsah

Relační model dat a jazyk SQL 3A3B33OSD (J. Lažanský)verze: Jaro 2014

Co to je relace?• Matematicky: Jsou dány množiny D1, D2, …, Dn, pak relací

R rozumíme podmnožinu kartézského součinu D1 x D2 x … x Dn. Relace tedy je množina n-tic (a1, a2, …, an), kde ai Di

• Příklad:– klient_jmeno = {Novák, Mates, Braun, Novotný …}

/* množna jmen klientů */– klient_ulice = {Spálená, Hlavní, Horní, …} /* množina jmen

ulic*/– klient_mesto = {Praha, Brno, Nymburk, …} /* množina jmen měst

*/– pak r = {

(Novák, Spálená, Praha), (Mates, Horní, Brno),(Braun, Hlavní, Brno),(Novotný, Horní, Nymburk)

}je relace, tj. podmnožina klient_jmeno x klient_ulice x klient_mesto

• Vzhledem k tomu, že jde vždy o konečné množiny, lze je vyjádřit výčtem, tedy tabulkami

Page 4: Obsah

Relační model dat a jazyk SQL 4A3B33OSD (J. Lažanský)verze: Jaro 2014

Relace je podmnožina kartézského součinu• V množinách

neexistuje duplicita– Velmi důležité pro

databázové aplikace• Prvky množiny

mohou být v jakémkoliv pořadí– neexistuje

uspořádání

Bush

Carter

Clinton

Jefferson

Kenedy

Lincoln

Obama

Roosevelt

Washington

Abr

aham

Bar

ac Bill

Fra

nklin

Geo

rge

Jim

my

John

The

odor

e

Tho

mas

Jména

Pří

jmen

í

Vybraní američtí prezidenti

Page 5: Obsah

Relační model dat a jazyk SQL 5A3B33OSD (J. Lažanský)verze: Jaro 2014

Typy atributů• Každý atribut v relaci má své jméno• Množina přípustných hodnot atributu je definiční

doménou atributu• Hodnoty atributu jsou (téměř vždy) atomické, tj. dále

nedělitelné– Např. hodnotou atributu „číslo_účtu“ smí být číslo jednoho

účtu, nikoliv množina čísel účtů• Speciální hodnota null patří do každé domény

– prázdná (nezadaná) hodnota– null značně komplikuje definici mnoha množinových operací,

a proto zpočátku tuto hodnotu budeme ignorovat• důsledky uvedeme později

Page 6: Obsah

Relační model dat a jazyk SQL 6A3B33OSD (J. Lažanský)verze: Jaro 2014

Relační schéma a instance• Relační schéma

– A1, A2, …, An jsou atributy– R = (A1, A2, …, An ) je relační schéma

Příklad:Klient_schema = (klient_jmeno, klient_ulice, klient_mesto)

– r(R) značí relaci r nad relačním schématem RPříklad:

klient (Klient_schema)• Instance relace (relační instance)

– Skutečné hodnoty (relační instance) jsou definovány výčtem, tj. tabulkou

– Prvek t relace r je n-tice, reprezentovaná řádkem tabulky

NovákNovotnýBraunMates

klient_jmeno

SpálenáHorníHlavníHorní

klient_ulice

PrahaNymburkBrnoBrno

klient_mesto

klient

atributy(tj. sloupce)

n-tice(řádky)

Page 7: Obsah

Relační model dat a jazyk SQL 7A3B33OSD (J. Lažanský)verze: Jaro 2014

Klíče (znovu)• Nechť K R. K je superklíč schématu R, když hodnoty

K stačí k jednoznačné identifikaci r(R) – Např. {klient_jmeno, klient_mesto} je superklíčem pro schéma

Klient_schema. Superklíčem je však i {klient_jmeno}• K je kandidát na klíč jestliže K je minimální superklíč

– Např. {klient_jmeno} je kandidátem na klíč pro schéma Klient_schema, neboť je to superklíč a žádná „podmnožina“ již superklíčem není

• Primární klíč je vybrán mezi kandidátními klíči tak, aby se během „života“ příslušné relace neměnil– Např. {klient_jmeno} může sloužit jako primární klíč pro naši

instanci relace, avšak když přijde další Novák, všechno bude špatně• e-mailová adresa může být primárním klíčem, avšak lidé svůj e-mail

občas mění (což je jiný typ komplikace)

Page 8: Obsah

Relační model dat a jazyk SQL 8A3B33OSD (J. Lažanský)verze: Jaro 2014

Cizí klíče• Relační schéma může obsahovat atribut, který

koresponduje s primárním klíčem v jiné relaci. Takový atribut se nazývá cizí klíč– Např. atributy customer_name a account_number relačního

schématu depositor jsou cizí klíče do customer a account– Hodnotami cizího klíče v referencující (odkazující) relaci smí

být jen ty hodnoty, které se vyskytují jako primární klíč v relaci referencované (odkazované)

• Důležitý typ omezení – referenční integrita

branch_cityassets

branch_name

branch

branch_namebalance

account_number

account

customer_streetcustomer_city

customer_name

customer

branch_nameamount

loan_number

loancustomer_nameloan_number

borrower

customer_nameaccount_number

depositor

Page 9: Obsah

Relační model dat a jazyk SQL 9A3B33OSD (J. Lažanský)verze: Jaro 2014

Relační algebra• Relační algebra je vlastně procedurální jazyk• Šest základních operátorů

– Selekce (restrikce) • Výběr jen některých prvků relace

– Projekce: • Výběr jen určitých atributů

– Sjednocení: • Spojení několika relací v jednu (spojované relace musí mít stejné

schéma)– Rozdíl (množin): –

• Výběr těch prvků první relace, které nejsou obsaženy v druhé relaci– Kartézský součin: x

• Klasická množinová operace– Přejmenování:

• Změna jména jednoho či více atributů• Všechny tyto operátory pracují s jednou nebo dvěma

relacemi a vytváří relaci novou

Page 10: Obsah

Relační model dat a jazyk SQL 10A3B33OSD (J. Lažanský)verze: Jaro 2014

Selekce• Zápis p(r)

– p je selekční predikát• Definice

p(r) = {t | t r p(t)}Selekční predikát p je výroková formule složená z termů propojených logickými operátory: (and), (or), (not)Každý term má tvar:

atribut op atribut nebo konstanta, kde op je jeden z =, , >, , <,

• Příklad selekce: klient_mesto=“Praha” (klient)

A B C D

1

23

7

10

A=B D > 5 (r)

A B C D

1

5

12

23

7

7

3

10

r

Page 11: Obsah

Relační model dat a jazyk SQL 11A3B33OSD (J. Lažanský)verze: Jaro 2014

Projekce• Zápis:

kde A1, A2 jsou jména atributů a r je jméno relace• Výsledek je definován jako relace s k atributy

(„sloupci“) vytvořená z relace r výběrem pouze vyjmenovaných atributů– Tedy vynecháním zbývajících (neuvedených) atributů– Duplicitní prvky (řádky) jsou odstraněny – relace jsou

množiny! • Příklad: V relaci klient nás nezajímá atribut klient_ulice

klient_jmeno, klient_mesto (klient)

)(,,, 21r

kAAA

A B C

10203040

1112

r

A C

1112

A C

112

A,C (r) =

Page 12: Obsah

Relační model dat a jazyk SQL 12A3B33OSD (J. Lažanský)verze: Jaro 2014

Sjednocení• Zápis: r s• Definice:

r s = {t | t r t s}• Relace r a s musí být kompatibilní, tj

1. r a s musí mít stejnou aritu (počet atributů)2. Domény atributů musí být po řadě shodné• Např. druhý atribut relace r a druhý atribut relace s musí mít shodný

datový typ (definiční doménu)• Příklad:

– najít všechny zákazníky banky, kteří mají vklad nebo půjčku customer_name (depositor) customer_name (borrower)

A B

121

r

A B

23

s

Relace r, s: r s:

A B

1213

Page 13: Obsah

Relační model dat a jazyk SQL 13A3B33OSD (J. Lažanský)verze: Jaro 2014

Rozdíl• Zápis: r – s• Definice:

r – s = {t | t r t s}

• Relace vstupující do množinového rozdílu musí opět být vzájemně kompatibilní

A B

121

r

A B

23

s

Relace r, s:

A B

1

1

r – s:

Page 14: Obsah

Relační model dat a jazyk SQL 14A3B33OSD (J. Lažanský)verze: Jaro 2014

Kartézský součin• Zápis: r x s• Definice:

r x s = {t q | t r q s}Předpokládejme, že atributy r(R) a s(S) jsou disjunktní tj., R S = .

– Lze použít i na více než dvě relace– Nejsou-li atributy disjunktní, tzn. některé atributy r(R) mají stejné

jméno jako jména atributů v s(S), musí se použít operace přejmenování

• POZOR: Mohou vznikat tabulkygigantické velikosti

A B C D E

11112222

1010201010102010

aabbaabb

r x s:Relace r, s:

A B

12

r

C D

10102010

E

aabb

s

Page 15: Obsah

Relační model dat a jazyk SQL 15A3B33OSD (J. Lažanský)verze: Jaro 2014

Operace přejmenování• Pomocná operace

– Fakticky nejde o pravou operaci relační algebry, zavádí se z pragmatických důvodů

– Umožňuje nově pojmenovat (a tím i referencovat) výsledek jiné relační operace

– Umožňuje též pojmenovat relaci více jmény• Příklad:

vrátí výsledek výrazu E pod jménem X– Jestliže relační výraz E má aritu n, pak

vrátí výsledek výrazu E pod jménem X s atributy přejmenovanými na A1 , A2 , …., An .

)(),...,,( 21E

nAAAX

EX

Page 16: Obsah

Relační model dat a jazyk SQL 16A3B33OSD (J. Lažanský)verze: Jaro 2014

Skládání operací• Skutečně užitečné relační operace vzniknou teprve

skládáním operací základních

A B C D E

122

101020

aab

A=C(r x s):

A B

11112222

C D

1010201010102010

E

aabbaabb

r x s:

Page 17: Obsah

Relační model dat a jazyk SQL 17A3B33OSD (J. Lažanský)verze: Jaro 2014

Příklad bankovní databáze• Relace

– branch(branch_name, branch_city, assets)– customer(customer_name, customer_street, customer_city)– account(account_number, branch_name, balance)– loan(loan_number, branch_name, amount)– depositor(customer_name, account_number)– borrower(customer_name, loan_number)

• Příklady dotazů– Najdi všechny půjčky (loan) přes 1200

– Najdi čísla půjček vyšších než 1200

– Najdi jména zákazníků majících vkladový účet v pobočce Nymburk

)(1200 loanamount

))(( 1200_ loanamountnumberloan

)(

)( )(

"Nymburk"__

accountdepositorberccount_num account.amber account_nudepositor.

namebranchnamecustomer

Page 18: Obsah

Relační model dat a jazyk SQL 18A3B33OSD (J. Lažanský)verze: Jaro 2014

Příklad bankovní databáze (2)• Další příklady dotazů

– Najdi jména zákazníků majících půjčku v pobočce ‘Nymburk’ a přitom nemají vkladový účet v žádné pobočce

– Najdi jména zákazníků, kteří mají půjčku vedenou v pobočce Nymburk

• 1. možnost

• 2. možnost

)(

)))((

( "Nymburk"

depositor

loanborrower

amecustomer_n

_number loan.loan oan_numberborrower.l

ebranch_namamecustomer_n

)))((

( "Nymburk"__

loanborrower_number loan.loan_number oanborrower.l

namebranchnamecustomer

))))((

((

"Nymburk"_

_

loanborrowernamebranch

_number loan.loan oan_numberborrower.lnamecustomer

Page 19: Obsah

Relační model dat a jazyk SQL 19A3B33OSD (J. Lažanský)verze: Jaro 2014

Příklad bankovní databáze (3)• Příklady dotazu (použití operace přejmenování)

– Najdi největší zůstatek vkladového účtu– Strategie:

• Najdi zůstatky, které nejsou největší• K tomu účelu přejmenuj relaci account na temp, abychom mohli

porovnávat jednotlivé zůstatky se všemi ostatními• Použij množinový rozdíl k nalezení těch zůstatků, které nejsou mezi

těmi, které jsme určili v předchozím kroku– Dotaz pak vypadá takto:

Пbalance(account) – Пaccount.balance (σaccount.balance < temp.balance

(account x ρtemp(account))

)

Page 20: Obsah

Relační model dat a jazyk SQL 20A3B33OSD (J. Lažanský)verze: Jaro 2014

Doplňkové operace, průnik• Z praktických důvodů se definují další operátory, které

umožňují zjednodušení častých dotazů do databáze– Průnik– Přirozené spojení (spojení přes rovnost)– Dělení– Přiřazení

• Průnik– Zápis: r s– Definice:

r s = { t | t r t s }– Předpoklad: Relace r a s jsou vzájemně kompatibilní– Poznámka: r s = r – (r – s)

A B

121

r

A B

23

s

Relace r, s:A B

2r s:

Page 21: Obsah

Relační model dat a jazyk SQL 21A3B33OSD (J. Lažanský)verze: Jaro 2014

Přirozené spojení• Zápis: r ⋈ s• Nechť r a s jsou relace podle schémat R a S.

r ⋈ s je pak relace podle schématu R S vytvořená jako:– Uvažme všechny páry n-tic tr z r a ts z s– Jestliže tr a ts mají stejné hodnoty všech atributů z R S, pak

n-tice t se objeví ve výsledku, přičemž t má stejné hodnoty atributů jako tr na r a t má stejné hodnoty atributů jako ts na s

• Výsledek přirozeného spojení je tedy množina všech kombinací „řádků“ z R a S, které mají shodné hodnoty stejnojmenných atributů

• Příklad:R = (A, B, C, D)S = (E, B, D)– Výsledné schéma = (A, B, C, D, E)– r ⋈ s pak je: srDsDrBsBrEsDrCrBrAr .....,.,.,.,.

Page 22: Obsah

Relační model dat a jazyk SQL 22A3B33OSD (J. Lažanský)verze: Jaro 2014

• Relace r, s: r⋈s:

• Praktický příklad

Přirozené spojení – příklad

A B

11112

C D

aaaab

E

A B

12412

C D

aabab

r

B

13123

D

aaabb

E

s

Page 23: Obsah

Relační model dat a jazyk SQL 23A3B33OSD (J. Lažanský)verze: Jaro 2014

Operace dělení• Zápis: r s

• Určeno pro dotazy obsahující frázi „pro všechny“– Nechť r a s jsou relace podle schémat R a S, kde R = (A1, …,

Am , B1, …, Bn ) a S = (B1, …, Bn)– Výsledkem r s je relace dle schématu R – S = (A1, …, Am)

r s = { t | t R-S (r) u s (tu r) }, kde tu značí zřetězení „řádků“ t a u chápané jako jediná n-tice

• Vlastnost – Nechť q = r s, pak q je největší relace splňující q x s r

• Definice pomocí základních operací relační algebry– Nechť r(R) a s(S) jsou relace a nechť S R

r s = R-S (r) – R-S (( R-S (r) x s) – R-S,S(r))

R-S,S (r) přeuspořádá atributy r

R-S (R-S (r) x s ) – R-S,S(r)) dá ty n-tice t z R-S (r), pro které

platí, že některá n-tice u s je taková, že tu r

Page 24: Obsah

Relační model dat a jazyk SQL 24A3B33OSD (J. Lažanský)verze: Jaro 2014

• Relace r, s: rs:

• Praktický příklad

Operace dělení – příklad

A

A B

εε

12311134612

r

B

12

s

Page 25: Obsah

Relační model dat a jazyk SQL 25A3B33OSD (J. Lažanský)verze: Jaro 2014

Přiřazovací operace• Přiřazovací operace () umožňuje pohodlný zápis

složitých výrazů– Dovoluje zapisovat „dotazy“ ve formě sekvence programových

příkazů ve tvaru série přiřazení následovaných snáze čitelnými výrazy

– Přiřazuje se vždy vhodné pracovní „proměnné typu relace“– Pracovní proměnné jsou pak dostupné v dalších výrazech

• Příklad: Operaci dělení r s lze zapsat jako temp1 R-S (r)temp2 R-S ((temp1 x s) – R-S,S (r))vysledek = temp1 – temp2

Page 26: Obsah

Relační model dat a jazyk SQL 26A3B33OSD (J. Lažanský)verze: Jaro 2014

Příklad bankovní databáze – další dotazy• Najdi jména všech zákazníků, kteří mají současně vkladový účet a

půjčkucustomer_name (borrower) customer_name (depositor)

• Najdi jména zákazníků, kteří mají půjčku, a výši této půjčkycustomer_name, loan_number, amount (borrower ⋈ loan)

• Najdi jména všech zákazníků, kteří mají vkladový účet v pobočce Nymburk nebo Benešov– Možnost 1

customer_name (branch_name = “Nymburk” (depositor ⋈ account)) customer_name (branch_name = “Benešov” (depositor ⋈ account))

– Možnost 2customer_name, branch_name (depositor ⋈ account)

temp(branch_name) ({ (“Nymburk”), (“Benešov”)})

• Všimněme si, že Možnost 2 používá „konstantní relaci“ temp ve funkci dělitele při dělení – ptáme se totiž „pro všechny uvedené pobočky“

Page 27: Obsah

Relační model dat a jazyk SQL 27A3B33OSD (J. Lažanský)verze: Jaro 2014

Pragmatická rozšíření relačních operátorů• Pro často kladené dotazy se zavádějí rozšířené operace

– Zobecněná projekce– Agregátní funkce– Vnější spojení (Outer Join)

• Zobecněná projekce zavádí aritmetické funkce do seznamu možných výstupních atributů

– E je relační výraz a F1, F2, …, Fn jsou aritmetické výrazy zahrnující atributy ze schématu výrazu E a konstanty

– Takto se získají odvozené (počítané) atributy• Příklad:

– Relace credit_info(customer_name, limit, credit_balance),– Urči, kolik může každá osoba ještě utratit:

customer_name, limit – credit_balance (credit_info)

)(,,, 21E

nFFF

Page 28: Obsah

Relační model dat a jazyk SQL 28A3B33OSD (J. Lažanský)verze: Jaro 2014

Agregátní funkce a operace• Agregátní funkce pracují s kolekcí hodnot a vrací jedinou

výslednou hodnotuavg: průměrná hodnotamin: minimum max: maximumsum: součet hodnotcount: počet hodnot

• Agregátní operace relační algebry vytvářejí relaci se „syntetickými“ atributy a případným seskupováním prvků

– E je relační výraz– G1, G2, …, Gm je seznam atributů, podle nich se má seskupovat

(může být i prázdný)– Fi jsou agregátní funkce– Ai jsou jména atributů ze schématu, podle něhož je tvořen E

)()(,),(),(,,, 221121E

nnm AFAFAFGGG

Page 29: Obsah

Relační model dat a jazyk SQL 29A3B33OSD (J. Lažanský)verze: Jaro 2014

Příklad agregátních operací a funkcí

• Relace r: sum(C)(r):

• Relace account seskupená podle branch_name:

branch_name sum(balance)(account):

A B

C

773

10

sum(C)

27

branch_name account_number balance

NymburkNymburkPraha 1Praha 1Benešov

A-102A-201A-217A-215A-222

400900750750700

branch_name sum(balance)

NymburkPraha 1Benešov

13001500700

Page 30: Obsah

Relační model dat a jazyk SQL 30A3B33OSD (J. Lažanský)verze: Jaro 2014

Vnější spojení• Vnější spojení je operace, která rozšiřuje přirozené

spojení a zamezuje „ztrátě informace“– Určí se přirozené spojení a pak se přidají prvky z jedné ze

spojovaných relací, které nesplňují požadavky na rovnost stejnojmenných atributů

– Podle toho, ze které relace se přidávají prvky, rozlišuje se levé vnější spojení a pravé vnější spojení

– Lze též přidat prvky z obou spojovaných relací a pak jde o plné vnější spojení

– Při doplňování mohou vznikat prvky s neznámými nebo nedefinovanými hodnotami, pro jejichž reprezentaci se zavádí hodnota null

Page 31: Obsah

Relační model dat a jazyk SQL 31A3B33OSD (J. Lažanský)verze: Jaro 2014

Typy a příklady vnějšího spojení

přirozené spojení⋈

levé vnější spojení⊐⋈

pravé vnější spojení⊐⋈

plné vnější spojení⊐⋈

⊐⋈

Page 32: Obsah

Relační model dat a jazyk SQL 32A3B33OSD (J. Lažanský)verze: Jaro 2014

Hodnoty Null• null se užívá pro neznámou hodnotu nebo pro označení

situace, že hodnota neexistuje– Aritmetický výraz obsahující null dává výsledek null– Agregátní funkce ignorují hodnoty null– Pro eliminaci duplikátů a seskupování se null uvažuje jako

jakákoliv jiná hodnota; dvě null hodnoty se považují za identické

• Predikáty zahrnující null vyžadují tříúrovňovou logiku s doplňkovou hodnotou unknown– Logika s pravdivostní hodnotou unknown:

• OR: (unknown or true) = true, (unknown or false) = unknown(unknown or unknown) = unknown

• AND: (true and unknown) = unknown, (false and unknown) = false,(unknown and unknown) = unknown

• NOT: (not unknown) = unknown– Selekční predikát vyhodnocený jako unknown se považuje za

false

Page 33: Obsah

Relační model dat a jazyk SQL 33A3B33OSD (J. Lažanský)verze: Jaro 2014

Modifikace relací v databázi• K modifikaci obsahu databáze potřebujeme operace

– Deletion (výmaz = odstranění prvku z relace)– Insertion (vložení prvku do relace)– Updating (aktualizace – změna prvku v relaci)

• Vše se realizuje operátorem přiřazení• Výmaz (deletion)

r r – Ekde r je relace a E je relační výraz určující mazané prvky

– Příklady• Vymaž všechny záznamy v pobočce Benešov

account account – branch_name = “Benešov”(account )

• Vymaž všechny záznamy o půjčkách se zůstatkem 0 až 50loan loan – amount 0and amount 50(loan)

Page 34: Obsah

Relační model dat a jazyk SQL 34A3B33OSD (J. Lažanský)verze: Jaro 2014

Vložení• Vložení v relační algebře je opět přiřazení

r r Ekde r je relace, do níž vkládáme a E je relační výraz

– Vložení jediného prvku se realizuje tak, že E bude konstantní výraz popisující prvek

– Vložit lze najednou i více prvků, pokud E bude relační výraz kompatibilní s r

• Příklad– Vlož do databáze informaci, že zákazník Kovář má účet A-973

se zůstatkem 1200 v pobočce Benešov

account account {(“A-973”, “Benešov”, 1200)}depositor depositor {(“Kovář”, “A-973”)}

Page 35: Obsah

Relační model dat a jazyk SQL 35A3B33OSD (J. Lažanský)verze: Jaro 2014

Aktualizace• Mechanismus pro změnu hodnoty zvolených atributů,

aniž by se měnily hodnoty všech atributů– Použije se zobecněná projekce

– Fi je buď • i-tý atribut r, pokud i-tý atribut nemá být změněn, nebo• Fi je výraz sestavený z konstant a atributů r, který dává novou hodnotu

atributu• Příklady

– Připočti úrok 5%account account_number, branch_name, balance * 1.05 (account)

– Přičti úrok 6% k účtům se zůstatkem přes 10.000 a 5% ke všem ostatním

account account_number, branch_name, balance * 1.06 (balance10000 (account ))

account_number, branch_name, balance * 1.05 (balance 10000 (account))

)(,,,, 21rr

lFFF

Page 36: Obsah

Relační model dat a jazyk SQL 36A3B33OSD (J. Lažanský)verze: Jaro 2014

Strukturovaný dotazovací jazyk SQL• Structured Query Language (SQL)

– jazyk pro kladení dotazů do databáze– obsahuje jak příkazy DML (manipulace s daty), tak i pro

definici dat (DDL)• Svojí syntaxí připomíná přirozenou angličtinu• SQL se opírá o výrazy relační algebry• Existuje mnoho dialektů SQL

– liší se různými rozšířeními či speciálními agregátními funkcemi– skladba vestavěných predikátů se rovněž může lišit

• Probereme jen základní konstrukty jazyka– konkrétní varianty vždy závisí na příslušném dialektu použitého

databázového systému• Poznámka k syntaxi

– SQL identifikátory a jména atributů NEROZLIŠUJÍ malá a velká písmena (tj. Branch_Name ≡ BRANCH_NAME ≡ branch_name

Page 37: Obsah

Relační model dat a jazyk SQL 37A3B33OSD (J. Lažanský)verze: Jaro 2014

Konstrukce create table• Relace v SQL je definována příkazemcreate table r (A1 D1, A2 D2, ..., An Dn,

(integritní-omezení1), ..., (integritní-omezeník))– r je jméno vytvářené relace– Ai jsou jména atributů schématu relace r– Di jsou příslušné datové typy hodnot domén atributů Ai

• Integritní omezení jsou standardně tvaru– not null– primary key(A1, ..., AL )

• Příkladcreate table branch

( branch_namechar(15) not null,branch_city char(30), assets integer,primary key(branch_name)

)

Page 38: Obsah

Relační model dat a jazyk SQL 38A3B33OSD (J. Lažanský)verze: Jaro 2014

Základní struktura SQL dotazu• Typický SQL dotaz má tvar:

select A1, A2, ..., An

from R1, R2, ..., Rmwhere p

– Ai jsou atributy, Ri jsou relace a p je predikát• Tento dotaz je ekvivalentní relačnímu výrazu

– Výsledek dotazu je relace• Důležité poznatky

– SQL je deklarativní (dotazovací) jazyk, zatímco relační algebra je procedurální

– Zobrazení SQL dotazů na relační výrazy převádí deklarativní dotazy na procedury

– Provedení („výpočet výsledku“) dotazu bude implementovat procedury operací relační algebry

))(( 21,,, 21 mpAAA RRRn

Page 39: Obsah

Relační model dat a jazyk SQL 39A3B33OSD (J. Lažanský)verze: Jaro 2014

Klauzule select• Klauzule select uvádí atributy výsledné relace dotazu

– odpovídá relační operaci projekce• Příklady:

– Získej jména poboček z relace (tabulky) loan:select branch_name from loan

– V relační algebře branch_name (loan)• Na rozdíl od relací SQL připouští duplikáty v relacích i

ve výsledcích dotazů– To narušuje relační model, avšak může výrazně zrychlit

zpracování• Eliminaci duplikátů lze vynutit použitím klíčového slova distinct za select.– Získej jména poboček z relace (tabulky) loan a odstraň

duplikátyselect distinct branch_name from loan

– Naopak klíčové slovo all explicitně říká, aby se duplikáty ponechaly

select all branch_name from loan

Page 40: Obsah

Relační model dat a jazyk SQL 40A3B33OSD (J. Lažanský)verze: Jaro 2014

Klauzule select (pokr.)• Hvězdička v klauzuli select značí “všechny atributy”

select from loan• Klauzule select může obsahovat aritmetické výrazy

obsahující operace +, –, , / a konstanty nebo atributy• Dotaz

select loan_number, branch_name, amount 100from loan

vrátí relaci shodnou s loan až na to, hodnota atributu amount bude vynásobena 100– Jde vlastně o zobecněnou projekci

loan_number, branch_name, amount 100(loan)

Page 41: Obsah

Relační model dat a jazyk SQL 41A3B33OSD (J. Lažanský)verze: Jaro 2014

Klauzule where• Klauzule where určuje podmínky, které musí splňovat

výsledek– Odpovídá selekčnímu predikátu relační algebry

• Příklad– Najdi čísla půjček z pobočky Benešov vyšší než 1200

select loan_numberfrom loanwhere branch_name="Benešov" and amount>1200

• Porovnání– Výsledky mohou být kombinovány logickými spojkami and, or

a not– Porovnání lze aplikovat i na výsledky aritmetických výrazů– SQL zahrnuje i porovnávací operátor between

• Např.: Najdi čísla půjček se zůstatky mezi 90.000 a 100.000 (tj. 90.000 a 100.000)select loan_number from loan where amount between

90000 and 100000což odpovídá relačnímu výrazu

loan_number((amount ≥ 90000)(amount ≤ 100000)(loan))

Page 42: Obsah

Relační model dat a jazyk SQL 42A3B33OSD (J. Lažanský)verze: Jaro 2014

Klauzule from• Klauzule from uvádí seznam relací, kterých se dotaz týká

– Odpovídá kartézskému součinu relací– Příkaz

select from borrower, loanvrátí kartézský součin relací borrower x loan

– Najdi jména, čísla půjček a výši dluhů všech zákazníků majících půjčku v pobočce Nymburk

select customer_name, borrower.loan_number, amount from borrower, loan where borrower.loan_number = loan.loan_number and

branch_name = "Nymburk" odpovídá relačnímu výrazu

customer_name, borrower.loan_number, amount ( borrower.loan_number = loan.loan_number branch_name="Nymburk"

(borrower x loan))

Page 43: Obsah

Relační model dat a jazyk SQL 43A3B33OSD (J. Lažanský)verze: Jaro 2014

Operace přejmenování• SQL umožňuje relace a atributy pomocí klauzule as

old-name as new-name– Najdi jména, čísla půjček a dlužné částky všech zákazníků a

pojmenuj sloupec loan_number jako loan_id

select customer_name, borrower.loan_number as loan_id, amountfrom borrower, loanwhere loan_id = loan.loan_number

• Domácí úkol:– Přepište tento dotaz do formy relačního výrazu

Page 44: Obsah

Relační model dat a jazyk SQL 44A3B33OSD (J. Lažanský)verze: Jaro 2014

n-tice jako proměnné• Proměnné ve tvaru n-tic se definují jako proměnné v

klauzuli from s použitím klauzule as• Příklad

– Najdi jména zákazníků, čísla jejich půjček a výši dluhů přes všechny pobočkyselect customer_name, B.loan_number, L.amount

from borrower as B, loan as Lwhere B.loan_number = L.loan_number

– Najdi jména poboček, které mají součet vkladů (assets) větší některá z poboček v Praze 1select distinct T.branch_name

from branch as T, branch as Swhere T.assets > S.assets and S.branch_city = "Praha 1"

Page 45: Obsah

Relační model dat a jazyk SQL 45A3B33OSD (J. Lažanský)verze: Jaro 2014

SQL připouští duplikáty• Pro zajištění dobré analogie SQL a množinového modelu

potřebujeme tzv. multisety– Multiset je množina s opakujícími se prvky

• Potřebujeme multisetové verze relačních operátorů mezi relacemi r1 a r2 (r1): Je-li c1 kopií n-tice t1 v r1, a t1 splňuje selekční predikát ,, pak bude c1 kopií t1 v (r1).

A (r ): Pro každou kopii t1 v r1 bude kopie A (t1) i v A (r1)– r1 x r2: Je-li c1 kopií t1 v r1 a c2 kopií t2 v r2, pak bude c1 c2

kopií n-tice t1t2 v r1 x r2

• Příklad: – Multisetové relace r1 (A, B) a r2 (C) jsou

r1 = {(1, a) (2,a)} r2 = {(2), (3), (3)}– Pak B(r1) bude {(a), (a)},

a B(r1) x r2 dá {(a,2), (a,2), (a,3), (a,3), (a,3), (a,3)}• SQL sémantika příkazu select A1,, A2, ..., An from r1,

r2, ..., rm where P je ekvivalentní multisetové verzi výrazu

))(( 21,,, 21 mPAAA rrrn

Page 46: Obsah

Relační model dat a jazyk SQL 46A3B33OSD (J. Lažanský)verze: Jaro 2014

Množinové operace v SQL• Množinové operátory union, intersect a except

jsou SQL ekvivalentem relačních (množinových) operací a– Najdi zákazníky mající vkladový účet nebo půjčku (nebo oboje)

(select customer_name from depositor) union

(select customer_name from borrower)

– Najdi zákazníky mající jak vkladový účet tak půjčku(select customer_name from depositor)

intersect(select customer_name from borrower)

– Najdi zákazníky mající vkladový účet a nemající půjčku(select customer_name from depositor)

except(select customer_name from borrower)

• SQL má dále operátor in, který testuje příslušnost či členství v množině– ekvivalent ∈

Page 47: Obsah

Relační model dat a jazyk SQL 47A3B33OSD (J. Lažanský)verze: Jaro 2014

Agregátní funkce v SQL• Tyto funkce pracují s multisety hodnot a vrací hodnotu

jedinou– jinak jsou shodné s dříve uvedenými agregátními funkcemi avg, min, max, sum a count

• Najdi průměrný vklad v pobočce Benešovselect avg(balance)from accountwhere branch_name = "Benešov"

• Urči počet vkladatelůselect count (distinct customer_name)from depositor

Page 48: Obsah

Relační model dat a jazyk SQL 48A3B33OSD (J. Lažanský)verze: Jaro 2014

Hodnoty null v SQL• Predikát is null slouží k testu null hodnot

– Např.: V relaci loan vyhledej čísla půjček s null hodnotou atributu amount

select loan_number from loan where amount is null

• Aritmetické operace zahrnující null dávají null– Např.: 5 + null vrací null

• Agregátní funkce null hodnoty ignorují• Je zavedena tříhodnotová logika s unknown

– Např.: 5 < null, null <> null nebo null = null se vždy vyhodnotí jako unknown

• Konstrukt p is unknown se vyhodnotí jako pravdivý, pokud predikát p má hodnotu unknown

Page 49: Obsah

Relační model dat a jazyk SQL 49A3B33OSD (J. Lažanský)verze: Jaro 2014

Vnořený dotaz

Vnořené dotazy• SQL má mechanismus pro vnořování dotazů (subquery)

– někdy zvané pod-dotazy• Vnořený dotaz má obvyklý tvar select-from-where,

je však zanořen do jiného dotazu– Nejčastěji se používá k realizaci testu členství v relaci,

porovnávání množin a určování kardinality relací• Příklad:

– Najdi zákazníky mající jak vkladový účet tak i půjčkuselect distict customer_name from borrower

where customer_name in (select customer_name from depositor)

Page 50: Obsah

Relační model dat a jazyk SQL 50A3B33OSD (J. Lažanský)verze: Jaro 2014

Pohledy• Často je nevhodné poskytovat uživateli všechna data

– tedy celý logický model databáze a všechny uložené relace– Bankovní úředník na jisté pozici potřebuje znát jméno

zákazníka a pobočku, kde má půjčku, ne však výši půjčky. (select customer_name, branch_name from borrower, loan

where borrower.loan_number = loan.loan_number )• Mechanismus pohledů (view) umožňuje skrýt určitá data

– Lze tak vytvořit jakoukoliv relaci, která není součástí konceptuálního modelu a zpřístupnit ji uživateli jako "virtuální relaci". Taková "virtuální relace" se nazývá pohled.

• Zavede se příkazem create view ve tvarucreate view v as <formulace dotazu>

kde v je jméno pohledu– Jakmile je pohled definován, jeho jméno lze používat jako

zkratku celého definičního dotazu

Page 51: Obsah

Relační model dat a jazyk SQL 51A3B33OSD (J. Lažanský)verze: Jaro 2014

SQL příkazy pro modifikaci databáze• Výmaz (deletion)

– Příkaz má strukturu delete-from-where s argumenty analogickými konstruktu select-from-where

– Vymaž všechny vkladové účty v pobočce Nymburk delete from account where branch_name = ‘Nymburk‘

• Vložení (insertion)– insert into relace values <kompatibilní_relace>– Přidej záznam do tabulky accountinsert into account (branch_name, balance, account_number) values ('Beroun', 1200, 'A-9732')

• Aktualizace (update)– update relace set atribut = výraz where podmínka– Přidej 6% prémie ke vkladovým účtům přes 1000update account set balance = balance 1.06

where balance > 1000

Page 52: Obsah

Relační model dat a jazyk SQL 52A3B33OSD (J. Lažanský)verze: Jaro 2014

Spojení relací v SQL• Základní syntaxe je

r1 <Typ> join r2 on <podmínka> using (A1, ...)– Úplná SQL syntaxe je popsána v příslušných dialektech a

standardizace je jen částečná– Typicky se používá jako součást pod-dotazu v klauzuli from.

• Typ spojení – "přívlastek" klíčového slova join – Jde o úplnou ekvivalenci se spojeními z relační algebry– Typy: inner join, left outer join, right outer join, full outer join

• Spojovací podmínka – určuje, na základě čeho má dojít ke spojení a které atributy budou

ve výsledném spojení• Příklad

– Najdi všechny zákazníky, kteří mají buď půjčku nebo vkladový účet, ale ne obojeselect customer_name

from (depositor full outer join borrower )where account_number is null or loan_number is null

Page 53: Obsah

Relační model dat a jazyk SQL 53A3B33OSD (J. Lažanský)verze: Jaro 2014

Dotazy


Recommended