Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení ze 4ST201.
Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji
Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo
zdaleka všechno, co byste měli umět. Dalším studijním materiálem je také učebnice, cvičebnice a poznámky z přednášek a cvičení!
25.9.2013 Tomáš Karel - 4ST201 2
Ing. Tomáš Karel
email: [email protected]
místnost: NB171 A
konzultační hodiny: čtvrtek 10.15 – 12.15)
(jinak dle dohody)
materiály ke cvičení: Průběžně na www.tomaskarel.cz/vse
web Katedry statistiky a pravděpodobnosti: http://kstp.vse.cz/
web předmětu: http://statistika.vse.cz/predmety/4st201.php
25.9.2013 3 Tomáš Karel - 4ST201
Statistika pro ekonomy Hindls R., Hronová S., Seger J.,
Fischer,J. (1. – 8. vydání)
Statistika v příkladech
– Marek L. a kolektiv
Seznam kapitol a příkladů z učebnice a cvičebnice, které jsou náplní kurzu 4ST201:
http://statistika.vse.cz/download/materialy/4ST201_co_se_ucit.pdf
25.9.2013 4 Tomáš Karel - 4ST201
kstp.vse.cz
statistika.vse.cz
◦ obsah přednášek a látka ke studiu
◦ požadavky k ukončení předmětu
Vzorce:
http://statistika.vse.cz/download/materialy/4ST201_vzorce.pdf
Tabulky:
http://statistika.vse.cz/download/materialy/tabulky.pdf
Vzorce a tabulky (bez individuálních úprav) z těchto webových stránek LZE používat jak na přůběžných testech na cvičení, tak i na závěrečném zkouškovém testu. Vzorce a tabulky si proto prosím vytiskněte a noste je prosím na cvičení, ať se s nimi naučíte pracovat.
25.9.2013 5 Tomáš Karel - 4ST201
1. průběžný test 20b 2. průběžný test 20b Celkem ze cvičení 40b
Zkouškový test 60 b
Celkem - maximum 100 b
25.9.2013 6
Hodnocení: 90 – 100% => 1
75 – 89% => 2
60 – 74% => 3
50 – 59% => 4+
pod 50% => 4
• Za každý ze dvou průběžných testů lze získat maximálně 20 bodů. Celkem lze tedy získat maximálně 40 bodů ze cvičení. • Na každý průběžný test je pouze jeden pokus. Nebudete-li se moci testu zúčastnit, je třeba donést omluvenku studijní referentce a budete psát test náhradní. • Neomluvená absence na testu znamená 0 bodů z daného testu. • Možné minimum ze cvičení je 16 b !!!
Tomáš Karel - 4ST201
1. test - 6. týden
2. test – 11. týden
30 minut (na konci cvičení)
pouze početní příklady
Možnost využití počítače, kalkulačky a vzorců, tabulek
1. test - 6. týden (popř. 7. týden)
2. test – 11. týden (popř. 12. týden)
25.9.2013 7 Tomáš Karel - 4ST201
60 minut, 60 bodů
ve zkouškovém období
obsahuje teorii i příklady
teorie (50% - 30b)
◦ zaškrtávací (1 správná odpověď, 5 × 4b)
(pozn. správná odpověď +4b, špatná odpověď -2b, žádná odpověď 0b)
◦ výroky (ano × ne, 5 × 2b)
(pozn. správná odpověď +2b, špatná odpověď -2b, žádná odpověď 0b)
◦ z teoretické části není možné získat záporný počet bodů, minimum je nula
příklady (50% - 30b)
◦ 3 příklady po 10 bodech
statistika má v dnešní době četná uplatnění v mnoha odvětvích, včetně ekonomie
vzhledem k možné rozsáhlosti vstupních dat a náročnosti operací spojených s jejich klasifikací a analýzou je v dnešní době často využíván statistický software:
SAS
R
Statistica
Statgraphics
SPSS
Matlab
Na tomto cvičení MS EXCEL – běžnou součástí většiny systémů MS Windows
25.9.2013 8 Tomáš Karel - 4ST201
1. Úvod, popisná statistika
2. Popisná statistika
3. Míry variability, pravděpodobnost
4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5. Pravděpodobnostní rozdělení
6. TEST, odhady parametrů
7. Testování hypotéz
8. Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9. Regrese
10. Regrese, korelace
11. TEST, časové řady (bazické a řetězové indexy)
12. Časové řady
13. Indexní analýza
25.9.2013 9 Tomáš Karel - 4ST201
kombinační čísla
Využití např. počet pravděpodobnosti (binomické rozdělení – další cvičení)
kombinační číslo „en nad ká“ vyjadřuje, kolik různých k-tic lze vytvořit z n prvků, přičemž na pořadí prvků v dané k-tici nezáleží a každý prvek se v dané k-tici smí vyskytnout maximálně jednou n! – „faktoriál“, na kalkulačce „x!“
25.9.2013 10
!)!(
!
kkn
n
k
n
Tomáš Karel - 4ST201
Vypočítejte:
25.9.2013 11
?3
8
?9
10
Tomáš Karel - 4ST201
V populárním seriálu The Big Bang Theory (Teorie velkého třesku) jedna z hlavních postav tohoto seriálu, Sheldon Cooper, uvádí rozšíření tradiční hry
kámen – nůžky – papír
o další dva symboly tapíra a Spocka (postava ze Star Treku) celkem na pětici symbolů
kámen – nůžky – papír – tapír – Spock
http://www.youtube.com/watch?v=_F0pszFyQqI
Kolik musí být ve hře s pěti symboly stanoveno pravidel, podle kterých se vůči sobě jednotlivé symboly chovají?
Např. 1) Papír balí kámen,
2) nůžky stříhají papír …
25.9.2013 Tomáš Karel - 4ST201 12
25.9.2013 13 Tomáš Karel - 4ST201
Statistické
znaky
kvantitativní
ordinální
(pořadové) měřitelné
kvalitativní
alternativní
(binomické) množné
Pomocí metody dotazování získáme údaje o 10 studentech v této třídě:
◦ pohlaví studenta (x1)
◦ věk studenta (x2)
◦ studovaná fakulta (x3)
◦ semestr (x4)
◦ založení facebook účtu (x5)
◦ počet přátel na facebooku (x6)
25.9.2013 14 Tomáš Karel - 4ST201
číslo pohlaví věk fakulta semestr facebook Fb přátelé
i x1 x2 x3 x4 x5 x6
1
2
3
4
5
6
7
8
9
10
25.9.2013 15 Tomáš Karel - 4ST201
Získaná data uspořádáme do přehledné tabulky tzv. datové matice (viz soubor cviceni_1.xlsx na ISISu v sekci dokumenty )
1) Určete typy proměnných x1 – x6
dle výše uvedeného schématu na jednom z předchozích slidů
x1…pohlaví studenta
x2…věk studenta
x3…studovaná fakulta
x4…semestr ve kterém jste si zapsali tento předmět
x5…založení facebooku
x6…počet „přátel“ na Vašem facebooku
25.9.2013 16 Tomáš Karel - 4ST201
2) Pro proměnnou x2 – věk studenta sestrojte tabulku rozdělení četností (absolutních, relativních, kumulativních absolutních a kumulativních relativních)
absolutní četnosti
relativní četnosti
kumulativní absolutní četnosti
platí:
kumulativní relativní četnosti
platí:
25.9.2013 17
kini ,...,2,1,
n
np i
i
...21 pp
...21 nn
11
k
i
ip
nnk
i
i 1
Tomáš Karel - 4ST201
3) Sestrojte tabulku rozdělení četností pro proměnnou x6 – počet facebookových „přátel“
◦ proměnná x4 nabývá mnoha obměn (tabulka četností i graf by nevypadaly dobře) vhodnější je intervalové rozdělení četností
◦ musíme zvolit vhodný počet a šířku intervalu
25.9.2013 18 Tomáš Karel - 4ST201
Sturgesovo pravidlo pro počet intervalů
šířka jednoho intervalu:
variační rozpětí:
25.9.2013 19
minmax xxR
Tomáš Karel - 4ST201
průměr (aritmetický, geometrický, harmonický, kvadratický)
modus = hodnota s nejvyšší četností
a%-ní kvantil = dělí soubor uspořádaný podle velikosti (od nejnižších hodnot po nejvyšší) na prvních a% hodnot a zbývajících (100-a)%
medián = prostřední hodnota v souboru uspořádaném podle velikosti = 50% kvantil
dolní kvartil = 25% kvantil
horní kvartil = 75% kvantil
25.9.2013 20 Tomáš Karel - 4ST201
25.9.2013 21 Tomáš Karel - 4ST201
Jaký je průměrný počet facebookových přátel? (vypočtěte dvojím způsobem - nejdříve ze základní tabulky
a poté z tabulky rozdělení četností)
ze základní tabulky (prostý aritmetický průměr)
z tabulky rozdělení četností (vážený aritmetický průměr)
25.9.2013 22
n
x
x
n
i
i 1
Tomáš Karel - 4ST201
k
i
i
i
k
i
i
n
nx
x
1
1
25.9.2013 23
Závodní okruh Sosnová má délku základní trasy 1,075 km.
Testovací závodník projel tento okruh celkem třikrát. V
prvním kole byla jeho průměrná rychlost 60 km/h, v
druhém kole už 72 km/h a ve třetím kole dosáhl průměrné
rychlosti 80 km/h.
Vypočítejte průměrnou rychlost jezdce za celou dobu jízdy,
definovanou jako podílcelkové dráhy za celkový čas
www.autodrom.cz
Tomáš Karel - 4ST201
s = 1,075 km
Pro proměnnou x2 - věk určete následující kvantily:
a) medián x0,5
b) horní kvartil x0,25
c) dolní kvartil x0,75
25.9.2013 24 Tomáš Karel - 4ST201
DÚ: Učebnice, cvičebnice – příklady
25.9.2013 Tomáš Karel - 4ST201 25