Studijní opora předmětu Elementární zpracování dat z ...Praktikum – elementární...

Vytvořil Jiri Safr 7.3.2017; aktualizováno 14.12.2017 1

Studijní opora předmětu Elementární zpracování dat z kvantitativního výzkumu

Úvod do analýzy kvantitativních dat v prostředí statistického software PSPP/ SPSS

Jiří Šafr

FHS UK Email: <jiri.safr(AT)seznam.cz>

Poslední aktualizace: 14. prosince 2017, verze 1.0

Vytvořeno 7. března. 2017, verze 0.1

Obsah Úvod: kvantitativní data a jejich záznam do datové matice ....................................................... 3

PSSP a SPSS – program pro statistickou analýzu dat ................................................................ 4

Prostředí programu PSPP/SPSS ................................................................................................. 5

Druhy „oken“ v PSPP/ SPSS ............................................................................................. 5 Data editor a datový soubor ............................................................................................... 6

Základní data management v PSPP/SPSS .................................................................................. 7

Vytvoření nové matice dat ................................................................................................. 7 Označování popisků proměnných .................................................................................... 10 Vkládání dat ..................................................................................................................... 11 Otevření již existujícího souboru dat ............................................................................... 12

Analýza dat (1): popisné statistiky, třídění dat 1.stupně .......................................................... 17

Popisné statistiky pomocí FREQUENCIES ..................................................................... 17 Grafy (1): třídění dat 1. stupně ................................................................................................. 19

Zadání grafů v příkazu Frequencies (sloupcový, koláčový a histogram) ........................ 19 Sloupcový graf a histogram .............................................................................................. 20

Technické rady pro práci v PSPP ............................................................................................. 25

Možnosti úprav výstupu (Output) z PSPP ........................................................................ 25 CSV – univerzální formát pro data .................................................................................. 28 Import CSV dat do PSPP ................................................................................................. 31

Syntax – ovládání pomocí příkazů (úvod) ............................................................................... 33

Analýza dat (2): Logika vytváření kontingenčních tabulek a jejich interpretace .................... 35

Prezentace a interpretace kontingenční tabulky (výzkumná otázka a hypotéza) ............. 35 Uspořádání v kontingenční tabulce .................................................................................. 38 Postup vytváření kontingenčních tabulek v PSPP (SPSS) ............................................... 40 Test dobré shody Chí kvadrát – (ne)závislost proměnných v kontingenční tabulce ........ 46 Znaménkové schéma – v kterých polích tabulky je jak silná souvislost? ........................ 47 Zadání kontingenční tabulky pomocí syntaxu PSPP/SPSS .............................................. 49

Tato studijní opora částečně vychází z dřívějšího textu pro FHS Návod na software PSPP/SPSS (část 1. – Úvod a část 2. – Kontingenční tabulky). Publikace vznikla jako součást řešení projektu Další profilování a inovování studijního programu na Katedře řízení a supervize v sociálních a zdravotnických organizacích v rámci institucionálního plánu FHS UK pro roky 2016-2018.

© Jiří Šafr 2017


Upozornění: Jedná se o studijní materiál pro kurz Praktikum - elementární zpracování dat z kvantitativního výzkumu (YMR13VOLI) vyučovaný na Katedře řízení a supervize FHS UK, který bude dále průběžně aktualizován. Cílem kurzu a tedy i této studijní opory je pomoci studentům (druhého ročníku) zpracovávat data pro výzkumné zprávy a své diplomové práce pomocí kvantitativní metodologie sociologického výzkumu. V jeho průběhu by se měli naučit na té nejjednodušší úrovni vytvářet a zpracovávat kvantitativní data (nejen) z vlastních výzkumných projektů. Výklad a praktické procvičování je zaměřeno na základní popisné statistiky a postupy k odhalení vztahů mezi proměnnými, tj. možnosti ověření platnosti hypotéz jednoduchým – deskriptivním způsobem (třídění dat 1. a 2. stupně). Předmětem výuky není inferenční statistika, tj. statistické testování hypotéz.

Text je členěn na dvě části. V první najdete úvod do prostředí programů PSPP a IBM-SPSS, základy data managementu (názvy proměnných, labelování, označování chybějících hodnot), nejzákladnější přístupy k třídění dat prvního stupně (popisné statistiky a grafy) a také technické rady specifické pro práci s PSPP. Na ní navazuje druhá část věnovaná vytváření tabulek třídění druhého stupně a interpretaci výsledků.

Před čtením tohoto textu, a tedy před prvním zapnutím počítače a spuštění programu PSPP anebo IBM-SPSS, laskavému čtenáři důrazně doporučuji přečíst si nejprve Studijní oporu předmětu Kvantitativní metody výzkumu v praxi. Ta vám objasní, co to vůbec obnáší „dělat sociálně-vědní výzkum“, tedy především co vše předchází tomu, než budete mít k dispozici data k analýze. Dozvíte se zde nejzákladnější principy, jak a hlavně proč ve výzkumu postupovat a také čeho se vyvarovat, zejména s ohledem na designování jednoduchých studií především v oblasti řízení a sociální práce/zdravotnictví. Zatím poslední verzi 07najdete na http://kmvp.wz.cz/KMVP_opora07.pdf Také doporučuji přečíst si nejprve prezentace k přednáškám KMVP, zejména tyto dvě:

Příklad postupu ověření platnosti hypotézy. Základní postupy explorační analýzy pomocí třídění dat 2. stupně. http://kmvp.wz.cz/KMVP_hypoteza_overeni_priklad.pptx

Výběry vzorků z populace, příprava dat, popisné statistiky a základní postup při ověřování hypotéz. http://kmvp.wz.cz/KMVP_4a_statistika.pptx Aktuální verze obou studijních textů spolu s powepointovými prezentacemi kurzů KMVP a Praktikum – elementární zpracování dat z kvantitativního výzkumu najdete na stránce http://kmvp.wz.cz . Data, která používám v následujících příkladech jsou dostupná na stránce http://metodykv.wz.cz kde také najdete podrobnější prezentace k analýze kvantitativních dat v prostředí programu IBM-SPSS.


Úvod:kvantitativnídataajejichzáznamdodatovématice Pokud jako metodu sběru dat používáme dotazník, a řekněme, že jsme zvolili přístup face-to-face rozhovor (tazatel se ptá respondenta) se záznamem do papírového archu – dotazníku, pak po provedení všech rozhovorů máme před sebou „hromadu dotazníků“. V zásadě máme dvě možnosti, jak s tímto datovým materiálem naložit a jak jej dále analyzovat: datovou matici (v elektronické podobě) si nevytvoříme a tak k analýze můžeme použít pouze metodu „čárkování“ (případně neustálého přeskupování na hromádky podle třídících znaků), k čemuž nám prakticky stačí tužka a papír případně kalkulačka (lepší je Excel či jiný tabulkový procesor). Touto možností se dále zabývat nebudeme, jednak protože je nespolehlivá a může být při vícenásobném třídění pekelně úmorná a také „data“ vlastně neexistují, není je možné sdílet, zálohovat a tedy ani archivovat. Druhou cestou, kterou se určitě vydáme, je pořídit ze zápisů v dotaznících elektronický záznam dat do datové matice.1 Ta má nejčastěji podobu, kterou ukazuje následující obrázek, kde ve sloupcích jsou proměnné a v řádcích případy, v našem případě respondenti. Ale mohly by to být také například různé organizace, proměnné ve sloupcích by pak představovaly kupříkladu jejich příjmy a výdaje za různé oblasti, počty klientů atd. Pokud máte data z jednoduchého výzkumu s využitím jejich sběru pomocí dotazníku, pak jeden datový řádek představuje jednoduše jeden dotazník, tedy jednoho respondenta.

Datová struktura ale může být složitější, a také ve výzkumu organizací často bývá. Někdy totiž v datech máme individuální případy (úroveň 1) sloučené do určitých přirozených klastrů (úroveň 2), které jsou v matici upořádány vždy pod sebou. Například provádíme výzkum zaměstnanců (1), kteří jsou z různých poboček firmy (2), analyzovat pak můžeme jedince – zaměstnance i organizační jednotky jako celky mezi sebou ale také obojí navzájem (o tomto uspořádání dat podrobněji v kapitole Úrovně měření, analytická jednotka a volba designu výzkumu, kde máme jednoduchý příklad takovéto víceúrovňové datové matice).

Výhoda záznamu dat do matice v elektronickém formátu spočívá v tom, že je lze jednoduše dále upravovat (transformovat proměnné, například slučovat hodnoty nebo vytvářet znaky nové na základě kombinací jiných původních znaků) a také úsporně archivovat a zálohovat. Jak datovou matici vytvořit, data do ní vložit a dále upravovat si povíme v další části, nejprve se ale seznámíme se dvěma statistickými programy, které nám v tom pomohou a ve kterých budeme pracovat: PSPP resp. IBM-SPSS, což je pro naše základní analýzy a úpravy dat vlastně jeden a ten samý program.

1 Tím úmyslně pomíjím mnohem přívětivější situaci, kdy záznam dotazníku probíhá pomocí nějakého elektronického způsobu zápisu, např. při vyplňování on-line dotazníku samotným respondentem, díky němuž datová matice vzniká víceméně automaticky (popravdě někdy méně než více…, tím mám na mysli různé problémy se způsobem záznamu a konverzí formátu).


Obrázek 1. Datová matice (2-way data: případy x proměnné)

KMVP část 1 9

ProměnnáPřípady

(např. respondenti) Hodnotyproměnné

Datová matice

PSSPaSPSS–programprostatistickouanalýzudatPSSP je program určený pro statistickou analýzu kvantitativních dat, který částečně nahrazuje profesionální programový balík IBM SPSS Statistics.2 Vytvořen byl pod GNU General Public License, tudíž je distribuovaný zdarma. Datové formáty, provedení prostředí programu a hlavně příkazový řádek (syntax) PSPP je kompatibilní s SPSS.

Hlavní stránku projektu s podrobnými návody a popisem naleznete na http://www.gnu.org/software/pspp . Zde jsou k dispozici ale pouze jen verze instalací pro Linux a nebo starší verze. Download neustále aktualizovaných verzí pro Windows naleznete na http://pspp.awardspace.com . Doporučuji vždy se čas od času se podívat po nové verzi (k 3/3/2017 byla poslední verze 10.4). Nové verze včetně opravných balíčků najdete také na https://sourceforge.net/projects/pspp4windows/files/2010-04-14/pspp-master-single-user-20100414-Setup.exe/download nebo http://ufpr.dl.sourceforge.net/project/pspp4windows/2010-04-14/pspp-master-20100414-Setup.exe

Ve verzi 10.4 (z 2016/09/27) byly k dispozici: - transformace a management dat (rekodování, agregování, spojování, převracení, vážení atd.) - popisné statistiky včetně grafů (histogram, vousaté krabičky, Q-Q plot), - kontingenční tabulky s míry asociace (korelace Pearson, Spearman, TauB, CC), - testování průměrů (t-testy a jednoduchá analýza rozptylu OneWayAnova), - Pearsonova korelace (korelační matice), - Klastrová analýza pomocí metody K-means cluster, - analýza položkové reliability (Cronbachovo Alpha, Half split), - faktorová analýza resp. analýza hlavních komponent (PCA, PAF), - lineární regrese (OLS), binární logistická regrese, - obecný lineární model (GLM) resp. vícerozměrná analýza rozptylu, - neparametrické testy, - prediktivní ROC křivky. 2 SPSS znamená Statistical Package for the Social Sciences. Tento statistický softwarový „balík“ má dlouhou historii spadající na počátek 70. let minulého století. Dále v textu pro tento program, prodávaný dnes pod obchodním názvem „IBM SPSS Statistics“, používám pro jednoduchost pouze tuto původní zkratku SPSS.

Vytvořil Jir

Dodejmzákladnpokročidnes jižCROSSpředevšverze ch

Prostř

DruhyV progr

1. D(

2. Ofpej

3. SpplPp

Data ed

Na rozdoutputů tak v PSnapříklamožné b„Windo„Windo

ri Safr 7.3.2017; a

me, že profesní postupy, tlejší grafy.

ž PSPP dostaSTABS, korším spolehlihyb postupn

ředíprog

y „oken“ vramu PSPP Data editor(datové souOutput – vformát pro přičemž bohexportu do je alespoň CSyntax– edpoužívat, popoužívat nalze ji kdykoPSPP a SPSpochopiteln

ditor

díl od SPSS,ů a mezi nimSPP to platí ad jeden synbuď pomoc

ows“ se zobrow“).

aktualizováno 14

sionální protak určitě v Pro základnačuje (příka

relace), otázivost (progrně odstraňuj

gramuPS

v PSPP/ S(i SPSS) prr – samotná

ubory mají kvýstupy anaoutputy a tahužel ztratítformátu, k d

CSV) mezi nditor přímýokud progra

aučíme, protoliv kontroloSS (vše ze sně neplatí).

, kde můžetmi přepínat,

jen u okna ntax pro úprí standardnírazí všechn

.12.2017

ogram IBM-něm najdetení data manazy FREQUzkou je ale uam může nejí). Proto si

SPP/SPSS

SPSS racujeme se á data a jejickoncovku „*alýz (zde je ak output lzte některé fodispozici jenimi ale nen

ých příkazůam budete otože je to šikovat a zopaksyntaxu v PS

Out

te mít u každokonce lzesyntaxu pro

ravu dat a dí klávesové a aktuálně o

-SPSS Statie mnohem l

nagement a jUENCIES, Duživatelská ečekaně „spPSPP průb

S

e třemi „oknch managem*.sav“) zatím nejvě

ze zatím uloformátové ve „pdf, txt, hní …) ů (koncovkaovládat pomkovný pomkovat mj. nSPP by měl

tput

ždého typu oe mít otevřeo zápis přík

druhý pro sa zkratky levotevřená ok

istics toho ulepší (vizuájednoduchoDESCRIPTIpřívětivost

padnout“, alěžně aktual

ny“: ment, jde o h

ětší nevýhožit jen jako lastnosti. K

htm, odt“ a d

a souborů jemocí menu amocník: přehna jiných datlo fungovat

okna otevřeeno i několikazového řádamotné analvý Alt+Tab kna (to platí

umí mnohemálně i flexibiu exploračnIVES, MEA(pokud jde le neustále aizujte.

hlavní okno

da PSPP, ktexport do n

Koncovka padalší; MS w

e „*.sps“). Ta klikání myhledně zaznatech a také tv SPSS, na

Syntax e

no více okek datových dku (můžeteýzy). Přepínnebo přes mi pro SPSS

m více. Pokuilitou úpravní analýzu vANS, EXPLo výstupy)

aktualizova

o programu

teré nemá vnějakého forak závisí na word ani Ex

Ten nemusítyší. My se hamenává vatvoří most m

aopak to ale

editor

en (např. vícsouborů so

te tak mít otnaní mezi omenu v rubr

S, kde se to j

5

ud jde o v) a však LORE,

a né nové

vlastní rmátu, volbě

cel (zde

te vůbec ho ale aši práci, mezi

ce oučasně), tevřený okny je rice jmenuje

Vytvořil Jir

Data eData ed

1. Data vkládám

2. Varia Zde můznaků, lúroveň mRovněž nebo vloV tomtomusímemůžemepak ve sodpověd

ri Safr 7.3.2017; a

editor a dditor má dv

view – zdeme data

able view

ůžeme upravlabel-pojmeměření – M lze při oznožit novou (o okně si věe vepsat do se navíc i olasloupcích obdi z dotazní

aktualizováno 14

atový souvě záložky:

e jsou v řádc

vovat paramenování, lab

Measure. ačení prom(prázdnou).ětšinou nejpsloupce Namabelovat jakbjeví jménaíků.

.12.2017

ubor

cích případy

metry proměbely kategor

ěnné (řádku. rve připravíme názvy pk proměnné a proměnnýc

y, ve sloupc

ěnných: názerií hodnot, c

u) pomocí p

íme datovouproměnných

tak jejich hch a již můž

cích proměn

ev – Name,chybějící ho

pravého tlač

u matici proh (podle naphodnoty (vizžeme vklád

nné. Jde o da

typ, zobrazodnoty – mis

ítka myši pr

o nová data.př. otázek v z dále). V oat data – př

atovou mat

zená šířka-pssing, zarov

roměnnou s

. Minimálnědotazníku),

okně Data viřepisovat na

6

ici, zde

počet vnání a

smazat

ě , iew se

apříklad

Vytvořil Jir

Základ

Vytvoř

Otevřete

Pokud m

ri Safr 7.3.2017; a

dnídata

ření nové

e program P

máte již otev

aktualizováno 14

managem

é matice d

PSPP (nebo

vřena jiná d

.12.2017

mentvP

dat

o SPSS). V m

data, tak se u

SPP/SPS

menu klikně

ujistěte, že j

S

ěte na File →

jsou uložen

→ New → D

na, protože t

Data.

ty jinak zmi

7

izí.

Vytvořil Jir

V záložZde je tv dotazn

Poté co přednasstringovpísmen Pozor: učíslo ponumericStringovčasto dokterému(ale to vVolbu zkliknutímísto (p

Názvy pale to pastejně anotázku 1 Poté co nezadát

ri Safr 7.3.2017; a

žce Variableto ID – znakníku), q2, v

vždy napíšstavené paravý znak. Je(slova), nik

uvědomte siouze označucký (kardinávé proměnnopředu neznu bychom pv některých záznamu datím v políčkupřednastave

proměnnýcak neotevřeni nedovolí1).

vytvoříte dte název, tak

aktualizováno 14

e View kliknk označujícíek, pohlavi

ete nový náametry. Ty jeho příkladekoliv jako číi, že v datec

uje nějakou kální či ordinné používámnáme přesnýak mohli přjiných progt pomocí tyu Type u př

eného) typu

ch (tzv. VAete v SPSS ví). Název vž

datovou matk se uloží po

.12.2017

něte do první číslo dotaz atd.

ázev proměnje někdy třeem je zde príslo. ch za čísly vkategorii (nnální) znak vme nejčastějý kódový klřiřadit Valuegramech pak

ypu stringovříslušné promNumeric vy

AR NAME) ve starších vždy musí za

tici, tak si jí od automati

ního pole Nzníku. Násle

nné, tak se aeba upravit, roměnná me

v kategoriícnapříklad pov pravém sli pro záznamlíč, ve kterée label. Zvyk zlobí).

vé proměnnéměnné na šybereme St

dělejte pouverzích než

ačínat písm

í uložte. Přípickým názv

Name a zadeeduje promě

automatickyzejména po

esto$, která

ch mohou bohlaví 1=mulova smyslum odpovědí

ém bychom ykem bývá o

é (jsou zde iedivý čtverring.

uze na 8 zna11), bez dienem, niko

pona pro davem Untitled

ejte název pěnná q1 (na

y doplní jejíokud půjde obude vklád

být i nominuž, 2 =žena)u! í na otevřenpřiřadili kóoznačovat je

i jiné typy zeček. Objev

aků (i když akritiky, bliv číslem (

atové soubord.sav. Při vk

první proměapř. první ot

í vlastnosti o nomináln

dána jako ře

nální znaky), tzn. nejde

né otázky, pód=číslo, ke e pomocí zn

záznamu) ozví se menu,

PSSPP umbez mezer (t(odtud q1 pr

ory je „sav“.kládání dat

8

nné. tázka

na ní – tzv. etězec

y, kdy e o

protože

naku $

značíme kde

mí i více, to vám ro

Pokud pak,

Vytvořil Jir

ukládejPrůběžnspadnou

ri Safr 7.3.2017; a

jte průběžnné ukládání ut.

aktualizováno 14

ně, zamezítedat platí v P

.12.2017

e ztrátě časuPSPP dvojn

u, pokud vánásobně, pro

ám program otože progra

spadne (nebam je někdy

ebo vypnou y nestabilní

9

proud). a může

Vytvořil Jir

OznačKrátká r

jméno p

popis pr

popis ka

Jméno puniverzáPopis prLze je zautomat Zadání lpopisu p

V přípamenu, kkliknoukliknouPoznámkkrajní, u p

ri Safr 7.3.2017; a

čování porekapitulace

proměnné

roměnné

ategorií

proměnné jeální název Vroměnné a j

zadat i pozdticky objevo

labelů se prproměnné p

dě popis kakde napíšemut na tlačítkout na Apply.ka: Olabelovanpětibodové šk

aktualizováno 14

opisků proe: v PSSP /

VAR NA

VAR LA

VAL LA

e povinné, pVAR0001 ajejích kateg

ději po pořízovat ve výst

rovádí v přípíšeme přím

ategorií (Vame hodnotu o Add. Změ. Smazání pné nemusí býtkály např. 1=sp

.12.2017

oměnnýcSPSS rozliš

AME m

ABEL Dzv

ABEL Pv

pokud ho neatd.). gorií je už pazení dat. Umtupech.

slušném slomo do kolonk

lues) se klik- Value, napěnit popis lzpopisu kateg

všechny katepokojen 5=ne

ch šujeme tři in

max. 8 znak

Delší popis znění otázkyvýstupech (n

Popis kategovýstupech (n

ezadáte nem

ak nepovinnmožní vám l

oupci nebo lky Label.

kne na šedivpř. 1 a vyplnze kliknutímgorie provedegorie hodnot espokojen).

nformace o

ků bez diakr

znaku, lze sy v dotazníknapř. Pohlav

orií znaku, knapř. 1= mu

můžete dál (v

ný, záleží nalepší orienta

lépe pomoc

vý čtverečeníme Value

m na příslušndeme pomoznaku (u ordin

proměnnýc

ritiky (např.

s diakritikouku, který se ví responde

které se buduž, 2 = žena

v SPSS se s

a vás, zda siaci v datech

í syntaxu (o

k v příslušne label, napřnou kategorcí Remove.nálních znaků

ch:

pohlavi)

u, např. (zkrbude objev

enta)

dou objevova)

sám vygene

i je zadáte nh a bude se

o tom pozdě

né buňce a oř. muž. Pak rii, pak je tř. ů často stačí je

10

rácené) vovat ve

vat ve

eruje

nebo ne.

ěji). U

objeví se je třeba řeba

en ty

Vytvořil Jir

Pokud banalýzuproměnnNapříkljejich ka

Vkládá Poté co samotnýv jednomřádku) pstringov

Podobnbloku a

Soubor Poznámk

ri Safr 7.3.2017; a

budete data u dat, např. Ené vždy je (ad v Exceluategorie).

ání dat

jste si zadaých dat (tedm řádku vkpro jeden přvých proměn

ně jako ve spmenu myši

r s daty si p

ka: data lze tak

aktualizováno 14

přenášet doExcel, tak la(musí zůstatu by to vypa

ali datovou mdy nejčastějikládáme hodřípad – nejčnných vepis

právě proměi pravým tla

průběžně uk

ké vložit ze sy

.12.2017

o jiného proabely (promt). adalo takto

matici (neboi dotazníků)dnoty proměčastěji jde o sujeme znak

ěnných, řádačítkem a C

kládáme!

yntax, ale o tom

ogramu, kterměnných i je

(nejsou tam

o alespoň je) a to v záloěnných (jejijeden dotazky (slova).

dek – jeden dClear.

m později.

rý není specejich katego

m labely ani

ejí část), můožce Data Vich jména vzník od jedn

dotazník mů

cializovaný orií) se ztratí

pro název p

ůžete přistouView. Postup

idíme v prvnoho respon

ůžeme vym

na statistickí, ale jméno

proměnné a

upit k ukládpně do buně

vním šedivéndenta. U

mazat označe

11

kou o

ani pro

dání ěk m

ením do

Vytvořil Jir

OtevřeNejčastěnahrajem

Zadáme

Alternatjsou datnenese ipodrobn

Nyní motevřena

ri Safr 7.3.2017; a

ení již exiěji máme dame takto, v

e cestu k sou

tivně můžemta vytvořenainformace oně popsán v

áte data ze a. Také je m

aktualizováno 14

istujícíhoata ve formmenu File →

uboru dat

me importoa v nějakemo labelech. Pv kapitole Im

svého vlastnmáte vícemé

.12.2017

o souboruátu SPSS (p→ Open

vat též soubm jiném progPoužijeme vmport CSV

ního výzkuméně již „olab

u dat přípona „sav

bory v univgramu (napřv menu Impdat do PSPP

mu uloženabelovaná“, t

v“). Již dřív

erzálním foř. Excelu). Tport DelimiP.

a nebo přípatj. máte přiř

ve vytvořený

ormátu CSVTento formáited Text D

adně z nějakřazeny popi

ý soubor da

V (viz dále), át v sobě vě

Data. Postup

kého jiného isky u názvů

12

at

kdy ětšinou p je

zdroje ů


proměnných (VARIABLE LABEL), to bývá nejčastěji zjednodušené znění otázek z dotazníku a také máte popisky u hodnot znaků (například názvy kategorií odpovědí). Pokud labely ještě nemáte, nevadí, dají se doplnit průběžně později, hlavní je v datech se vyznat (co která proměnná a její hodnota znamená), k čemuž poslouží i separátně vytvořený codebook – dokumentace k datům (ten se ale dá jednoduše během vteřiny vytvořit z již olabelovaných dat).

Uvědomte si, že jde zatím jen o „hrubá – nevyčištěná“ data. Než přikročíte k jejich věcné analýze, tak nejprve musíte data zkontrolovat, což většinou znamená, že je v prvním kroku bude třeba takzvaně „vyčistit“ a případně i nějak ještě upravit, například vytvořit umělé – syntetické proměnné. (u převzatých dat to pochopitelně tak být nemusí, ale zkontrolovat je musíme stejně vždycky).

Prvním krokem při čištění dat je zjištění jaké se v datech objevuje rozmezí hodnot u všech znaků (například odpovídají možným hodnotám v dotazníku?). Pokud se jedná o nějakou systematickou chybu či výpadek při samotném zadávání dat, bude třeba data manuálně v data editoru nejprve opravit. I když jsou hodnoty „v pořádku“, přesto nemusí zcela odpovídat hodnotám, které budeme chtít analyzovat, tj. platné hodnoty. Příkladem jsou odpovědi „Nevím“ nebo „Neodpověděl“. Takovéto hodnoty znaku, které nebudeme dále chtít věcně analyzovat, ale přesto je chceme v datech zachovat, můžeme v datech označit jako chybějící, tj. „missing“. (A také bychom kvalitu dat v tomto ohledu měli nejprve zkontrolovat; o tom „kdo nám neodpovídá“ a zda to má nějaké důsledky pro reprezentativitu výsledků si ale povíme na jiném místě).

Vytvořil Jir

OznačChybějísoučástíkterá sežádnou chybějí

Program(SYMISvýstupejejich záurčité k

U uživanebo „nmimo rouživatelodpovědpak figukardinálprůměruPoznámkchybějící responden

V data esloupci z analýza jednu

Optimál Hodnoty efektivněvyfiltrujepůvodní p

ri Safr 7.3.2017; a

čení chybící hodnota í běžné anal

e vytvoří authodnotu (p

ící hodnotu

my PSPP a SSS) definovech samostaávislost na jategorie res

atelských mineví“, pro něozpětí platnlsky definovdět (pro znaurovat v analní znak (či u či směrodka: správně by hodnota, SYSnt „neodpověd

editoru na zMissing. O

z vynechat, diskrétní ho

lní je zadáv

Missing Valuě selektovat ureme respondenproměnnou.

aktualizováno 14

bějících h(missing valýzy. Rozlištomaticky, políčko datec

u (MISSING

SPSS umožvat i tři hodtně (i původjiných znacspondentů).

issing valueěž je zvykem

ných kategorvaný missinaky s více číalýzách, resordinální š

datné odchylychom měli rozSMIS, která mděl“ (např. 9).

záložce VariObjeví se me

alternativněodnotu).

vat chybějící

ues si můžemerčitý rozsah kanty mladší než

.12.2017

odnot – malue) je takošujeme systpokud k proch je prázdnG VALUE)

žňují vedle snoty uživatdním rozlišeích (např. z

es se nejčastm označovarií (odpověd

ng představoíslicemi by p. budou (nkálu), nebulky. zlišovat mezi

mohla vznikno. V praxi se vš

iable View enu, kde můě lze zadat d

í hodnoty p

e také průběžnategorií znakuž 21 let, aniž b

missing vová hodnotatémově defioměnné nevné, rsp. je v), kdy označ

systémově dtelské, což jením a labe

zda na určito

těji jedná o at je pomocídí). Napříklovat hodnotto bylo, nap

např. u frekvudou tyto ho

„prázdným pout i chybou pšak toto rozliš

provedemeůžeme vyjmdva rozsahy

pomocí Synt

ně pro určité au. Např. označbychom je vym

values

a znaku, u kinovanou cvložíme u da

něm tečka)číme určité

definovanýcje výhodné

elem), což nou otázku od

kategorie oí hodnot, ktlad u čtyřbota 8 = neví apř. u věku 9vencí) zobraodnoty zahrn

olíčkem“ v dapři ukládání dašní většinou ne

označení umenovat až 3y (do/od nej

taxu (bude p

analýzy „zapínčením hodnot nmazaly, či jina

které nechcehybějící hoaného přípa) a uživatelshodnoty za

ch chybějící, protože seám umožňudmítají či n

odpovědí jakteré jsou již odové škály a 9 = neodp999). Tyto hazeny oddělnuty napříkl

atech (= systémat) a určitou hoeprovádí.

určité hodno3 hodnoty, knižší a/nebo

popsáno v d

nat/vypínat“. Lnižších než 21ak nenávratně

eme, aby byodnotu (SYadu-respondsky definov

a neplatné.

ích hodnot e objevují veuje kontroloneumí odpov

ko „neodpona první posouhlasu m

pověděl/odmhodnoty nebleně. Jde-lilad do výpo

mově definovodnotou ozna

oty za missinkteré chcemo nejvyšší h

další části).

Lze tak napřík1 u proměnné ě transformova

14

yla YMISS), denta vanou

e ovat vědět

ověděl“ ohled

může mítl budou i o očtu

vaná čující, že

ng ve me hodnoty

klad věk,

aly

Vytvořil Jir

Ovládá

Krom stvyužívaumožňuměření, název vpoužít v r

Standarcož bývv dotaznstabilněnajedeteznovu).

ri Safr 7.3.2017; a

ání progr

tandardní ceat zkratek pouje: přesun n

hycbějící hvloží do syntrozepsaném sy

rdně je v PSvá přehledněníku např., qě nastavit, ale na jakoukTo platí i p

aktualizováno 14

ramu a se

esty skrze momocí ikonena danou prhodnoty (mitaxu (bohužeyntaxu, musíte

PP bohuželější (protožeq1, q2, …).le na jménaoliv proměn

pro okýnka p

.12.2017

eznam po

menu (nápisek. Napříklaroměnnou vissingy) a lael na rozdíl ode si jí tam ješt

l nastaveno e nejčastěji Sice PSPP proměnnýc

nnou (bohužpři analýzác

oměných

sy v šedivémad velmi už

v datech (Juabely. Také d SPSS, do poktě zkopírovat

zobrazení Vproměnné o na rozdíl och lze přepnžel při otevch v menu A

m pruhu: Filžitečná je fuump), ukazu

když kliknekaždé novéhoa tento nový s

Variable laboznačujeme

od SPSS nemnout pomocírání okna tAnalyze.

le / Edit / Vunkce Variabuje její paramete na Paste syntaxu, takž

syntax zavřít).

bels, nikolive podle číslamá Options,í pravého tlto musíte ud

View / Data bles, která

ametry: úrove, tak vám jže pokud jí ch.

v Variable na otázky , kde by se tlačítka myšidělat pokažd

15

atd.) lze

veň ejí

hcete

names,

to dalo i, když dé

Vytvořil Jir

V datovkategori

Poznám

ri Safr 7.3.2017; a

vém editoru ií a nebo po

mka: Proměn

aktualizováno 14

– v záložceopisků → ik

nná mesto$

.12.2017

e Data Viewkonka Value

je stringová

w si můžete e Labels.

á proto se z

přepnout m

obrazují jm

mezi zobraze

ména města j

ením hodno

jako hodnot

16

ot čísel

ty.

Vytvořil Jir

Analý

Popisn 1. FREQV menu

Ze seznproměnnv analýzVytvoři

Vidíme

ri Safr 7.3.2017; a

ýzadat(1

né statist

QUENCIEu: Analyze →

namu proměných) do okze. Přednastit můžeme t

rozložení k

aktualizováno 14

1):popisn

tiky pomo

ES Třídění p→ Descripti

ěnných (okýkýnka Varitaveno mámtaké grafy (v

kategorie od

.12.2017

néstatist

ocí FREQ

prvního stuive statistic

ýnko vlevo) able(s) napr

me průměr, sviz dále).

dpovědí pro

tiky,třídě

QUENCIES

upně: jednos → Freque

přenést pomravo. Ve Stsměrodatno

proměnnou

ěnídat1

S

oduchá tabencies

mocí šipky tatistics lze ou odchylku

u spok_dnes

.stupně

bulka frekv

proměnnounastavit, co

u, minimum

s (Jak jste d

vencí

u (či více o chceme

m, maximum

dnes spokoje

17

m.

en/a?):


Value = číslo kategorie Frequency = absolutní četnost Percent = procenta ze všech případů (tj. včetně případných missingů) Valid percent = procenta platných odpovědí, kdy jsou missingy vyřazeny (je třeba si je ale nejprve označit!) Cum percent = kumulativní procento (součet % kategorií nad danou hodnotou) Total = celkem Druhá tabulka uvádí souhrnné statistky: počet platných a chybějících hodnot (Valid, Missing) průměrnou hodnotu Mean (což dává smysl pouze u kardinálních znaků; případně i ordinálních, jako je tomu zde), směrodatnou odchylku průměru Std Dev („rozptýlení“ odpovědí od průměru) a v souboru se vyskytující minimální a maximální hodnotu (Minimum, Maximum). Jak s výsledky v okně výstupů - Outputu dále pracovat najdete v kapitole Možnosti úprav výstupu (Output) z PSPP. Třídění dat druhého stupně, tj. vzájemné souvislosti dvou (kategoriálních) znaků se věnuje kapitola Logika vytváření kontingenčních tabulek a jejich interpretace.

Vytvořil Jir

Grafy

Zadán V předc

Ve výst

ri Safr 7.3.2017; a

(1):třídě

ní grafů v

cházejícím p

tupu pak má

aktualizováno 14

ěnídat1

příkazu F

příkladu lze

áme i graf/y

.12.2017

.stupně

Frequenc

e zadat také

y:

cies (slou

grafy v sek

upcový, k

kci Charts,

oláčový a

např. Histog

a histogra

gram s proc

19

am)

centy.

Vytvořil Jir

Pozor Hgraf) můHistogra Označit

výslede

Sloupc HistogrHistograprocentaznaku (p

Zdroj: S

ri Safr 7.3.2017; a

Histogram uůže uvádět jamem a Slo

t si lze i zob

k pak obsah

cový graf

ram (graf znam je sloupa!). Zobrazuproto ho ně

Studenti HiS

aktualizováno 14

ukazuje frekjak počet př

oupcovým g

brazení chyb

huje i kateg

f a histog

názorňující pcový graf, vuje distribuckdy doplňuj

So-Kombi L

.12.2017

kvence, zatířípadů tak i grafem v %)

bějících hod

orii „neví/n

gram

četnost) v němž každci kategorií

ujeme o distr

LS 2010

ímco Pie chprocenta (z

)

dnot (missin

neodpověděl

dé kategori numerickéribuční křiv

hart (koláčovzadání Perce

ngs): Includ

l“ definovan

i přiřadíme ho- kardiná

vku normáln

vý graf) a Bentages). (v

de slices for

nou jako mi

její četnost álního (neboního rozděle

Barchart (sloviz dále rozd

missing va

issing:

t (nejde tedyo ordinálníhení).

20

oupcový díl mezi

lues.

y o ho)


Frequency na ose Y znázorňuje počet případů v dané kategorii (absolutní četnost tedy nikoliv procenta), např. v kategorii 1-velmi nespokojen máme dva respondenty, zatímco v kategorii 3-ani/ani jsou čtyři. Sloupcový graf v % (Bar Chart) Sloupcový graf pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny). Pokud bychom ho zadali v absolutních četnostech, dostaneme vlastně histogram. Sloupcový graf v procentech (Bar chart) není v PSPP dosud implementován (vyrobeno v SPSS).

Zdroj: Studenti HiSo-Kombi LS 2010


Porovnání různých druhů grafů. Bar chart v %

Bar chart v absolutních četnostech

Koláčový graf v % (Pie Chart)

Histogram

Zdroj: Studenti HiSo-Kombi LS 2010 Obecně platí, že histogram používáme pro zobrazování distribuce kategorií numerického (kardinálního) znaku, který může mít větší počet hodnot, jakým je kupříkladu věk (viz ukázka z výzkumu CVVM 2007/04), zatímco Sloupcový graf v % (nebo koláčový) používáme pro zobrazení menšího počtu kategorií, které nemusí být hierarchicky (ordinálně) uspořádány (nominální znaky). Viz sloupcový graf pro sloučený věk do 4 kategorií.


Graf. Histogram pro věk respondenta.

Zdroj: CVVM 2007/04 Všimněte si, že v histogramu jsou sloupce na sebe těsně navázány – zobrazujeme numerické hodnoty znaku, které plynule vzrůstají a navazují na sebe. Naproti tomu ve sloupcovém grafu v % ukazujeme nominální (či ordinální) znak, kde bychom také mohli kategorie mezi sebou případně i proházet. Graf. Sloupcový graf pro věkové kategorie (%)

Zdroj: CVVM 2007/04 Dále platí, že sloupcový graf v % je vhodný pro porovnání podílů mezi různými skupinami, což histogram neumožňuje, protože záleží na tom, kolik případů je v dané kategorii, pro níž frekvence třídíme. Příkladem budiž věkové kategorie a pohlaví respondenta.


Graf. Sloupcový graf pro věkové kategorie podle pohlaví respondenta (%)

Zdroj: CVVM 2007/04 O třídění dat druhého stupně si povíme více v druhé části Opory.

Vytvořil Jir

Techn

MožnoNevýhoupravovdo pdf (v tabulkvkládat (označeuloží jenv počítaWordu vvšeho) avýsledk

V SPSSsamostaeditor), (*.spv) a vkládaextrémnSpecial Vložit jobrázkůa zabíra V PSPP

3 Pozor zvvybírat je

ri Safr 7.3.2017; a

nickérad

osti úpravodou PSPP jvat. Je třeba(přesný obrakovém formpřímo do M

ení je krkolon jako obrázači (nejčastěvypíše cestua pak Ctrl+C

ků (nejprve n

S je to vše matné objektyzkopírovat a také expoat jako vektně malé (klia zakliknětako a vyberů určených pají moc míst

P výstup ulo

volit nejprve Sen některé tabu

aktualizováno 14

dyproprá

v výstupuje na rozdíl a nejprve celaz z PSPP),

mátu a lze hoMS Wordu (omné, přes mzky (ve forměji někde jaku, kde obrázC (kopírovana něj klikn

mnohem jedny, které můžsi můžete j

ortovat mj. dtorovou grafikněte na obte „Metafilerte jeden z tpro fotografta.

ožíme takto:

Select All je nulky či grafy.

.12.2017

ácivPSP

u (Outputod SPSS, žlý výstup ul txt, htm. V

o poté otevř(od verze PSmenu takto:mátu png) dko: users / jzky najdeteat), ale je třenout).

noduší a kožete dál upraen vybrané

do Excelu pfiku, která z

bjekt 1x a pre (WMF, EMtěchto vektofie jako jsou

: File → Ex

nezbytné, jinak

PP

t) z PSPPže nemůžeteložit a teprv

Vhodný je fořít i v MS WSPP 10). Bo: Edit / Seledo velmi divméno uživa). Lze použeba být v O

omfortnější.avovat (dvavýstupy a c

při zachovánzachovává mravým tlačítMF)“, poté porových formu jpg, png s

xport, pak za

k se nic nezko

e tabulku či ve ten pak lzormát htm, p

Wordu. Takéohužel to lzect All a pakvného a skoatele / temp,žívat i kláveutputu v lev

Tabulky a akrát na něj celé to lze uní formátovámaximální otkem vyvolpři vkládánímátů). Vyhntejně jako b

adat název s

opíruje. Takže

jiné výstupze upravit. Uprotože zaché již lze výste jen jako c

k Copy)3 a noro nedohled, naštěstí váesové zkratkvém podokn

grafy jsou vklikněte a o

uložit ve vlaání. Navíc gostrost obraejte menu, zí např. do Mněte se, pok

bitmapového

souboru a je

e nelze jako v

py v okně přUkládat můhovává tabutup i kopíro

celý výstup navíc grafy datelného mám to při vloky Ctrl+A (ně se seznam

v Outputu otevře se přastním formgrafy lze koazu a obrázkzvolte: Cop

MS Wordu dkud to lze, fo bmp, jsou

eho formát.

SPSS selektiv

25

římo ůžeme ulky ovat a

se nám místa ožení do (výběr mem

íslušný mátu opírovat ky jsou py dejte formátů u neostré

vně

Vytvořil Jir

Pozor: jsouboruWindow ukázka

ukázka

A při ul

Poznámk

ri Safr 7.3.2017; a

je možné, žeu. Tu je pak ws.

outputu v P

outputu v T

ložení do fo

ka: jak vidno, P

aktualizováno 14

e po uložentřeba ručně

PDF

TXT

ormátu htm t

PSPP v htm n

.12.2017

ní v názvu soě zadat-změ

to vypadá ta

nezvládá zcela

ouboru buděnit, např. ve

akto:

a českou diakr

e chybět koe WinComa

ritiku. Záleží a

oncovka oznanderu nebo

ale na verzi če

načující typ o v Průzkum

eštiny ve Wind

26

mníkovi

dows.

Vytvořil Jir

Tabulkuformátuve Word Tabulk

Od

Velmi n

Nespok

Ani spk

Spokoj

Velmi s

Neví/ne

Spok

N

Průměr

Směr. o

Minimu

Maxim Výsledk

ri Safr 7.3.2017; a

u pak lze zku otevřenéhodu):

ka 1. Odpov

dpovědi

nespokojen

kojen

k./ani nesp

en

spokojen

eodpověl/a

kojenost:

Platn Miss

r

odch.

um

um

ky ve formá

aktualizováno 14

kopírovat doo v interneto

vědi na otáz

Hodnot

n

pk.

a

Celkem

dnes

né 14

sing 1

3,2

1,4

1,0

5,0

átu htm a cs

.12.2017

o Wordu a tovém prohl

zku „Jak js

ta Počet

1 2

2 2

3 4

4 3

5 3

9 1

m 15 1

v lze otevír

tam jí upravlížeči, ale m

ste dnes po

% Pl

13,3

13,3

26,7

20,0

20,0

6,7

100,0 %

rat a následn

vit, napříklamůžete také c

okojen?“, p

latná % K

14,3

14,3

28,6

21,4

21,4-

100,0 %

ně upravova

ad takto (zkocelý soubor

rocenta.

Kumulativn

1

2

5

7

10

at v Excelu.

opírováno zr htm otevří

ní %

14,3

28,6

57,1

78,6

00,0

27

z htm t rovnou

Vytvořil Jir

Poznám

CSV –Formátpro výmPoužít hZejmén Problémčárkou vstředníkv buňceExistují 1 . V Exčárkami

ri Safr 7.3.2017; a

mka: viz násl

– univerzát CSV (Com

měnu tabulkho můžete taa pak pro im

m je, že v čev češtině od

ky). Aby se e ještě navící dvě řešení

xcelu při otvi):

aktualizováno 14

ledující osv

ální formámma-separakových dat, kaké pro přenmport dat z

eské verzi Eddělujeme dodlišila des

c uvozovky jak CSV z

vírání zadat

.12.2017

větlení, jak f

át pro datated values)kdy hodnotynos dat mezonline dota

Excelu se stadesetinné mísetinná hodn(více na httPSPP otevř

t jako Odděl

funguje form

ta je jednoduc

ty jsou oddězi různými pazníků (např

andardně poísto. PSPP anota od sloutp://cs.wikipřít v Excelu

lovač čárku

mát CSV.

chý univerzělené čárkamprogramy: nř. www.vyp

oužívají mísale generujeupce používpedia.org/w.

u, tj. označit

zální soubormi. např. PSPP plnto.cz)

sto čárek stře CSV s čárvají se pro o

wiki/CSV).

t, že sloupce

rový formát

/ SPSSP ↔

ředníky, to prkami (SPSSoznačení čís

e budou odd

28

t určený

↔ Excel.

protože S umí se el/údajů

děleny

Vytvořil Jir

výsledk

ri Safr 7.3.2017; a

kem je pak p

aktualizováno 14

přiřazení ho

.12.2017

dnot do slouupců

29

Vytvořil Jir

2. Nebo(čárka)

Jenomždesetinn

Při nahrpokud b

ri Safr 7.3.2017; a

o otevřít CSVnahradit zn

e pak je třebná místa (po

razování je by v labelec

aktualizováno 14

V soubor nenakem „;“ (s

ba ještě v Eomocí Ctr+H

třeba hlídatch byly někd

.12.2017

ejprve v napstředník).

Excelu naradH).

t, zda se někde použity č

př. Poznámk

dit všechny

kde znaky nčárky).

kovém blok

středníky z

nezměnily n

ku nebo Wo

ase zpátky n

echtěným z

ordu a znak

na čárky od

způsobem (n

30

„,“

ddělující

např.

Vytvořil Jir

ImportFormát labely je

Musímecontain

Následupoužít lzv ukázcnavíc ozoddělov

ri Safr 7.3.2017; a

t CSV datCSV se pouen názvy pr

e zadat, zda ns variable

uje zadání oze i jiné zna

ce datové maznačeny uvovače sloupců

aktualizováno 14

t do PSPPužívá přederoměnných)

první řádeknames a so

oddělovače saky (např. čatice Fieldsozovkami (ců; viz výše)

.12.2017

P evším pro im).

k obsahuje noučasně klik

sloupců = pčárku), záležs Preview dcož umožňu).

mport dat z j

názvy promkneme na d

proměnnýchží na tom, ja

dole. Zadat luje rozeznán

jiných prog

měnných → druhý řádek

h. Zde volímak jsou sloulze také, zdaní čárek či s

ramů (neob

Line above(musí být š

me středník (upce oddělena znaky ve sstředníků, k

bsahuje ovše

e selected lišedivý).

(Semicoloneny, což vidísloupcích js

které neznam

31

em

ine

n), íme sou menají

Vytvořil Jir

ri Safr 7.3.2017; aaktualizováno 14

.12.2017 32

Vytvořil Jir

SyntaxProgramikonky)provádě– pro za(koncovs daty p

V podstPříkazospecifikVždy k

Uveďmvytvořevložíme

FREQUE

Máme zodpověd

PříkazoRun a zOutputu

Příkazy u Frequ

FRE sp

Nicmén(lomítko(PIECH

FREQUE

/

/

/

Použijem

*Popis

FREQUE

ri Safr 7.3.2017; a

x–ovládm PSPP/ SP) a nebo takéění transformadání nové avka .SPS), pprováděli).

tatě se jednávý řádek vž

kace analýzyončí tečkou

me si zadání ní jednoduc

e) řádek:

ENCIES V

zde příkaz kdí na otázku

vý řádek (nzvolíme Selu na výslede

y lze zadávatuencies stačí

po_dnes.

ně příkazy lzo). U Frequ

HART) a neb

ENCIES

/VARIABL

/FORMAT=

/PIECHAR

me-li jako p

sné stat

ENCIES s

aktualizováno 14

dánípomSS lze ovláé pomocí přmací, úpravanalýzy stačpak můžeme

á o jednoduždy obsahujy. u !

příkazu FRché tabulky

VARIABLES

k operaci (zdu „Jak jste d

nebo i více řection. Pouek (na rozdí

t ve zkrácení takto:

.

ze i dále speuencies můžbo také seřa

LES= spo_

=DFREQ TA

RT= MISSI

příkaz *. pa

tistiky p

spo_dnes.

.12.2017

ocípříkaádat klikánímříkazového

v dat a analýčí změnit náe operace op

chý textovýe příkaz a jm

REQUENCIE. Do okna e

S=spo_dn

de tabulku fdnes spokoj

řádků najednužít lze také íl od SPSS s

né podobě (

ecifikovat –žeme napříkazení katego

_dnes

ABLE

ING.

k se nám ve

příkazem

.

azů(úvodm na menu řádku, tzv.

ýz. Výhodouázvy proměpakovat a k

ý editor, v nméno prom

ES, který jseditoru Synt

nes.

frekvencí) aen?“)

nou) pak oz klávesovouse nám toto

(a v tom je p

– specifikaceklad přidat zorií podle do

e výstupu ob

m FREQUE

d)v grafickémsyntaxu. Sy

u je předevšnných. Pok

kontrolovat (

němž zadáváměnné(ých),

sme používataxu vepíšem

a jméno pro

značíme do u zkratku C okno samo

právě kouzl

e v rámci jezadání tisku osažené čet

bjeví náš ko

NCIES pr

m rozhraní (yntaxe sloužším rychlost

kud si syntax(vidíme i po

áme příkazodoplněn mů

ali v předchme (nebo zk

měnné (zde

bloku a v mtrl+R. Poté

o automatick

o rychlého

ednoho řádkkoláčového

tnosti (DFR

omentář, na

ro znak

(případně naží k efektivnt a opakovax uložíme o čase, co js

ové řádky. ůže být o da

hozí části prkopírováním

e spo_dnes,

menu kliknese podívám

ky nepřepne

zadávání př

ku odděluje o grafu

REQ).

apř.:

spo_dnes

33

a nímu

atelnost

sme

alší

o m

která je

eme na me do e).

říkazů)

/

s.

Vytvořil Jir

První řávýstupuje pak s

Je dobrýnutné.

Příkaz pv menu.příkaz dje tomu příkazu (pozor n

Všimněvýsledk

Důležitépomocí Skvělý nhttp://wTaké prpro SPSsyntaxůkurzu Phttp://km

ri Safr 7.3.2017; a

ádek s hvězdu, nic neprovamotný přík

ým zvykem

pro syntax s. Před (nebodo nového o

v SPSS), tavždy vybra

nefungují kl

ěte si také, žky. Přehledn

é je, že něktzadání v synávod na sy

www.gnu.orrezentace prSS (PSPP), Nů, co jsme děPraktikum elmvp.wz.cz/

aktualizováno 14

dičkou * je vádí, jen infkaz Frequen

m samotné př

si můžete jeo místo) klikokna syntax akže pokud at a vložit dolávesové zk

že syntax se ně tak vidím

teré funkce yntaxu, tzn. yntax PSPP rg/softwarero předmětyNajdete je nělali na semlementární a.

.12.2017

zde pouze vformuje (obncies.

říkazy psát

dnoduše neknutí na tlačeditoru. Bochcete mít o vašeho sy

kratky ctrl+c

nám automme, o co v an

či analýzy jže je nenajdnaleznete n

e/pspp/many Analýza kvna stránce h

minářích AKanalýzy kva

váš (nepovibjeví se text

velkými pís

echat vytvořčítko OK, kohužel vždyvšechny př

yntax souboc /+v).

maticky objenalýze jde a

jsou v PSPPdete v menuna nual/pspp.h

kvantitativníhttp://metodKD. Jednoduantitativních

inný) koment co je mezi

smeny, uleh

řit při zadávkliknete na Py do novéhoíkazy v jednru, pomocí

evuje v okněa můžeme jí

P (to ale plau.

html ích dat I., IIdykv.wz.czuché syntaxh dat najdet

ntář, který s* a tečkou)

hčí to orient

vání pomocíPaste. Vyge

o, nikoliv aknom soubormenu myši

ě výstupů, ptaké pozděj

atí i pro SPS

. III. uvádí p/ , kde je taky s tím „co e také na str

se objeví ve). V druhém

taci, ale nen

í klikání myeneruje se vktivního oknru, musíte tei – pravé tla

před samotněji i zopakov

SS) dostupn

příklady příaké archiv rů

jsme dělaliránce

34

e m řádku

ní to

yší vám celý na (jako ext

ačítko

nými vat.

né pouze

íkazů ůzných i“ na


Analýzadat(2):Logikavytvářeníkontingenčníchtabulekajejichinterpretace

Prezentace a interpretace kontingenční tabulky (výzkumná otázka a hypotéza) V zásadě k tabulkám můžeme přistoupit dvojím způsobem. Buď postupujeme jen víceméně deskriptivně – explorativně, kdy nemáme žádnou předem danou otázku/ hypotézu a jen systematicky popisujeme rozdíly v závislé (vysvětlované) proměnné z hlediska třídění jinými znaky. Anebo máme předem definované výzkumné otázky (obecné i ty konkrétní, nejčastěji formulované již ve fázi přípravy výzkumu) a z nich odvozené hypotézy (tj. vlastně odpovědi na tyto otázky na základě teorie) a postupujeme tak, že tabulku či graf konstruujeme podle těchto otázek/hypotéz, tak abychom přímo ověřili předpokládané vztahy. Viz následující příklad ze cvičného výzkumu studentů na FHS s názvem „TV a knihy“. Výzkumná otázka (RQ): Souvisí počet přečtených knih s dobou sledování TV?

Hypotéza „sociologická“, tj. věcně formulovaná: Počet přečtených knih roste s dobou strávenou sledováním TV. → předpokládáme pozitivní souvislost

Nulová „statistická“ hypotéza (H0): Počet přečtených knih se neliší v závislosti na době strávené u TV. → Statistickým postupem je očekávat a ověřovat „žádný vztah“.

K ní lze formulovat tzv. alternativní hypotézu (HA) – kdy H0 neplatí, tj. vztah existuje.

Dodejme ještě, že vztahy nemusí být takto jednoduché, vyjádřené jako lineární souvislosti (u kategoriálních znaků spíše hovoříme o monotónním vztahu). Ostatně uvedený příklad pracuje se dvěma ordinálními znaky (koneckonců mohli bychom místo tabulky spočítat jen ordinální–pořadový korelační koeficient, ale tím bychom ztratili mnoho podstatných informací), ale kontingenční tabulky používáme také pro hlavně čistě nominální znaky (zde by se hodilo například zkoumat souvislost mezi tím, jaký literární žánr studenti čtou a jaké typy televizních pořadů sledují). Navíc vztahy se mohou projevovat třeba jen v určitých podskupinách (tj. jen za určitých podmínek).

Z toho vyplývá, že zamítnutím jednoduše formulované hypotézy bychom se neměli spokojit. To pochopitelně platí i pro hypotézy „potvrzené“, resp. správně řečeno – nezamítnuté. Navíc mnoho vztahů, kde chceme usuzovat na kauzální působení, je zprostředkovaných a tudíž bivariátní vztah dvou znaků může být způsoben (podmíněn) působením třetí proměnné. Prací výzkumníka je právě v dalším kroku odhalovat i tyto komplikovanější vztahy (o podobě vztahu hodně napoví kontingenční tabulka a nebo pro spojité znaky X-Y bodový – scatterplot graf a následné třídění třetího stupně).


Tabulka 2. Počet knížek přečtený za rok (tercily) podle sledování TV v hodinách za den (tercilu), sloupcová procenta, studenti FHS předmětů J. Šafra v letech 2011 až 2012.

Sledování TV (tercily)

Celkem I. tercil (-) II. tercil (0) III. tercil (+)

Knihy přečtené celkem za rok (tercily)

I. tercil (-) 15,8 23,1 38,9 25,4%

II. tercil (0) 42,1 46,2 44,4 44,4%

III. tercil (+) 42,1 30,8 16,7 30,2%

Celkem N

100 % (19)

100 %(26)

100 %(18)

100 %(63)

Zdroj: FHS TV a knihy 2011-2012

N (validní) = 63 (chybějící hodnoty 12,5 %). Tabulka 2 ukazuje relativní podíl přečtených knih za rok (soubor jsme rozdělili na tři stejně velké skupiny čtenářů podle tercilů) ve skupinách definovaných podle doby sledování televize v běžném dni (rovněž kategorizováno na tercily). V tabulce ověřujeme hypotézu, podle níž počet přečtených knih roste s dobou strávenou s TV.

Zatímco v kategorii podprůměrného množství přečtených knih (I. tercil) je pouze 16 %, těch kdo televizi sledují málo (I. tercil), tak studentů, kteří se na televizi dívají nadprůměrně často (III. tercil) je v této kategorii zhruba 2,5 krát více (39 %). Obdobně v kategorii nejvíce přečtených knih (III. tercil) je 42 % těch, kdo se na televizi v podstatě nedívají a zároveň jen 17% těch, kteří se na ní dívají velmi často (III. tercil). Vidíme tak, že mezi čtením knih a sledováním televize existuje negativní souvislost (vyjádřeno pomocí kontingenčního koeficientu souvislost je tato souvislost středně silná, CC = 0,25). Naší hypotézu o pozitivní souvislosti mezi počtem přečtených knih a sledováním TV nám tedy nezbývá než „zamítnout“ (resp. ji na základě našich dat nemůžeme potvrdit), vztah je totiž přesně obrácený: čím více studenti čtou, tím méně se dívají na televizi. ← To byl ale pouze popis vztahů v tabulce, následovat musí věcné vysvětlení, většinou ho odvozujeme z určité teorie. Zde alespoň krátký náznak:

Jedním z možných vysvětlení by mohl být vzájemný konkurenční vztah konzumace médií, den má jen 24 hodin a člověk se musí rozhodnout, jaké médium zvolí… Můžeme také uvažovat o tom, že tato média reprezentují poněkud odlišný kulturní svět (kniha má blízko k intelektuální – vysoké kultuře, zatímco televize spíše k masové – zábavné kultuře) a tak v pozadí výběru jednoho nebo druhého média může působit odlišný kulturní vkus. Nicméně k detailnějšímu posouzení těchto vysvětlení bude třeba přistoupit k dalším analýzám, které zhodnotí souvislosti čtení s jinými aktivitami volného času a zejména ověří, zda tento vztah je platný v rámci různých sociálních skupin (např. dle pohlaví, věku apod.).


Při interpretaci dat nebuďte pouze popisní, mechanicky nekopírujte, co čtenář vidí v tabulce.

Vyberte pouze podstatné vztahy z hlediska vaší hypotézy – ty které ji potvrzují a zejména ty, které ji vyvrací (!).

Interpretujete jen skutečně věcně významné rozdíly – zamyslete se, jak velké jsou rozdíly v závislé–vysvětlované proměnné mezi kategoriemi nezávislé proměnné, pokud vezmete v úvahu metriku (počty či vzdálenosti kategorií; u numerických znaků směrodatnou odchylku) závislé proměnné.

Nabízejte věcná vysvětlení zasazená do kontextu toho, co zkoumáte.

Ale pozor na interpretaci vztahů jako kauzálních: „X ovlivňuje Y“. Takový to závěr, resp. ověření hypotézy o kauzálním – příčinném vlivu, vždy vyžaduje mnohem více než jednu tabulku souvislosti dvou proměnných (viz Opora KMVP s. 24-33).

Pište čtivý text, který nebude čtenáře nudit.

Prezentace tabulek v textu (např. diplomové práce nebo výzkumné zprávy) má svá pravidla. Povšimněte si zvýrazněných částí v předchozí tabulce 2. Vždy je nutné uvádět absolutní počet, z nějž počítáte procenta a také by mělo být jasné, jaký je podíl chybějících hodnot (tj. kolik respondentů neodpovědělo). Více si o základních pravidlech pro úpravu tabulek i to, jak z nich psát text, povíme na semináři. Pro zajímavost, předchozí tabulku bylo nejprve třeba upravit, původně vypadala ve výstupu SPSS takto:


Uspořádání v kontingenční tabulce Než si ukážeme, jak kontingenční tabulku vytvořit v prostředí programu PSPP/SPSS připomeňme si obecný postup a logiku vytváření kontingenčních tabulek (viz obrázek Uspořádání tabulky). Dodejme, že dále se budeme zabývat pouze tabulkami pro kategoriální znaky, tj. situací, kdy počítáme s absolutními nebo relativními četnostmi (N; procenta nebo pravděpodobnost).4 Základní princip sestavení kontingenční tabulky:

V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné.

závislá proměnná = je v hypotéze ovlivňována, způsobována (nejčastěji je v řádcích) nezávislá(é) proměnná = vysvětluje, ovlivňuje závislou (ne nutně kauzálně–příčinně)

Ale pozor! Směr kauzality je vždy věcí teorie, nelze ji určit z dat samotných.

Praktikum KMVP část 2 18

21100 % (9)100 % (12)Celkový součet

866 % (6)16 % (2)3 (spokojen)

611 % (1)41 % (5)2

722 % (2)41 % (5)1 (nespokojen)

Celkový součetŽenaMužSpokojenost

Pohlaví

ZÁVISLÁ -vysvětlovaná

NEZÁVISLÁ - vysvětlující

Uspořádání tabulky sloupcová procenta:

V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné.

Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá(vysvětlující) ve sloupcích.

4 Tabulky pochopitelně mohou zobrazovat i jiné míry, např. střední hodnoty pro kardinální znaky (průměr, medián). Logika je podobná, dokonce na pochopení je to mnohem jednouší. Každý jistě rozumí principu porovnání průměrů v podskupinách a také ví, jak ho spočítat. Třeba pokud jde o rozdíl v průměrném příjmu čtyř skupin zaměstnanců podle vzdělání, což je v podstatě stejná úloha jako našem následujícím příkladu, kde ovšem máme příjem kategorizován do čtyř skupin na základě kvintilů a tudíž musíme vztah vzdělání – příjem analyzovat pomocí kontingenční tabulky.

Vytvořil Jir

Uveďmže očektabulkudata repprojektu

*V katezávislé p

*Informproměnn

→ tabuv řádcíc

A nezapotázku (proměnn

Nyní, jstabulka,Příklad zde najdmnohemZadávánk tomutpřehled nebude oznámí aktualiz

ri Safr 7.3.2017; a

me si to na daáváme jejicu ukazujícíprezentují dou ISSP 2007

egoriích nezproměnné (

mace z tabulné (zde stup

ulku čteme ch a sloupc

pomeňte, př(případně i nou (a přípa

sa vybaveni , můžeme kukazuji v P

dete mnohemm více různýní pomocí pto principu vpříkazů k zfungovat něže „tento p

zujte verzi P

aktualizováno 14

alším příklach praktickyí závislost pospělou pop7 (proveden

závislé prom(prijem4).

lky interpretpně vzdělán

„po řádcíccová procen

řed sestavenodpověď naadně i další

„teoretickýkonečně přisPSPP. V SPSm větší nabých ikonek příkazovéhoviz kapitoluzadávání koěco, na co jříkaz zatím

PSPP (je to

.12.2017

adu, kde máy vzato lineápříjmu na vpulaci ČR vn byl náhodn

měnné (zde V

tujeme tak, ní) podle vla

ch“ (pokud nta jako zde

ním kontinga ní ve form– kontrolní

ými“ znalosstoupit k anaSS je to obd

bídku, což jeke klikání (

o řádku je u u Syntax – ontingenčnícsme zvyklí ještě není p

free-projekt

áme opět dvární souvislvzdělání: přv roce 2007 ný výběr v p

Vzdělání) u

že porovnáastností záv

máme neze, což je nej

genční tabulkmě hypotézyí).

stmi, jak se alýze dat vdobné, logike vidět již n(což jsou vltěchto zákl

ovládání pomch tabulek).z SPSS, ale

podporovánt v neustálé

va ordinální ost (nebo alříjem (kvarta pochází zpopulaci sta

ukazujeme k

áme navzájevislé proměn

ávislý znakjobvyklejší,

ky vždy nejy). Ta vám d

sestavuje a prostředí pr

ka grafickéhna první pohlastně takovladních analmocí příkaz Nanejvýšee PSSP vámn“. Takže přm vývoji).

znaky, což lespoň montily) a vzdělz mezinárodarší 18-let).

kompletní (1

em podskupnné (zde kva

k ve sloupcí, ale lze to c

jprve formudefinuje záv

interpretujerogramů PSho rozhraní hled, kdy v Své zkratky dlýz a procedzů (úvod) a

se může stám v takovémřipomínám,

většinou znnotóní vztahlání (4 kategdního výzku

100 %) dist

piny nezávisartily příjmu

ích, závislýcele otočit o

ulujte výzkuvislou a nez

e kontingenSPP nebo SP

je podobnáSPSS máte

do prostředí dur stejný (ona konci mát, že v PSP

m případě věpravidelně

39

namená, h). gorie),

umného

tribuci

slé u)

ý o 90st).

umnou ávislou

ční PSS. á, jen

menu). obecně

máte i PP ětšinou si

Vytvořil Jir

Postu Nejprve V PSPPAnalyze

ri Safr 7.3.2017; a

p vytváře

e si otevřem

P přes menue → Descrip

aktualizováno 14

ení kontin

me datový so

u zadáme: ptive Statist

.12.2017

ngenčních

oubor, zde je

tics → Cros

h tabulek

e to ISSP20

sstabs.

k v PSPP

007_v2_1.sa

(SPSS)

av.

40

Vytvořil Jir

Pro jednpravého

Najdemprijem4

Dále muPSPP mvhodné

ri Safr 7.3.2017; a

noduší orieno tlačítka př

me si proměn4) a do slou

usíme nastamá přednasta

je vybrat po

aktualizováno 14

ntaci si můžepnout na z

nné, které chupců = Row

avit, co budeaveny všechouze to, co

.12.2017

žeme pomoczobrazování

hceme do tas (vzdel4)

e v políčkáchny možnosbudeme pot

cí myši – naí Variable N

abulky a do

ch tabulky vsti (četnosti,třebovat, ab

ajedeme na Names (míst

o řádků = Ro

v sekci Cell, řádková, sby tabulka b

seznam proto labels).

ows dáme z

s: loupcová i c

byla přehled

oměnných –

závislou (zd

celková %)dná.

41

– a jejího

de

,

Vytvořil Jir

Zde chc

StatisticPokud pzákladnnulovoudoporučneparamčetnosti

ri Safr 7.3.2017; a

ceme pouze

cs: Statisticponecháme ní test asociau hypotézu, čuji ponechametrický, taki v jednotliv

aktualizováno 14

sloupcová

cké testy a nastavení –

ací v tabulceže kategoriat, je to zákkže je vhod

vých polích

.12.2017

procenta (C

míry asoci– zakliknutoe tzv. Test die proměnný

kladní test, indný i na mal

tabulky (viz

Colum) a po

iace o je Chisq, tdobré shodyých jsou na nterpretace

lé výběrové z dále).

onecháme té

tak se nám vy Chisquaresobě nezávje jednoducsoubory). H

éž absolutní

ve výstupu e (Chíkvadrávislé. Můžemchá (navíc jHlídat ale m

í četnosti (C

rovněž objeát), který teme ho vypnje to test

musíme dost

42

Count).

eví estuje nout, ale

taečné

Vytvořil Jir

Výstup Nejprveproměnn

Zde vidobě otázNepsanéhodnot neodpovtřídění p Hlavní tkonting

Tabulkarozdělit s Colum Samotn

ri Safr 7.3.2017; a

(output) a

e dostanemené v kontin

díme, že z cezky pouze 8é pravidlo pdo 5%, pakvídají“. Zdeprvního stup

tabulka, ktegenční tabu

a v sobě obst při zadávánmn.

né absolutní

aktualizováno 14

jak ho čtem

e tabulku Sungenční tabu

elkového po843, takže mpro velké výk to můžemee je to způsopně pomocí

erá nás zajímulka:

sahuje jak rení na dvě –

četnosti vy

.12.2017

me:

ummary infulce).

očtu případůmáme 31% mýběrové soue ignorovat,obeno odpoví FREQUEN

má a kterou

elativní podprovedeme

padají takto

formující ná

ů (respondemissingů –

ubory (cca n, jinak bychvědí na otáz

NCIES – viz

později upr

díly (%) take analýzu 2x

o (zde pozor

ás o počtu p

ntů ve výzkchybějících

nad 100 příphom měli zjizku po příjmz návod na

ravíme do z

k absolutní čx za sebou j

r na nesmys

latných příp

kumu) 1222h hodnot, copadů) říká, žistit, „kdo jsmu (to by náPSPP část 1

zprávy/ diplo

četnosti. Můednou s Cou

slné desetin

padů (průni

2 odpovědělož je hodně.že je-li chybsou ti, kdo ám řekla tab1).

lomky je sam

ůžeme je s vunt, podruh

nné místo):

43

k za obě

lo na bějících

bulka

motná

výhodou hé

Vytvořil Jir

Tuto tabkategoriAle nezpřípadů2 x 2 tab Samotn

InterprdostatečpořádcícOpakuji

Také mů

ri Safr 7.3.2017; a

bulku absoluií jsou závis

zapomeňte ů (v absolubulka), např

né sloupcové

retace prováčné množstvch porovnávi grafický p

ůžeme sledo

aktualizováno 14

utních četnoslé na tzv. mzde kontrotní četnostiříklad pomo

é četnosti vy

ádíme taktoví případů vváme, zda sříklad:

ovat kupení

.12.2017

ostí nemůžemarginálnícholovat, že vi). Pokud neocí příkazu

ypadají takt

o: nejprve zkv políčkách se lišší % za

í četností na

eme interpreh četností, tkaždém poe, tak můžeRECODE (

to:

kontrolujemtabulky. Pa

astoupení v

a diagonále,

etovat, prottj. rozloženíolíčku tabute některé k(o tom v 3 d

me absolutníak čteme slopříjmové k

, které indik

ože četnostií kategorií o

ulky máte akategorie slodílu návodu

í četnosti (voupcová proategorii pod

kuje lineární

i ve spoluvýobou znaků.alespoň ccaoučit (minim

u na PSPP).

v Count), zdocenta a to dle vzdělání

ní závislost.

44

ýskytu . 5

mum je

da máme

í.

Vytvořil Jir

Zde se zpříjem r Tabulkuprohodprocent

V princi

Udělat sdata o újde o popocházedotazníkže rozdízkoumastatisticstatistikRobustnějakýcvýsledk

ri Safr 7.3.2017; a

zdá, že vyššroste se vzd

u lze pochopdit proměnnta (Row). P

ipu to tedy

správně zorúplné populaouhou exploející pouze zkového šetříly mezi katanou populaké inferenc

ky, ale mějtenost našich

ch rádoby „kků (tj. „jak j

aktualizováno 14

ší příjmové děláním. Ale

pitelně otočné (vzd4 a pPak čteme ta

vypadá takt

rientovanou aci (tj. cenzoraci vztahůz nějakého ření) a chcemtegoriemi naaci, pak muse (tj. o zobee vždy namyh závěrů bykouzelných“jsou velké“

.12.2017

kategorie ne podrobněj

čit o 90st., aprijem4) z řabulku „po

to:

tabulku nemzus). Se samů bez nárokureprezentame zobecnitaměřené v nsíme provésecňování zeysli, že pořáy měla být v“ statistickýa co zname

nacházíme ui viz dále zn

aniž by se zmřádků na slsloupcích“.

musí stačit.motnou tabulu na přesnějativního výbt výsledky nnašem výběst ještě statie vzorku na ád platí: vždy patrn

ých testů. Venají ve vzta

u vzdělanějšnaménkové

měnil její výloupce a zad

Plně dostačlkou si takéjší závěry, aběru z popunašeho výzkěrovém vzorstický test tpopulaci) s

ná již ze samVždy proto s

ahu ke zkou

ších respondé schéma.

ýznam, ale pdat, že chce

čuje pouze t vystačíme

ale pokud mulace (zde nkumu, tedy rku platí i péto závislose dočtete v

motných tasledujte věcumanému fe

dentů, tedy

při zadání meme řádkov

tam, kde mv situaci, k

máme data např. pomochceme-li t

pro celou sti. O princiučebnicích

abulek bez cnou význaenoménu).

45

že

musíme vá

áme kdy nám

cí tvrdit,

ipech

amnost

Jiří Ša

Tes Postpromrůzn

Ale

StatHod0,00NulodppříjmkoliIntupoupřid Zdů(vzoi prbychsmětěchznam

Navmusz dotrivipráz

K pnezn

afr, 14.12.2017, v

st dobré s

tup ověřováměnných v né typy prom

zpět do out

tistická tzv. dnota testov0. ovou hypotovídá zvolemu je ovlivnik jich je (zduitivně na toužít statistickdáme tzv. A

ůrazňuji, že orku, zde 12ro celou pophom museliěru), napříklhto koeficienménkového

víc, k tomu sí být náhodostatečně veiální, souviszdná).

rincipu testnamená důl

verze 0.1

shody Ch

ání statistickkontingenčměnných a

tputu. Ve vý

nulová hypvého kritéria

tézu zde nemené chybě 5něna alespoda platí zde o můžeme uký test, kter

Adjustované

smyslem te222 respondpulaci. Nic i ještě spočílad koeficientů), anebo

o schématu.

abychom mdný, dostateelké populacslosti statist

ování hypotležitý." na h

hí kvadrát

ké hypotézyní tabulce (forem jejich

ýstupu mám

potéza zde řa Chíkvadrá

můžeme při%). Zname

oň jednou kakvazi-lineá

usoudit z rozrý by nám dresidua (viz

estování hydentů ve výzjiného! Neř

ítat nějakouent kontinge

se detailněj

mohli tento pečně velký ce, na druhéticky význam

téz viz vícehttp://www.

t – (ne)zá

y si ukážemdodejme, žeh vzájemný

me ještě tab

říká, že příjeát je 122,42

ijmout neboná to, že i pategorií vzdární závisloszdílů mezi s

dále ukázal kz dále).

ypotéz je uszkumu ISSPříká nic o t

u míru souvience nebo pji podívat „

postup použ(minimálněé straně nesmmné) a v po

e článek P. Ssocioweb.cz

ávislost p

me na našem e existuje m

ých vztahů).

ulku s výsl

em je na vzdpři 9 stupn

oť dosaženápro celou podělání. Tentst, nebo zdasloupcovýmkde je souvi

suzovat na P) s přijatetom, jak moislosti – těsnořadovou k

„dovnitř“ tab

žívat, musí bě 30-50 přípmí však být

olích tabulk

Soukupa Soz/index.php

proměnný

příkladu vzmnoho jinýc

ledkem stat

dělání nezávích volnosti

á hladina výopulaci ČR pto test nám aa je závislos

mi procenty, islost a jak j

to, zda vztelnou mírouoc je vztah nosti vzájem

korelaci (v obulky, což u

být splněnopadů, ale zált příliš velký

ky musí být

oukup, P. 20p?disp=teori

ých v kon

ztahu dvou kh postupů a

tistického t

vislý. i (df) a p-ho

ýznamnostplatí, že aleale neříká, kst jen mezi dčteme-li tabje silná, kdy

ahy ve vašeu chyby (ne

mezi prommného vzta

obou případeuděláme v d

mnoho podleží na veliký (protože pdostatečný

007. "Statistie&shw=29

ntingenčn

kategoriálna statistický

testu nezáv

odnota (Asy

ti p je menšespoň jedna které kategodvěma kateg

abulku po řáyž si do pol

em výběrovejčastěji volměnnými těahu (u ordinech existují

další části po

dmínek, mj.kosti populapak jsou všepočet přípa

ticky význam98&lst=108

ní tabulce

ních ých testů pro

vislosti.

ympt.signif.

ší než 0,05 (kategorie

orie to jsou,goriemi).

ádcích. Můžíček tabulky

vém souborlíme 5 %) pěsný. K tomnálních znakí různé variaomocí tzv.

.: výběr vzoace), echny, byť

adů (nesmí b

mný

46

e

o

) je

(což

ani

žeme y

ru latí

mu ků i anty

orku

být

Jiří Ša

Zna Při ivyujednkonznam V C

Výs

Platnezáhodzast

afr, 14.12.2017, v

aménkov

interpretaciužít tzv. Adjnoduchý způntingenční taménka „+“

CROSSTAB

sledkem mů

tí, že čím vyávislé a záv

dnoty) nebo toupení kate

verze 0.1

vé schéma

souvislostiustovanýchůsob k zčiteabulce tak, aa „—“, pod

BS si zadám

ůže být buď

yšší hodnotyvislé proměn

podreprezeegorií uvažo

a – v kter

i v tabulce ph residuí, naelnění % odaby v ní byldle vypočten

me Adjustova

samostatná

y (uvažujemnné. Buď jsentovány (záovaných zna

rých políc

používáme na jejichž zákdchylek od tla rychlá opné veličiny

aná standard

á tabulka jak

me ale pouzou kategoriáporné hodnaků).

ch tabulk

nejčastěji slkladě se utvotzv. teoreticptická orient„z“ [Šafář 1

dizovaná re

ko zde nebo

ze vyšší nežie v tom ktenoty) oproti

ky je jak s

loupcová proří znaménkkého rozděltace. Procen1969: 566; p

esidua (Adju

o další řádek

ž 1,96), tím verém políčkui teoretickém

ilná souv

rocenta (viz kové schémlení četnostntní odchylkpodrobně vi

usted Std. R

k v kontinge

větší souvisu nadreprezmu očekává

vislost?

z výše), s výma odchylektí v málo překy převádímiz Řehák, Ř

Residuals)

enční tabulc

slost mezi kzentovány (kání (to zohle

ýhodou lze k v polích. Jdehledné

me na Řeháková 19

ce:

kategoriemi kladné edňuje odliš

47

de o

986].

šně

Jiří Šafr, 14.12.2017, verze 0.1 48

Graficky to lze vyjádřit pomocí tzv. znaménkového schématu, které slouží ke zčitelnění odchylek od tzv. teoretického rozdělení četností v málo přehledné kontingenční tabulce tak, aby ní byla rychlá optická orientace. % odchylky převádíme na znaménka „+“ a „–“

• kde abs(z) >= 3.29 nahradíme +++ resp. – – –,

• kde abs(z) >= 2.58 nahradíme ++ resp. – –,

• kde abs(z) >= 1.96 nahradíme + resp. –.

• pro abs(z) < 1.96 dáme 0

což odpovídá klíči: 0 = statisticky nevýznamné +‚ – = významná odchylka na 5 % hladině statistické významnosti ++‚ – – = významnost od 0,1 % do 1 %, +++‚ – – –‚ = pravděpodobnost náhodného výskytu odchylky menší než 0,1 % V našem případě to pak vypadá takto (vytvořeno v SPSS, ale znaménka lze dodatečně udělat v Excelu či Wordu – stačí přepsat Adjustované residua podle výše uvedeného pravidla):

vzd4 Vzdělání

1 ZŠ 2 VYUČ 3 SŠ 4 VŠ

prijem4

Příjem-osobní – kvartily (s24)

1 I. do 7 tis. +++ -- o o

2 II. 7–9 tis. o +++ --- o

3 III. 9–15 tis. --- + o o

4 IV. nad 15 tis. --- --- +++ +++

Interpretace znamének je ve smyslu „nacházíme výrazně více lidí s určitou vlastností (zde kategorií vzdělání) v daných polích tabulky oproti tzv. očekávané četnosti“. Nejde tedy o žádný průměr. Nezapomeňte, než uděláte znaménkové schéma, nejprve byste měli provést Chíkvadrát test pro celou tabulku (což jsme udělali v předchozí části). Zjistit, zda můžete zamítnout nulovou hypotézu o tom, že žádná kategorie v tabulce se „statisticky významně“ neodlišuje od ostatních (tedy můžeme-li přijmout tzv. alternativní hypotézu, že alespoň v jednom poli se zjištěná četnost odlišuje). Připomínám, že tento test říká, že tento rozdíl platí nejen pro data v našem vzorku, ale že ho nalezneme i v celé populaci.

Jiří Šafr, 14.12.2017, verze 0.1 49

Zadání kontingenční tabulky pomocí syntaxu PSPP/SPSS Následující text lze zkopírovat do Syntax editoru v PSPP/SPSS (v menu: File / New / Syntax ) a spustit (pomocí Run nebo Ctrl+R). Nejprve je třeba otevřít datový soubor ISSP2007_v2_1.sav. Tyto příkazy také lze použít při analýze jakýchkoliv jiných dat, stačí jen změnit názvy proměnných (prijem4 a vzd4). *zadání kontingenční tabulky v SPSS / PSPP: pro COL = sloupcová procenta. CROSSTAB prijem4 BY vzd4 /CELL=COL COUNT. *pro test nezávislosti Chí kvadrát přidáme. CROSSTAB prijem4 BY vzd4 /CELL=COL COUNT /STATISTICS=CHISQ *pro přidání adjustovaných residuí ještě. CROSSTAB prijem4 BY vzd4 /CELL=COL COUNT ASRESID /STATISTICS=CHISQ. *tabulky % a N samostatně dostaneme takto. CROSSTAB prijem4 BY vzd4 /CELL= COUNT. CROSSTAB prijem4 BY vzd4 /CELL= COL. CROSSTAB prijem4 BY vzd4 /CELL= ASRESID. *nebo otočeno o 90st, tedy pro ROW = řádková procenta a prohodíme proměnné!. CROSSTAB vzd4 BY prijem4 /CELL=ROW COUNT. CROSSTAB vzd4 BY prijem4 /CELL=ROW COUNT ASRESID.

Date post:	02-Apr-2021
Category:	Documents
Upload:	others
View:	1 times
Download:	0 times

Studijní opora předmětu Elementární zpracování dat z ...Praktikum – elementární...

Documents