+ All Categories
Home > Documents > 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2...

2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2...

Date post: 03-Nov-2019
Category:
Upload: others
View: 5 times
Download: 0 times
Share this document with a friend
7
58 KAPITOLA 2 U složitějších výpočtů vícerozměrných analýz je potřeba, abyste si všechny příka- zy k analýzám uchovávali ve svém výpočetním archivu Nikdy totiž nevíte, kdy si budete muset ověřit, zdali jste postupovali správně – a bez archivace syntaxe výpočtu toho nebudete schopni SPSS má poměrně rozsáhlou a dobře zpracovanou nápovědu (Help), která obsahu- je i základní uvedení do programu (Tutorial) Rozhodně stojí za prohlédnutí Společně s ukázkovými daty se totiž lze mnohému naučit sám i bez dotěrného učitele a (špatně) napsané učebnice 2.2 Data 2.2.1 Matice dat Při statistické analýze dat pracujeme s číslicemi, které mají určitý význam (pracujeme s kategorizovanými daty), nebo s čísly Abychom mohli analýzu provádět, musíme tato data dostat do počítače a vytvořit v něm datovou matici Protože jde o zpracování hromadných dat, pracujeme s hodnotami proměnných neboli s kvantifikovanými cha- rakteristikami/vlastnostmi případů – to je respondentů či jiných objektů, popřípadě jevů Matici tvoří tedy případy (obvykle řádky matice) versus proměnné (obvykle sloupce matice) a obsah matice tvoří hodnoty příslušných proměnných charakteri- zujících jednotlivé případy Případy jsou popsány svými vlastnostmi (atributy) – variantami neboli hodnotami proměnných, které jsou jejich logickými uskupeními Například proměnná vzdělání může být uskupením možných nejvyšších dosažených stupňů vzdělání: základ- ní, středoškolské, vysokoškolské, které lze popřípadě dále členit: vysokoškolské nižšího typu (Bc), vyššího typu (Mgr), popř s vědeckou hodností (PhDr, PhD apod) Každému případu přidělujeme v matici jeho identifikační číslo – ID – a ideál- ní je, máme-li stejným číslem označený i originální dokument, z něhož data o případu (nejčastěji respondentovi/respondentce – tedy dotazníku) čerpáme Jen tak můžeme v případě nejasností porovnat zdroj dat s jejich záznamem v matici (proto dotazníky nikdy neničíme, ale archivujeme je) a data tak dodatečně kontrolovat A že se chyby při nahrávání dat vyskytují, je mnohokrát potvrzenou zkušeností 47 Co jsou proměnné, již víme, stejně jako víme, že existují proměnné kategorizované (nominální a ordinální) a proměnné spojité (kardinální) U nominálních proměnných je spojení číslice (numerického kódu) a vlastnosti zcela arbitrární, takže bychom proměnnou „rodinný stav“ mohli kódovat např 1 = svobodný/á, 5 = ženatý/vdaná, 6 = rozvedený/á a 9 = ovdovělý/á, u ordinálních proměnných číslice označují pozici 47 Což jenom dále nahrává určité skepsi o možnostech měření v sociálních vědách Je ale pravda, že chybám při nahrávání dat do počítače se nevyhnou ani přírodní vědy
Transcript
Page 1: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

58

KapItOla 2

− Usložitějšíchvýpočtůvícerozměrnýchanalýzjepotřeba,abystesivšechnypříka-zykanalýzámuchovávalivesvémvýpočetnímarchivu .Nikdytotižnevíte,kdysibudetemusetověřit,zdali jstepostupovalisprávně–abezarchivacesyntaxevýpočtutohonebudeteschopni .

SPSSmápoměrněrozsáhlouadobřezpracovanounápovědu(Help),kteráobsahu-jeizákladníuvedenídoprogramu(Tutorial) .Rozhodněstojízaprohlédnutí .Společněsukázkovýmidatysetotižlzemnohémunaučitsámibezdotěrnéhoučitelea(špatně)napsanéučebnice .

2.2 Data

2.2.1 Matice dat

Přistatistickéanalýzedatpracujemesčíslicemi,kterémajíurčitývýznam(pracujemeskategorizovanýmidaty),nebosčísly .Abychommohlianalýzuprovádět,musímetatodatadostatdopočítačeavytvořitvněmdatovoumatici .Protožejdeozpracováníhromadnýchdat,pracujemeshodnotamiproměnných neboliskvantifikovanýmicha-rakteristikami/vlastnostmipřípadů– to je respondentůči jinýchobjektů,popřípadějevů .Maticitvořítedypřípady(obvykleřádkymatice)versusproměnné(obvyklesloupcematice)aobsahmaticetvoříhodnoty příslušných proměnnýchcharakteri-zujícíchjednotlivépřípady .

Případy jsoupopsánysvýmivlastnostmi(atributy)–variantaminebolihodnotamiproměnných,kteréjsoujejichlogickýmiuskupeními .Napříkladproměnnávzdělánímůže být uskupením možných nejvyšších dosažených stupňů vzdělání: základ-ní, středoškolské, vysokoškolské, které lze popřípadě dále členit: vysokoškolskénižšího typu (Bc .), vyššího typu (Mgr .), popř . s vědeckou hodností (PhDr ., Ph .D .apod .) .Každémupřípadupřidělujemevmaticijehoidentifikačníčíslo–ID–aideál-níje,máme-listejnýmčíslemoznačenýioriginálnídokument,zněhoždataopřípadu(nejčastějirespondentovi/respondentce–tedydotazníku)čerpáme .Jentakmůžemevpřípaděnejasnostíporovnatzdrojdatsjejichzáznamemvmatici(protodotazníkynikdyneničíme,alearchivujemeje)adatatakdodatečněkontrolovat .Ažesechybypřinahrávánídatvyskytují,jemnohokrátpotvrzenouzkušeností .47

Cojsouproměnné,jižvíme,stejnějakovíme,žeexistujíproměnnékategorizované(nominální a ordinální) a proměnné spojité (kardinální) . U nominálních proměnnýchje spojení číslice (numerického kódu) a vlastnosti zcela arbitrární, takže bychomproměnnou „rodinný stav“ mohli kódovat např . 1 = svobodný/á, 5 = ženatý/vdaná,6 = rozvedený/á a 9 = ovdovělý/á, u ordinálních proměnných číslice označují pozici

47 Cožjenomdálenahráváurčitéskepsiomožnostechměřenívsociálníchvědách .Jealepravda,žechybámpřinahrávánídatdopočítačesenevyhnouanipřírodnívědy .

Page 2: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

59

pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU

variantynaškále,anižbycokolivříkalyovzdálenostimezitěmitopozicemi(vzdělání:základní=1,střední=2,vysokoškolské=3apod .) .Jedobrésitotozvolenépřiřazeníčíslickcharakteristikámpamatovat:jesicejiždokumentovánovdotazníku,aledoněhonemůžemepřianalýzezčasovýchdůvodůneustálenahlížet,aprotopřidefinicimaticevSPSSmusímevedledefiniceproměnnýchtakéurčit,jakproměnnoupojmenujeme,kolikbudemít–vpřípaděspojitýchproměnných–desetinnýchmíst, jakýverbálnívýznammá jméno proměnné a číslice jejích hodnot v případě kategorizovaných proměnných .Uspojitýchproměnnýchjsoujejichhodnotykonkrétnímičísly,kterápřímovyjadřujímnožstvípříslušnévlastnosti,takžepopiskyjejichhodnotnejsoupotřebné .

Zopakujmesitedy:každýpřípadpředstavujevektorobsahujícíhodnoty příslušných proměnných(každávariantakaždéproměnnémápřiřazenučíslici) .48Vektoryplnímedomatice: co řádek, topřípad (např . respondent), a co sloupec, toproměnná .Všeilustrujeobr .2 .6 .

Obr. 2.6 Ukázka matice dat s pěti proměnnými a dvěma případy (respondenty) – smyšlený soubor

48 SPSSumožňujeizáznamhodnotyproměnnéveformětextu .Sohledemnato,žetutovariantupoužívámevsociálníchvědáchjenokrajově,znašichúvahjivynecháváme .

1 = muž2 = žena

1 = základní, nevyučen/a2 = základní, vyučen/a3 = středoškolské4 = vysokoškolské

1 = krajní levice2 = levice3 = střed4 = pravice5 = krajní pravice

PŘÍPAD (CASE/RESPONDENT) 1:pořadové číslo (ID) = 1080žena (pohlaví = 2)věk: 34 letvzdělání: vyučenápozice na škále politická levice či pravice = 1 signalizuje levicovou orientaci

PŘÍPAD (CASE/RESPONDENT) 2:pořadové číslo (ID) = 1081muž (pohlaví = 1)věk: 45 letvzdělání: vysokoškolsképozice na škále politická levice či pravice = 5 signalizuje pravicovou orientaci

Page 3: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

60

KapItOla 2

Maticedatje,řečenojinak,souboremkódů,zanimižseskrývajíkonkrétníkvali-tativnínebokvantitativnívlastnostijednoteknašehovýzkumu .Tatodatamohoubýtdále upravována, například pomocí transformací proměnných či výběrem případůa–především–analyzována .

Podíváme-lisenynínadotazník,jenžjevsociologiiobvyklýmnástrojemsběrukvantitativníchúdajů,zhlediskaanalýzydat,jenutnokaždoujehootázku(položku)a navržený způsobměření (to je k ní přiřazenou stupnici hodnot) vnímat tak, jakukazujeobr .2 .7 .

36. S kým jsou podle Vás větší výdaje, se syny nebo s dcerami anebo je to stejné?

Obr. 2.7 Demonstrace otázky v dotazníku jako (kategorizované) proměnné z hlediska jazyka SPSS

pozn. Odpovídající jméno proměnné se obvykle neuvádí v dotazníku (proto zde absentuje), ale až při vytváření matice dat.

Každéotázcevdotazníku (neboliproměnné)musímepřiřadit technické jméno:vmaticidatsetotojménoobjevívoznačenísloupce .Jména(names)můžemedávatrůzná, ale SPSS má svá přísná pravidla, jak mohou vypadat . Především, každéjménomusízačínatpísmenem, jménabyalemělabýtpřiměřeněkrátká .49Ve jmé-nech můžeme používat písmena i číslice, jména tedy mohou být alfanumerická,alebezdiakritiky (např .P1,A26,X26), lzepoužívat ipodtržítko(např .P_01) .Přivymýšlení jmen simůžeme stanovit systém, který nám usnadní práci smaticí přianalýze .NapříkladrezervujemevšechnajménazačínajícípísmenemAproproměnné,kterézjišťovalydůvody,pročlidéchtějímítděti,písmenoBprodůvody,pročdětimítnechtějí .PísmenemDpakmůžemeoznačitdemografickécharakteristikyrespondentů(pohlaví, věk, rodinný stav apod .) Nebo můžeme používat i nápovědných jmenproměnných:např .sexpropohlaví(neprofrekvencikoitu),prijem,vzdel,job(po-volání) apod .Abychom věděli přesně, co tato technická jména znamenají, SPSS49 StaršíverzeSPSSumožňovalyužítjen8znaků .Jevhodnétentolimitnepřekračovat,protože

jinépaketymajítentolimitdodneška .

Page 4: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

61

pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU

umožňujejménataképopsatveforměvariable label(vizobr .2 .3)–vpodstatěsemmůžemevložitzkrácenouverziotázky .

Propopiskyvariantodpovědí(value labels)užmůžemevyužítdiakritickýchzna-mének(možnostpsátčeskysilzenastavitvmenuEdit – Options) .Doporučujeme,abytytopopiskybylypřiměřenékrátké(alevýstižné),neboťsezobrazujívevýstupníchtabulkáchajejasné,žekaždátabulkamápřitiskunaplošestránkyformátuA4jenomezený prostor . Jednotlivým value labels odpovídají příslušné hodnoty (values),vnašempříkladuto jsouhodnoty1,2a3 .Ochybějícíhodnotě(missing value)sezmiňujemeníže .

Vněkterýchpřípadechmajíotázkyvdotazníkupodobutzv .baterieotázek,cožilustrujeobr .2 .8 .

1. Řekněte prosím o každé z následujících skutečností, jak je ve Vašem životě důležitá:

Velmi důležitá

Dost důležitá

Ne příliš důležitá

Vůbec ne důležitá

NevíNeodpo-věděl(a)

a práce 1 2 3 4 −1 −2 Q1a

B Rodina 1 2 3 4 −1 −2 Q1b

C přátelé a známí 1 2 3 4 −1 −2 Q1c

D Volný čas 1 2 3 4 −1 −2 Q1d

E politika 1 2 3 4 −1 −2 Q1a

F Náboženství 1 2 3 4 −1 −2 Q1f

Obr. 2.8 Demonstrace baterie otázek v dotazníku jako sady (kategorizovaných) proměnných

V této tabulce je každý řádek proměnnou s variantami/oboremhodnot <1; 4>;zdejsmezvolilinázvyQ1aažQ1f(mohlobybýttakéQ1_1ažQ1_6)proto,abyna-povídaly,ževšech6proměnnýchtvoříjednuspolečnoubateriiotázek,žetedyměříněcospolečného .Zápornéhodnotyuodpovědí„neví“a„neodpověděl(a)“představujísvým způsobem chybějící údaje neboli chybějící hodnoty (missing values) –vždyckymusíme totiž předpokládat, že někteří respondenti na naše otázky neod-poví .Ichybějícíúdajejedobrékódovat,volbakódujelibovolná,kódvšaknesmímíthodnotu,kteroumůženabývatpříslušnáproměnná .Umissing valuesjenavícněkdyužitečnérozlišovat,kdyúdajchybíproto,žerespondentnaotázkuodmítlodpovědět,kdyproto,žesehonetýká(cožjepřípadvnašítabulce),popřípaděžechybějícíúdajvzniklopomenutímtazateleapod .50

50 Vněkterýchsituacíchmátotižsmyslanalyzovatitytochybějícíodpovědi,zvláštěkdyžsejichuněkterýchpoložekobjevímnoho:analýzanámumožnízjistit,jakýtyprespondentůodpověďodmítl,cožmůžebýtprointepretacivýsledkůdůležitáinformace .

Page 5: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

62

KapItOla 2

2.2.2 Definice jednotlivých proměnných

Abychommohlimaticinaplnitdaty,musímeji,jakjsmenaznačilivýše,nejprvedefino-vat .DějesetakvokněVariable View,kteréjsmeukázalijižnaobr .2 .3 .Jdeotytoúkony:– Připsání technického jména proměnné, určení jejího místa v matici (sloupce/

sloupců) .– Definicecharakteruproměnnéjakočíselné(numeric)čitextové(string);textovou

proměnnoupočítačchápejakooznačeníaneprovádísnípočetníoperace,jakojesčítáníčinásobení .

– Připsáníširšího/podrobnějšíhooznačení proměnné(variable labels) .– Připsáníverbálníhooznačení jednotlivým hodnotám(kategorizované)proměnné

(value labels) .Tyzpřehledňujítištěnévýstupy,neboťpřiřazujíkejménůmproměn-nýchivysvětlujícípopis .Např .q1_2můžebýtjménoproměnnénebolivariable namea„důležitostrodinyvživotě“můžebýtvysvětlujícípopisekjménatétopro-měnnénebolivariable label .Jejívarianty„velmidůležitá“,„dostidůležitá“,„nepří-lišdůležitá“,„vůbecnedůležitá“a„neví“jsoupakvalue labelsdanéproměnné .

Pozor:Vpřípaděspojitýchproměnnýchnedávajívalue labelssmyslanepoužívámeje!

– Určenípočtudesetinnýchmíst(vpřípaděspojitýchproměnných) .– Definováníuživatelských chybějících hodnot(tzv .user missing values) .51Někdy

domissing value přeřazujeme některé hodnoty proměnných při jejich transfor-maci .Týkásetonapříkladvarianty„nevím“,kterásiceněkdymůžebýtsoučástíordinálníproměnné jakožto její středováhodnota (1= svládou jsemspokojen,2=nevím,3=svládoujsemnespokojen),častějšíjsoualepřípady,kdyjipoužívá-mejenproto,abychomnenutilirespondenta/respondentkuzaujímatpostoj,kterýnemá .Vdalšíanalýzesepakčastosoustřeďujeme jenna ty,kdopostojzaujaliavmoduluTransform – Recodepřiřadímeodpovědím„nevím“číslicioznačujícíchybějícíhodnotu(missing value) . Častojetozápornáhodnota .52

– RozumnéjeurčitukaždéproměnnévkolonceMeasureúrověňměření .Tatoinfor-macetotižuněkterýchstatistickýchoperacírozhodujeovolběpočítanýchstatistik .

NěkterésloupcevokněVariable view(vizobr .2 .9)můžemevyplnitpřímovepsánímpříslušnéhotextu,jinénámnabídnoupokliknutípředdefinovanévolby .PřímovyplňujemesloupceNameaLabel,vostatníchpokliknutívyskočírozbalovacíokno .

51 SPSS zná i systémové chybějící hodnoty (system missing value) .Ty se zobrazují v datovématicijakotečkyaznamenají,žeprodanouproměnnouadanýpřípadneníkdispozicižádnáhodnota(např .vdotazníkunenízaškrtnutažádnáodpověď) .

52 Ktomu,jaksevněkterýchkonkrétníchstatistickýchtechnikáchzacházísmissing value,seještěvrátíme .Většinou se s případy obsahujícímimissing value nepracuje (s výjimkou uvedenouvpozn .48) .

Page 6: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

63

pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU

Obr. 2.9 Okno pro popis proměnných

Klikneme-linasloupecValues,můžemevrozbalivšímseokněvepsatpopiskyje-jichhodnot(vizobr .2 .10) .DokolonkyValuevepíšemečíslicihodnoty,tabulátoremčipomocímyšipřejdemedokolonkyLabelavepíšemepopisek .Spodnítlačítkanámumožnítaktodefinovanýlabelpřidat(volbaAdd)avseznamulabelspakprovádětzměny(volbyChangečiRemove) .NakonecvšeodsouhlasímekliknutímnaOK .

Obr. 2.10 Okno pro popis variant znaků (Value Labels)

Podobněmůžeme definovat i uživatelské chybějící hodnoty (missing values), cožjsouhodnoty,kterénevcházejí(pokudsitovýslovněnepřejemeanezadámepříkazem)do analýzy . SPSS nám k tomu nabízí speciální okno, jehož ukázku uvádí obr . 2 .11 .

Page 7: 2.2 Data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2 .3)– v podstatě sem můžeme vložit zkrácenou verzi otázky . Pro popisky variant

64

KapItOla 2

Zdejsmerozhodli,žeprochybějícíhodnotybudemerezervovatvýrazy−1,−2a−3 .Jistěpodleukázkypřijdetesaminato,jakédalšímožnosti, jakdefinovatmissing values,senabízejí .53

Obr. 2.11 Okno pro definování chybějících hodnot

2.2.3 Plnění matice dat

Datamůžemedostatdomaticerůznýmizpůsoby .Důležitéjsoupronászejména:− Plněnínámidefinovanématicenašimidaty .− Importdat ze souboru jiného typu (z textovéhoeditoru,databázeči tabulkové-hoprocesoru–spreadsheetu–,např .programu,jakojeExcel) .Můžeme ovšem také použít i dříve nebo někým jiným vytvořenou matici dat

(tzv . systémový soubor) .Nejčastějším případem je plnění námi definovanématicedatpřepisemúdajůzdotazníkůnebojinýchzáznamovýcharchů .

2.3 Práce se systémovými souboryExistující datové soubory otvíráme stejně jako jakékoliv soubory v jiných progra-mech .TedypospuštěníprogramuSPSSklikámepostupněnatlačítkaFile – Open – Data,votevřenémokněpaknajdemetosprávnémístonadisku(popř .naexternímdiskuneboflashdisku),kdemámesouboruložen(vizobr .2 .12) .

Máme-limaticinaplněnounašimidaty,snažímesetutomaticizachovatprodalšízpra-cování tím, že ji uložíme jako systémový soubor .SPSS takovýmsouborůmpři jejichuloženípřidávápříponu .sav–podlenítytosouborymůžeteidentifikovat(obr .2 .13) .

53 SPSSjevmožnostidefinovatmissing valuesnesmírněflexibilní,jinéstatistickébalíkyumožňujízpravidladefinovatpouzejedinouhodnotujakochybějící .


Recommended