Date post: | 18-Apr-2015 |
Category: |
Documents |
Upload: | jan-jiri-buchta |
View: | 149 times |
Download: | 4 times |
Masarykova univerzita Filozofická fakulta
Ústav pedagogických věd
Bakalářská práce
2012 Bc. Jan Jiří Buchta
1
Masarykova univerzita
Filozofická fakulta
Ústav pedagogických věd
Pedagogika
Bc. Jan Jiří Buchta
Testování znalostí na vysokých školách, použití písemného testu coby prostředku učení se
– korektivní zpětná vazba jako faktor ovlivňující retenci
Bakalářská práce
Vedoucí práce: Mgr. Roman Švaříček, Ph.D.
2012
2
Prohlašuji, že jsem diplomovou práci vypracoval
samostatně s využitím uvedených pramenů a literatury.
……………………………………………..
Podpis autora práce
3
Žádný moudrý člověk netrestá proto, že se stala chyba, ale proto, aby se
neopakovala.
Seneca
Zkušenost je název, který dáváme svým chybám a omylům.
Oscar Wilde
Poděkování
Poděkování patří především vedoucímu mé práce Mgr. Romanu Švaříčkovi, Ph.D., a to nejen
za pomoc při zpracovávání tématu, nýbrţ především za jeho neutuchající zájem o mou práci.
Mému vedoucímu patří rovněţ omluva za VELKÉ mnoţství konzultací mimo jeho
konzultační hodiny.
Stejně tak musím poděkovat rodině a všem blízkým za jejich podporu při studiu.
4
Obsah 1. Úvod ................................................................................................................................................ 6
Teoretická část práce I......................................................................................................................... 8
2. Testování a typy testů ..................................................................................................................... 8
2.1 Testy a testování obecně ............................................................................................................... 8
2.2.1 Testy schopností ......................................................................................................................... 9
2.2.2 Testy osobnosti .......................................................................................................................... 9
2.2.3 Testy výkonu ............................................................................................................................. 10
3. Didaktický test ............................................................................................................................... 11
3.1.1 Konstruktová validita didaktického testu ................................................................................. 12
3.1.2 Objektivita didaktického testu ................................................................................................. 13
3.1.3 Reliabilita didaktického testu ................................................................................................... 13
3.2 Standardy testování znalostí u didaktických testů ...................................................................... 14
3.3 Klasifikační hlediska didaktických testů....................................................................................... 17
3.4 Zápočet ........................................................................................................................................ 18
4. Teoretické důvody pro práci se zpětnou vazbou a chybou ........................................................... 19
4.1 Lidské učení ................................................................................................................................. 19
4.2 Typy zpětné vazby ve školním učení, korektivní zpětná vazba ................................................... 20
4.3 Typy zpětné vazby u testů na vysoké škole ................................................................................. 22
Teoretická část II. – zpětná vazba a korektivní zpětná vazba ve školní realitě ................................. 24
5. Vliv korektivní zpětné vazby na retenci a porozumění učivu ........................................................ 24
5.1 Empirické výzkumy potvrzující pozitivní vliv korektivní zpětné vazby na proces učení a retenci24
5.2 Iniciační test, učení rozšířené o test, zpětná vazba a její vliv na retenci ..................................... 27
5.3 Argumenty proti nutnosti zpětné vazby – učení bez zpětné vazby ............................................ 30
6. Učební styly a použití testu jako učebního materiálu ................................................................... 32
6.1 Učební styly a autoregulace učení ............................................................................................... 32
6.2 Autoregulace učení...................................................................................................................... 32
6.3 Studenti začátečníci a autoregulace učení .................................................................................. 34
6.4 Studenti pokročilí a autoregulace učení ...................................................................................... 34
6.5 Styly učení studentů a autoregulace učení ................................................................................. 35
6.6 Soulad učebního stylu a autoregulace učení s vnějšími podmínkami ......................................... 36
6.7 Přílišná důvěra ve vlastní schopnosti a AIM hypotéza ................................................................ 37
5
7. Důsledky zjištění ve školní realitě .................................................................................................. 41
7.1 Test znalostí s uzavřenými odpověďmi ....................................................................................... 41
7.2 Testy znalostí s otevřenými odpověďmi ...................................................................................... 44
8. Výsledek a závěr, diskuse. Možné budoucí výzkumy. ................................................................... 45
9. Použitá literatura ........................................................................................................................... 47
6
1. Úvod
Ve své teoretické bakalářské diplomové práci1 se zabývám moţným pouţitím testů znalostí
jako učebního nástroje, přičemţ hlavní důraz bude kladen specificky na vysokoškolské učení
a s ním související testování znalostí.
Mým cílem je přinést argumenty vyslovující se pro to, ţe písemný test, který je na vysokých
školách pouţíván výhradně za účelem evaluace či ověření znalostí, není neutrální situací
v procesu učení. Naopak bude mou snahou dokázat, ţe test a testování znalostí jsou
specifickou situací, jeţ sama o sobě podporuje zapamatování naučeného a pozdější výkon při
dalším učení či testu, coţ platí především v případě, kdy je studentovi k testu poskytnuta
korektivní zpětná vazba (viz dále). Právě při poskytnutí zpětné vazby a v případě, kdy je
studentovi umoţněno zjištění chyb, které jím v testu byly učiněny (tj. při poskytnutí
korektivní zpětné vazby) se poté z testu stává prostředek učení. Termíny zpětná vazba
a korektivní zpětná vazba budou podrobně specifikovány.
Test jako učební prostředek následně umoţňuje studentovi sebereflexi a úpravu či změnu
vlastní autoregulace učení, ověření správného přístupu k učení a látce nebo dokonce změnu
pojetí učení a stylu učení, tj. studijní strategie.
Ve druhé kapitole mé práce popisuji principy testování znalostí a typy testů pouţívaných jako
měřicí nástroj, poté se v kapitole třetí věnuji specificky didaktickému slouţícímu k testování
znalostí na českých vysokých školách. Jsou popsány nejen základní charakteristiky
didaktického testu, jako jsou jeho konstruktová validita, objektivita a reliabilita, nýbrţ
i standardy testování znalostí těmito testy a jeho klasifikační hlediska.
Ve druhé teoretické části práce nakonec přiblíţím výsledky studií, které se věnují práci
s chybou a pouţití testů jako učebního materiálu podporují. V této části jsou představeny
studie, které rozdílným výzkumným designem zkoumaly, jakým způsobem ovlivňuje
přítomnost, resp. nepřítomnost korektivní zpětné vazby poskytnuté k testům znalostí pozdější
1 Práce je po domluvě s vedoucím ryze teoretická, tj. bez aplikační části
7
retenci – vybavení si učiva. Jak bude ukázáno, moţný přínos korektivní zpětné vazby není
v pouhé lepší retenci učiva, nýbrţ i v jeho lepším pochopení.
V následující části práce se poté věnuji pouţití testu jako učebního materiálu ve spojitosti
s učebními styly, studentovou autoregulací učení a jeho přístupem k učení. Jak píši, pro
pouţití testu jako učebního matriálu je nutný soulad učebního stylu, autoregulace učení
a externích podmínek. Nakonec přináším i pohled na druhý moţný důsledek nepřítomnosti
korektivní zpětné vazby u testů pro studenty – jejich přílišnou důvěru ve vlastní schopnosti.
Přináším pohled na problematiku z hlediska AIM (accuracy-influences-memory) hypotézy
a výsledek experimentální studie, která se analogickou situací zabývala.
V další kapitole se zabývám důsledky svých zjištění ve školní realitě. Popisuji dva typy
didaktických testů pouţívaných na vysokých školách k měření znalostí – testy
s uzavřenými/otevřenými otázkami a následně dopad, jaký můţe mít zveřejnění/nezveřejnění
korektivní zpětné vazby u těchto testů.
Ve výsledku konstatuji, ţe existují empirické důkazy pro pouţití testů jako učebního matriálu,
ovšem pouze za podmínky, ţe je zároveň přítomna korektivní zpětná vazba.
Cílem mé práce je přinést argumenty vyslovující se pro zveřejňování výsledků testů a jejich
pouţití jako učebního nástroje, přičemţ bych chtěl především poukázat na vhodnost takového
počínání. Hlavní motivací pro moji práci je osobní zkušenost s testováním na vysokých
školách a zároveň přemýšlení o vlastních chybách po napsání testu. Takové přemýšlení, jak
bude ukázáno dále, je totiţ nezřídka velmi těţké – studenti namnoze nemohou vidět své
opravené testy, neví tedy, kde udělali chybu a nemohou se z ní proto poučit.
Poznámka k citacím a v práci použité citační normě: S ohledem na pouţití velkého mnoţství databázových zdrojů
a elektronických informačních zdrojů jsem jako normu pro citování pouţil citační standard APA (Americké psychologické
asociace), zpracovaný pro české podmínky Mgr. et Mgr. Janem Marešem, Ph.D. z katedry Psychologie FSS MUNI.2
2 Citační normu lze nalézt pod odkazem: psych.fss.muni.cz/materialy/citace.doc
8
Teoretická část práce I.
2. Testování a typy testů
V následující kapitole se budu zabývat testováním a typy testů. Nejprve obecně popíši, jaké
typy testů se pouţívají pro testování v různých oblastech lidské činnosti a co se těmito testy
měří. Následovat bude představení didaktického testu jako nejpouţívanější metody k měření
či ověřování znalostí studentů ve všech typech škol i na univerzitách.
2.1 Testy a testování obecně
Do češtiny byl výraz „test“ převzat z angličtiny, kde se jím podle Hornbyho (cit. dle Maněna
& Chrzová, 2008) obecně označuje zkouška nebo postup zkoumání kvality, hodnoty nebo
sloţení.
Pedagogický slovník o testu uvádí, ţe se ve významu specificky definované zkoušky pouţívá
v lékařství, chemii, statistice. V pedagogice jde o nástroj měření výkonu, v psychologii
o měření schopností, dovedností, osobnosti apod. (Průcha, Walterová, Mareš, 2003).
Chráska (1999) píše, ţe testů a testování se pouţívá pro měření výkonu v akademické
i neakademické oblasti, v oblasti poznávací, afektivní a psychomotorické. Nejčastěji se
prostřednictvím testů a testování měří se výkon, potenciál, schopnosti či osobnostní
charakteristiky (podrobná specifikace těchto jednotlivých testů viz dále).
Hlavním účelem testování je podle stejného autora měření dosaţeného výkonu či potenciálu,
diagnóza slabých a silných stránek výkonu, hodnocení výkonu a schopností, moţnost
srovnávání individuí a skupin a mnohostranná diagnostika (ibidem).
Cronbach dělí testy v psychologické oblasti na testy schopností (abilities) a testy osobnosti
(cit. dle Ferjenčík, 2000), přičemţ testy výkonu a vědomostí jsou součástí testů schopnosti,
podle Chrásky (1999) lze v obecné rovině dělit lze testy dělit na testy schopností, testy
osobnosti a testy výkonu – autor rozlišuje testy výkonu jako specifickou jednotku, která má
význam především v pedagogice v podobě didaktických testů (viz dále).
9
Specifikaci jednotlivých typů testů uvádím níţe.
2.2.1 Testy schopností
Testy schopností měří, jaké schopnosti (předpoklady či dispozice) má jedinec pro řešení
určitých úloh nebo situací určitého typu. Podle Urbánka sem patří například tzv. „test
vybraných pracovních úkolů“. Autor ho specifikuje jako: „Test schopností jedince plnit
úkoly, ze kterých je sloţen výkon nějakého povolání (Urbánek, 2002, s. 146).“
Patrně nejznámějšími testy schopností jsou podle Urbánka (2002) stejně jako Chrásky (1999)
testy inteligence, které zjišťují jedincovy předpoklady orientovat se v problémových situacích
a tyto situace řešit.
Ferjenčík (2000) testy schopností specifikuje jako tzv. „testy maximálního výkonu“ a řadí
mezi ně 1) testy všeobecných mentálních schopností – IQ, dále 2) testy speciálních mentální
schopností, 3) testy výkonu a vědomostí a nakonec 4) testy dovedností.
2.2.2 Testy osobnosti
Testy osobnosti označuje Ferjenčík (2000) za testy typického výkonu. Jejich cílem je podle
stejného autora získat jedincovy nejtypičtější charakteristiky, k čemuţ se pouţívá především
dotazníků a výkonových testů osobnosti (ibidem).
Podle Chrásky (1999) tyto testy měří především stránek osobnosti jako například vlastnosti
temperamentu, osobnostní zaměření nebo motivace, dále charakterové vlastnosti jako je
úzkostnost, neuroticismus apod..
Cílem testů osobnosti je podat charakteristiku osobnosti testovaného jedince či jeho
povahových rysů (například míra introverze/extraverze). Typické jsou Eysenckovy testy
temperamentu či test osobnosti od stejného autora, Myers-Briggsův test osobnosti (MBTI)
a další.
10
2.2.3 Testy výkonu
Testy výkonu se velice často pouţívají v pedagogických výzkumech, přičemţ jejich
nejčastější podobou je test rychlosti anebo test úrovně testovaných (Ferjenčík, 2000).
Prvně jmenovaný test specifikuje Půlpán takto: „Test rychlosti je časově omezený test
sestavený z velmi snadných úloh. Výkon je dán počtem správně vyřešených úloh (Půlpán,
1991, s. 14).“ Typickými jsou podle stejného autora testy numerického počítání, řečové
dovednosti či test rychlosti sportovního výkonu (ibidem).
Test úrovně je oproti testu rychlosti bez časového omezení a sestavený z úloh s rostoucí
obtíţností. Půlpán uvádí: „Předpokládá se, ţe testovaný ukončí řešení testu u úlohy, jejíţ
obtíţnost je tak vysoká, ţe ji jiţ není schopný řešit (Půlpán, 1991, s. 15).“
Pro pedagogický výzkum a školní měření znalostí má podle Bílka s Jeřábkem (2010)
a Chrásky (1999) největší význam specifická podskupina testů výkonu - testy didaktické.
Těmito testy se budu podrobně zabývat v následující třetí kapitole mojí práce.
11
3. Didaktický test
Pro měření3
či ověřování znalostí studentů se na školách (a nejen těch vysokých) pouţívají
specifické, takzvané didaktické testy (angl. achievement test). Půlpán didaktické testy
definuje takto: „Didaktické testy jsou prostředek systematického zjišťování výsledků výuky
(Půlpán, 1991, s. 3).“ Materiál Portálu pro informační gramotnost přináší obsáhlejší pohled na
tvorbu testu: „Didaktický test chápeme jako zkoušku, která se orientuje na objektivní
zjišťování úrovně zvládnutí učiva u určité skupiny lidí. Od běţné zkoušky se didaktický test
liší zejména tím, ţe je navrhován, ověřován, hodnocen a interpretován podle určitých, předem
stanovených pravidel (infogram.cz).“
Cíle didaktického testu shodně specifikují materiály Centra pro zjišťování výsledků
vzdělávání a stránky portálu Nová maturita takto: „Prostřednictvím didaktických testů
obvykle chceme zjišťovat úroveň znalostí a dovedností ţáků v určité oblasti. Údaje, které na
základě testu získáme, jsou však hodnotné pouze za předpokladu, ţe pouţitý test je kvalitním
měřícím nástrojem. Kvalitní test musí vykazovat tyto vlastnosti: objektivita, validita
a reliabilita (www.cermat.cz; www.novamaturita.cz).“ Těmto termínům se budu věnovat
v následujících podkapitolách.
Půlpán (1991) k základním vlastnostem didaktického testu přidává ještě praktičnost, jíţ
definuje jako: „snadnost zadávání, skórování a interpretace výsledků. Testovaní by měli
snadno a rychle pochopit způsob záznamu odpovědí, test by měl být co nejkratší a testovací
čas úměrný závaţnosti výsledku (Půlpán, 1991, s. 12).“
Praktický test by měl být podle stejného autora (ibidem) jednoduchý na vyhodnocení a jeho
výsledky snadno interpretovatelné, přičemţ náklady na techniku a materiál by měly současně
být co nejniţší. Jak ale Půlpán dodává, nejdůleţitějším kritériem testu je validita, praktičnost
testu by tedy neměla být uplatňována na úkor validity.
3 Měřením je míněno typicky známkování písemných testů – zkoušek, ověřováním pak dosažení minimální nutné hranice
pro zápočet
12
3.1.1 Konstruktová validita didaktického testu
Konstruktová validita nebo jen zkráceně validita u testu vypovídá o tom, „zda skutečně
měříme to, co měřit chceme. Přitom předpokládáme dostatečnou přesnost měření – reliabilitu
(viz dále). Vysoká konstruktová validita projektu znamená, ţe měřené proměnné dobře
reprezentují pojmy, s nimiţ v projektu pracujeme (Jeţek, Vaculík, Wortner, 2006, s. 7).“
Podle materiálu Centra pro zjišťování výsledků vzdělávání „Validita představuje shodu mezi
funkčností testu a účelem, pro který byl test vytvářen (www.cermat.cz).“
Podle Půlpána je didaktický test validní, pakliţe „dobře slouţí účelu, pro který byl
konstruován, kdyţ měří to, co má být měřeno (Půlpán, 1991, s. 11).“ Podle stejného autora
(ibidem) je moţno hodnotit validitu testu jen nestatistickými metodami, např. pomocí jiných
hodnotitelů či hlubším rozborem procesu řešení testových úloh respondenty.
Materiál cermatu ke konstruktové validitě dále uvádí, ţe nízká validita testu znemoţňuje
interpretaci výsledků a tedy jejich další vyuţití v pedagogické praxi. Můţe být ohroţena
především nesprávným postupem při konstrukci úloh nebo chybným výběrem učiva, které má
být testem ověřováno (ibidem).
Půlpán (1991) dělí konstruktovou validitu u testů ještě na kriteriální, obsahovou a pojmovou.
Kriteriální validita podle něj „označuje, do jaké míry jsou výsledky testu v souhlasu
s nějakým znakem (kritériem) (Půlpán, 1991, s. 13). Například test studijních předpokladů
(TSP) pouţívaný na FF MUNI je tím validnější, čím více jsou jeho nejlepší absolventi úspěšní
ve studiu.
Obsahová validita podle autora (ibidem) označuje, do jaké míry obsah testu reprezentuje
oblast, ve které chceme určit výkon testovaného. Vysoce validní test pokrývá celou oblast
učiva, kterou měl student nastudovat.
Pojmová validita podle Půlpána (ibidem) vyjadřuje vztah příslušné teorie a řešení testové
úlohy. Zásadní otázka, které se pojmová validita týká, zní podle Půlpána: „Je řešení testové
13
úlohy skutečně mírou té vlastnosti, kterou jako podstatnou předpokládáme? (Půlpán 1991,
s. 12).“
3.1.2 Objektivita didaktického testu
Objektivně zkonstruovaný didaktický test je podle materiálů Centra pro zjišťování výsledků
vzdělávání (www.cermat.cz) „schopný poskytnout objektivní a tedy srovnatelné výsledky,
které závisí pouze na znalostech a dovednostech jednotlivých ţáků. V testu jsou ţákům
předloţeny shodné úlohy s předem určeným správným řešením a se stejným časovým
limitem. Ţáci tak mají shodné výchozí podmínky při ověřování svých znalostí a dovedností.
Tyto shodné podmínky současně umoţňují porovnávat výsledky dosaţené jednotlivými ţáky
(ibidem).“
Podle Půlpána objektivitou měření rozumíme „zajištění takových podmínek testování, aby se
zamezilo zkreslování výsledků a interpretace testu (Půlpán 1991, s. 13).“ Výhodou ve
srovnání s ústním zkoušením je podle materiálu Centra pro zjišťování výsledků vzdělávání
v případě didaktického testu „menší subjektivní vliv osobnosti učitele na zadání úkolů
a hodnocení jejich řešení“ a „srovnatelné podmínky (úkoly, čas, hodnotící kritéria) pro
všechny ţáky (cermat.cz),“ přičemţ samozřejmá je menší časová náročnost oproti ústnímu
zkoušení jednotlivých ţáků.
3.1.3 Reliabilita didaktického testu
Reliabilita je u testů „Spolehlivost (přesnost) s níţ test měří cokoli, co měří. Jinými slovy také
míra, v níţ je měření prosto náhodných a systematických chyb (Jeţek, Vaculík, Wortner,
2006, s. 11).“ Materiál Cermatu uvádí, ţe reliabilita představuje míru přesnosti a spolehlivosti
testu a dodává: „Pouze test, který měří přesně a spolehlivě, poskytuje směrodatné informace
o úrovni znalostí a dovedností ţáků. Přesné měření znamená, ţe výsledek v testu vypovídá
o skutečných znalostech a dovednostech ţáků (www.cermat.cz).“ Podle Půlpána vyjadřuje
14
reliabilita přesnost a spolehlivost testu a autor dodává: „Výsledky didaktického testu se musí
co nejméně lišit od hodnot skutečných (Půlpán, 1991, s. 12).“
3.2 Standardy testování znalostí u didaktických testů
Beuk (2005) rozlišuje u didaktických testů dva standardy testování znalostí – relativní
a absolutní.
Při pouţití relativních didaktických testů jsou dělítka4 – hranice pro úspěšné absolvování
testu - vytvořena v závislosti na rozdělení skórů jednotlivých kandidátů. Autor k těmto testům
dodává: „Při celkovém vysokém skóre5
všech účastníků je tato hranice vyšší, neţ v případě
celkově nízkých skóre6. Na kritérium tedy mají výrazný vliv průměr a rozloţení četností
jednotlivých skórů7 (Beuk, 2005, s. 147)“. V českých zdrojích jsou takové testy někdy
označovány jako rozlišovací či srovnávací, případně NR-testy podle anglického ekvivalentu
norm-referenced tests (cermat.cz).
Absolutní testy pak stejný autor definuje takto: „Při pouţití absolutních tesů je dělítko určeno
pomocí externího kritéria. Jeho stanovením se určuje, jaká míra znalostí je nutná pro úspěšné
absolvování8 (Beuk, 2005, s. 148).“ Hranice stanovená dělítkem nezávisí na aktuálních
výkonech participantů, nepoměřuje mezi nimi, jedno kritérium je platné pro všechny
testované. Cílem testu je zjistit, zda a jak ţáci zvládli danou látku. Absolutní testy české
zdroje téţ někdy označují jako testy ověřující či kriteriální, případně jako „CR testy“ dle
anglického ekvivalentu criterion-referenced tests (cermat.cz).
4 V originále „cut-off score” 5 Efekt stropu, jednoduchý test, špatně rozlišující v horní hranici skóre 6 efekt podlahy, obtížný test, špatně rozlišující v dolní hranici skóre 7 V originále: “When scores are high, the cut-off score or passing score will be higher than when scores are low. The average and the spread of the frequency distribution of scores have a pronounced effect on where the passing score is placed” 8 V originále: “When absolute methods are used, the test scores are interpreted in terms of an external criterion. To fix the passing score, examiners have to consider especially whether the candidates have done well enough. The passing score is not dependent on the actual achievements of the participating candidates.”
15
Jak Beuk (2005) dodává, relativní metody jsou pouţívány k testování a následnému
porovnání jednotlivých participantů, absolutní testy jsou pouţívány k testování souvisejícímu
s udělením nějaké licence (typicky řidičský průkaz) či známky.
Na univerzitách jsou při testování studentů na závěr semestru pouţívány testy absolutního
výkonu, přičemţ technické minimum (dělítko) bývá stanoveno nutnými 60% či 50%
správných odpovědí/získaných bodů. Právě takovými testy se budu zaobírat při dalším
popisu, který se bude týkat moţného pouţití testů jako učební pomůcky.
Druhy didaktických testů spolu s jejich klasifikačními hledisky přehledně zobrazuje tabulka,
viz následující strana:
16
Druhy didaktických testů spolu s jejich klasifikačními hledisky (převzato z Chráska 1999)
Druhy testů, které jsou pouţívány k testování znalostí specificky na vysokých školách, jsem
v tabulce označil tučným písmem.
Klasifikační
hledisko Druhy testů
Měřená
charakteristika
výkonu
Rychlosti Úrovně
Dokonalost
přípravy testu
a jeho
příslušenství
Standardizované Kvazistandardizované Nestandardizované
Povaha
činnosti
testovaného
Kognitivní Psychomotorické
Míra
specifičnosti
učení
zjišťovaného
testem
Výsledků výuky Studijních předpokladů
Interpretace
výkonu Rozlišující
(relativního výkonu)
Ověřující
(absolutního výkonu)
Časové
zařazení do
výuky
Vstupní Průběžné
(formativní)
Výstupní
(sumativní)
Tematický
rozsah Monotematické Polytematické
(souhrnné)
Míra
objektivity
skórování
Objektivně
skórovatelné
Kvaziobjektivně
skórovatelné
Subjektivně skórovatelné
17
3.3 Klasifikační hlediska didaktických testů
Prvním klasifikačním hlediskem uvedeným v tabulce je Měřená charakteristika výkonu
a v ní uvedené Testy rychlosti a Testy úrovně. Testů rychlosti se podle Chrásky (1999) uţívá
pro měření toho, jak rychle jsou ţáci schopní řešit určitý typ velmi snadných testových úloh.
Typickým je také test rychlosti čtení.
Test úrovně je podle Chrásky (ibidem) nejpouţívanějším testem pro ověřování vědomostí,
časový limit je obvykle stanoven jen z praktických důvodů (např. 45 minut). Hodnocena je
úroveň studentových vědomostí a dovedností.
Druhé kritérium, dokonalost přípravy testu a jeho příslušenství, se týká standardizace
testu. Standardizované testy jsou profesionálně vytvářené testy se standardem (normou pro
hodnocení). Na vysokých školách se při ověřování znalostí vyuţívají především testy
nestandardizované, u kterých podle Chrásky (ibidem) neproběhlo ověřování na větším vzorku
ţáků a nejsou tedy známy všechny jejich vlastnosti. Tyto testy se podle stejného autora
(ibidem) někdy označují jako testy učitelské či neformální.
U povahy činnosti testovaného se u ţáků zjišťuje buď kvalita jejich poznání (kognitivní druh
testů), anebo jejich senzomotorických schopností – např. rychlost psaní na stroji.
Míra specifičnosti učení zjišťovaného testem se dělí podle toho, hodnotí zpětně dosaţení
nějakých stanovených cílů (tj. výsledků výuky), nebo zda testují schopnost dosáhnout
určitých výsledků v budoucnu (test studijních předpokladů, pouţívaný např. u přijímacího
řízení u FF MUNI.
Klasifikační hledisko interpretace výkonu a u něj uvedené testy rozlišující a ověřující jsou
ve shodě s dříve uvedeným dělením testů podle Beuka.
Hledisko Časové zařazení do výuky se týká období semestru, kdy je test zařazen.
Tematický rozsah se týká látky, jejíţ znalost test ověřuje – monotematické didaktické testy
zkouší téma jediné látky, kdeţto polytematické zkouší učivo více témat či celků (Chráska,
1999).
18
Posledním hlediskem je Míra subjektivity skórování, přičemţ zmíněné hledisko se týká
moţnosti rozhodnout, zda úloha byla řešena správně či špatně (Chráska, 1999). Většina
univerzitních testů jsou testy objektivně skórovatelné, mezi subjektivně skórovatelné úlohy
patří široké otázky s volnou odpovědí, které zkouší komplexní vědomosti (ibidem).
3.4 Zápočet
V případě písemných zápočtů, které jako takové lze označit za zvláštní druh didaktických
testů ověřujících absolutní výkon, je studentovi na základě jeho výkonu uděleno pouze
hodnocení uspěl/neuspěl. V takovém případě je jeho povědomí o správných či špatných
odpovědích ještě menší neţ u známky z písemné zkoušky, která je udělena v závislosti na
procentu studentových správných odpovědí (viz dále).
Existuje výjimka v podobě tzv. klasifikovaného zápočtu, udíleného rovněţ na MU, ovšem
jeho vyuţité při testech je velmi řídké. Jak uvádí Studijní a zkušební řád MUNI: „Zápočtem
nebo klasifikovaným zápočtem se ukončují předměty, jejichţ poţadavky jsou plněny
průběţně především v době jejich výuky stanovené týdenním nebo blokovým rozvrhem
(is.muni.cz/auth/help/szr_do_1_2_2012).“ Z informací v Informačním systému Masarykovy
univerzity (MUNI) dále vyplývá, ţe klasifikovaný zápočet je nejvíce vyuţíván na
Přírodovědecké fakultě či Fakultě sportovních studií (ibidem).
19
4. Teoretické důvody pro práci se zpětnou vazbou a chybou
V následující části začnu popisem různých definicí lidského učení, přiblíţím rozličné typy
zpětné vazby, které lze učícímu se ţákovi poskytnout, přičemţ se zaměřím především na
oblast vysokého školství a tzv. korektivní zpětnou vazbu, která je z hlediska pouţití testu jako
učebního nástroje nejdůleţitější.
4.1 Lidské učení
Rozličné definice lidského učení přináší pohledy na toto učení z několika moţných úhlů
pohledu: „Lidské učení má velký počet rozmanitých druhů i forem (Čáp a Mareš, 2001,
s. 80),“ případně: „lidské učení je komplexní a zahrnuje kromě motorických odpovědí také
kognitivní a zejména verbální sloţky (Nakonečný, 1995, s. 321).“
Kulič přináší podrobnější definici lidského učení: „učení je proces, v jehoţ průběhu
a důsledku mění člověk svůj soubor poznatků o prostředí přírodním a lidském, mění své
formy chování a způsoby činnosti, vlastnosti své osobnosti a obraz sebe sama. Mění své
vztahy k lidem kolem sebe a ke společnosti, ve které ţije – a to vše směrem k rozvoji a vyšší
účinnosti. K uvedeným změnám dochází především na základě zkušeností, tj. výsledků
předcházejících činností, které se transformují na systémy znalostí – na vědění. Jde přitom
o zkušenosti individuální nebo o přejímání a osvojování zkušenosti společenské (Kulič, 1992,
s. 32)." Je zřejmé, ţe lidské učení se netýká pouze získávání znalostí, nýbrţ se jedná
o fenomén utváření jedince v průběhu celého jeho ţivota.
Čáp a Mareš (cit. dle Krejčí, 2011) blíţe specifikují výsledky takového učení - výsledkem
lidského učení můţe být osvojení vědomostí, dovedností, návyků, postojů, ale také změna
psychických procesů a stavů i změna psychických vlastností.
Pro lidské učení je nepostradatelná zpětná vazba, kterou specifikuji na další stránce.
20
4.2 Typy zpětné vazby ve školním učení, korektivní zpětná vazba
Zpětnou vazbu lze podle Reitmayerové a Broumové (2007) obecně pojmout jako informaci
upozorňující nás na to, zda chování nějakého systému je či není na správné cestě. Jde tedy
o informaci poskytující náhled na vnější i vnitřní projevy chování.
Slavík (1999) přináší základní rozdělení typů zpětné vazby na 1) zpětnou vazbu (hodnotící)
a 2) zpětnou vazbu nehodnotící. První zmíněnou (hodnotící) zpětnou vazbu, anglicky
evaluative feedback, popisuje autor takto: „Zpětná vazba je informační vztah, v němţ je
vykonavateli určité činnosti poskytována informace o důsledcích této činnosti (Slavík, 1999,
s. 186).“ Jak dále autor píše (ibidem), na podkladě takové zpětné vazby můţe vykonavatel
korigovat či jinak upravovat svou činnost vzhledem ke stanoveným cílům.
Označení „hodnotící zpětná vazba“ podle Slavíka je významově shodné s označením
„korektivní zpětná vazba“, jak ji pouţívají mj. Hattie a Timperleyová (2007), Agarwall
(2008) a další. Zároveň je pro účely mojí práce takové označení vhodnější, jelikoţ dané
spojení naznačuje, ţe studentovi nebylo předáno pouze hodnocení ve formě známky (např.
A – F), ale také korektivní informace vypovídající o tom, které poloţky v testu jsou správně
a které nikoliv. V celém dalším textu proto pouţívám právě spojení „korektivní zpětná
vazba“.
Zpětnou vazbu nehodnotící, anglicky nonevaluative feedback, specifikuje Slavík jako:
„Zpětná vazba je komentář určité situace, ve kterém není obsaţený hodnotový soud, ale pouze
potvrzení, ţe ho mluvčí bere na vědomí a nějak proţívá určitou situaci, pracovní postup apod.,
aniţ by o tom vyslovil hodnotový soud (Slavík, 1999, s. 186).“
Termín hodnocení, s nímţ budu v práci dále pracovat, chápu podle Slavíkovy definice (in
Průcha, 2009, s. 587) jako: „Hodnocení studentů je interpretační a komunikační proces, který
poskytuje diagnostické informace o porovnatelných kvalitách učebních výkonů a chování
studentů s cílem zvyšovat kvalitu učení a efektivitu vyučování. Hodnocení ovlivňuje
21
autoregulaci studentského učení a motivaci k němu, působí na sociální vztahy, sebepojetí
nebo aspirace studentů atd.“
Hodnocení, které je obsaţeno ve zpětné vazbě, můţe být pozitivní či negativní. V případě
pozitivní zpětné vazby se jedná o potvrzení správnosti ţákovské odpovědi (ať jiţ verbální
nebo písemné), v případě zpětné vazby negativní naopak o její odmítnutí ţákovské odpovědi
a signalizaci chyby. Mareš a Křivohlavý (cit. dle Šeďová, Švaříček & Šalamounová 2012)
zpětnou vazbu chápou jako informaci určenou ţákovi, která jej má informovat o tom, jak
probíhá proces jeho učení.
Typy negativní zpětné vazby člení Mareš a Křivohlavý (ibidem) rovněţ do čtyř typů. Prvním
typem negativní zpětné vazby je prostá detekce chyby – učitel dá najevo, ţe odpověď je
nesprávná, druhým typem je identifikace chyby spojená se specifikací nesprávného údaje či
pasáţe v ţákovském výkonu; třetím typem je interpretace chyby čili poskytnutí vysvětlení,
jak k chybě došlo a posledním čtvrtým typem je korekce chyby spojená s podáním správné
odpovědi.
Ve výukové komunikaci podle Šeďové, Švaříčka a Šalamounové (2012) přichází zpětná
vazba obvykle bezprostředně po tom, co ţák podá nějaký výkon (např. odpoví na otázku
učitele),
a předpokládá se, ţe ţák na jejím základě reguluje svůj další učební postup, coţ vede ke
zlepšení jeho výkonu v budoucnosti.
Taková zpětná vazba se týká především vyučovací hodiny a verbální komunikace. U testů,
o kterých pojednává má práce, není příliš obvyklé, aby ţák obdrţel informaci ihned po
napsání. Výjimkou jsou testy v e-learningovém modulu Masarykovy univerzity, takzvaném
elfu.
22
4.3 Typy zpětné vazby u testů na vysoké škole
U testů na vysokých školách se zpětná vazba můţe vyskytnout vţdy jen ve dvou z celkových
čtyř moţných typů u pozitivní zpětné vazby a stejně tak u dvou projevů u vazby negativní.
V případě pozitivní zpětné vazby učitel buď odpověď akceptuje, coţ v testu označí známou
„fajfkou“ případně hodnocením „správně“ či „ano“. Druhou moţnou situací je, ţe odpověď
akceptuje a spolu s výše zmíněným označením ji ještě rozvine či doplní – z logiky věci
vyplývá, ţe v případě správné odpovědi nelze obdrţet tzv. korektivní zpětnou vazbu, viz dále.
V případě vazby negativní učitel u písemných testů buď pouze zaškrtne odpověď jako
nesprávnou, anebo případně ještě specifikuje, který údaj či pasáţ ţákova výkonu je nesprávná.
Korekce chyby spojená s uvedením správné odpovědi se na vysokých školách vyskytuje
takřka výhradně jen u on-line testů. Je proto patrné, ţe ani v případě negativní zpětné vazby se
nejedná o čistě korektivní zpětnou vazbu.
Hattie a Timperleyová (2007) člení zpětnou vazbu s ohledem na její zaměření a rozlišují
následující čtyři úrovně: 1) zpětná vazba zaměřená na úkol9, 2) zpětná vazba zaměřená na
proces zvládnutí úkolu10
, 3) zpětná vazba zaměřená na seberegulaci11
a 4) zpětná vazbu
zaměřená na sebe sama12
.
Pro testování znalostí lze uvaţovat o dvou aţ třech ze zmíněných typů zpětné vazby. Jednak o
zpětné vazbě zaměřené na úkol, kterou popisují autorky následovně: „Tato úroveň zahrnuje
zpětnou vazbu týkající se toho, jak dobře byl úkol zvládnut či proveden, odlišuje správné
odpovědi od špatných (Hattie a Timperleyová, 2007, s. 91)“.13
Jak autorky dále uvádějí, tento
typ zpětné vazby je znám jako „znalost výsledků“ či „korektivní zpětná vazba“14
(ibidem).
9 V originále: „Feedback about the task (FT)“
10 V originále: Feedback about the processing of the task (FP) 11 V originále: Feedback about self-regulation (FR) 12 V originále: Feedback about the self as a person (FS). 13 V originále: This level includes feedback about how well a task is being accomplished or performed, such as distinguishing correct from incorrect answers 14 V originále: „knowledge of results „ a „corrective feedback“
23
Zároveň je moţné při testování znalostí uvaţovat o vyuţití zpětné vazby zaměřené na proces
zvládnutí úkolu: „Hlavní část této zpětné vazby se týká studentových strategií hledání chyby“
a dále „tyto chyby mohou indikovat neúspěch a potřebu změny studijní strategie či volby
rozdílných studijních strategií, (potřebu) být více efektivní v aplikování strategií anebo
potřebu vyhledání pomoci (Hattie a Timperleyová, 2007, s. 93).“15
V reálné situaci se můţe zmíněná zpětná vazba objevit u studenta po testu či zkoušení, pokud
má moţnost seznámit se s výsledky své práce. Právě v takové chvíli můţe změnit svou
studijní strategii.
15 V originále „major type of FP relates to students’ strategies for error detection“ a „Such errors may indicate failure and a need to restrategize, to choose different strategies, to be more effective in applying strategies, and/or to seek help“
24
Teoretická část II. – zpětná vazba a korektivní zpětná vazba ve
školní realitě
5. Vliv korektivní zpětné vazby na retenci a porozumění učivu
V této části práce se zaměřím na syntézu zjištění, uvedených v částech předchozích. Nejprve
představím výsledky empirických výzkumů, které zkoumaly vliv (korektivní) zpětné vazby
při učení na retenci či porozumění látce. I s vyuţitím těchto zjištění poté přinesu syntézu
v práci učiněných zjištění a jejich dopad na školní realitu.
5.1 Empirické výzkumy potvrzující pozitivní vliv korektivní zpětné vazby na proces
učení a retenci
Pouţití testů jako učebního materiálu nutně souvisí s přítomností korektivní zpětné vazby,
zmíněné v úvodu mé práce. Studie (Larsen et al., 2009; Agarwal et al., 2008; Bryant
& Ainsfeld 1969 a další) zkoumající vliv zpětné vazby na zapamatování informací se shodují
v tom, ţe korektivní zpětná vazba pomáhá studentům nejen s uvědoměním si chyb, ale také se
zapamatováním zkoušené látky. Výsledky vybraných studií, které se týkají toho, jaký vliv má
přítomnost/nepřítomnost korektivní zpětné vazby v testech evaluujících různé typy
vědomostí, shrnuji níţe.
Larsen et al. (2009) zkoumali, zda opakované testování znalostí nabytých v situacích
výukového typu (jednalo se didaktickou konferenci) povede k jejich lepšímu vybavení
později. Po přednášce týkající se dvou témat – 1) stavů epilepsie a 2) Myasthenia gravis
(MG), specifického nervosvalového onemocnění16
- byli účastníci rozděleni do dvou skupin.
Členové 1. skupiny nejprve vyplnili test týkající se epilepsie a poté studovali přehledový arch
o MG, členové 2. skupiny vyplnili test týkající se MG a pak studovali arch o epilepsii (šlo
tedy o mezisubjektový plán). Larsen et al. uvádějí: „Testování i studování následovalo
okamţitě po přednášce a poté při dvou dalších příleţitostech po době cca 2 týdnů, po kaţdém
testu obdrţeli participanti (korektivní) zpětnou vazbu. Po 6 měsících respondenti psali
16
Nemoc, při níž je oslaben volní pohyb vykonávaný příčně pruhovaným svalstvem
25
závěrečný test týkající se obou témat17
(Larsen et al, 2009, s. 1176).“ V testu týkajícím se
stavů epilepsie skórovali ti respondenti, kteří byli z epilepsie testováni, průměrně o 11% lépe
neţ ti respondenti, kteří studovali přehledový arch (P <0,05; Cohenovo D = 0,65; tedy střední
efekt). V testu týkajícím se MG skórovali respondenti, kteří byli na MG testováni, v průměru
o 17% lépe neţ ti respondenti, kteří jen četli přehledový arch (P<0,001; Cohenovo D = 1,30;
tedy velký efekt). Meziskupinově přineslo opakované testování o 13% lepší výsledky neţ
opětovné studování přehledového archu (P<0,001; Cohenovo D = 0,91; tedy velký efekt).
Z výsledků výzkumu je patrné, ţe opakované testování mělo na mnoţství zapamatovaných
informací větší vliv neţ opakované studium přehledového archu, přičemţ pro účely mé práce
je podstatná informace o poskytnuté zpětné vazbě. Výzkumný design studie poměrně věrně
simuluje typickou situaci na VŠ – také po běţném testu je moţné přečíst si zdroje, které se
k němu váţí (podobně jako ve studii pouţitý přehledový arch), avšak bez přímé zpětné vazby
student neví přesně, co napsal správně a co pokazil. Tato jeho nevědomost je navíc přímo
úměrná mnoţství chyb – čím více chyb student udělá, tím méně si můţe být jistý, které
odpovědi byly správné a které chybné. Podmiňování, pozitivní či negativní zpevňování je
proto moţné pouze v případě, kdy je přítomna korektivní zpětná vazba.
V anglicky mluvících zemích se v minulosti vliv pouţití/nepouţití zpětné vazby zkoumal také
v souvislosti s tvořením singuláru či plurálu slov.18
Bryant a Anisfeld (1969) testovali vliv
korektivní zpětné vazby poskytnuté dětem z mateřské školky19
při tvorbě singuláru či plurálu
novotvarů (anglického) jazyka. Děti měly tvořit buď plurál ze singuláru či obráceně singulár
z plurálu, přičemţ jedné skupině dětí byla poskytnuta okamţitá korektivní zpětná vazba
17
V originále: „Testing and studying occurred immediately after teaching and then at two additional times at intervals of about 2 weeks. Residents received feedback after each test. Tests consisted of short-answer questions and the review sheets consisted of information identical to that on the answer sheets for the tests.
At about 6 months residents took a final test on both topics.” 18
V angličtině „pluralization rules“, popisující specifická pravidla tvorby plurálu, která nejsou rozumově
odvoditelná – např. sg.: a mouse/pl.: two mice. 19
Mateřská školka je sice vzdálená vysokoškolskému studiu, ale v principu experiment sleduje, jak zpětná vazba pomáhá v manipulaci se zcela novými, předtím neznámými informacemi, což je na VŠ poměrně častá náplň studia.
26
týkající se správnosti/nesprávnosti vytvořeného slova, děti z druhé skupiny zpětnou vazbu
nedostaly. Jak autoři (1969) uvádějí, celkový průměrný počet chyb byl při poskytnutí
korektivní zpětné vazby významně niţší neţ za jejího neposkytnutí (výsledek z porovnání
průměrů F-testem signifikantní na 0,005% hladině významnosti). Průměrný počet chyb
v sekvenci singulár-plurál (obtíţnější sekvence) byl podle autorů mnohem větší při nepodání
korektivní zpětné vazby neţ za její přítomnosti, zatímco sekvence plurál-singulár byla
v tomto ohledu zpětnou vazbou ovlivněna jen mírně20
. Bryant a Anisfeld dodávají: „Výsledky
jasně ukazují, ţe poskytnutí (korektivní) zpětné vazby vede k podstatnému zlepšení učení21
(v obou sekvencích),“ a dále: „K otestování, jak rychlé toto zlepšení bylo, jsme změřili
mnoţství chyb učiněných účastníky po první a po druhé sekvenci tvořených slov. Ze čtyř
případů přinesl signifikantní zlepšení jediný: v sekvenci plurál-singulár se za přítomnosti
zpětné vazby průměrný počet chyb 1,42 z první části sníţil na 0,94 chyb v části druhé,
výsledek byl signifikantní na 1% hladině statistické významnosti22
(Bryant a Anisfeld, 1969,
s. 253 - 254).“ Výsledky svého výzkumu uzavírají: „Postup bez (korektivní) zpětné vazby
ukazuje, jaké znalosti mohou studenti pouze okamţitě demonstrovat, postup se zpětnou
vazbou naopak ukazuje, jaké znalosti mohou rychle a ochotně získat23
(ibidem).“
Zjištění z tohoto výzkumu se netýkají přímo paměti a zapamatování, ilustrují však proces
učení se něčemu zcela novému, dosud nepoznanému – jak tomu bývá i na VŠ, kdyţ studenti
některé informace uslyší úplně poprvé. Je patrné, ţe korektivní zpětná vazba v takovém
případě umoţňuje lepší porozumění a pochopení studia, přičemţ pochopení je jednou ze
základních podmínek úspěšného naučení.
20
Přesná čísla či statistiky autoři bohužel neuvádějí a v dostupných zdrojích je není možné dohledat. 21
The results clearly indicate that the Feedback condition produced a substantial learning effect. 22
To test how rapid this learning was, Ss' performance on the first half of the list (10 items) was compared with their performance on the second half (10 items) in each condition for each of the two sequences. This analysis shows that of the four cases the only significant improvement from the first half to the second half was in the Feedback condition in the Plural-Singular sequence; mean number of errors for the first half = 1.42, mean second half = .94, £(36) = 2.66, p < .01 23
The No-Feedback procedure showed what knowledge the child can immediately demonstrate and the Feed-back procedure what knowledge he can readily acquire.
27
5.2 Iniciační test, učení rozšířené o test, zpětná vazba a její vliv na retenci
McDaniel et al. (2006) svým termínem „učení rozšířené o test“24
popisuje tu skutečnost, ţe
vykonání tzv. iniciačního testu25
zvyšuje zapamatování látky více, neţ pouhé samostatné
studium a závěrečný test. „Testování není neutrální situace v procesu učení, nýbrţ jde
o postup, který sám o sobě podporuje zapamatování a pozdější výkon při dalším testu26
(McDaniel et al., 2006, s. 200)“. Jako jednu z implikací testu ve vzdělávání uvádí jejich úlohu
v regulaci učení (kvůli známkám a hodnocení), zároveň jej ale označuje za robustní techniku,
která studentům v učení pomáhá (ibidem).
Toto zlepšení souvisí s efektem, který Roediger a Karpicke (2006) nazývají „testovací efekt“
– zlepšený výkon v pozdějším znovuvybavení látky plyne z testování těchto znalostí (krátce
po naučení).
Jak autoři uvádějí: „Tradičně spatřují učitelé test jako způsob měření toho, co student ví.
Testy ovšem nejsou jen pouhým měřením naučených znalostí, jsou i prostředkem jejich
změny, přičemţ testování naučené látky má velice pozitivní efekt na retenci tohoto učiva,“
a dále: „Toto testování má pozitivnější vliv neţ opětovné studium materiálu (které by trvalo
stejně dlouho jako zmíněný test), dokonce i tehdy, kdyţ je jeho výsledek vzdálený hranici
„výborný výkon“ a není mu poskytnuta zpětná vazba27
(Roediger a Karpicke, 2006, s. 181).“
Informace o nepřítomnosti (korektivní) zpětné vazby jako by byla v opozici vůči tématu mé
práce, je však třeba zmínit jisté konsekvence uvaţování autorů. Jelikoţ se ve zmíněné práci
jedná o iniciační test provedený okamţitě po naučení látky, spíše neţ o skutečný test jde
o jakési pokračování samotného učení se. Je tedy nutné zváţit, zda se v případě iniciačních
24 V originále „test-enhanced learning“ 25
Iniciační test je podle McDaniela test, kterým se ihned po naučení prozkouší osvojený obsah. 26
“Testing is not a neutral event in terms of learning, but may itself promote unique processing of target material that improves retention and later test performance.” 27
“The traditional perspective of educators is to view tests and examinations as assessment devices to measure what a student knows. Although this is certainly one function of testing, we argue in this article that testing not only measures knowledge, but also changes it, often greatly improving retention of the tested knowledge,” a dále “Taking a test on material can have a greater positive effect on future retention of that material than spending an equivalent amount of time restudying the material, even when performance on the test is far from perfect and no feedback is given on missed information.”
28
testů nejedná o opakování látky za pouţití testu (test vyzkouší ţáka a donutí jej zopakovat si
to, co se před chvílí naučil), coţ dobře vyjadřuje český překlad „učení rozšířené o test“.
I takové pouţití testu ovšem podporuje myšlenku o pouţití testu jako učebního materiálu.
Butler et al. (2006) a Roediger a Marsh (2005) v souvislosti s testovacím efektem doplňují:
Výzkumy ukazují, ţe pokud udělají studenti v iniciačním testu chybu a neobdrţí korektivní
zpětnou vazbu, mohou si tyto chyby uchovat i do příštích testů a vystavit se tak riziku, ţe
nesprávné informace naruší jejich znalosti (cit. dle Agarwall et al., 2008). Proto je nasnadě, ţe
také po iniciačním testu je lepší poskytnout studentům korektivní zpětnou vazbu.
Agarwall et al. (2008) testoval pouţití zpětné vazby při zkouškách, u kterých studenti
smí/nesmí pouţívat své poznámky a sešity. Za podmínek prvního testu se zavřenou knihou/se
zavřenou knihou + korektivní zpětnou vazbou28
/s otevřenou knihou/za simultánního
odpovídání29
autor měřil, jaké mnoţství znalostí studenti prokáţou při druhém testu,
uskutečněném za jeden týden. Výsledky shrnující průměrnou proporci správných odpovědí
uvádí tabulka č. 1:
Tabulka č. 1 – průměrná proporce správných odpovědí
Podmínka iniciační test retest po 7 dnech
Studium jednou (bez iniciačního testu) 0,46
Test se zavřenou knihou (pouze test po učení) 0,72 0,59
Test se zavřenou knihou + zpětnou vazbou 0,69 0,68
Test s otevřenou knihou 0,81 0,65
Simultánní odpovídání 0,82 0,63
Kontrolní skupina 0,18
28
Za podmínky zpětné vazby studenti nejprve vyplnili test bez toho, aby se dívali do knihy, po vyplnění jim byly knihy podány a studenti měli zkontrolovat své odpovědi. Měli označit odpovědi správné a u odpovědí nesprávných napsat „X“ bez toho, aniž by dopisovali správné znění odpovědí do testu. 29
Při simultánním odpovídání studenti současně četli knihu a odpovídali na otázky – knihu tedy nečetli před samotným testováním.
29
Jak autor uvádí, přítomnost iniciačního testu v jakékoli podobě zlepšuje vybavení vzpomínek
po delším časovém úseku. Testování za přítomnosti zpětné vazby vedlo k lepším výsledkům
neţ testování bez její přítomnosti (N1=18, N2=18, M1=0,68 oproti M2=0,59; Cohenovo
D=0,57; tedy střední efekt), coţ ukazuje pozitivní vliv zpětné vazby na dlouhodobé
zapamatování (Agarwal et al. 2008).
O něco lépe odpovídali při závěrečném testu studenti, kteří vyplňovali test s otevřenou
knihou, neţ ti, kteří měli knihu zavřenou a nedostalo se jim zpětné vazby (N1=18, N2=18,
M1=0,65 oproti M2=0,59, Cohenovo D=0,45; tedy malý efekt). Nebylo příliš rozdílu mezi
studenty vyplňujícími test s otevřenou knihou oproti těm, kteří při testu nepouţívali knihu, ale
dostali zpětnou vazbu. Autor k tomu dodává: „Zatímco při iniciačním testu podali studenti
s otevřenou knihou podstatně lepší výkon neţ ti, kteří do knihy nemohli nahlíţet, tato
počáteční výhoda se nepřenesla do opakovaného testu30
(Agarwal et al., 2008, s. 866)“. Jak je
zjevné i z tabulky č. 1, studenti, kterým se dostalo zpětné vazby u zavřené knihy, podali při
iniciačním testu téměř shodný výkon, jako u retestu po týdnu (M1=0,69 oproti M2=0,68),
jejich vědomosti tedy zůstaly takřka na stejné úrovni. Studenti, kteří směli pracovat
s otevřenou knihou, se však zhoršili tak, ţe klesli pod úroveň prvně jmenované skupiny.
Agarwal uzavírá: „Výsledky dokazují robustní efekty plynoucí jak z testování, tak
z přítomnosti (korektivní) zpětné vazby31
“ a dále: „Pouţití iniciačního testu přináší lepší
dlouhodobé zapamatování látky neţ studium bez testu. Přítomnost (korektivní) zpětné vazby
vedla k lepším výsledkům neţ v případě její nepřítomnosti32
(Agarwal et al., 2008, s. 866).“
Lze proto konstatovat, ţe korektivní zpětná vazba je přínosná také u učení rozšířeného o test,
přičemţ také toto testování má prokazatelný vliv na retenci.
30 „Thus, while open-book tests resulted in substantially greater initial performance than closed -book tests,
this boost in initial performance did not carry forward to the final test.“ 31
“The results demonstrate robust testing and feedback effects .“ 32
“Taking an initial test after studying produced better long-term retention than studying without testing. Feedback condition resulted in greater final performance than the closed-book test without feedback condition.“
30
5.3 Argumenty proti nutnosti zpětné vazby – učení bez zpětné vazby
Bylo nastíněno mnoţství argumentů pro zveřejňování výsledků testů a jejich pouţití jako
prostředku korektivní zpětné vazby. Lidé jsou však ve velmi specifických situacích schopní
učit se i bez její přítomnosti, Weber (2000) takový postup označuje jako učení tzv. opakované
zkušenosti, jeţ nastává „pokud jedinec neobdrţí ţádnou zpětnou vazbu ke své dřívější
činnosti předtím, neţ udělá další krok. Přesto takové učení zlepšuje jedincův výkon33
(Weber,
2000, s. 135).“ Specificky se toto učení týká 1) teorie her a 2) ekonomické aktivity, při nichţ
účastníci obdrţí buď opoţděnou, nebo velmi slabou zpětnou vazbu vztahující se k jejich
výkonu. V takových chvílích můţe účastník své (minulé) volby opravit či upravit pouze
pozorováním zisků, které mu vyplynuly či nevyplynuly z předchozího jednání, aniţ by
poznal, jaký byl skutečný stav34
(Weber, 2000).
Jedná se specificky o skupinové odhadovací hry35
či poker. V pokeru hráči neznají jiné karty
neţ vlastní, takţe musí uvaţovat o svých krocích, ale také o kartách a krocích soupeřů,
přičemţ na konci zjistí pouze to, zda prohráli nebo vyhráli. Přesto se neustálým hraním
v pokeru zdokonalují. Weber k tomu uvádí: „Pokud učení funguje pouze zpevňováním
zkušenostních závěrů, volby v podmínkách bez zpětné vazby by se neměly přibliţovat
Nashovu ekvilibriu36
. Nastávají ovšem situace, kdy se i při nedostatečném mnoţství informací
a bez zpětné vazby tyto volby k Nashovu ekvilibriu přibliţují37
(Weber, 2000, s. 134).“ Při
Weberově experimentu se volby participantů, kterým byla poskytnuta zpětná vazba, podle
očekávání Nashovu ekvilibriu přibliţovaly, stejně tak se mu ovšem přibliţovaly i volby
účastníků bez zpětné vazby. Weber toto učení označuje jako „Schopnost učit se opakovanou
33
“This type of learning occurs when individuals receive no feedback on prior performance before performing a task again, yet still improve their performance.“ 34
Tím pádem se mu nedostává opravdové zpětné vazby. 35
Cílem je např. uhádnout číslo v rozmezí 1 – 100, přičemž se jedná o skupinovou interakci. 36 Nashovo ekvilibrium (rovnováha), termín z teorie her, je definováno jako taková situace ve hře, kdy hráč
za předpokladu, že všichni ostatní zachovají svou dosavadní strategii, nemůže změnou své strategie již nic získat. 37 „If learning takes place only through reinforcement resulting from experienced outcomes, choices in the no-feedback conditions should not converge towards the Nash equilibrium. While less than under full information, there is convergence towards the equilibrium prediction in the no -feedback conditions.”
31
zkušeností s prostředím. Opakování a zkušenost se sestavou procedur mohou vést k vhledu do
problému, který je spojené s postupem na jeho nejlepší (vy)řešení, a to i za nepřítomnosti
zpětné vazby (Weber, 2000, s. 135-136).“ Experimentem Weber naznačuje, ţe se lze učit i
bez znalosti výsledků a tím pádem zpětné vazby. Pro účely školy je ale učení opakovanou
zkušeností jen málo vhodné – těţko si lze představit, ţe by byla úspěšná strategie neustálého
chození na test s očekáváním, ţe po několikátém napsání testu do jednoho předmětu napíši
test správně. Testy se jednak mění, druhak je počet pokusů o napsání zkoušky omezen
studijním řádem.
32
6. Učební styly a použití testu jako učebního materiálu
6.1 Učební styly a autoregulace učení
Pouţití test jako učebního matriálu, jak bylo ukázáno, je moţné v případě, kdy je studentovi
poskytnuta korektivní zpětná vazba. Na základě stejné podmínky je moţné uvaţovat o vlivu
korektivní zpětné vazby na autoregulaci učení. Kuliče (1992) dělí autoregulaci učení na 1)
pouhé učení se a 2) řízení vlastního učení.
Bez korektivní zpětné vazby se ţák či student můţe „pouze“ učit (případ 1), ovšem jen velice
těţko můţe své učení regulovat, jak bude ukázáno v kapitole 7 mé práce. S přítomností
korektivní zpětné vazby je moţné začít uvaţovat o řízení vlastního učení (případ 2), které
Kulič rozděluje na dvě podsloţky.
Řízení učení dělí Kulič (ibidem) na tzv. vnější, které je dle autora více rozpracováno – zabývá
se jím především pedagogika a psychologie, a vnitřní, jeţ je zastoupeno autoregulací učení.
Autoregulací učení, která je vedle znalosti výsledku testu nejdůleţitější podmínkou pro
pouţití testu jako učebního materiálu, se budu věnovat v následující kapitole.
6.2 Autoregulace učení
O autoregulaci učení Zimmerman uvádí, ţe je to aktivita jedince v procesu učení po stránce
činnostní, motivační i metakognitivní; stanovuje si cíle, iniciuje a řídí své úsilí a pouţívá
specifických strategií s ohledem na kontext učení (cit. dle Mareš 2010). Je zjevné, ţe takto
autoregulovat se student můţe pouze se znalostí výsledků testů, ať jiţ průběţných či
závěrečných. Bez podrobné znalosti výsledků své předešlé činnosti (korektivní zpětná vazba)
lze jen těţko uvaţovat a jakékoli autoregulaci, jelikoţ tato by neměla z čeho vycházet.
Předpoklady autoregulace jsou podle Mareše (ibidem), viz následující stránka:
33
Předpoklady pro studentovu autoregulaci, převzato z Mareš, 2010:
1) Potencialita kaţdého ţáka
2) Výuka musí umoţnit získat dovednost „jak se učit“
3) Vnější řízení má stimulovat autoregulaci
4) Rozvoj metakognitivních strategií v prepubertě
5) Postupným zdokonalování se ţák stává nezávislým na vnějším řízení
6) Můţe postupně lépe zvládat své emoce při učení
7) Postupně aktivní přístup k prostředí pro učení
8) Rozvoj je vázán na rozvoj „já“ (self)
9) Není ryze individuální proces; utváří se ve spolupráci s druhými (párové, skupinové,
vrstevnické učení...)
10) Je to aktivní proces; nelze „předat návod“
11) Rozvíjí se více při souladu s vnějším řízením
12) Jedná se o celoţivotní proces (vývojové změny a jejich integrace)
Jak je patrné z předloţeného textu, autoregulaci učení není moţné „natrvalo získat“, rozvíjí se
po celý ţivot/studium. I z toho důvodu je nutné předat ţákovi korektivní zpětnou vazbu
a umoţnit mu regulovat sám sebe, jak je uvedeno především v bodu 3 – díky neustálému
zjišťování chyb a jejich nápravě se student nejen správně naučí dané látce, nýbrţ se i vyvaruje
chybám v budoucnosti tím, ţe změní svůj přístup, jelikoţ vedl k chybám. Tento postup úzce
souvisí s prováděním autoregulace v praxi, jíţ Zimmerman a Schunk (cit. dle Mareš 2010)
spojili se dvěma skupinami studentů. Zmínění autoři dělí studenty na začátečníky
a pokročilé. Specifikaci obou skupin studentů uvádím níţe.
34
6.3 Studenti začátečníci a autoregulace učení
Studenti „začátečníci38
“ mají podle Zimmermana se Schunkem chaotické a nespecifické cíle,
orientují se výhradně na výkon, mají nízké self-efficacy39
, nemají na vzdělání osobní zájem –
jejich motivace je vnější40
, nedůvěřují si, pouţívají sebesniţování a kontrolují jen výsledky
svého snaţení, nikoli jeho průběh. Při učení se vyhýbají sebehodnocení, příčiny neúspěchu
hledají ve svých schopnostech (jsou tedy neovlivnitelné), reagují na sebe negativně
a v měnících se podmínkách jsou zmatení (cit. dle Mareš 2010). Je zjevné, ţe pro takové
studenty by test patrně nebyl učebním materiálem ani tehdy, pokud by se zveřejňovala
korektivní zpětná vazba – bez snahy svůj test vidět a poučit se z chyb by zveřejnění výsledků
přišlo vniveč. Pokud by totiţ studenti svůj test vidět nechtěli, jeho zveřejnění by patrně
nezměnilo jejich názor.
6.4 Studenti pokročilí a autoregulace učení
Studenti, které Zimmerman se Schunkem označují jako „pokročilé“, mají cíle hierarchicky
uspořádané, specifické a perspektivní. Orientují se na proces učení, nikoli jen na výsledky,
mají dostatečně vysoké self-efficacy a jejich motivace je vnitřní41
. Při učení si jasně stanoví
plán, věří si a kontrolují i průběh, nejen výsledek svého učení. Při učení se na rozdíl od
začátečníků nevyhýbají sebehodnocení a příčiny neúspěchu hledají v pouţité strategii, nikoli
v situaci, čímţ se příčiny úspěchu/neúspěchu stávají ovlivnitelnými pro budoucí počínání.
Zároveň na sebe a své znalosti reagují pozitivně a dobře se adaptují měnícím se podmínkám
(cit dle Mareš 2010).
38
Označení začátečník v tomto případě nemá žádnou negativní konotaci, popisuje pouze faktický stav věci 39
Termín ze sociální psychologie označující vědomí vlastní účinnosti, schopnosti řešit problémy a vypořádávat se s těžkostmi. 40
Vnější motivace jako termín ze sociální psychologie označuje motivaci zapříčiněnou okolím a externími vlivy – např. rodiči, spolužáky, pouhou nutností navštěvovat školu apod. – student není sám motivován učit se, motivaci mu zprostředkuje někdo jiný buď odměnou či trestem 41
Vnitřní motivace jako termín ze sociální psychologie označuje motivaci zapříčiněnou vlastní snahou něco dokázat či vykonat, pochopit, naučit se apod.. Ovlivňuje ji dotyčný jedinec a jako taková není závislá na vlivu okolí.
35
Jak bude uvedeno i dále, uvaţované pouţití testu jak učebního materiálu (za předpokladu
zveřejnění výsledku testu) je moţné patrně pouze u studentů-pokročilých podle
Zimmermanovy a Schunkovy definice. Právě ti, podle výše zmíněné specifikace, kontrolují
nejen výsledek, nýbrţ i průběh učení, přičemţ analogicky lze na špatný průběh učení
usuzovat ze špatné známky. Díky tomu by takový student, pakliţe by napsal test špatně, ale
zároveň se byl podívat na své chyby, mohl svůj postup/učební strategii změnit a přistoupit
napříště k učení jinak.
6.5 Styly učení studentů a autoregulace učení
Podobná situace jako u studentů začátečníků a pokročilých je u stylů učení (téţ učebních
stylů). Styly učení definuje Mareš (1998; 2010) jako jemné projevy individuality člověka
v mnoha situacích učení. Jsou podle něj transsituační a přestavují metakognitivní potenciál
člověka, tedy to, jak člověk poznává vlastní kognitivní potenciál. Zároveň jsou styly učení
takovými svébytnými postupy při učení, které jedinec v daném období preferuje.
Podle stejného autora jsou učební styly svébytné svou motivovaností (vnější, vnitřní),
strukturou (strategie, taktiky), posloupností (pořadí činností), hloubkou (povrchový versus
hloubkový styl), propracovaností a pruţností aplikace. Tyto styly se vyvíjejí z vrozeného
základu (tj. z jedincových kognitivních stylů), ale proměňují se během ţivota jak záměrně, tak
bezděčně.
Aby bylo moţné nějaký jedincův projev označit za jeho studijní styl, je nutné, aby jej tento
jedinec uţíval ve většině situací pedagogického typu, přičemţ tento styl je relativně nezávislý
na učivu (obsahu). Podle Mareše (ibidem) si je jedinec zpravidla neuvědomuje, neanalyzuje,
nezlepšuje je; jsou „nejlepší“ a jeví se mu jako postupy samozřejmé, jemu vyhovující,
„optimální“.
Newble a Entwistle (cit. dle Döményová 2011) rozlišují tři učební styly: povrchový,
hloubkový a strategický přístup k učení.
36
Povrchový přístup k učení je podle zmíněných autorů charakteristický tím, ţe studentovi
stačí absolvovat daný předmět, popřípadě je student motivován snahou vyhnout se neúspěchu.
Proces studentova zpracování informací není příliš efektivní, soustřeďuje se pouze na
izolovaná fakta dané látky, tedy nesnaţí se získat celkový přehled o problematice, a v případě,
ţe něčemu nerozumí, uchyluje se k memorování. Jedinec je sice schopný ve výsledku zhruba
reprodukovat učební látku, ovšem nemá ji zcela zvládnutou, coţ se podle Newbleho
a Entwistla (cit. dle Döményová 2011) projevuje například uváděním nepodstatných detailů či
chybějícími asociacemi.
Strategický přístup můţe být dle Newbleho a Entwistla (ibidem) charakterizován velkou
soutěţivostí a snahou získat co nejlepší známky za jakoukoli cenu. Student volí potřebné
učební techniky, ať je to memorování či učení s porozuměním. Výsledné znalosti pak závisí
na povaze zdrojového učebního materiálu - jedinec můţe dané problematice porozumět,
a rovněţ se látku můţe pouze „našprtat“ jako typ povrchový.
Student posledního, tzv. hloubkového přístupu, podle Newbleho a Entwistla (ibidem)
projevuje skutečný zájem o učivo a problematiku. Student se v dané oblasti buď hodlá
v budoucnu realizovat, anebo je jednoduše zvídavý. Jeho záměrem je snaha učivu skutečně
porozumět, z čehoţ plyne i jeho pokročilost v autoregulaci učení. Při učení hloubkový typ
vytváří bohaté asociace, prozkoumává jednotlivá tvrzení a usiluje o skutečné porozumění.
Tyto styly je moţné měnit – ve školní realitě je důvodem ke změně daného učebního stylu pro
ţáka buď vlastní neporozumění tématu a opětovné studium, anebo špatná známka u testu,
která jej nutí k opětovnému studiu rovněţ.
6.6 Soulad učebního stylu a autoregulace učení s vnějšími podmínkami
Je zjevné, ţe učební styl a s ním související autoregulace jdou „ruku v ruce“ – student
„začátečník“ podle Zimmermana a Schunka patrně bude z logiky věci k učení přistupovat
37
povrchně, jak to popisují Newble s Entwistlem. Posléze, vývojem svých metakognitivních42
i kognitivních schopností a strategií učení se můţe stát studentem expertem – v této chvíli ale
přichází důleţitá podmínka, vyplývající z předešlých řádků i logiky.
Bez toho, aniţ by student znal korektivní zpětnou vazbu a díky tomu mohl změnit své učení,
není moţné, aby poznal či dokonce měnil své učební styly a zdokonaloval se. Učební styl
a autoregulaci lze označit za podmínky vnitřní, situaci u testu za podmínky vnější (podobně
jako se např. v sociální psychologii dělí atribuce za atribuci vnitřní, která náleţí člověku
samému, a atribuci vnější, která náleţí okolí). Pokud studentovi vnější podmínky nebudou
přát – nebude moci vidět svůj test po jeho napsání a následkem toho nebude vědět, kde a jaké
udělal chyby, jen těţko bude moci nějak změnit svou přípravu na příští test.
Je proto nezbytné, aby veškeré zmíněné okolnosti byly ve vzájemném souladu, uvaţujeme-li
o pouţití testu jako učebního materiálu.
6.7 Přílišná důvěra ve vlastní schopnosti a AIM hypotéza
Nepřítomnost korektivní zpětné vazby u testu můţe způsobit vedle studentovy neznalosti, co
odpověděl správně a z toho plynoucí nejistoty o správnosti minulého učení, i opačný problém.
Student si můţe kvůli nepřítomnosti korektivní zpětné vazby a právě díky neznalosti
učiněných chyb příliš důvěřovat.43
Taková situace byla i experimentálně zkoumána, výsledky
výzkumu Dunloskyho a Rawsonové přináším níţe.
Výzkumy na toto téma vycházejí z AIM hypotézy, v originále accuracy-influences-memory
(AIM) hypothesis. Dunlosky a Rawsonová ji specifikují takto: „Studenti pouţívají
monitorování a sledování svého studia a studijních situací k tomu, aby následně mohli
efektivně studovat a plnit studijní povinnosti. Očekává se, ţe právě vyšší přesnost
42
Metakognice je poznáváním toho, jak člověk poznává.jak se učí apod. Jedná se o sebereflexi vlastních kognitivních stylů, metod, strategií apod. 43
Tato situace může nastávat buď při obdržení známky, která je považována za „dobrou“, tj. A, B či C, anebo při vykonání zápočtu, jež rozlišuje pouze na úrovni vykonal/nevykonal a nikoli celkovou úspěšnost – viz kapitola 7.
38
monitorování sebe sama je spojena s efektivnějším učením se a vyšší úrovní retence
(Dunlosky a Rawsonová 2011: 272)44
.“ Je nutné uvést, ţe nevyslovený předpoklad k takové
úvaze je, ţe se jedná o studenty-pokročilé podle výše uvedené Zimmermanovy a Schunkovy
definice – právě ti se zajímají nejen o výsledky učení, nýbrţ i jeho průběh.
Stejní autoři (ibidem) ovšem uvádějí, ţe existují dvě esenciální podmínky, které jsou s AIM
hypotézou spojeny. Thide (cit. dle Dunlosky a Rawsonová 2011) tyto podmínky specifikuje:
Existuje předpoklad, ţe (sebe)monitorováním učení lze toto učení relativně efektivně řídit –
ovšem kdyby student sledoval vlastní učení s maximální pečlivostí a přesností, ale zároveň
toto učení nekontroloval (nebo nemohl kontrolovat) v jeho jednotlivých částech, pak
výsledkem vynaloţené pečlivosti a přesnosti nebude lepší retence informací. Druhá podmínka
je podle stejných autorů důsledkem podmínky první: Spojení mezi přesností monitorování
a vlastním učením nemusí být pozorováno tehdy, pakliţe se studenti liší ve způsobu, jakým
pouţívají monitorování ke kontrole svého studia.
Jako příklad uvádí autoři (ibidem) situaci, kdy student sice své studium monitoruje
maximálně přesně, ale nepouţívá výsledky z daného měření ke vhodné změně studia.
Sami autoři Dunlosky a Rawsonová (2011) zkoumali vliv přílišné jistoty či důvěry45
ve
vlastní znalosti na výkon u pozdějšího testu. Při jejich mezisubjektovém výzkumu bylo 48
studentů bakalářského Úvodu do psychologie na Kent State University náhodně rozděleno do
dvou skupin (idea-unit group o N1=26; no-standard group o N2=22). Všichni účastníci se
shodně učili základním termínům sociální psychologie jako např. „Just-world hypothesis46
“.
Po iniciačním studiu kaţdého podtématu v délce 4 minut byli participanti vyzváni, aby
o termínu napsali co nejvíce.
44
V originále: „Because learners use monitoring to efficiently obtain their learning goals better monitoring accuracy is expected to be related to more effective learning and higher levels of retention.“ 45 originální termín „overconfidence“ nemá odpovídající jednoslovný český ekvivalent, následný overconfidence effect se do češtiny překládá jako „efekt přehnané sebedůvěry neodpovídající realitě“ 46 Jedná se o víru ve spravedlivý svět, v němž si každý zaslouží, co dostává a dostává, co zaslouží. Jedná se o jednu ze sebeobranných atribucí k uchování jistoty v těžkém čase, termín se vztahuje k sociální atribuci.
39
Členové no-standard group následně byli vyzváni, aby svojí odpověď současně sami
oznámkovali, jako kdyby byla známkována ve škole. Členům idea-unit group byla jejich
odpověď prezentována spolu s listy se správnou odpovědí. U kaţdé takové odpovědi byla
k zatrhnutí moţnost ANO/NE k posouzení, zda původní respondentova odpověď byla správná
či nikoliv.
Po jejím vyplnění byli participanti poţádáni o posouzení a zhodnocení, nakolik jejich
odpovědi byly správné ve srovnání s prezentovaným originálním zdrojem (bez toho aniţ by
původní zdroj viděli). Teprve po tomto posouzení bylo oběma skupinám ukázáno správné
znění původní otázky.
Počítačový program následně pouţil osobního hodnocení participantů k určení času, po
kterém bude ukončeno opakované čtení původního materiálu. Jak uvádí Dunlosky
a Rawsonová (2011), aţ ve chvíli, kdy participant potřetí posoudil své odpovědi na vybrané
otázky jako správné, bylo testování ukončeno. Jak autorky dále poznamenávají, zmíněný
design s trojím opakováním byl pouţit proto, aby přesnost posouzení participantů byla
skutečně zaloţena na retenci událostí a nikoli na náhodě. Po takovém trojím opakování byli
participanti vyzváni k návratu o dva dny později, kdy vyplnili i retenční test.
Kaţdé odpovědi z retenčního testu bylo přiřazeno“retenční skóre“47
, které bylo odvislé od
přítomnosti testované definice termínu. Dunlosky a Rawsonová (2011) uvádí: „Odpovědi
byly uznány za správné, pakliţe obsahovaly buď definici slovo od slova, anebo i její
parafrázi, která jinak formulovala původní význam.“48
Jako výsledek autoři uvádějí, ţe průměrný rozdíl mezi individuálními korektními
vzpomínkami na danou definici byl meziskupinově tento: M = 41, SD = 29.5, rozsah 0 – 100.
Jak Dunlosky a Rawsonová (2011) predikovali, retence naučených konceptů byla
signifikantně vyšší u skupiny idea-unit, která obdrţela vyšší absolutní přesnost (tj. v případě
47 V originále recall score 48 V originále: Responses were counted as correct if they included either verbatim restatements or paraphrases that preserved the meaning of the definition.
40
chybné odpovědi mohli její členové nahlédnout do papírů a upravit své znalosti, tudíţ i svoji
původní jistotu, ţe informace vědí správně). Výsledek meziskupinového měření byl M1 = 50,
SEM149
= 7 u idea-unit grup oproti M2 = 33, SEM2 = 5 u no-standard group. Jak autoři
(ibidem) dále uvádějí, výsledek byl průkazný na pětiprocentní hladině statistické významnosti
(t=1.92, p < .05).
Autoři k výsledku studie píší: „V souladu s AIM hypotézou se prokázala lepší retence u členů
idea-unit skupiny, která byla způsobena ziskem lepší absolutní přesnosti (oproti přílišné
důvěře ve vlastní znalosti u no-standard skupiny).“50
Jak je patrné z výše zmíněné studie, přílišná důvěra ve vlastní znalosti a nemoţnost tyto
znalosti upravit/učinit správnými komplikuje učení podobně jako nepřítomnost korektivní
zpětné vazby. Ve školní realitě se problém s přílišnou důvěrou ve vlastní znalosti, kteráţto
důvěra ovšem není zaloţená na reálné situaci, můţe vyskytnout především u zápočtů.
Zápočty, jak bylo uvedeno výše, jsou specifickými testy absolutního výkonu, jenţ podobně
jako všechny ostatní testy tohoto typu špatně rozlišují ve své dolní hranici. Proto student,
důvěřující příliš ve své znalosti, pakliţe dostane zápočet, můţe předpokládat správnost všech
svých odpovědí. Ve skutečnosti můţe mít 40 – 50 % odpovědí chybných, jak bude ukázáno
v následující kapitole. Udělený zápočet ovšem jeho přílišnou sebedůvěru patrně ještě posílí.
49 Směrodatná chyba odhadu 50 V originále According to the AIM hypothesis, this boost in retention was due to the idea-unit group obtaining better absolute accuracy (in terms of reduced overconfidence).
41
7. Důsledky zjištění ve školní realitě
Ve své práci jsem se snaţil nastínit, ţe teorie učení i empirické výzkumy ukazují na
nezbytnost vyuţití zpětné vazby pro úspěšné učení. Bez toho, aniţ by student věděl, kde
v testu udělal chybu, se jen těţko můţe přesvědčit o tom, co skutečně ví a co se naopak naučil
špatně.
Ve školní realitě můţe mít tato poznatek několik důsledků. Situace se různí podle typu
studentovi předloţeného testu a také podle mnoţství testovacích otázek, jak bude ukázáno
níţe. Základním rozdělením je, zda test obsahuje uzavřené otázky, nebo otázky otevřené.
7.1 Test znalostí s uzavřenými odpověďmi
Při tomto typu zjišťovacího testu (rozdělení zjišťovací/ověřovací viz výše) student zaškrtává
jednu či více správných odpovědí z několika (obvykle 4 aţ 6) předem nabízených moţností.
Existují dvě varianty udílení bodů za správné odpovědi – buď se a) udílí body za správnou
odpověď či část bodu za zaškrtnutí jedné z více správných odpovědí a za špatnou otázku se
bod nestrhává, anebo se za b) platí předchozí, ovšem bod se za špatnou odpověď strhává.
Student v tomto testu zaškrtne odpovědi, které povaţuje za správné, po opravení se dozví
známku a učení tím zdánlivě končí. Jak ale bylo ukázáno v mé práci, bez znalosti chybných
odpovědí si student nemůţe být příliš jistý, které jeho odpovědi byly správné a které nikoli,
coţ zvláště u testu s uzavřenými odpověďmi má tyto následky:
Uvaţujme typický středně obtíţný test o 20 uzavřených otázkách s pouze jednou správnou
odpovědí. Student, který dostane z testu druhou nejlepší známku B, odpověděl na 80 – 90 %
otázek správně, tj. udělal 4 nebo 3 chyby. Zásadní otázka v testové realitě ale je: Ví student,
který si neprohlédne svůj test po jeho opravení, kde přesně udělal zmíněné 3 aţ 4 chyby?51
51
Zmíněná úvaha implicitně počítá s takovou strategií vyplňování testů, kdy student označí odpovědi u všech nebo téměř všech otázek, což je časté především u testů bez odečítání části bodu za špatnou odpověď.
42
Pokud v identické situaci dostane student z testu hodnocení „E“, tedy poslední známku
signalizující úspěch, nezatrhl by ve stejném testu správně 6 aţ 8 či dokonce 8 aţ 10
odpovědí52
. Je velmi nepravděpodobné, ţe by si byl po testu při případné osobní kontrole
schopen vzpomenout, jak u které otázky odpovídal, které jeho odpovědi byly správné a které
špatné.53
Je zřejmé, ţe studentova nejistota, jakou část/které otázky testu napsal či označil špatně,
stoupá se zhoršující se známkou – čím více má chybných opovědí, tím méně je
pravděpodobné, ţe přesně ví, které otázky zodpověděl chybně. Pokud navíc student obdrţel
známku F, neví uţ vůbec, jaká byla proporce jeho správných/špatných odpovědí – známka
F špatně rozlišuje ve své dolní hranici a student ji dostane, ať odpoví správně na 49% otázek
či na 0% otázek. V případě obdrţení této známky je proto student ponechán v maximální
moţné nevědomosti o stavu svých vědomostí.
Tento fakt ilustruje následující graf, na němţ lze snadno podle obsahu obrazce pod tlustou
černou čarou odvodit proporci správných oproti špatným odpovědím.
Graf č. 1 – proporce správných ke špatným odpovědím v závislosti na známce
52
Minimem pro vykonání zkoušky na E je na Masarykově univerzitě zatržení buď 50% či 60% správných odpovědí. 53
Kapacita krátkodobé paměti je podle výzkumů kognitivních psychologů 7 +/- 2 zapamatované okolnosti, přičemž u 10 špatných odpovědí ve zmíněném testu se jedná o 10 otázek x 4 možnosti odpovědí, tedy 40 údajů.
43
Schematické vyjádření příkladu správných/špatných odpovědí u testu s 20 otázkami a hranicí
50% správných odpovědí pro vykonání testu, který jsem uvedl výše, je moţné provést tímto
způsobem:
Známka A 0 – 2 špatné odpovědi 20 – 18 správných odpovědí
Známka B 3 – 4 špatné odpovědi 17 – 16 správných odpovědí
Známka C 5 – 6 špatných odpovědí 15 – 14 správných odpovědí
Známka D 6 – 8 špatných odpovědí 13 – 12 správných odpovědí
Známka E 8 – 10 špatných odpovědí 12 – 10 správných odpovědí
Známka F 11 a více špatných odpovědí 9 a méně správných odpovědí
I z tohoto znázornění vyplývá, jak narůstá mnoţství špatných odpovědí a mění se jejich
poměr k odpovědím správným v závislosti na udělené známce. Zároveň je třeba podotknout,
ţe z hlediska studenta je snazší přemýšlet, které 3 odpovědi byly špatné, pakliţe 17 otázek
bylo zodpovězeno správně, neţ v případě známky E přemýšlet, kterých 10 odpovědí bylo
správných a kterých 10 naopak chybných.
Pokud navíc u tohoto typu testu vezmeme v úvahu 4 moţné odpovědi u kaţdé otázky, násobí
se čtyřmi také rozsah moţných odpovědí, na něţ by se student musel rozpomenout a následně
odvozovat tu správnou.
Výše zmíněné okolnosti platí pochopitelně v případě, kdy student nemá automaticky moţnost
opravený test vidět a musí se spoléhat na svou paměť a vlastní analýzu v testu napsaných
odpovědí.
U testů, u nichţ se nestrhává bod či jeho část za špatnou odpověď, se problém studentova
rozpomínání na správné/špatné odpovědí ještě komplikuje běţně pouţívanou studentskou
strategií vyplňování testů. Pakliţe student není vystaven riziku ztráty bodu či jeho části, je
z jeho hlediska velice rozumné zaškrtnout nějakou odpověď u kaţdé otázky a doufat
44
v „trefu“. Takovou variantu – zaškrtnutí odpovědi u všech otázek – studentovi dokonce radí
všemoţné studijní návody i knihy. Například v materiálu Student guides and strategies
(www.studygs.net/tsttak3.htm), který je přímo určený studentům a má jim pomoci s lepším
psaním testů, je jako jeden z návodů uvedeno: „Vţdy tipujte, pokud není stanovena
penalizace za špatnou odpověď“ a dále „Nehádejte, pokud jste za špatnou odpověď
penalizováni.“54
7.2 Testy znalostí s otevřenými odpověďmi
U testů, při nichţ studenti odpovídají sami, bez vybírání předem uvedených moţností
odpovědi, je situace obdobná jako v předchozím případě. Studenti sice při případné zpětné
kontrole nemusí vzpomínat na ţádné jiné alternativní odpovědi, nýbrţ pouze na to, co sami
v testu napsali, ovšem platí podobné předpoklady jako v testech s uzavřenými odpověďmi –
s rostoucím mnoţstvím otázek a délky odpovědí je pro studenta stále těţší zapamatovat si vše,
co do testu napsal.
Zároveň ovšem testy s otevřenými odpověďmi přinášejí jedno specifikum – není obvyklé, aby
za špatné odpovědi v takových testech vyučující strhávali body, tudíţ běţnou strategií je
u těchto testů napsat něco ke kaţdé otázce, protoţe studenti mají vţdy naději, ţe se alespoň
částečně „trefí“ a budou jim uznány nějaké body.
Taková strategie ale ještě více znesnadňuje pozdější vzpomínání na test a přemýšlení
o špatných a správných odpovědích.
54
V originále: „Always guess when there is no penalty for guessing or you can eliminate options.“ a „Don't guess if you are penalized for guessing and if you have no basis for your choice
45
8. Výsledek a závěr, diskuse. Možné budoucí výzkumy.
Ve své práci jsem se zabýval testy a testováním znalostí u studentů vysoké školy a moţným
pouţitím testů jako učebního materiálu. Takové pouţití testu, jak bylo dokázáno, je moţné
pouze v případě, kdy student obdrţí k testu korektivní zpětnou vazbu, tudíţ má moţnost
dozvědět se, jaké chyby v testu udělal.
Představil jsem proto nejprve typy testů a následně didaktický test jako nástroj, jímţ jsou na
vysokých školách znalosti studentů měřeny nejčastěji. U zmíněného didaktického testu jsem
následně specifikoval, jaké typy zpětné vazby je k němu moţné obdrţet, přičemţ typy zpětné
vazby u testů na vysoké školy byly uvedeny ve zvláštní kapitole.
V druhé části práce jsem představil nejprve výzkumy týkajících se vlivu pouţití korektivní
zpětné vazby v testových situacích na pozdější retenci znalostí. Výsledky experimentů
potvrzují pozitivní vliv korektivní zpětné vazby poskytnuté k testování znalostí na retenci
faktů, které byly předmětem testu. Přítomnost korektivní zpětné vazby ale podle výsledků
výzkumů pomáhá i lepšímu porozumění učivu stejně jako jeho lepšímu zvládnutí (např.
tvorba nepravidelného plurálu v angličtině). Podle výsledků studií je jasná evidence mezi
zveřejněním korektivní informace a následným učením i lepším zapamatováním informací.
Výzkumy dále naznačují, ţe pokud student k testu obdrţí korektivní zpětnou vazbu, je jeho
napsání efektivnější cestou k učení se neţ opětovné čtení materiálu, který je výchozím
podkladem k testu. Tento fakt přímo souvisí s počáteční myšlenkou pouţití testu jako
učebního materiálu – zmíněné pouţití testu je moţné pouze tehdy, obdrţí-li student korektivní
zpětnou vazbu.
V práci přibliţuji také koncepty iniciačního testu a učení rozšířeného o test. Iniciační test jako
postup slouţí primárně nikoli k otestování znalostí, ale k ověření, kolik si toho jedinec
správně zapamatoval, přičemţ důleţitá je přítomnost korektivní zpětné vazby uţ u tohoto
prvotního testování. Princip učení rozšířeného o test spočívá v testování znalostí krátce po
46
učení se, přičemţ tento test odpovídá zpětné vazbě, kterou si obvykle student sám po učení
poskytuje, aby zjistil, kolik látky si zapamatoval.
Popisuji rovněţ nutnost souladu studentova učebního stylu a jeho autoregulace učení
s externími podmínkami (tedy s přítomností korektivní zpětné vazby u testu) k tomu, aby
mohl být test pouţit coby učební materiál. Bez zmíněného souladu by podle všeho případné
zveřejnění výsledku testu a korektivní zpětné vazby přišlo vniveč.
Zároveň přináším pohled na moţnou studentovu přílišnou důvěru ve vlastní schopnosti,
plynoucí z neznalosti přesných výsledků svého testu, a dopad na učení ve spojitosti s AIM
hypotézou.
V části „Důsledky zjištění ve školní realitě“ ukazuji, jak pro studenta můţe vypadat situace po
napsaném testu, pokud k němu neobdrţí odpovídající korektivní zpětnou vazbu. Jak bylo
ukázáno, nejistota studenta týkající se toho, které odpovědi má špatně a které správně, roste se
zhoršující se známkou, coţ dokládá i mnou předkládané grafické znázornění takové situace.
Veškeré zmíněné okolnosti mají dopad zejména na studentovo budoucí učení a jeho
autoregulaci, jelikoţ bez zpětné vazby a znalosti chyb nemusí student přesně vědět, jak své
učení změnit a zlepšit tak, aby se příště naučil více a z testu obdrţel lepší známku.
Ve výsledku lze konstatovat, ţe test je moţné pouţít jako učební materiál.
Eventuální budoucí výzkumy této oblasti by se mohly zaměřit na otázku, proč není test jako
učební materiál běţně uţíván, kdyţ je takové pouţití spojeno s mnoha benefity jak pro
studenty, tak pro učitele (kromě počáteční investice do systému zveřejňování výsledku testu
by mohli učitelé profitovat z lepších znalostí ţáků a s tím spojeným menším mnoţstvím
individuálních konzultací, dalších termínů testů apod.). Nejdůleţitější potenciální výzkumnou
otázkou by bylo, proč studenti nechtějí vidět testy/učitelé opravené testy nenabízejí
k nahlédnutí. Zároveň by se bylo moţné zaměřit na otázku, kde tento zpětnovazebný problém
vzniknul – pakliţe studenti nechtějí testy vidět, učitelé je nenabízejí k nahlédnutí, anebo
naopak pakliţe učitelé nenabízejí testy k nahlédnutí, studenti je nechtějí vidět.
47
9. Použitá literatura
Agarwal, P.K.; Karpicke, J.D.; Kang, S.H.K.; Roediger III., H.L.; McDermott, K.B. (2008).
Examining the Testing Effect with Open- and Closed-Book Tests. Applied Cognitive
Psychology, 22, 861 – 876. Retrieved October 27, 2010, from: http://psych.wustl.edu/
Atkinson, R. [et al.]. (2003). Psychologie. Praha: Portál
Bílek, M. & Jeřábek, O. TEORIE A PRAXE TVORBY DIDAKTICKÝCH TESTŮ.
Retrievede April, 1, 2012 from zvyp.upol.cz/publikace/bilek_jerabek.pdf
Beuk, C.H. (2005). A method for reaching a compromise between absolute and relative
standards in examinations. Journal of educational measurement, 21, 147-152. Retrieved
October 20, 2010, from jstor database.
Bryant, B. & Ainsfeld, M.(1969). Feedback versus No-Feedback in Testing Children's
Knowledge of English Pluralization Rules. Journal of Experimental Child Psychology, 8, 250-
255. Retrieved October 18 2010, from: ScienceDirect database.
Čáp, J.(1997). Psychologie výchovy a vyučování. Praha : Univerzita Karlova
Didaktické testy (n.d.) Retrieved April 1, 2012, from www.cermat.cz/didakticke-testy-
1404034141.html
Didaktické testy (n.d.) Retrieved April 1, 2012, from www.novamaturita.cz/didakticke-testy-
1404033135.html
Dunlosky, J. & Rawson, K. A. (2011). Overconfidence produces underachievement:
Inaccurate self evaluations undermine students’ learning and retention. Learning and
Instruction 22 (2012). Retrieved July, 23, 2012 form elsevier database
Ferjenčík, K. (2000). Úvod do metodologie psychologického výzkumu. 1. vyd. Praha: Portál,
2000. 420 s.
Hattie, J. & Timperley, H.: The power of feedback. REVIEW OF EDUCATIONAL
RESEARCH 2007. Retrieved October 16, 2010, from ISI Web of knowledge database.
Chráska, M. (1999). Didaktické testy: Příručka pro učitele a studenty učitelství. Brno: Paido
Jeţek, S. Vaculík, M. Wortner, F. (2011). ZÁKLADNÍ POJMY Z METODOLOGIE
PSYCHOLOGIE (2011). Retrieved April 13, 2009, from is.muni.cz
Krejčí, A. Mezigenerační učení (děti, rodiče a prarodiče) v rodině (diplomová práce).
Retrieved January, 1, 2012 from is.muni.cz
Kulič, V.. (1971). Chyba a učení: funkce chybného výkonu v učení a jeho řízení. Praha: SPN
Kulič, V. (1992). Psychologie řízeného učení. Praha: Academia
48
Larsen, D.P.; Butler, A.C.; Roediger, H.L. (2009). Repeated testing improves long-term
retention relative to repeated study: a randomised controlled trial. Medical Education, 43,
1174 – 1181. Retrieved October 16, 2010, from Wiley Online Library database.
Linhart, J.. (1986). Základy psychologie učení. Praha: Státní pedagogické nakladatelství
Maněna, V. & Chrzová, M.. METODOLOGIE VYTVÁŘENÍ TESTU. Retrieved April 1,
2012, from: http://fim.uhk.cz/oliva/tvorba_vedeni/REKAP-www/M1.pdf
Mareš, J. (2010). Autoregulace učení, in Psychologie výchovy a vzdělávání – 02
Autoregulace učení. PDF. Učební materiál dostupný z muni.cz
Mareš, J. (1998) Styly učení ţáků a studentů. Praha: Portál
McDaniel, M.A.; McDermott, K.B.; Roediger III., H.L. (2007). Generalizing test-enhanced
learning from the laboratory to the classroom. Psychonomic Bulletin a Review, 14, 200 – 206.
Retrieved October 21, 2010, from: http://pbr.psychonomic-journals.org/content/14/2/200.long
Nakonečný, M. (1995). Lexikon psychologie. Praha: Vodnář
Průcha, J. (ed.). Pedagogická encyklopedie. Praha: Portál, 2009. 936 s. ISBN 978-80-7367-
546-2.
Průcha, J.; Walterová, E.; Mareš, J.. (2003). Pedagogický slovník. Praha: Portál
Reitmayerová, E.; Broumová, V.. (2007). Cílená zpětná vazba. Metody pro vedoucí skupin a
učitele. Praha : Portál
Roediger, H.L.; Karpicke, J.D. (2006). The power of testing memory. Basic Research and
Implications for Educational Practice. Perspectives on Psychological Science, 1, 181-210.
Retrieved September, 24, 2010, from: Sage jurnals online database.
Šeďová, K., Švaříček, R,. Šalamounová, Z. (2012). Komunikace ve školní třídě. Praha: Portál.
Slavík, J.. (1999). Hodnocení v současné škole. Praha: Portál
Studijní a zkušební řád Masarykovy univerzity (nd.). Retrieved February, 28, 2012 from:
is.muni.cz/auth/help/szr_do_1_2_2012
Urnánek, T. (2002). Základy psychometriky. Brno: Masarykova univerzita v Brně pro
Filozofickou fakultu.
Weber, R.A.. „Learning“ with no feedback in a competetive guessing game. Games and
Economic Behaviour, 44, 2003, 134 – 144. Retrieved January 1, 2011, from: ScienceDirect
database