Valenční slovník českých sloves

Post on 11-Jan-2016

103 views 1 download

description

Valenční slovník českých sloves. Zdeněk Žabokrtský ÚFAL, 23.5.2005. Jak zmenšit VALLEX?. Osnova : 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí. VALLEX. - PowerPoint PPT Presentation

transcript

Valenční slovník českých sloves

Zdeněk Žabokrtský

ÚFAL, 23.5.2005

Jak zmenšit VALLEX?

• Osnova:

1) Stručně o VALLEX 1.0

2) Jak snížit počet hesel?

3) Jak snížit počet rámců v heslech?

4) Shrnutí

VALLEX

• Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“– stát – někde, o někoho, za něco, za něčím, při někom…– odpovídat – někomu na něco, za někoho, něčemu – brát – něco někomu, za něco, roha, zasvé,…

• Teorie valence ve Funkčním generativním popisu– aktanty-volná doplnění, posouvání, obligatornost…

• VALLEX– valenční slovník českých sloves budovaný na základě

FGP od jara 2001– verze 1.0 zveřejněná na podzim 2003 (cca 1400 sloves)– http://ckl.mff.cuni.cz/zabokrtsky/vallex/1.0

Volba termínů pro popis slovníku

• Filipec, 1994 – lexém trojí úrovně: • 1. odpovídat, 2. odpovídat2 (čemu), 3. „ Neodpovídá požadavkům“

• Mel’čuk, Žolkovskij, 1984 • vocabel (odpovídat) vs. lexeme (odpovídat2)

• Filipec,Čermák, 1985• lexém vs. lexie

• Cruse, 1986 • lexém vs. lexikální jednotka

Jak snížit počet hesel ve VALLEXu

• tradiční pohled:– 1 slovníkové heslo ~ 1 lexém ~ 1

lemma

• řešení:– více slovesných lemmat v jednom

lexému

Sloučení vidových „dvojic“do jediného lexému

+ přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness)

+ snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky)

– vidové protějšky nesdílí všechny významy/rámce

– problematické vymezení vidové dvojice

– ztráta stromové struktury slovníku

– nestandardní makrostruktura slovníku

– jak má vypadat tektogramatické lemma (t-lemma v PDT 2.0)?

dát

dávat dávávat

Vidové dvojice

• způsoby tvoření vidových dvojic:(a) – sufixace (vypsat-vypisovat)(b) – prefixace (psát-napsat)(c) – supletivní dvojice (vzít-brát)

• problematické (b)– nejednoznačný dok. protějšek (zblednout/vyblednout)– hypotéza čistě vidové předpony– kritérium sekundární imperfektivizace (napisovat?)

• závěr:– ve VALLEXu do jednoho lexému raději jen (a) a (c)

Změna datové struktury

• VALLEX 1.0 • VALLEX 2.0

lemma-pf-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-impf-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-impf

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-pf

Kvantitativní důsledky sloučení vidových dvojic

ve VALLEX 1.5• před sloučením vid. dvojic:

– 2451 lexémů (1338 impf, 1075 perf, 38 biasp)– 6411 lexikálních jednotek

• po sloučení vidových dvojic– 1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp)– 4303 lexikálních jednotek,

• z toho 2623 u sloučených lexémů• z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice

• závěr:– sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu

(co do počtu lexémů i lexikálních jednotek) při zachování stejné informace

Další kandidáti na sloučení

• determinovaná / nedeterminovaná slovesa– jít-chodit, jet-jezdit, běžet-běhat ...

• pro:– posun v (základním) lexikálním významu je

srovnatelný s posunem u vidových dvojic

• proti:– jen malá uzavřená skupina– další zkomplikování datové struktury

Jak snížit počet rámců?

• tradiční pohled:– 1 podheslo (LU) ~ 1 rámec ~ 1

význam

• řešení– více rámců/významů v jedné LU

Kandidáti na sloučení

• odevzdat nález policii – na policii• ukradl bance peníze – peníze z banky• vyčistit šaty od bláta – bláto z šatů• naložit vůz cementem – cement na vůz• osázet park stromy – stromy do parku• prorazit hřebík plechem – plech hřebíkem• vyjít na kopec – vyjít kopec• oloupat slupku z jablka – jablko• umístit nábytek do bytu – nábytek v bytě• slunce vyzařuje světlo – světlo vyzařuje ze slunce• tričko pouští barvu – barva pouští z trička

• Volba termínu– diateze - Mel’čuk, Cholodovič, 1970

– hierarchizace – Daneš, 1985

– alternace – Levinová, 1993

• Trojí projev alternace(1) změna (povrchové) formy predikátoru

(2) změna valenčního rámce

(3) změna lexikálního významu

Pozn.: model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek

Alternace

(1) Změna formy predikátoru

• alternace v širokém pojetí:– pasivizace (být vybrán)

– reflexivizace (mýt se)

– složený tvar s pomocným slovesem (dostat slíbeno)

– dispoziční modalita (Knížka se mi čte dobře.)

– ? prefixace (nachodit se - alternace přes hranice lexému!)

(2) Změna valenčního rámce

• Změny ve valenčních rámcích:– přibyde aktant (Vyběhl kopec.)– ubyde aktant (Pepík už čte.)– záměna dvou valenčních členů s různým

funktorem – např. ADDR-DIR3 (možný souvýskyt: Poslal jeden dopis babičce a dva domů.)

– náhrada jednoho funktoru skupinou:• DIFF – DIR1+DIR3 , DIFF – ORIG+EFF (klesl o

10cm/ze 150 na 140 cm), LOC – DIR1+DIR3

(3) Změna lexikálního významu

• ne nutně zcela totožná situace, ale změna

významu po provedení alternace je (pro třídu

sloves, která se této alternace může účastnit)

predikovatelná

• různý (ontologický,pragmatický?) vztah

argumentů a predikátu

– ... hřebík.PAT plechem – plech.PAT hřebíkem

Příklad 1:„odstraňování z

kontejneru“ • vybalit (dárky,kufr), vykácet (stromy, zahradu),

vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník)... (Daneš,1985)

• změna formy predikátoru: žádná• změna valenčního rámce: ubude obl. DIR1 (ale: vysypat popelník z okna(?))• změna významu:

– před alternací je kontejner na tg.rovině obsažen v DIR1, po alternaci je PAT

– po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)

Příklad 2:dispoziční modalita

• dobře se mi čte (ta kniha)

(ale: *zná se mi dobře, *umí se mi dobře, *cítí se

mi dobře)

• změna formy predikátu: reflex.

• změna valence: přibude hodnotící obl.MANN,

ACT(3) a non-obl PAT(1)

• změna významu: modální příznak

Příklad 3: „ztranzitivnění“ sloves

pohybu

• vyjít/vyběhnout/vyjet/vylézt na kopec/kopec

• změna formy predikátu: žádná

• změna valence: ubude obl.DIR3, přibude obl.

PAT

• změna významu: před alternací jde jen o

dosažení cíle, po alternaci jde o zdolání úseku

ČNK: plavat + ak.

Alternační model valenčního slovníku

LEXÉM

LEX. JEDNOTKA

RÁMEC

... ... ...

lemma1lemma2

LEX. FORMY

LEXÉM

LEX. JEDNOTKA

ZÁKL. RÁMEC

... ... ...

lemma1lemma2

LEX. FORMY

ODV. RÁMCE

Další výhody alternačního modelu

– valence komparativů a superlativů• tatáž lexikální jednotka, ale jiná valence

– valence substantiv („přetížený“ genitiv)• Karlův dluh dvou miliónů / dluh Karla

– valence anglických sloves • He gave Mary a book / He a book to Mary.

– „nadfunktory“ • DIR1-TFRWH: pochází z osmého století / ze střední Asie

– krok k vyšší (sémanticko-logické?) rovině popisu jazyka• napustil vanu vodou napustil vodu do vany

Závěr

• sloučení vidových dvojic– významné snížení redundance slovníku– přiblížení FGP– komplikovanější datová struktura slovníku

• alternační model valenčního slovníku– snížení redundance slovníku– jednotný mechanismus pro popis řady dosud (v

rámci VALLEXu) nezachytitelných situací– zásah do valenční teorie FGP– komplikovanější datová struktura slovníku

• otevřené otázky ...

„Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko.“