+ All Categories
Home > Documents > Valenční slovník českých sloves

Valenční slovník českých sloves

Date post: 11-Jan-2016
Category:
Upload: jagger
View: 103 times
Download: 1 times
Share this document with a friend
Description:
Valenční slovník českých sloves. Zdeněk Žabokrtský ÚFAL, 23.5.2005. Jak zmenšit VALLEX?. Osnova : 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí. VALLEX. - PowerPoint PPT Presentation
24
Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005
Transcript
Page 1: Valenční slovník českých sloves

Valenční slovník českých sloves

Zdeněk Žabokrtský

ÚFAL, 23.5.2005

Page 2: Valenční slovník českých sloves

Jak zmenšit VALLEX?

• Osnova:

1) Stručně o VALLEX 1.0

2) Jak snížit počet hesel?

3) Jak snížit počet rámců v heslech?

4) Shrnutí

Page 3: Valenční slovník českých sloves

VALLEX

• Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“– stát – někde, o někoho, za něco, za něčím, při někom…– odpovídat – někomu na něco, za někoho, něčemu – brát – něco někomu, za něco, roha, zasvé,…

• Teorie valence ve Funkčním generativním popisu– aktanty-volná doplnění, posouvání, obligatornost…

• VALLEX– valenční slovník českých sloves budovaný na základě

FGP od jara 2001– verze 1.0 zveřejněná na podzim 2003 (cca 1400 sloves)– http://ckl.mff.cuni.cz/zabokrtsky/vallex/1.0

Page 4: Valenční slovník českých sloves

Volba termínů pro popis slovníku

• Filipec, 1994 – lexém trojí úrovně: • 1. odpovídat, 2. odpovídat2 (čemu), 3. „ Neodpovídá požadavkům“

• Mel’čuk, Žolkovskij, 1984 • vocabel (odpovídat) vs. lexeme (odpovídat2)

• Filipec,Čermák, 1985• lexém vs. lexie

• Cruse, 1986 • lexém vs. lexikální jednotka

Page 5: Valenční slovník českých sloves

Jak snížit počet hesel ve VALLEXu

• tradiční pohled:– 1 slovníkové heslo ~ 1 lexém ~ 1

lemma

• řešení:– více slovesných lemmat v jednom

lexému

Page 6: Valenční slovník českých sloves

Sloučení vidových „dvojic“do jediného lexému

+ přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness)

+ snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky)

– vidové protějšky nesdílí všechny významy/rámce

– problematické vymezení vidové dvojice

– ztráta stromové struktury slovníku

– nestandardní makrostruktura slovníku

– jak má vypadat tektogramatické lemma (t-lemma v PDT 2.0)?

dát

dávat dávávat

Page 7: Valenční slovník českých sloves

Vidové dvojice

• způsoby tvoření vidových dvojic:(a) – sufixace (vypsat-vypisovat)(b) – prefixace (psát-napsat)(c) – supletivní dvojice (vzít-brát)

• problematické (b)– nejednoznačný dok. protějšek (zblednout/vyblednout)– hypotéza čistě vidové předpony– kritérium sekundární imperfektivizace (napisovat?)

• závěr:– ve VALLEXu do jednoho lexému raději jen (a) a (c)

Page 8: Valenční slovník českých sloves

Změna datové struktury

• VALLEX 1.0 • VALLEX 2.0

lemma-pf-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-impf-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-impf

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

-attr1-attr2

lemma-pf

Page 9: Valenční slovník českých sloves

Kvantitativní důsledky sloučení vidových dvojic

ve VALLEX 1.5• před sloučením vid. dvojic:

– 2451 lexémů (1338 impf, 1075 perf, 38 biasp)– 6411 lexikálních jednotek

• po sloučení vidových dvojic– 1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp)– 4303 lexikálních jednotek,

• z toho 2623 u sloučených lexémů• z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice

• závěr:– sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu

(co do počtu lexémů i lexikálních jednotek) při zachování stejné informace

Page 10: Valenční slovník českých sloves

Další kandidáti na sloučení

• determinovaná / nedeterminovaná slovesa– jít-chodit, jet-jezdit, běžet-běhat ...

• pro:– posun v (základním) lexikálním významu je

srovnatelný s posunem u vidových dvojic

• proti:– jen malá uzavřená skupina– další zkomplikování datové struktury

Page 11: Valenční slovník českých sloves

Jak snížit počet rámců?

• tradiční pohled:– 1 podheslo (LU) ~ 1 rámec ~ 1

význam

• řešení– více rámců/významů v jedné LU

Page 12: Valenční slovník českých sloves

Kandidáti na sloučení

• odevzdat nález policii – na policii• ukradl bance peníze – peníze z banky• vyčistit šaty od bláta – bláto z šatů• naložit vůz cementem – cement na vůz• osázet park stromy – stromy do parku• prorazit hřebík plechem – plech hřebíkem• vyjít na kopec – vyjít kopec• oloupat slupku z jablka – jablko• umístit nábytek do bytu – nábytek v bytě• slunce vyzařuje světlo – světlo vyzařuje ze slunce• tričko pouští barvu – barva pouští z trička

Page 13: Valenční slovník českých sloves

• Volba termínu– diateze - Mel’čuk, Cholodovič, 1970

– hierarchizace – Daneš, 1985

– alternace – Levinová, 1993

• Trojí projev alternace(1) změna (povrchové) formy predikátoru

(2) změna valenčního rámce

(3) změna lexikálního významu

Pozn.: model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek

Alternace

Page 14: Valenční slovník českých sloves

(1) Změna formy predikátoru

• alternace v širokém pojetí:– pasivizace (být vybrán)

– reflexivizace (mýt se)

– složený tvar s pomocným slovesem (dostat slíbeno)

– dispoziční modalita (Knížka se mi čte dobře.)

– ? prefixace (nachodit se - alternace přes hranice lexému!)

Page 15: Valenční slovník českých sloves

(2) Změna valenčního rámce

• Změny ve valenčních rámcích:– přibyde aktant (Vyběhl kopec.)– ubyde aktant (Pepík už čte.)– záměna dvou valenčních členů s různým

funktorem – např. ADDR-DIR3 (možný souvýskyt: Poslal jeden dopis babičce a dva domů.)

– náhrada jednoho funktoru skupinou:• DIFF – DIR1+DIR3 , DIFF – ORIG+EFF (klesl o

10cm/ze 150 na 140 cm), LOC – DIR1+DIR3

Page 16: Valenční slovník českých sloves

(3) Změna lexikálního významu

• ne nutně zcela totožná situace, ale změna

významu po provedení alternace je (pro třídu

sloves, která se této alternace může účastnit)

predikovatelná

• různý (ontologický,pragmatický?) vztah

argumentů a predikátu

– ... hřebík.PAT plechem – plech.PAT hřebíkem

Page 17: Valenční slovník českých sloves

Příklad 1:„odstraňování z

kontejneru“ • vybalit (dárky,kufr), vykácet (stromy, zahradu),

vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník)... (Daneš,1985)

• změna formy predikátoru: žádná• změna valenčního rámce: ubude obl. DIR1 (ale: vysypat popelník z okna(?))• změna významu:

– před alternací je kontejner na tg.rovině obsažen v DIR1, po alternaci je PAT

– po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)

Page 18: Valenční slovník českých sloves

Příklad 2:dispoziční modalita

• dobře se mi čte (ta kniha)

(ale: *zná se mi dobře, *umí se mi dobře, *cítí se

mi dobře)

• změna formy predikátu: reflex.

• změna valence: přibude hodnotící obl.MANN,

ACT(3) a non-obl PAT(1)

• změna významu: modální příznak

Page 19: Valenční slovník českých sloves

Příklad 3: „ztranzitivnění“ sloves

pohybu

• vyjít/vyběhnout/vyjet/vylézt na kopec/kopec

• změna formy predikátu: žádná

• změna valence: ubude obl.DIR3, přibude obl.

PAT

• změna významu: před alternací jde jen o

dosažení cíle, po alternaci jde o zdolání úseku

Page 20: Valenční slovník českých sloves

ČNK: plavat + ak.

Page 21: Valenční slovník českých sloves

Alternační model valenčního slovníku

LEXÉM

LEX. JEDNOTKA

RÁMEC

... ... ...

lemma1lemma2

LEX. FORMY

LEXÉM

LEX. JEDNOTKA

ZÁKL. RÁMEC

... ... ...

lemma1lemma2

LEX. FORMY

ODV. RÁMCE

Page 22: Valenční slovník českých sloves

Další výhody alternačního modelu

– valence komparativů a superlativů• tatáž lexikální jednotka, ale jiná valence

– valence substantiv („přetížený“ genitiv)• Karlův dluh dvou miliónů / dluh Karla

– valence anglických sloves • He gave Mary a book / He a book to Mary.

– „nadfunktory“ • DIR1-TFRWH: pochází z osmého století / ze střední Asie

– krok k vyšší (sémanticko-logické?) rovině popisu jazyka• napustil vanu vodou napustil vodu do vany

Page 23: Valenční slovník českých sloves

Závěr

• sloučení vidových dvojic– významné snížení redundance slovníku– přiblížení FGP– komplikovanější datová struktura slovníku

• alternační model valenčního slovníku– snížení redundance slovníku– jednotný mechanismus pro popis řady dosud (v

rámci VALLEXu) nezachytitelných situací– zásah do valenční teorie FGP– komplikovanější datová struktura slovníku

• otevřené otázky ...

Page 24: Valenční slovník českých sloves

„Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko.“


Recommended