+ All Categories
Home > Documents > Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za...

Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za...

Date post: 18-Jan-2021
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
105
´ Uvod do poˇ ıtaˇ cov´ e lingvistiky Aleˇ s Hor´ ak E-mail: [email protected] http://nlp.fi.muni.cz/poc_lingv/ Obsah: Organizace pˇ redmˇ etu IB030 Poˇ ıtaˇ cov´ a lingvistika Situace na FI MU ´ Uvod do poˇ ıtaˇ cov´ e lingvistiky 1/11 1 / 19
Transcript
Page 1: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Uvod do pocıtacove lingvistiky

Ales Horak

E-mail: [email protected]://nlp.fi.muni.cz/poc_lingv/

Obsah:

Organizace predmetu IB030

Pocıtacova lingvistika

Situace na FI MU

Uvod do pocıtacove lingvistiky 1/11 1 / 19

Page 2: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 3: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 4: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 5: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 6: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 7: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030

Organizace predmetu IB030

Hodnocenı predmetu:

zaverecna pısemka (max 80 bodu)• jeden radny a dva opravne termıny

prubezny ukol (max 20 bodu)

navıc moznost 1 bodu za netrivialnı vylepsenı slajdu

hodnocenı – soucet bodu za pısemku i ukol (max 100 bodu)

rozdıly zk, k, z – ruzne limitynapr.:

A 80 – 100B 73 – 79C 65 – 72D 58 – 64E 50 – 57F 0 – 49

K 45 – 100Z 40 – 100

Uvod do pocıtacove lingvistiky 1/11 2 / 19

Page 8: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 9: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 10: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 11: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 12: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 13: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Zakladnı informace

prednaska je nepovinna

cvicenı – obcas doporucene male ukoly

jeden hodnoceny ukol (viz dalsı slajdy)

web predmetu – http://nlp.fi.muni.cz/poc_lingv/

slajdy – prubezne doplnovany na webu predmetu

kontakt na prednasejıcıho – Ales Horak <[email protected]>

(Subject: IB030 . . . )

Uvod do pocıtacove lingvistiky 1/11 3 / 19

Page 14: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – programatorsky

dva typy – programatorsky × lingvistickyprogramatorsky ukol – upravit nekterou z dostupnych jazykovychknihoven pro cestinu:

• NLTK – Natural Language Toolkit http://www.nltk.org

• C&C Tools http://svn.ask.it.usyd.edu.au/trac/candc/wiki

• Field Linguist’s Toolbox http://www.sil.org/computing/toolbox/

• FreeLing http://nlp.lsi.upc.edu/freeling/

• Stanford University Natural Language Software

http://nlp.stanford.edu/software/

• IBM LanguageWare Resource Workbench

http://alphaworks.ibm.com/tech/lrw

k odevzdanı je zapotrebı:• naprogramovany vybrany algoritmus na cestine• dokumentace programu s ukazkami a navodem na instalaci/spustenı na

serveru aurora.fi.muni.cz a vyhodnocenım uspesnosti algoritmu na ne zcelatrivalnıch ceskych datech

• vse odeslat v komprimovanem archivu e-mailem prednasejıcımu (Subject:IB030 – odevzdani ukolu) do 17. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• slozitosti vybraneho algoritmus• kvality zpracovanı algoritmu i dokumentace

Uvod do pocıtacove lingvistiky 1/11 4 / 19

Page 15: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – programatorsky

dva typy – programatorsky × lingvistickyprogramatorsky ukol – upravit nekterou z dostupnych jazykovychknihoven pro cestinu:

• NLTK – Natural Language Toolkit http://www.nltk.org

• C&C Tools http://svn.ask.it.usyd.edu.au/trac/candc/wiki

• Field Linguist’s Toolbox http://www.sil.org/computing/toolbox/

• FreeLing http://nlp.lsi.upc.edu/freeling/

• Stanford University Natural Language Software

http://nlp.stanford.edu/software/

• IBM LanguageWare Resource Workbench

http://alphaworks.ibm.com/tech/lrw

k odevzdanı je zapotrebı:• naprogramovany vybrany algoritmus na cestine• dokumentace programu s ukazkami a navodem na instalaci/spustenı na

serveru aurora.fi.muni.cz a vyhodnocenım uspesnosti algoritmu na ne zcelatrivalnıch ceskych datech

• vse odeslat v komprimovanem archivu e-mailem prednasejıcımu (Subject:IB030 – odevzdani ukolu) do 17. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• slozitosti vybraneho algoritmus• kvality zpracovanı algoritmu i dokumentace

Uvod do pocıtacove lingvistiky 1/11 4 / 19

Page 16: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – programatorsky

dva typy – programatorsky × lingvistickyprogramatorsky ukol – upravit nekterou z dostupnych jazykovychknihoven pro cestinu:

• NLTK – Natural Language Toolkit http://www.nltk.org

• C&C Tools http://svn.ask.it.usyd.edu.au/trac/candc/wiki

• Field Linguist’s Toolbox http://www.sil.org/computing/toolbox/

• FreeLing http://nlp.lsi.upc.edu/freeling/

• Stanford University Natural Language Software

http://nlp.stanford.edu/software/

• IBM LanguageWare Resource Workbench

http://alphaworks.ibm.com/tech/lrw

k odevzdanı je zapotrebı:• naprogramovany vybrany algoritmus na cestine• dokumentace programu s ukazkami a navodem na instalaci/spustenı na

serveru aurora.fi.muni.cz a vyhodnocenım uspesnosti algoritmu na ne zcelatrivalnıch ceskych datech

• vse odeslat v komprimovanem archivu e-mailem prednasejıcımu (Subject:IB030 – odevzdani ukolu) do 17. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• slozitosti vybraneho algoritmus• kvality zpracovanı algoritmu i dokumentace

Uvod do pocıtacove lingvistiky 1/11 4 / 19

Page 17: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – programatorsky

dva typy – programatorsky × lingvistickyprogramatorsky ukol – upravit nekterou z dostupnych jazykovychknihoven pro cestinu:

• NLTK – Natural Language Toolkit http://www.nltk.org

• C&C Tools http://svn.ask.it.usyd.edu.au/trac/candc/wiki

• Field Linguist’s Toolbox http://www.sil.org/computing/toolbox/

• FreeLing http://nlp.lsi.upc.edu/freeling/

• Stanford University Natural Language Software

http://nlp.stanford.edu/software/

• IBM LanguageWare Resource Workbench

http://alphaworks.ibm.com/tech/lrw

k odevzdanı je zapotrebı:• naprogramovany vybrany algoritmus na cestine• dokumentace programu s ukazkami a navodem na instalaci/spustenı na

serveru aurora.fi.muni.cz a vyhodnocenım uspesnosti algoritmu na ne zcelatrivalnıch ceskych datech

• vse odeslat v komprimovanem archivu e-mailem prednasejıcımu (Subject:IB030 – odevzdani ukolu) do 17. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• slozitosti vybraneho algoritmus• kvality zpracovanı algoritmu i dokumentace

Uvod do pocıtacove lingvistiky 1/11 4 / 19

Page 18: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – lingvisticky

lingvisticky ukol – znackovanı vyznamu frazı a slov.napr. v roce 2013:

• cestina, 300 otazek a odpovedı podle textu z Wikipedie

Jak se nazyva strom, jehoz zrna jsou vyuzıvana k vyrobe cokolady?Theobroma cacaoCokolada se vyrabı z kvasenych, prazenych a mletych zrnek tro-pickeho kakaoveho stromu Theobroma cacao.http://cs.wikipedia.org/wiki/%C4%8Cokol%C3%A1da

k odevzdanı je zapotrebı:• oznamit vcas vyber ukolu a zıskat svoji sadu slov• odeslat vysledek v aplikaci nebo v ZIPu e-mailem prednasejıcımu

(Subject: IB030 – odevzdani ukolu) do 3. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• kvality zpracovanı znackovanı vsech vet

Uvod do pocıtacove lingvistiky 1/11 5 / 19

Page 19: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – lingvisticky

lingvisticky ukol – znackovanı vyznamu frazı a slov.napr. v roce 2013:

• cestina, 300 otazek a odpovedı podle textu z Wikipedie

Jak se nazyva strom, jehoz zrna jsou vyuzıvana k vyrobe cokolady?Theobroma cacaoCokolada se vyrabı z kvasenych, prazenych a mletych zrnek tro-pickeho kakaoveho stromu Theobroma cacao.http://cs.wikipedia.org/wiki/%C4%8Cokol%C3%A1da

k odevzdanı je zapotrebı:• oznamit vcas vyber ukolu a zıskat svoji sadu slov• odeslat vysledek v aplikaci nebo v ZIPu e-mailem prednasejıcımu

(Subject: IB030 – odevzdani ukolu) do 3. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• kvality zpracovanı znackovanı vsech vet

Uvod do pocıtacove lingvistiky 1/11 5 / 19

Page 20: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Zakladnı informace

Samostatny hodnoceny ukol – lingvisticky

lingvisticky ukol – znackovanı vyznamu frazı a slov.napr. v roce 2013:

• cestina, 300 otazek a odpovedı podle textu z Wikipedie

Jak se nazyva strom, jehoz zrna jsou vyuzıvana k vyrobe cokolady?Theobroma cacaoCokolada se vyrabı z kvasenych, prazenych a mletych zrnek tro-pickeho kakaoveho stromu Theobroma cacao.http://cs.wikipedia.org/wiki/%C4%8Cokol%C3%A1da

k odevzdanı je zapotrebı:• oznamit vcas vyber ukolu a zıskat svoji sadu slov• odeslat vysledek v aplikaci nebo v ZIPu e-mailem prednasejıcımu

(Subject: IB030 – odevzdani ukolu) do 3. kvetna 2016

hodnocenı bude od 0 do 20 bodu podle:• kvality zpracovanı znackovanı vsech vet

Uvod do pocıtacove lingvistiky 1/11 5 / 19

Page 21: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetu

Uvod do pocıtacove lingvistiky 1/11 6 / 19

Page 22: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetu

Uvod do pocıtacove lingvistiky 1/11 6 / 19

Page 23: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetu

Uvod do pocıtacove lingvistiky 1/11 6 / 19

Page 24: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetu

Uvod do pocıtacove lingvistiky 1/11 6 / 19

Page 25: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetuUvod do pocıtacove lingvistiky 1/11 6 / 19

Page 26: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Literatura

Literatura

Pala, Karel: Pocıtacove zpracovanı prirozenehojazyka, Brno FI MU, 2000. 190 s.

The Oxford handbook of computational lingu-istics, ed. by Ruslan Mitkov. Oxford UniversityPress, 2003, 784 s.

Allen, James: Natural language understanding,Redwood : Benjamin/Cummings Publishing,1995, 654 s.

Chomsky, Noam: Syntakticke struktury, Praha :Academia, 1966. 209 s.

Materna, Pavel - Stepan, Jan: Filozoficka logika:nova cesta?, Olomouc (Univerzita Palackeho),2000. 127 s.

slajdy na webu predmetuUvod do pocıtacove lingvistiky 1/11 6 / 19

Page 27: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 28: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 29: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 30: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 31: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 32: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Organizace predmetu IB030 Napln predmetu

Napln predmetu

pocıtacove zpracovanı prirozeneho jazyka (Natural LanguageProcessing, NLP)

roviny jazyka

reprezentace morfologickych a syntaktickych struktur

analyza a synteza: morfologicka, syntakticka, semanticka

formy reprezentace znalostı o lexikalnıch jednotkach

porozumenı jazyku: reprezentace vyznamu vety, inference areprezentace znalostı

Uvod do pocıtacove lingvistiky 1/11 7 / 19

Page 33: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Obsah

1 Organizace predmetu IB030Zakladnı informaceLiteraturaNapln predmetu

2 Pocıtacova lingvistikaHistorie pocıtacove lingvistikyCıle pocıtacove lingvistiky

3 Situace na FI MUPrednasky se vztahem k NLPNLP Centre – Centrum ZPJNLP projekty a SW

Uvod do pocıtacove lingvistiky 1/11 8 / 19

Page 34: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 35: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 36: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 37: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 38: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 39: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 40: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika

Co je “pocıtacova lingvistika”

Lingvistika:

jazykoveda (lingua = lat. jazyk)

veda o jazycıch, jejich trıdenı, stavbe, zvukove i psane podobe

zkouma strukturu jazyka – slovotvorba, kombinace slov do vet,vyznam vety, ...

Pocıtacova lingvistika:

od 60. let, Computational linguistics, casto NLP (Natural LanguageProcessing)

spojenı umele inteligence (informatiky) a lingvistiky – jako jednaz kognitivnıch ved

zkouma problemy analyzy ci generovanı textu nebo mluveneho slova,ktere vyzadujı urcitou (ne absolutnı) mıru porozumenı prirozenemujazyku strojem.

tvorı jazykove modely – pojmy algoritmus, datova struktura,(formalnı) gramatika, . . .

Uvod do pocıtacove lingvistiky 1/11 9 / 19

Page 41: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test

z roku 1950, zalozen na tzv. imitacnı hre

ukol – program komunikujıcı jako clovek

zahrnuje:

• zpracovanı prirozeneho jazyka (NLP)

• reprezentaci znalostı (KRepresentation)

• vyvozovanı znalostı (KReasoning)

• strojove ucenı

• (pocıtacove videnı)

• (robotiku)

od 1991 – Loebnerova cena (Loebner Prize) → kazdy rok $4.000 za“nejlidstejsı” program, nabızı $100.000 a zlata medaile za slozenıceleho Turingova testu

Uvod do pocıtacove lingvistiky 1/11 10 / 19

Page 42: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test

z roku 1950, zalozen na tzv. imitacnı hre

ukol – program komunikujıcı jako clovek

zahrnuje:

• zpracovanı prirozeneho jazyka (NLP)

• reprezentaci znalostı (KRepresentation)

• vyvozovanı znalostı (KReasoning)

• strojove ucenı

• (pocıtacove videnı)

• (robotiku)

od 1991 – Loebnerova cena (Loebner Prize) → kazdy rok $4.000 za“nejlidstejsı” program, nabızı $100.000 a zlata medaile za slozenıceleho Turingova testu

Uvod do pocıtacove lingvistiky 1/11 10 / 19

Page 43: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test

z roku 1950, zalozen na tzv. imitacnı hre

ukol – program komunikujıcı jako clovek

zahrnuje:

• zpracovanı prirozeneho jazyka (NLP)

• reprezentaci znalostı (KRepresentation)

• vyvozovanı znalostı (KReasoning)

• strojove ucenı

• (pocıtacove videnı)

• (robotiku)

od 1991 – Loebnerova cena (Loebner Prize) → kazdy rok $4.000 za“nejlidstejsı” program, nabızı $100.000 a zlata medaile za slozenıceleho Turingova testu

Uvod do pocıtacove lingvistiky 1/11 10 / 19

Page 44: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test

z roku 1950, zalozen na tzv. imitacnı hre

ukol – program komunikujıcı jako clovek

zahrnuje:

• zpracovanı prirozeneho jazyka (NLP)

• reprezentaci znalostı (KRepresentation)

• vyvozovanı znalostı (KReasoning)

• strojove ucenı

• (pocıtacove videnı)

• (robotiku)

od 1991 – Loebnerova cena (Loebner Prize) → kazdy rok $4.000 za“nejlidstejsı” program, nabızı $100.000 a zlata medaile za slozenıceleho Turingova testu

Uvod do pocıtacove lingvistiky 1/11 10 / 19

Page 45: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Eliza, Parry, ...

Eliza – Joseph Weizenbaum, MIT, 1964–66

program napodobujıcı chovanı psychoterapeuta:

young woman: Men are all alike.eliza: In what way?

young woman: They’re always bugging us about something.eliza: Can you think of a specific example?

young woman: Well, my boyfriend made me come here.eliza: Your boyfriend made you come here?

young woman: He says I’m depressed much of the time.eliza: I am sorry to hear you are depressed.

young woman: It’s true. I’m unhappy.

Parry (Kenneth Colby, 70. leta), protejsek Elizy – pocıtacova simulacepacienta postizeneho paranoiou

oba vyuzıvajı spıs “triky” nez analyzu

prakticky vyznam – tzv. expertnı systemy

Uvod do pocıtacove lingvistiky 1/11 11 / 19

Page 46: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Eliza, Parry, ...

Eliza – Joseph Weizenbaum, MIT, 1964–66

program napodobujıcı chovanı psychoterapeuta:

young woman: Men are all alike.eliza: In what way?

young woman: They’re always bugging us about something.eliza: Can you think of a specific example?

young woman: Well, my boyfriend made me come here.eliza: Your boyfriend made you come here?

young woman: He says I’m depressed much of the time.eliza: I am sorry to hear you are depressed.

young woman: It’s true. I’m unhappy.

Parry (Kenneth Colby, 70. leta), protejsek Elizy – pocıtacova simulacepacienta postizeneho paranoiou

oba vyuzıvajı spıs “triky” nez analyzu

prakticky vyznam – tzv. expertnı systemy

Uvod do pocıtacove lingvistiky 1/11 11 / 19

Page 47: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Eliza, Parry, ...

Eliza – Joseph Weizenbaum, MIT, 1964–66

program napodobujıcı chovanı psychoterapeuta:

young woman: Men are all alike.eliza: In what way?

young woman: They’re always bugging us about something.eliza: Can you think of a specific example?

young woman: Well, my boyfriend made me come here.eliza: Your boyfriend made you come here?

young woman: He says I’m depressed much of the time.eliza: I am sorry to hear you are depressed.

young woman: It’s true. I’m unhappy.

Parry (Kenneth Colby, 70. leta), protejsek Elizy – pocıtacova simulacepacienta postizeneho paranoiou

oba vyuzıvajı spıs “triky” nez analyzu

prakticky vyznam – tzv. expertnı systemy

Uvod do pocıtacove lingvistiky 1/11 11 / 19

Page 48: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Eliza, Parry, ...

Eliza – Joseph Weizenbaum, MIT, 1964–66

program napodobujıcı chovanı psychoterapeuta:

young woman: Men are all alike.eliza: In what way?

young woman: They’re always bugging us about something.eliza: Can you think of a specific example?

young woman: Well, my boyfriend made me come here.eliza: Your boyfriend made you come here?

young woman: He says I’m depressed much of the time.eliza: I am sorry to hear you are depressed.

young woman: It’s true. I’m unhappy.

Parry (Kenneth Colby, 70. leta), protejsek Elizy – pocıtacova simulacepacienta postizeneho paranoiou

oba vyuzıvajı spıs “triky” nez analyzu

prakticky vyznam – tzv. expertnı systemy

Uvod do pocıtacove lingvistiky 1/11 11 / 19

Page 49: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Eliza, Parry, ...

Eliza – Joseph Weizenbaum, MIT, 1964–66

program napodobujıcı chovanı psychoterapeuta:

young woman: Men are all alike.eliza: In what way?

young woman: They’re always bugging us about something.eliza: Can you think of a specific example?

young woman: Well, my boyfriend made me come here.eliza: Your boyfriend made you come here?

young woman: He says I’m depressed much of the time.eliza: I am sorry to hear you are depressed.

young woman: It’s true. I’m unhappy.

Parry (Kenneth Colby, 70. leta), protejsek Elizy – pocıtacova simulacepacienta postizeneho paranoiou

oba vyuzıvajı spıs “triky” nez analyzu

prakticky vyznam – tzv. expertnı systemy

Uvod do pocıtacove lingvistiky 1/11 11 / 19

Page 50: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test – jine varianty

Winograd Schema Challenge:

vyhlaseny organiyacemi Commonsense Reasoning a Nuance od 2015

“strukturovanejsı” test – zalozeny na rozpoznavanı anafor

podrobneji v prednasce o semantice

Turing tests in Creative Arts:

DigiLit – generovanı povıdek

PoetiX – generovanı sonetu

AlgoRhythms – elektronicky DJ, generovanı vyberu tanecnı hudby

Uvod do pocıtacove lingvistiky 1/11 12 / 19

Page 51: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test – jine varianty

Winograd Schema Challenge:

vyhlaseny organiyacemi Commonsense Reasoning a Nuance od 2015

“strukturovanejsı” test – zalozeny na rozpoznavanı anafor

podrobneji v prednasce o semantice

Turing tests in Creative Arts:

DigiLit – generovanı povıdek

PoetiX – generovanı sonetu

AlgoRhythms – elektronicky DJ, generovanı vyberu tanecnı hudby

Uvod do pocıtacove lingvistiky 1/11 12 / 19

Page 52: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test – jine varianty

Winograd Schema Challenge:

vyhlaseny organiyacemi Commonsense Reasoning a Nuance od 2015

“strukturovanejsı” test – zalozeny na rozpoznavanı anafor

podrobneji v prednasce o semantice

Turing tests in Creative Arts:

DigiLit – generovanı povıdek

PoetiX – generovanı sonetu

AlgoRhythms – elektronicky DJ, generovanı vyberu tanecnı hudby

Uvod do pocıtacove lingvistiky 1/11 12 / 19

Page 53: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Turinguv test – jine varianty

Winograd Schema Challenge:

vyhlaseny organiyacemi Commonsense Reasoning a Nuance od 2015

“strukturovanejsı” test – zalozeny na rozpoznavanı anafor

podrobneji v prednasce o semantice

Turing tests in Creative Arts:

DigiLit – generovanı povıdek

PoetiX – generovanı sonetu

AlgoRhythms – elektronicky DJ, generovanı vyberu tanecnı hudby

Uvod do pocıtacove lingvistiky 1/11 12 / 19

Page 54: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 55: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 56: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 57: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 58: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 59: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 60: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 61: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 62: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

IBM Watson – DeepQA

stroj oznacovany jako Watson – DeepQA vyvinuty za ucelem porazitlidske sampiony ve hre Jeopardy (Riskuj)navazuje tım na stroj DeepBlue, ktery v roce 1997 porazil Kasparovav sachu

po 5 letech vyvoje se to Watsonovi podarilo 16.unora 2011

princip:• vytvorenı databaze tvrzenı z internetovych dat• analyza castı otazky, clenenı otazek podle typu• vysoce paralelnı hledanı odpovedi s urcenım mıry jistoty• vyladeny algoritmus pro kombinaci stovek vysledku do vysledneho

rozhodovacıho skore• viz Jak a proc Watson vyhral Jeopardy!

nejedna se o umelou inteligenci podle Turingova testu

prakticky vyznam – inteligentnı zpracovanı obrovskeho mnozstvı textupro hledanı odpovedi

Uvod do pocıtacove lingvistiky 1/11 13 / 19

Page 63: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 64: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 65: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 66: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 67: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 68: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 69: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 70: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 71: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Historie pocıtacove lingvistiky

Historie pocıtacove lingvistiky

1957 – rusko-anglicky preklad

Chomsky (60. leta) – generativnı gramatika, vrozenost jazyka, . . .

strojovy preklad nenı ani dnes dokonaly – potrebuje porozumetobsahu textu (Paretuv zakon – pravidlo 80/20)

problemy – vıceznacnost, mnozstvı vyznamu slov, ruzne zpusoby uzitıslov k vyjadrenı vyznamu, “Commonsense” a lidske uvazovanı

Robert Wilensky: NLP je ”AI-complete”

80. a 90. leta – rozvoj formalismu pro syntaktickou analyzu PJ (LFG,LTAG, HPSG)

soucasne – zkoumanı kvality statistickych metod s rozsahlymi daty →

srovnatelne vysledky!

90. leta az 200x – tvorba zdroju vyssı urovne (syntakticko-semantickelexikony, wordnety, . . . )

stale nenı na obzoru splnenı Turingova testu

Uvod do pocıtacove lingvistiky 1/11 14 / 19

Page 72: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 73: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 74: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 75: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 76: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 77: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 78: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 79: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 80: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 81: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Pocıtacova lingvistika Cıle pocıtacove lingvistiky

Cıle pocıtacove lingvistiky

Vyznamne ukoly v NLP:

analyza prirozeneho jazyka – morfologicka, syntakticka, semanticka

generovanı prirozeneho jazyka

synteza a rozpoznavanı reci

strojovy preklad (Machine translation)

odpovıdanı na otazky (Question answering)

zıskavanı informacı (Information retrieval)

korektura textu (Spell-checking, Grammar checking)

extrakce informacı (Information extraction)

vytah z textu (Text summarization)

urcenı typu dokumentu (Text Classification/Clustering)

Uvod do pocıtacove lingvistiky 1/11 15 / 19

Page 82: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU

Obsah

1 Organizace predmetu IB030Zakladnı informaceLiteraturaNapln predmetu

2 Pocıtacova lingvistikaHistorie pocıtacove lingvistikyCıle pocıtacove lingvistiky

3 Situace na FI MUPrednasky se vztahem k NLPNLP Centre – Centrum ZPJNLP projekty a SW

Uvod do pocıtacove lingvistiky 1/11 16 / 19

Page 83: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU Prednasky se vztahem k NLP

Prednasky se vztahem k NLP na FI MU

obor Umela inteligence a zpracovanı prirozeneho jazyka

vybrane Bc prednasky:

IB030 Uvod do pocıtacove lingvistiky Horak

IB047 Uvod do korpusove lingvistiky apocıtacove lexikografie

Rychly, Pala

IV029 Logicka analyza prirozeneho jazyka Materna, Duzı

PB016 Uvod do umele inteligence Horak

PB095 Uvod do pocıtacoveho zpracovanı reci BartekPV056 Strojove ucenı a dobyvanı znalostı PopelınskyPV173 Seminar zpracovanı prirozeneho

jazykaHorak, Rychly

Uvod do pocıtacove lingvistiky 1/11 17 / 19

Page 84: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU Prednasky se vztahem k NLP

Prednasky se vztahem k NLP na FI MU

obor Umela inteligence a zpracovanı prirozeneho jazyka

vybrane Bc prednasky:

IB030 Uvod do pocıtacove lingvistiky Horak

IB047 Uvod do korpusove lingvistiky apocıtacove lexikografie

Rychly, Pala

IV029 Logicka analyza prirozeneho jazyka Materna, Duzı

PB016 Uvod do umele inteligence Horak

PB095 Uvod do pocıtacoveho zpracovanı reci BartekPV056 Strojove ucenı a dobyvanı znalostı PopelınskyPV173 Seminar zpracovanı prirozeneho

jazykaHorak, Rychly

Uvod do pocıtacove lingvistiky 1/11 17 / 19

Page 85: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 86: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 87: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 88: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 89: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 90: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 91: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 92: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 93: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP Centre – Centrum ZPJ

NLP Centre – Centrum ZPJ na FI MU

sdruzenı lidı (studentu Bc., Mgr. a PGS i zamestnancu) z oblasti NLP

webovy server nlp.fi.muni.cz

fyzicky – 2 “sklenıky” ve 2. patre budovy B:• 2 mıstnosti NLP – laboratore zpracovanı prirozeneho jazyka (doc. Pala)• cast B203 pro LSD – laborator vyhledavanı a dialogu (doc. Kopecek,

prof. Zezula)

vlastnı laboratornı servery a stanice s OS Linux

resı nekolik velkych grantovych projektu, porada mezinarodnıkonference (TSD, GWC, Lexicom, . . . )

prace studentu:• “male projekty,” ktere se vyuzijı v ramci “velkych projektu”• bakalarske, diplomove i disertacnı prace• nekdy i zamestnanecky pomer

PV173 Seminar Laboratore zpracovanı prirozeneho jazyka –pravidelna spolecna vymena informacı

Uvod do pocıtacove lingvistiky 1/11 18 / 19

Page 94: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 95: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 96: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 97: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 98: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 99: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 100: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 101: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 102: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 103: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 104: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19

Page 105: Uvod do pocitacove lingvistiky 1/11 - nlp.fi.muni.cz · nav´ıc moˇznost 1 bodu za netrivi´aln´ı vylepˇsen´ı slajd˚u hodnocen´ı – souˇcet bod˚u za p´ısemku i u´kol

Situace na FI MU NLP projekty a SW

NLP projekty a SW na FI MU

Vybrane projekty:

ajka, majka, desamb – morfologicky analyzator, tagger

synt, set, zuzana – syntakticke (a logicky) analyzatory

X.plain – hra na hadanı slov, clovek × pocıtac

Watsonson – hra na hledanı parafrazı

DEB – platforma pro XML databaze/slovnıky

(DEB)VisDic – editor wordnetu

VerbaLex – slovnık slovesnych valencı

bonito, manatee, Word Sketches – korpusovy manazer

Visual Browser – graficke znazornenı (semantickych) sıtı

GDW (Grammar Development Workbench) – GUI pro vyvoj gramatiky

demosthenes, text2phone (mbrola) – syntetizatory reci

korpusy, slovnıky, encyklopedie, . . .

Uvod do pocıtacove lingvistiky 1/11 19 / 19


Recommended