+ All Categories
Home > Technology > NMI15 Kateřina Veselovská – Automatická detekce emocí v textu

NMI15 Kateřina Veselovská – Automatická detekce emocí v textu

Date post: 21-Jul-2015
Category:
Upload: new-media-inspiration
View: 60 times
Download: 0 times
Share this document with a friend
54
Automatická detekce emocí v textu Kateřina Veselovská [email protected] New Media Inspiration, Praha 21. 2. 2015
Transcript

Automatická detekce

emocí v textu

Kateřina Veselovská [email protected]

New Media Inspiration, Praha 21. 2. 2015

Informace v textu

• objektivní fakta

• subjektivní názory

• pocity

• domněnky

• pozitivní či negativní hodnocení

atd.

Informace v textu

• rozvoj Webu 2.0 → obsah generovaný uživateli

→ potřeba automatického

třídění informací

K čemu je to dobré?

Postojová analýza (sentiment analysis)

• automatická extrakce názorů a postojů z textu a řeči

= co si vlastně lidé myslí

Postojová analýza

• automatická extrakce názorů a postojů z textu a řeči

= co si vlastně lidé myslí

Postojová analýza

• binární úloha nebo ordinální škála:

- líbí x nelíbí

-

K čemu je to dobré?

• hodnocení produktů

• průzkum veřejného mínění

• monitoring sociálních sítí

• intenční analýza

• forenzní lingvistika

• predikace trendů v marketingu

• predikace výsledků voleb

K čemu je to dobré?

• potenciální zákazník – názory a komentáře jiných

• uživatel – sdílení zkušeností

• obchodník – zpětná vazba

Jak se to dělá?

Nerezový vejcovar Steba má vyměnitelné pláty

pro volská oka.

vs.

[Krásný nerezový vejcovar Steba je i u netrpělivých

zákazníků velmi oblíben.]+

= hlasování prostou většinou

Czech Sublex 1.0

Czech Sublex 1.0

• překlad části MPQA korpusu přes paralelní korpus

CzEng

1954 substantiv

1698 sloves

819 adjektiv

465 adverbií

4936 hodnotících slov

přístupný ze stránek www.ufal.cz/sentiment

Jak se to dělá?

• metody kvantitativní lingvistiky (tematická koncentrace)

• unsupervised learning

- Turneyův třístupňový algoritmus (využití PMI)

• supervised learning - support vector machines - maximální entropie - slovníkové klasifikátory - Naivní Bayesův klasifikátor

Naivní Bayes

• velké množství trénovacích dat (csfd.cz, mall.cz…)

• preprocessing: spell-checking

lemmatizace

desambiguace

morfologie

parsing…

Naivní Bayes

• feature: přítomnost lemmatu v daném segmentu

• odhaduje predikační sílu lemmatu vzhledem k polaritě

• trénování = budování slovníku všech přítomných

lemmat a jejich predikačních sil

Naivní Bayes

• filtrování

- podle slovních druhů

- na základě frekvence

- zohlednění jazyka emocí

emocí v jazyce

Jazyk emocí

Jazyk emocí

Jazyk emocí

• emotikony :-) :-D :-P ;-) >:-[ :-/ :-( …

• výrazná interpunkce!!!!!!!??????????!!!!!!

• opakování znaků: Supeeeeeeeeer!

• důraz pomocí kapitálek: Je to prostě BOŽÍ!

• vytýkání: Tenhle vejcovar nade všechno *miluju*

• nové pojetí vulgarismů: KUA

Jazyk emocí

Jazyk emocí

• augmentativa (barabizna)

• deminutiva (mimísek)

• eufemismy (okrasný tukový prstenec x špek)

• vulgarismy (@#%$!!)

• evaluativní frazémy a idiomy

• pojmenované entity

Jazyk emocí

za málo peněz hodně muziky

mít se jako prase v žitě

cítit se jako nahý v trní

stát za houby

být příjemný jako osina v zadku

jít jako po másle

být šťastný jako blecha

tvářil se, jako by mu uletěly včely

má to své mouchy

lepší než drátem do oka…

Emoce v jazyce

moderátorka Jolka Krásná

obec Krásná

karpatský hřeben Krásná polonina

zemědělské družstvo Krásná Hora nad Vltavou

bar/pořad Krásný ztráty

časopis Krásná a zdravá

lunární kalendář Krásné paní

píseň Krásná je Neapol

poéma Krásná Poldi

román Cizinec a krásná paní

film Život je krásný

soutěž Věda je krásná

Jazyk emocí

„Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci.“ → zdroj

Zdroj: http://www.zpovednice.cz – diskuse k básni Splav

Jazyk emocí

„Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci.“ → zdroj → cíl

Zdroj: http://www.zpovednice.cz – diskuse k básni Splav

Jazyk emocí

„Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci.“ → zdroj → cíl → hodnocení

Zdroj: http://www.zpovednice.cz – diskuse k básni Splav

Emoce v jazyce

• plnovýznamové slovní druhy s výjimkou zájmen a

číslovek

• evaluativní částice

• citoslovce

Emoce v jazyce

• důležitost desambiguace

Dobře, já to udělám.

Zachoval se dobře.

Emoce v jazyce

• důležitost slovesa

zdroj – hodnocení – cíl

agens – predikát – patiens

Emoce v jazyce

• slovesa osobního mínění

myslet, domnívat se, předpokládat, pohlížet na…

Emoce v jazyce

• explicitní hodnocení – vyjádření citového stavu

nesouhlasit s, nesnášet, chválit, zbožňovat…

[Toho hrdopýška všichni nesnášejí.] –

[Toho hrdopýška všichni chválí.] +

→ hodnotící sloveso má větší indikační sílu

než hodnotící substantivum

Emoce v jazyce

• důležitost částic

[Bohudík toho hrdopýška všichni nesnášejí.] +

[Bohužel toho hrdopýška všichni chválí.] -

→ emocionální částice má větší indikační sílu

než evaluativní sloveso

- chválabohu, naštěstí, zaplať pánbůh…

Emoce v jazyce

• důležitost adjektiv

[Bylo to příjemné nedorozumění.] +

→ hodnotící adjektivum má větší indikační sílu

než hodnotící substantivum

Emoce v jazyce

• pragmatická odbočka: ironie

Byl to hrdinný chlípník.

Byl to chlípný hrdina.

Emoce v jazyce

• intenzifikátory

[Ještě si pamatuju, že to kafe bylo strašně dobrý.] +

Emoce v jazyce

• důležitost negace

- obrací větnou polaritu

[Jídlo nebylo dobré.] –

Emoce v jazyce

• důležitost spojky ale ‒ adverzativní koordinace

[Pláž byla hrozná]- , ale [v hotelu se nám líbilo.]+

Emoce v jazyce

• přípustkové spojky

přestože, ačkoliv, jakkoliv, byť, i když…

Přestože příjezd nesplnil všechna jeho očekávání,

leccos ho potěšilo.

Emoce v jazyce

• hodnocení je často závislé na doméně:

• chytrý telefon x chytrý zásah litvínovského útočníka

• tichý vysavač x tichý detektor kouře

• „Go read the book!“

Emoce v jazyce

„Rubbish hotel in Madrid“

Jakou to má úspěšnost?

• nejlepší dosažená přesnost: 89% (trénovací data z

Mall.cz)

Jaké to má aplikace?

Customer churn analysis:

„Blahopřeju vám k anti-péči o zákazníka. Jsem u vás od

roku 2002 a jediné co mi umíte nabídnout jsou běžné −

a stále dost nevýhodné − tarify. Člověk si aspoň

uvědomí, jak moc potřebujeme Evropskou unii (jejíž

instituce jako jediná z relevantních subjektů tlačí ceny

dolů). Po špatných zkušenostech hodlám přejít ke

konkurenci.“

Jaké to má aplikace?

Customer loyalty analysis

„Produkt této společnosti používám na několika PC už

několik let a zatím jsem neobjevil žádné vady.

Vzhledem k mé naprosté spokojenosti ani do budoucna

nehodlám nic měnit.“

Jaké to má aplikace?

Customer risk analysis

• detekce lži:

kratší věty, krátká slova, více výrazů vyjadřujících

pozitivní emoce… (+ další dimenze)

• detekce spamu, detekce falešných profilů,

výhružných e-mailů aj.

Jaké to má aplikace?

Customer feedback analysis

„Koupit si tento fotoaparát a spoléhat na jméno firmy se

mi vůbec nevyplatilo. Např. proti mému stařičkému

fotoaparátu je toto naprostý propadák. Průměrný telefon

s fotoaparátem udělá stejné, ne-li lepší fotografie. Ani

komunikace s centrem podpory nestojí za nic. Výrobek

mě zklamal a víckrát už si žádný produkt této firmy

bezpochyby nekoupím.“

cílený marketing

Jaké to má aplikace?

personalizovaný marketing, individuální interakce

http://twittersentiment.appspot.com/

Jaké to má aplikace?

http://socialmention.com/

Jaké to má aplikace?

Zdroj: http://www.yeseter.com

Jaké to má aplikace?

Zdroj: http://www.semantic-visions.com/

Jaké to má aplikace?

Jaké to má aplikace?

Jaké to má aplikace?

Jakou to má budoucnost?

• lepší preprocessing: pojmenované entity

spell-checking (vulgarismy apod.)

• automatická identifikace cílů

• doménově závislé výrazy

• analýza mluvených dat

• psycholingvistické experimenty

*Děkuji* za pozornost!!

www.ufal.cz/~veselovska


Recommended