+ All Categories
Home > Documents > Sémantický význam Wikipedie

Sémantický význam Wikipedie

Date post: 13-Aug-2015
Category:
Upload: josef-slerka
View: 1,788 times
Download: 3 times
Share this document with a friend
27
Sémantick ý v ý znam Wikipedie Wikinomics Forum 2010, Praha Josef Š lerka, ÚISK FF UK Sunday, December 5, 2010
Transcript
Page 1: Sémantický význam Wikipedie

Sémantický význam Wikipedie

Wikinomics Forum 2010, PrahaJosef Šlerka, ÚISK FF UK

Sunday, December 5, 2010

Page 2: Sémantický význam Wikipedie

Wikipedia jako předmět zkoumání

Za posledních 10 let bylo podle serveru Google Scholar publikováno více než 2.000 studií, v jejichž názvu se vyskytuje slovo Wikipedia.

Slouží za typický příklad kolektivní inteligence a bezedný důl pro dataming.

Sunday, December 5, 2010

Page 3: Sémantický význam Wikipedie

Kolektivní inteligence

"Kolektivní inteligenci je obecně možné definovat jako schopnost skupiny najít větší množství, anebo kvalitnější řešení nějakého problému, než její jednotliví členové" (wiki)

Sunday, December 5, 2010

Page 4: Sémantický význam Wikipedie

Kolektivní inteligence

"Forma univerzálně distribuované inteligence, konstantně zdokonalované, koordinované v reálném čase a vyúsťující v efektivní využití schopností" (Piére Lévy)

Sunday, December 5, 2010

Page 5: Sémantický význam Wikipedie

Kolektivní inteligence

"Skupina pracující v kolektivu tak, že to vypadá inteligentně" (CCI MIT)

Sunday, December 5, 2010

Page 6: Sémantický význam Wikipedie

Nejčastější využití

extrakce znalostí

využití sítě vazeb mezi pojmy a kategoriemi

Sunday, December 5, 2010

Page 7: Sémantický význam Wikipedie

Extrace znalostí

problém s nestrukturovaností dat

odměna v podobě obrovské znalosti

Sunday, December 5, 2010

Page 8: Sémantický význam Wikipedie

David Beckham

Sunday, December 5, 2010

Page 9: Sémantický význam Wikipedie

DBpedia.org

3.4 million things, 1.5 million are classified in a consistent Ontology, 312,000 persons, 413,000 places, 94,000 music albums, 49,000 films, 15,000 video games, 140,000 organizations, 146,000 species and 4,600 diseases.

Sunday, December 5, 2010

Page 10: Sémantický význam Wikipedie

Chytré dotazy

All soccer players, who played as goalkeeper for a club that has a stadium with more than 40.000 seats and who are born in a country with more than 10 million inhabitants?

Sunday, December 5, 2010

Page 11: Sémantický význam Wikipedie

Chytré dotazy SELECT DISTINCT ?player { ?s foaf:page ?player. ?s rdf:type <http://dbpedia.org/ontology/SoccerPlayer> . ?s dbpedia2:position ?position . ?s <http://dbpedia.org/property/clubs> ?club . ?club <http://dbpedia.org/ontology/capacity> ?cap . ?s <http://dbpedia.org/ontology/birthPlace> ?place . ?place ?population ?pop. OPTIONAL {?s <http://dbpedia.org/ontology/number> ?tricot.} Filter (?population in (<http://dbpedia.org/property/populationEstimate>, <http://dbpedia.org/property/populationCensus>, <http://dbpedia.org/property/statPop> )) Filter (xsd:int(?pop) >10000000 ) . Filter (xsd:int(?cap) <40000 ) . Filter (?position = "Goalkeeper"@en || ?position = <http://dbpedia.org/resource/Goalkeeper_%28association_football%29> || ?position = <http://dbpedia.org/resource/Goalkeeper_%28football%29>) } Limit 1000

Sunday, December 5, 2010

Page 13: Sémantický význam Wikipedie

...další servery

http://www.freebase.com/

http://www.wolframalpha.com

Sunday, December 5, 2010

Page 14: Sémantický význam Wikipedie

Wikipedie jak síť

Pro řadu badatelů je Wikipedie především sémantickou sítí, jejímž určitým nedostatkem je neutrální prolinkování mezi pojmy a kategoriemi, které nenese další informaci o povaze zařazení, tak jako je to v případě WordNetu.

Sunday, December 5, 2010

Page 15: Sémantický význam Wikipedie

David Beckham

Person is ... who plays ...

Sunday, December 5, 2010

Page 16: Sémantický význam Wikipedie

Sunday, December 5, 2010

Page 17: Sémantický význam Wikipedie

Ale je to vlastně nevýhoda?

zkrátka akademici (až na vyjimky) nevěří Wikipedii

Sunday, December 5, 2010

Page 18: Sémantický význam Wikipedie

Ale je to vlastně nevýhoda?

Sunday, December 5, 2010

Page 19: Sémantický význam Wikipedie

Ale je to vlastně nevýhoda? Hierarchie kategorií a pojmů ve Wikipedii odpovídá stavu diskursu v dané jazykové komunitě a je výrazem společenského common sense pojmů.

Tím ovšem vytváří ideální základ pro klasifikaci, protože v zásadě staví na hierarchii vyplývající z běžné jazykové praxe komunity, nikoli z vědeckého (nebo jiného) diskursu.

Sunday, December 5, 2010

Page 20: Sémantický význam Wikipedie

A zase ta CI

průměrování,

dělba práce

zpětnou vazba

Sunday, December 5, 2010

Page 21: Sémantický význam Wikipedie

... Wiki o Wiki Dělbou práce je v tomto případě fakt, že každý návštěvník wikipedie má právo a okamžitý přístup k editaci stávajících či založení nového článku. Jednotliví autoři však jsou však málokdy schopni zpracovat celý článek samostatně bez pomoci ostatních a tak i ostatní autoři doplňují, opravují a rozšiřují to, co někdo napsal před nimi. Pokud je nějaké téma kontroverzní, dochází k časté editaci až do chvíle, kdy se dosáhne mezi autory konsensu. Výsledek je tedy jakýmsi znalostním průměrem jednotlivých autorů. (Wikipedia)

Sunday, December 5, 2010

Page 22: Sémantický význam Wikipedie

Ukázky z Nového Zélandu

Hledání podobností

Pomoc extrakci thesauru a podobně

Extrakce kategorii z text Wikify

Sunday, December 5, 2010

Page 26: Sémantický význam Wikipedie

Další aplikace

extrakce geodat pro Google Maps

integrace do AR jako v případě Wikitude

a řada dlaších

Sunday, December 5, 2010

Page 27: Sémantický význam Wikipedie

Děkuji za pozornost

[email protected]

Sunday, December 5, 2010


Recommended