+ All Categories
Home > Education > Vyhledavani v prostredi Internetu

Vyhledavani v prostredi Internetu

Date post: 18-Dec-2014
Category:
Upload: barbora-p
View: 981 times
Download: 5 times
Share this document with a friend
Description:
Presentation for project LiveOnLine www.liveonline.cz
53
Barbora Poláková ; Martin Kozel
Transcript
Page 1: Vyhledavani v prostredi Internetu

Barbora Poláková ; Martin Kozel

Page 2: Vyhledavani v prostredi Internetu
Page 3: Vyhledavani v prostredi Internetu

Osnova přednášky Co se děje?

změny v přístupu a práci s informacemi

Co s tím ? Struktura informací na webu – teorie a praxe

Jak na to ? Strategie vyhledávání a postupy

Page 4: Vyhledavani v prostredi Internetu

Informace Komunikovatelný popis jevu, jehož přijetím

dochází ke změnám v informačním systému. Odstraněná ENTROPIE

Vyšší míra uspořádanosti Čím více neurčitosti odstraní tím větší má

informace hodnotu. (Shannon,1948)

○ popsatelná○ kontextově nezávislá

○ organizovatelná

informační zdroj/pramen

Page 5: Vyhledavani v prostredi Internetu

Informační společnost je taková společnost, ve které je věnována pozornost

informační činnosti natolik, že dojde ke snížení zájmu o zemědělskou a průmyslovou výrobu (Vlasák, 2000)

Marc Uri Porat (1976). Information economy : definition and measurement

70.léta – postindustriální společnost ○ průmysl ----- > služby

Page 6: Vyhledavani v prostredi Internetu

80.léta – informační společnost propojení počítačového průmyslu s ostatními průmyslovými

odvětvími rozvoj informační a počítačové GRAMOTNOSTI INFORMAČNÍ SEKTOR – profese tvorby, sběru, zpracovávání,

uchovávání, zpětného vyhledávání a dalšího šíření informací (Vlasák, 2000)

Page 7: Vyhledavani v prostredi Internetu

Informační exploze

Informace = Moc = Peníze !!!

Prudký rozvoj informačních technologií a jejich dostupnost

KVANTITATIVNÍ nárůst informací a informačních zdrojůRedundance ; relevance ; pertinenceMrtvá data – long tail effect

Page 8: Vyhledavani v prostredi Internetu

Informační smog (Shenk 1997)

lidstvo se nevyvíjí dost rychle aby zvládalo množství informací

Exformace - informace existující za hranicemi našeho vědomí (Gore, 1994)

Zahlcení snížení citlivosti k obsahu  - mozková

kapacita je stále stejná (Černohlávková, 2006)

Page 9: Vyhledavani v prostredi Internetu

Znalostní společnost

nadstavba informační společnosti založená na kolaboraci a interakci mezi uživateli

Web 2.0 - Tim Bernards-Lee (2000) Znalost

kontextově závislá ; pragmatický obraz informace reprezentovaný intelektuálním kapitálem jednotlivce (Bukh, 2001)

Page 10: Vyhledavani v prostredi Internetu

Terminologické vyjasnění

Základní abstraktní pojmy : INFORMACEZNALOSTI

Základní konkrétní pojmy : Informační / elektronický zdroj digitální / informační objekt / entita

Page 11: Vyhledavani v prostredi Internetu

Publikační procesy

Page 12: Vyhledavani v prostredi Internetu

Publikační proces informačního zdroje - původní

Nakladatelství, časopisy, databáze, databázová centra

Page 13: Vyhledavani v prostredi Internetu

Publikační proces informačního zdroje – nyní

Web 2.0 – sociální sítě, wiki, blog

Page 14: Vyhledavani v prostredi Internetu

Hodnocení +

AktuálnostRychlost Kooperace

-Kontrola kvality, relevance Korektura Odborný dohled Distribuce a popis jsou na autorovi –

NEDOHLEDATELNOST

Page 15: Vyhledavani v prostredi Internetu

KDE TO VŠECHNO MŮŽEME NAJÍT ?

Page 16: Vyhledavani v prostredi Internetu

World Wide Web

Viditelný / povrchový web informační entity volně přístupné a snadno

dostupné pomocí vyhledávacích strojů

Neviditelný / hluboký webneviditelný pro běžné vyhledavače

○ databáze, adresáře, rejstříky, dokumenty v nepodporovaných formátech, licencované stránky

○ 500x větší než povrchový web

Page 17: Vyhledavani v prostredi Internetu

Web povrchový a hluboký (Bergman,2001)

Page 18: Vyhledavani v prostredi Internetu

Obsahové rozvrstvení hlubokého webu (Bergman, 2001)

Page 19: Vyhledavani v prostredi Internetu

CO TAM MŮŽEME NAJÍT ?

Page 20: Vyhledavani v prostredi Internetu

Digitální objekt (DO)

základní entita

Hledisko původu: digitalizované informační zdroje

○ E-book ; postprinty born digital

○ Webové stránky, fóra, komunity, blogy, wiki

Page 21: Vyhledavani v prostredi Internetu

Hledisko typů DO

MIME - Multipurpose Internet Mail Extension Specifikuje charakter obsahu oficiálně

komunikovaných DO na internetu Typy: ○ Text ○ Obraz ○ Video ○ Zvuk○ Software○ Trojrozměrné digitální objekty

Page 22: Vyhledavani v prostredi Internetu

Digitální objekt

Hlavička /Metadata

Obsah

Podpis

Page 23: Vyhledavani v prostredi Internetu

Metadata – Velká a mocná „Data o datech“

Strukturované informace, které popisují, osvětlují, lokalizují a usnadňují vyhledávání a využívání informačního zdroje. (Guidlines for Digitalization, 2007)

Page 24: Vyhledavani v prostredi Internetu

Popis DO

Předobraz metadatového popisu je v popisu tradičních zdrojů. strojem čitelný X stroji srozumitelný

Dvě úrovně popisu:

věcná – obsah, anotace, abstrakt, klíčová slova, kódy systematického třídění …

popisná –popis dokumentu podle formálních znaků ; autor, název, vydavatel, rok vyd. …

Page 25: Vyhledavani v prostredi Internetu

Tradiční bbg. Záznam - MARC 21

Page 26: Vyhledavani v prostredi Internetu

Dublin Core Metadata Initiative -DCMI Dublin Core

Soubor 15 metadatových kvalifikovatelných prvků

Původně popis zdrojů na WWW ; současně popis jakéhokoli objektu

Garant popisu - autor user-friendly

Dublin Core Czech DCMI homepage

Page 27: Vyhledavani v prostredi Internetu

Prvky DC

Page 28: Vyhledavani v prostredi Internetu

Identifikátory URL

Adresa DO; určuje pozici DO v prostředí webu

URN Znakový řetězec nebo číslo, které

jednoznačně identifikuje dokumentTrvalé, nepřenosné

Generátory metadat XML soubory

Page 29: Vyhledavani v prostredi Internetu

Metadata - DC

Page 30: Vyhledavani v prostredi Internetu

TAK JSME TO HEZKY POPSALI … A JAK TO NAJDEM?

Page 31: Vyhledavani v prostredi Internetu

Vyhledávací nástroje

„HLAVORUČNÍ“ Předmětové katalogy - directories-

Seznam katalog, Yahoo katalog

třídění a organizace DO podle předem dané taxonomie nebo předmětové klasifikace Nejpodobnější tradičním knihovnám Lidský faktor Malé pokrytí, úplnost taxonomie

Page 32: Vyhledavani v prostredi Internetu

Vyhledávací nástroje

AUTOMATICKÉ Vyhledavače - search engine

Altavista Metavyhledavače

víc indexů najednouOpen Text

Sekvenční analýza Automatická INDEXACE digitálních objektů za

pomoci speciálního softwaruRobot ; crawler ; spiders ; bot Index – reprezentace fondu úplných textů - metadata

Page 33: Vyhledavani v prostredi Internetu

Vyhledavač – obecné schéma

Vyhledavač Prostředí webu

(Poláková, 2009)

Page 34: Vyhledavani v prostredi Internetu

Google Schéma (Brin & Page, 2000)

Page 35: Vyhledavani v prostredi Internetu

Uživatelské rozhraní – 1/2Textové

Textový vyhledávací dotaz

Textová reprezentace výsledku Index – zkrácená informace o příslušném

zdroji odkaz na fulltext

○ Google

Page 36: Vyhledavani v prostredi Internetu

Question answering2/2

Page 37: Vyhledavani v prostredi Internetu

Uživatelské rozhraní – 1/3Clustry

Vektorová logika –Vážení podobnosti dokumentů s dotazy –

relevance

Informační prostor – soubor prvku a vztahů mezi nimi udržovaných informačním systémem (Ingwersen 1996)

Page 38: Vyhledavani v prostredi Internetu

Clustry 2/3v informačním prostoru

(Traykovski &Sosisk, 2007)

Page 39: Vyhledavani v prostredi Internetu

Clusty.com 3/3

Page 40: Vyhledavani v prostredi Internetu

Uživatelské rozhraní – 1/3

Vizuální

Page 41: Vyhledavani v prostredi Internetu

Carrot2

2/3

Page 42: Vyhledavani v prostredi Internetu

Searchme 3/3

Page 43: Vyhledavani v prostredi Internetu

CO, KDE, a JAK

Page 44: Vyhledavani v prostredi Internetu

Základní princip

CO? KDE? JAK?

Page 45: Vyhledavani v prostredi Internetu

Co chci najít?

Informační potřebato co vím mi nestačí

Požadavekkonkretizovaná představa o informační

potřebě

DotazKladu přímo zdroji, ve kterém hledámVe vyhledávačích obecně:

navigační, informační, transakční (např. co, kdy, kde atd.)

Page 46: Vyhledavani v prostredi Internetu

Informační potřeba

V 80-90 letech se rozvíjí věda nazvaná „informační chování uživatele“

Posun v přístupu

computer-centred => user-centred Tři základní přístupy

KognitivníSociální Sociokognitivní (nejvíc in, kombinace

individualismu s kontextualitou prostředí)

Page 47: Vyhledavani v prostredi Internetu

KDE Typ zdroje

Primární zdrojeSekundární zdrojeTerciální zdroje

Vyhledavače, katalogy, databáze, encyklopedie

Globální / lokální charakter, Gatekeeping

Page 48: Vyhledavani v prostredi Internetu

JAK Vychytávky

Boolean logika (AND, OR, NOT )Proximitní operátory (NEAR,

WITHIN, SAME, „…“)Lematizace (skloňování, ?, * atd.)

Typy vyhledáváníFulltextovéFaktografické Atd.

Rešeršní strategie

Page 49: Vyhledavani v prostredi Internetu

JAK

ANALYTICKÉ VYHLEDÁVÁNÍSystematická strategiePříprava, promýšlení problému,

předdotazy

PROHLÍŽENÍ (browsing)Intuitivní vyhledávání

Page 50: Vyhledavani v prostredi Internetu

ZPĚTNÁ VAZBA

Page 51: Vyhledavani v prostredi Internetu

REŠERŠNÍ STRATEGIE

Základní kameny Rostoucí perla Osekávání

Page 52: Vyhledavani v prostredi Internetu

Literatura GORE, Albert. Země na misce vah. 1.vyd. Praha: Argo, 1994, ISBN 80-

85794-21-7. str.186. ČERNOHLÁVKOVÁ, Kateřina. Informační hygiena. Brno : Masarykova

Univerzita, 2006. SHENK, David. Data Smog : Surviving the Information Glut. 1 st ed. San

Francisco : Harper Edge,1997. 250 s. ISBN 0060187018. ARMS, W. Key Concepts in the Architecture of the Digital Library. D-Lib

Magazine [online]. July 1995 [cit. 2007-10-22]. Dostupný z WWW: < http://www.dlib.org/dlib/July95/07arms.html>. ISSN 1082-9873.

Brin S., Page, L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Stanford University [online] 2000 [cit. 2010-03-22]. Dostupný z WWW: http://infolab.stanford.edu/~backrub/google.html

SKLENÁK (2000). Data informace znalosti BUKH, P.N. Larsen H.T., Mouritsen J. (2001) Constructing intellectual

capital statements. Scandinavian Journal of managemennt roč. 17, s. 87-108

Page 53: Vyhledavani v prostredi Internetu

Literatura

VLASÁK, R. (2000). Informační povolání a informační společnost

PILECKÁ, Věra Kognitivní aspekty vyhledávání. Dostupný z WWW: <http://www.ikaros.cz/node/3592>.

Pilecká, Věra (2010) Kognitivní přístupy k vyhledávání informací. Praha : Univerzita Karlova.

Mírková, Miluše (2009) Bibliografická a rešeršní činnost. Dostupný z WWW: http://home.czu.cz/~mirkova/

Portál pro podporu informační gramotnosti – www.inforgram.cz


Recommended