+ All Categories
Home > Documents > Helena Kučerová VOŠIS Praha

Helena Kučerová VOŠIS Praha

Date post: 30-Dec-2015
Category:
Upload: ila-barrett
View: 36 times
Download: 0 times
Share this document with a friend
Description:
Odborná terminologie knihovnictví a informační vědy očima uživatelů databáze TDKIV Předběžné výsledky projektu. Helena Kučerová VOŠIS Praha. Cíl projektu:. - PowerPoint PPT Presentation
25
Odborná terminologie knihovnictví a informační vědy očima uživatelů databáze TDKIV Předběžné výsledky projektu Helena Kučerová VOŠIS Praha 1
Transcript
Page 1: Helena Kučerová VOŠIS Praha

Odborná terminologie knihovnictví a informační vědy očima uživatelů

databáze TDKIVPředběžné výsledky projektu

Helena KučerováVOŠIS Praha

1

Page 2: Helena Kučerová VOŠIS Praha

2

Využít metody kvantitativní analýzyk objevení nových poznatků a námětů,skrytých v uchovávaných uživatelských datecho vyhledávání v TDKIV.

Zadavatel:Redakční rada TDKIVŘešitel:VOŠIS Praha – 6členný studentský týmTermín: zimní semestr 2011/2012

Cíl projektu:

Page 3: Helena Kučerová VOŠIS Praha

Česká terminologická databáze knihovnictví a informační vědy

3

Producent:grant MK ČR 2001 – 2002NK ČR – tým 50 autorů, lektorů a redaktorů

Obsah: knihovnictví, knihověda, informační věda, informační technologie

Page 4: Helena Kučerová VOŠIS Praha

TDKIV v číslech:

4

rok vzniku: 2003počet (preferovaných) termínů: 3 000počet ekvivalentů (nepreferovaných termínů):4 000počet dotazů / rok: 53 000počet vyhledávaných výrazů / rok: 12 000počet uživatelů (UIP adres): 500průměrná doba strávená v databázi: 1 – 2 minuty

Page 5: Helena Kučerová VOŠIS Praha

Struktura terminologického hesla

5

termín anglický ekvivalent ekvivalent (nepreferovaný termín) příbuzný termín výklad termínu (autorský / normativní) zdroj výkladu poznámka třídník (věcná kategorie) autor / konzultant / lektor / redaktor

Page 6: Helena Kučerová VOŠIS Praha

Ukázka terminologického hesla

6

Page 7: Helena Kučerová VOŠIS Praha

7

Možnosti vyhledávání v TDKIV

Způsob vyhledávánívyhledávání

SEARCH

listováníSCAN

navigacePříbuzný termín

Použitýindex

z více políFREE TEXT

z jednoho pole

Zdrojovábáze

KTD

KTDPPracovní báze

Page 8: Helena Kučerová VOŠIS Praha

8

Vyhledávání v TDKIV

SEARCH

Page 9: Helena Kučerová VOŠIS Praha

9

Listování v TDKIV

SCAN

Page 10: Helena Kučerová VOŠIS Praha

10

Navigace v TDKIV

Page 11: Helena Kučerová VOŠIS Praha

Výzkumné otázky:

11

Statistický rozbor a vizualizace: četnost hledaných a nalezených / nenalezených

výrazů četnost způsobů vyhledávání čas vyhledávání rozdělení IP adres

Data mining a business intelligence: příčiny neúspěšných dotazů společně hledané termíny

Page 12: Helena Kučerová VOŠIS Praha

Metodika:

12

korpusová terminografie kvantitativní analýzy, pokus o data mining (bibliomining)

logy z vyhledávání v systému Aleph – data za období březen 2010 – srpen 2011cca 80.000 záznamů

MS SQL, dotazování v SQL

Page 13: Helena Kučerová VOŠIS Praha

13

SELECT a.search_text as hledany_a, COUNT(a.search_text) as pocet_hledani, b.search_text as hledany_b FROM SEARCH_KTD a JOIN SEARCH_KTD b on a.cas = b.cas AND a.ip = b.ip and a.datum = b.datum WHERE a.search_text <> b.search_text AND a.HITS <> 0 and b.HITS <> 0GROUP BY a.search_TEXT, b.SEARCH_TEXT, a.SEARCH_TEXT+a.DATUM+a.CAS, b.SEARCH_TEXT+b.DATUM+b.CASHAVING COUNT(a.SEARCH_TEXT) > 5

Page 14: Helena Kučerová VOŠIS Praha

Struktura dat

14

část IP adresy počítače,ze kterého byl dotaz zadán

čas zadání dotazu

počet nalezených záznamů

způsob vyhledávání(21 – základní vyhledávání,23 – pokročilé vyhledávání,29 – vyhledávání v rejstřících…)

prohledávaná báze(KTD, KTDP)

vyhledávaný výraz

Page 15: Helena Kučerová VOŠIS Praha

Vyhledávání podle měsíců

15

Page 16: Helena Kučerová VOŠIS Praha

Vyhledávání podle dní

16

Page 17: Helena Kučerová VOŠIS Praha

Čas vyhledávání

17

Page 18: Helena Kučerová VOŠIS Praha

Rozdělení uživatelů

18

Vyhledávání v KTD:42 701 vyhledávání (sessions)4 264 (cca 10 %) vyhledávání z IP 195.113.xx (PASNET)

počet vyhledávání

SCAN 6 02680 %

80 %SEARCH 28 134

80 %

SCAN 1 50720 %

20 %SEARCH 7 034

20 %

počet IP adres

5021 %

20 %11224 %

18180 %

80 %36176 %

Page 19: Helena Kučerová VOŠIS Praha

Nejvyhledávanější výrazy

19

Page 20: Helena Kučerová VOŠIS Praha

Úspěšnost vyhledávání

20

počet vyhledávaných výrazů 17 285

úspěch (>=1 hitů) 6 867 (cca 40 %)

neúspěch (0 hitů) 10 326 (cca 60 %)

Page 21: Helena Kučerová VOŠIS Praha

Nenalezené výrazy

21

1 překlep2 doporučeno zařadit do TDKIV3 věcně nerelevantní k TDKIV4 nesprávný typ vyhledávání5 jiný jazyk než čeština

Page 22: Helena Kučerová VOŠIS Praha

Výrazy hledané společně

22

Page 23: Helena Kučerová VOŠIS Praha

Předběžné shrnutí výsledků

23

Potvrzeno: Kvantitativní metody mohou poskytnout jak náměty ke zkvalitnění použitelnosti a přístupnosti databáze, tak i přímé podněty k terminologické práci

náměty na zařazení nových termínů nebo ekvivalentůdo TDKIVklastry současně hledaných termínů umožňují nacházet sémantické vztahyodhaleny problémy k řešení:

2/3 vyhledávání končí neúspěchem 1/5 z nenalezených výrazů jsou překlepy významný podíl dotazů ve slovenštině dotazy na zkratky

eratainforamční průmyslaldinky

Page 24: Helena Kučerová VOŠIS Praha

A co na to studenti…

24

Page 25: Helena Kučerová VOŠIS Praha

Plány na další pokračování výzkumu:

25

tvorba vícečetných klastrů ontologizace TDKIV

(syntagmatické → paradigmatické vztahy) porovnání vyhledávacích výrazů s termíny

v databázi analýza vyhledávacích procesů „opravdový“ data mining

Další náměty?


Recommended