+ All Categories
Home > Documents > Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Date post: 12-Jan-2016
Category:
Upload: zlhna
View: 32 times
Download: 0 times
Share this document with a friend
Description:
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK. 2. Modelování a podobnost. Modelová struktura multimedia retrieval systému. LAN , intranet,. web. „sketch“ dotaz. robot. „example“ dotaz. mana žer dokumentů. relevance feedback. indexer. extraktor. podobnost. index(y). - PowerPoint PPT Presentation
28
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 2. Modelování a podobnost
Transcript
Page 1: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vyhledávání v multimediálních databázích

Tomáš SkopalKSI MFF UK

2. Modelování a podobnost

Page 2: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

manažer dokumentů

robot

databázedokumentů

extraktor indexer

index(y)

„example“ dotaz

„sketch“ dotaz

web

LAN, intranet, ...

relevance feedback

podobnost

relevantní dokumenty

Modelová struktura multimedia retrieval systému

Page 3: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Extrakce vlastností

které vlastnosti extrahovat? používané mírou podobnosti deskriptivní (rozlišující) relativně malý počet kompaktní (malé prostorové náklady)

geometrický přístup model vektorového prostoru metrického prostoru obecně „dissimilarity space“

single-reprezentace vs. multi-reprezentace single-reprezentace – jediný komplexní objekt, složen z více podobjektů

problém: jak měřit komplexní podobnost? multi-reprezentace – dokument je rozdroben na více jednoduchých objektů

problém: jak při extrakci rozpoznat izolované části v dokumentu?

Page 4: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vektor

homogenní histogram na jedné sémantické doméně

např. šedotónový histogram k obrázku

heterogenní kombinace nezávislých vlastností (domén) např. u notové partitury (takt, tempo, žánr, délka)

kombinovaný homogenní části vektoru např. 3 histogramy pro barvy

Page 5: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Geometrie

polygon

síť polygonů

Page 6: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Množina

otisky identifikační body (více druhů)

komplexní objekty, single-reprezentace např. řetězce (množina slov/vět v textu) tvary (polygony) cokoliv jiného

Page 7: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Posloupnost

diskrétní signál v čase, extrakce vzorkováním akcie trajektorie

řetězec vektor proměnné délky

DCT, DFT, DWT koeficienty

obecně lineární uspořádání na množině čehokoliv

Page 8: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Řetězec

DNA

termyslovník

AATAGCAGCATA...

Page 9: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Graf

XML XML dokument reprezentován

stromem (obecně grafem) sada grafů

topologie webu identifikace zajímavých podgrafů

např. k-souvislé komponenty modelování topologií webových komunit

podgrafy tvoří objeky sady

Page 10: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Míry podobnosti

vlastnosti metriky, nemetriky kvalita (teorie podobnosti vs. restrikce)

učení, adaptace, relevance feedback uživatelské profilování

robustní míry většinou nemetrické snížená citlivost na tzv. „outliers“, anomální objekty, kde

vlastnost objektu je výrazně jiná než tato vlastnost u ostatních objektů

typicky šum nebo chyba v signálu důraz na efektivní spočitatelnost

Page 11: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Metriky vs. nemetriky

argumenty proti axiomům metriky

(a) reflexivita

(b) pozitivita

(c) symetrie

(d) trojúhelníková nerovnost

Page 12: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vektorové metriky

L1 L2 L5 L∞

vážená L2

kvadratická forma

tzv. Minkowského vzdálenosti

Page 13: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vektorové nemetrické míry (1)

kosinová míra SIMcos kosinus úhlové odchylky dvou vektorů

normovaný skalární součin úhel (tj. arccos(SIMcos)) je metrika

(L2 vzdálenost po povrchu jednotkové koule v radiánech)

robustní vůči velikostem vektorů

fractional Lp distances zobecnění Minkowského vzdáleností

použitím p<1 robustní vůči extrémním rozdílům

hodnot souřadnic

L0.5

Page 14: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vektorové nemetrické míry (2)

Page 15: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Vektorové nemetrické míry (3)

COSIMIR třívrstvá neuronová síť vstup – dva vektory výstup – hodnota podobnosti učení pomocí back-propagation

uživatelem ohodnocené vektory nebezpečí lokálních extrémů,

tj. při učení nemusí konvergovat

Page 16: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Konvexní vs. nekonvexní regiony

na tvaru regionu nezáleží „hustota“ regionů se liší

metrika nemetrika metrika nemetrika

Page 17: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Míry pro posloupnosti

lze aplikovat i vektorové míry (např. Euklidovskou) nevhodné pro porovnávání různě

dlouhých posloupností omezeno na číselné posloupnosti

(dynamic) time warping distance (DTW) zohledňuje časově lokální „frekvenci vzorkování“ tím, že lokálně

„natahuje/zkracuje“ posloupnost s cílem najít nejmenší cenu součtu parciálních vzdáleností

tzv. zarovnání posloupností (sequence alignment) i nečíselné posloupnosti (prvkem může být cokoliv „měřitelné“) není to metrika (porušena trojúhelníková nerovnost)

Page 18: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

DTW, princip (1)

matice M řádu m x n, kde m = |s1|, n = |s2|, kde s1 a s2 jsou porovnávané posloupnosti

buňka matice M(i,j) odpovídá parciální vzdálenosti (s1(i),s2(j)) DTW(s1,s2) je nejkratší cesta v matici (ve smyslu součtu hodnot

buněk na cestě) definice cesty – buňky na cestě mají jisté vlastnosti

monotónnost – buňky uspořádány monotónně spojitost – buňka „sousedí“ s buňkou hraniční podmínka – první buňka je v matici na souřadnicích (0,0),

poslední na souřadnicích (m-1, n-1)

Page 19: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

DTW, princip (2)

exponenciální počet možných cest, nicméně DTW lze spočítat v čase O(m*n) pomocí dynamického programování

parametr ≥0 (tzv. Sakoe-Chibův pás) umožňuje snížit počet přípustných cest, čímž se zamezuje „patologickým cestám“ snižuje složitost výpočtu na O((m+n)* )

pro =0, m=n a (x,y) = |x-y| dostanemeEuklidovskou vzdálenost (L2)(pouze jedna cesta, zarovnává se 1:1)

Page 20: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Řetězcové (ne)metriky (1)

editační vzdálenost (Levenshteinova metrika) je nejmenší počet operací potřebných ke konverzi jednoho řetězce do druhého operace vložení, vymazání, substituce znaku

substituce se může chápat jako dvojice vložení, vymazání), tzv. indel vzdálenost (insert-delete), tj. lze se omezit pouze na indel

různé váhy pro operace podobná filosofie jako u DTW

koncept cest v matici, resp. alignment, dynamické programování šikmá hrana v cestě je match znaků, vertikální/horizontální je vložení/smazání

Hammingova vzdálenost editační, kde je povolena pouze substituce řetězce stejné délky, v podstatě vektorová metrika

indel(ATGTTAT ATCGTAC) = 4

hamming(ABCDEF BCDEFA) = 6

Page 21: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Řetězcové (ne)metriky (2)

LCSS (longest common subsequence) hledání nejdelšího společného podřetězce (podposloupnosti)

myslí se podposloupnost, která může být „prokládaná“, tj. LCSS(ABCD, ACBD) = 3 (buď ABD nebo ACD)

opět podobná filosofie jako u DTW rovněž koncept cest v matici, resp. alignment, dynamické

programování pouze binární ohodnocení vztahu prvků v posloupnostech

(match / mismatch) šikmá hrana je match, rovná hrana mismatch

využití zejména v DNA databázích nemetrika

Page 22: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Množinové metriky (1)

Jaccard distance (normed overlap distance) normovaná velikost průniku dvou množin

Hausdorffova metrika měří „nejvzdálenějšího nejbližšího souseda“

pro všechny prvky A se spočítají vzdálenosti k nejbližšímu sousedu v B a vezme se maximum

dNO({kočka, pes, myš}, {klávesnice, myš}) = 0.75

Page 23: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Množinové metriky (2)

source: Michael Leventon's pages

Hausdorffova metrika a shape retrieval

- multi-reprezentace (sada objektů příslušející jednomu dokumentu)

- je vzdálenost dvou úseček (obecně kusů polygonu)

dotaz

sada objektů příslušející jednomu dokumentu

výsledek – nejbližší objekt, resp. odpovídající dokument

Page 24: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Množinové metriky (2)

Hausdorffova metrika a otisky prstů

- single-reprezentace

- je Euklidova vzdálenost dvou bodů (identifikační body)

Page 25: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Grafové metriky

měření strukturální podobnosti stromová editační vzdálenost

novější obdoba řetězcové editační vzdálenostije nejmenší počet operací potřebných ke konverzi jednoho stromu do druhého

operace přejmenování uzlu, vymazání uzlu, vložení uzlu

Page 26: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Robustní míry

k-median distances uvažuje (k-té) nejpodobnější části v objektu operátor k-med (výběr k-té nejmenší hodnoty) se aplikuje na

setříděnou posloupnost parciálních vzdáleností

fractional Lp distances redukuje se vliv „outlier dimenzí“

Page 27: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

k-median Hausdorff distance

single-reprezentace je Hausdorffova metrika (jako u multi-reprezentace) k = 3 (vrací vzdálenost třetího nejpodobnějšího objektu)

outliers

Page 28: Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK

Black-box míry

zcela neznámá analytická definice black-box

algoritmusHW zařízení


Recommended