GOOGLEGOOGLEvyhledvyhledáávváánníí
Fakta na zaFakta na začčáátektek
= = automaticky sbautomaticky sbííranranáá data, kterdata, kteráá jsou registrovjsou registrováána na plnotextovplnotextověě
a ua užživateli nabivateli nabíízzíí vyhledvyhledáávváánníí ve svve svéé rozsrozsááhlhléé a neusta neustáále aktualizovanle aktualizovanéé
databdatabáázi pomoczi pomocíí klklííččových slov prostových slov prostřřednictvednictvíím jednoduchm jednoduchéého rozhranho rozhraníí
K bK břřeznu 2005 nabeznu 2005 nabíízel vzel vííce nece nežž 8 miliard dokument8 miliard dokumentůů a kaa kažždou sekundudou sekundu
je pje přřes es GoogleGoogle polopoložženo peno přřes 1000 dotazes 1000 dotazůů, , žžije z placenije z placenéé reklamy reklamy
a a úúrok jeho akcirok jeho akciíí za poslednza posledníí rok rok ččinil 300%.inil 300%.
ZZáákladem jeho infrastruktury jsou levnkladem jeho infrastruktury jsou levnéé lowlow--endend servery, kterservery, kteréé se se ččastoasto
porouchajporouchajíí. O to d. O to důůmyslnmyslněějjšíší je vje vššak software ak software GoogluGooglu, který takov, který takovéé
selhselháánníí ppřředpokledpoklááddáá a uma umíí ho obejho obejíít.t.
ProPročč GoogleGoogle??
Je rychlýJe rychlý-- na vna vášáš dotaz odpovdotaz odpovíí za nza něěkolik desetin kolik desetin sekundysekundy
Rychle se uRychle se uččíí-- napnapřř. v . v ČČeešštintiněě umumíí skloskloňňovat, ovat, ččasovat a rozeznasovat a rozeznáávváá i drobni drobnéé rozdrozdííly ve významechly ve významech
Je zdarmaJe zdarma-- pokud si ovpokud si ovššem nechcete zaplatit em nechcete zaplatit reklamu, nebo upreklamu, nebo upřřednostnit svoji strednostnit svoji stráánkunku
Je Je „„vváš“áš“-- jeho fungovjeho fungováánníí zzáávisvisíí do znado značčnnéé mmííry na ry na aktivitaktivitěě uužživatelivatelůů, kte, kteřříí odkazujodkazujíí a odkazuja odkazujíí a a klikajklikajíí
a a klikajklikajíí
ZZáákladklad
JJáádrem vyhleddrem vyhledáávavačče e GoogleGoogle je algoritmus je algoritmus PageRankPageRankvyvinutý pvyvinutý půůvodnvodněě v rv ráámci výzkumnmci výzkumnéého projektu ho projektu
na na StanfordskStanfordskéé univerzituniverzitěězakladatezakladateli spoleli společčnosti nosti SergeyemSergeyem BrinemBrinema a LarryLarry PagemPagema pojmenoa pojmenovaný podle vaný podle
druhdruhééhoho z nich.z nich.
PageRankPageRank, roboti, indexov, roboti, indexováánníí a celkova celkovéé fungovfungováánníí GoogluGooglu-- viz. minulviz. minuláá ppřřednednášáška ka nebo studijnnebo studijníí materimateriáály pana ly pana ŠŠkykyřřííkaka z druhz druhéého semestruho semestru
DuplicitnDuplicitníí strstráánkynky
GoogleGoogle duplicitnduplicitníí strstráánky indexuje tak, nky indexuje tak,
žže si vybere jednu stre si vybere jednu stráánku z mnoha nku z mnoha stejných a ostatnstejných a ostatníí ignoruje. Pokud se ignoruje. Pokud se obsah strobsah stráánek linek lišíší jenom trochu, jde jenom trochu, jde
o podobnost. Podobno podobnost. Podobnéé strstráánky nky GoogleGooglesice indexuje, ale vysice indexuje, ale vyřřazuje je pazuje je přři hledi hledáánníí(vyp(vypíšíše pouze jednu). e pouze jednu).
„„klikacklikacíí farmyfarmy““ a jina jinéé podvodypodvody
Farmy jsou mnoFarmy jsou množžiny navziny navzáájem jem prolinkovanýchprolinkovaných
strstráánek s nnek s nááhodným obsahem hodným obsahem
WebmasteWebmasteřřii poupoužžíívajvajíí ke zmatenke zmateníí vyhledvyhledáávavačůčů
i skrytý text obsahuji skrytý text obsahujííccíí klklííččovováá slova, neviditelnslova, neviditelnééodkazy a jinodkazy a jinéé daldalšíší metody (metody (cloaking, cloaking, doorwaydoorwaypagepage, , deceptivedeceptive redirectredirect atd.atd.))
�� Penalizace (Penalizace (Spam reportSpam report))
VyhledVyhledáávváánníí-- mmůžůže být proble být probléém v m v
uužživateli?ivateli?
UUžživatelivateléé z 25 z 25 procent pouprocent použžíívajvajíípouze jednoslovný pouze jednoslovný dotaz, z 80 procent dotaz, z 80 procent svsvéé dotazy vdotazy vůůbec bec nemodifikujnemodifikujíí a celých a celých 85 procent se d85 procent se díívváápouze na prvnpouze na prvnííobrazovku výsledku obrazovku výsledku
1,391,39PoPoččet et shlshléédnutých dnutých stranstran
2,022,02PoPoččet dotazet dotazůů
(1 u(1 užživatele)ivatele)
0,410,41PoPoččet operet operáátortorůůdotazudotazu
2,352,35PoPoččet slov et slov dotazudotazu
PrPrůůmměěrnrnáá
hodnotahodnotaHodnotaHodnota
OperandyOperandy
OperandyOperandy
ZajZajíímmáá vváás, co s, co GoogleGoogle na tento dotaz na tento dotaz nanaššel? el?
…… aneb vaneb vššeho moc eho moc šškodkodííPokroPokroččililéé operandy naleznete operandy naleznete ZDEZDE
JednoduchJednoduchéé vyhledvyhledáávváánníí
JednoduchJednoduchéé rozhranrozhraníí nabnabíízzíí pouze pole pro zadpouze pole pro zadáánníí klklííččovovéého slovaho slovaZde je moZde je možžnnéé výsledek ovlivvýsledek ovlivňňovat pouze upovat pouze upřřesesňňovováánníím hledanm hledanéého ho
výrazu a pouvýrazu a použžíívváánníím vhodných operandm vhodných operandůů..
PokroPokroččililéé vyhledvyhledáávváánníí
NabNabíízzíí upupřřesnesněěnníí, nap, napřř. form. formáát, domt, doméénu, jazyk, region, vylounu, jazyk, region, vylouččeneníí slov, výskyt, slov, výskyt, odkazy a dalodkazy a dalšíší
GoogleGoogle bombsbombs
ZZáámměěrnrnéé vyuvyužžititíí ssííly zply zpěětných odkaztných odkazůů ččastoastos vtipným podtextem.s vtipným podtextem.
PrvnPrvníí GoogleGoogle bomba byla zcela nbomba byla zcela nááhodnhodnáá. V roce 1999 v. V roce 1999 váámmvyhledvyhledáávavačč nabnabíídl jako prvndl jako prvníí po zadpo zadáánníí dotazu dotazu „„vvííc zla nec zla nežžSatanSatan““ domovskou strdomovskou stráánku nku MicrosoftuMicrosoftu..
Dnes Dnes ččasto diskutovanou asto diskutovanou „„ččeskou bomboueskou bombou““ je odkazovje odkazováánníína pana na pana ParoubkaParoubka v souvislosti s klv souvislosti s klííččovým slovemovým slovem„„namynamyššlenejlenej buranburan““..
Zdroje:Zdroje:
http://www.jakpsatweb.cz/google.htmlhttp://www.jakpsatweb.cz/google.html
http://blog.air4web.com/google.htmlhttp://blog.air4web.com/google.html
http://blog.air4web.com/google.htmlhttp://blog.air4web.com/google.html
http://www.vyhledavace.us/google/wwwstranky.htmlhttp://www.vyhledavace.us/google/wwwstranky.html
http://zbiejczuk.com/web20/08http://zbiejczuk.com/web20/08--googlegoogle--com.htmlcom.html
http://www.mpalan.cz/nastroje/googlehttp://www.mpalan.cz/nastroje/google--operatory.phpoperatory.php
http://www.google.cz/intl/cs/help/refinesearch.htmlhttp://www.google.cz/intl/cs/help/refinesearch.html
http://izi215.wordpress.com/http://izi215.wordpress.com/
A dalA dalšíší