Vyhledávání informací na Internetu

V předchozí kapitole jsme si ukázali tu nejzákladnější funkci Internetu – prohlížení stránek, která úzce souvisí také s druhou velmi často provozovanou činností lidí na Internetu – vyhledávání. Jistě, každý má své oblíbené stránky (u většiny mladých lidí je to např. Facebook), ale každý z nás se při surfování setkal s tím, že potřebuje na Internetu najít nějaké informace – ať už je to adresa, mapa, telefon, text oblíbené písničky či stránky oblíbené kapely apod.

Položme si otázku: Potřebujeme vůbec vyhledávače? Odpověď je jednoznačně ANO. Podle statistik stránek www.worldwidewebsize.com, který měří velikost indexovaných stránek je na Internetu 7,64 miliardy indexovaných stránek (situace k 13. srpnu 2012) a každý den samozřejmě přibývají další. Podle další statistiky na www.worldometers.info se v ten samý moment na světě nachází 7 059 556 491 lidí. Uveďme si příklad – pokud bychom chtěli prohledat celý Internet rychlostí jednu stránku za jednu sekundu bez jakékoli přestávky, trvalo by nám to 240 let! Z toho vyplývá, že bez vyhledávačů se dnes v podstatě neobejdeme a funkčnost Internetu jako studnice informací by byla dost omezena.

Pro vyhledávání informací na Internetu můžeme použít dva způsoby. Buď využijeme tzv. Seznamu katalogů nebo klasického vyhledávače. Typickým příkladem Seznamu katalogů byl do nedávna český Seznam.cz, jak můžeme vidět např. z Obr. 34 (zdroj: web.archive.org). Stránky jsou zde hierarchicky rozděleny do kategorií a podkategorií a tak můžete prolistovávat katalog tak, jako byste prohledávali například telefonní seznam. Obdobnou strukturu měly i konkurenční české katalogy www.atlas.cz a www.centrum.cz.

Daleko častějším způsobem hledání na Internetu je využití klasického vyhledávače, kde zadáme výraz, který hledáme, popř. ho popíšeme a čekáme, co nám vyhledávač zobrazí. Synonymem pro vyhledávání se v posledních letech stal americký gigant Google a slangové slovo „vygooglovat“ (anglicky google it) se dokonce objevuje v oficiálních zdrojích, popř. filmech či seriálech. Dá se říct, že společnost Google v podstatě dává směr vyhledávání na Internetu a nejenom jemu. I když existují další vyhledávače, ať už anglické Bing společnosti Microsoft či www.yahoo.com nebo české www.seznam.cz, www.centrum.cz nebo www.atlas.cz, které se za poslední roky přetvořily ze seznamu katalogů, všechny v podstatě kopírují Google případně přidávají nějaké vlastní možnosti ve vyhledávání.

 

Úvodní strana Seznamu z 14.11.1996

Společnost Google založili v rámci doktorandského studia na Stanfordské univerzitě syn ruských emigrantů Sergey Brin (*1973) a syn amerických univerzitních profesorů Larry Page (*1973). Oba se v rámci výzkumu v roce 1996 zabývali způsobem, jak se co nejlépe orientovat v stále rostoucím množství dat uveřejňovaných na Internetu. Při vymýšlení algoritmu vycházeli z akademické praxe, kde jsou vědecké práce hodnoceny podle toho, jak jsou citovány v jiných pracích – čím více jsou citovány, tím jsou více ceněné a relevantní k danému tématu. Vymysleli tak tzv. PageRank, což je algoritmus ohodnocení webových stránek podle struktury hypertextových odkazů vzájemně si stránky doporučujících. PageRank je tedy číslo, které Google přiděluje každé indexované stránce a vyjadřuje její věrohodnost nebo důležitost.

Svůj algoritmus nejprve vyzkoušeli v roce 1998 na vyhledávači BackRub, který spustili jen na síti Stanfordské univerzity. Díky své přesnosti upoutal velkou pozornost studentů a to motivovalo Brina a Pagea ke koupi serverů a testovaní vyhledávání i v samotném Internetu. Na podzim roku 1997 přejmenovali vyhledávač BackRub na dnes známý Google. Oba pánové původně vůbec nechtěli založit firmu a podnikat, chtěli jen licenci na vyhledávání prodat. Byli dokonce u obou tehdy nejvýznamnějších společností provozujících vyhledávací služby – Yahoo.com a AltaVista.com. Obě je odmítly, což dnes mohou zcela jistě považovat na nejhorší věc, kterou v životě udělaly. Obdobně dopadli i v dalších firmách a tak se rozhodli riskovat a začít podnikat sami. Za první investici 100 tisíc dolarů od firmy Sun Microsystems rozšířili svoji firmu o první zaměstnance, na konci roku 1998 již měl jejich vyhledávač zmapováno 60 milionů stránek a časopisem PC Magazine byl označen jako „nejlepší vyhledávač“, čímž se dostal do povědomí veřejnosti a přitáhl další investory a firma se začalo rozrůstat a vydělávat. Příjmy Googlu plynou ze dvou zdrojů – z vyhledávacích služeb, kdy služeb Googlu využívají také další společnosti. Druhá, podstatnější, část příjmů je z tzv. kontextové reklamy, která se zobrazuje uživatelům při vyhledávání cíleně podle slova nebo slovního spojení, které vyhledávají. Google se stal za poslední roky opravdu internetovým fenoménem a své služby stále rozšiřuje např. o e-mailové služby (Gmail), on-line kalendář (Google Calendar), blogovací službu (Blogger.com), správu fotek (Picasa) či videí (Youtube.com) apod.

Druhý v pořadí vyhledávačů je již výše zmíněný vyhledávač Bing od Microsoftu. Spuštěn byl v červnu 2009, ale historii má delší, protože vychází z MSN search, Windows Live a Live Search. Dvojkou na trhu je také kvůli tomu, že se v červenci spojil s dalším velkým hráčem na poli vyhledávačů – Yahoo! Search, který dnes využívá při vyhledávání právě Bing. Při vyhledávání nabízí podobné výsledky jako Google, dovede také prohledávat obrázky, což je vylepšeno oproti Googlu o tzv. nekonečný posuvník, tzn. že při posunu posuvníku na konec stránky se stále doplňují další obrázky. Dovede také sdílet výsledky vyhledávání s Facebookem nebo úložištěm SkyDrive. Nevýhoda může být v tom, že český uživatel je ochuzen o některé funkce oproti verzi pro USA.