Pro správné pochopení způsobu fungování vyhledávacích služeb databázového typu je vhodné si je přirovnat k nástrojům pro fulltextové vyhledávání v textových dokumentech - zde se jedná o plnotextové vyhledávání v rámci WWW stránek (resp. v jejich textové části), a to "na dálku", v rozsahu celého Internetu. V zásadě si lze představit, že vyhledávací služba si přečte celý text WWW stránky, vezme každé jednotlivé slovo které se zde vyskytuje, a to si zanese do své databáze spolu s informací o tom, na které stránce se toto slovo vyskytovalo (v terminologii fulltextových vyhledávacích technologií se toto označuje jako tzv. indexování). Následně pak může databáze odpovídat na dotazy typu "na kterých WWW stránkách se vyskytuje slovo X", nebo "kde se vyskytuje slovní spojení XYZ", a jako odpověď vrátit odkazy na příslušné stránky. Právě popsaný způsob fungování (indexování celých textů WWW stránek a v rozsahu celého Internetu) je ovšem nesmírně náročný na systémové zdroje (paměť i výpočetní a přenosovou kapacitu), a dlouhou dobu se lidé domnívali, že něco takového vůbec není možné. Původně proto bylo "plnotextové" vyhledávání (resp. indexování obsahu) vždy nějak omezeno, například jen na titulek stránky a prvních 20 slov jejího obsahu apod.
V prosinci roku 1995 se ale objevila první vyhledávací služba databázového typu, která dokázala prolomit magickou hranici a zvládnout indexování celého obsahu všech WWW stránek v rozsahu celého Internetu (i když "celého" je možná trochu nadnesené, ale v zásadě bez nějakého výraznějšího kvantitativního omezení). Touto první službou svého druhu se stala vyhledávací služba AltaVista firmy Digital, na adrese http://altavista.digital.com (která dnes již má i svou českou verzi, viz obrázky). Časem se pak objevilo několik dalších vyhledávacích služeb s celosvětovým dosahem, například služba HotBot (http://www.hotbot.com), Excite (http://www.excite.com) a další.
Dodnes však existují (a mají své opodstatnění) i takové vyhledávací služby databázového typu, které nemají celosvětový dosah, ale jsou nějak omezeny, nejčastěji regionálně. Pro uživatele v ČR jsou například velmi zajímavé takové vyhledávací služby, které mapují WWW prostor českého Internetu. O těch se samozřejmě zmíníme podrobněji.
|
Dotazovací formulář služby AltaVista, v češtině
|