Systém TOPIC - tématické vyhledávání
Problém vyhledání všech dostupných informací týkajících se určitého tématu byl nejprve řešen tam, kde bylo informací vždy nejvíce - ve zpravodajských službách. Tímto řešením byl systém TOPIC vyvinutý americkou vládní agenturou Advanced Decision Systems a dále pak komerčně rozvíjen americkou firmou Verity Inc.
Hlavním rysem systému TOPIC je to, jak lze formulovat INTELIGENTNÍ dotazy, které se nazývají „Topiky“:
„Topik“ má podobu tzv. sémantického stromu. Tento strom má následující prvky:
- Listy - tvoří slova, která mohou svědčit o tom, že se zkoumaný text o daném tématu zmiňuje.
- Strukturu - seskupováním slov do větví se vrcholové téma člení na řadu logických podtémat (ktérá lze pak využít v jiných stromech).
- Váhy - každý list má svou váhu, která je mírou toho, jak moc se výskyt daného slova v textu může považovat za důkaz toho, že se v textu hovoří o nadřazeném tématu. Při tvorbě stromu se všechny váhy nastavují na 50% a teprve v další fázi se „ladí“. Ve stejném smyslu jsou váhy přiřazovány též větvím.
- Operátory - určují způsob, jakým se vyhodnotí přítomnost skupiny slov resp. dílčích témat z hlediska toho, že se tato skupina považuje za důkaz výskytu tématu v daném textu.
Výsledkem takovéhoto inteligentního dotazu je pak seznam nalezených dokumentů, které ksou setříděny podle tzv. relevance, tj důležitosti svého obsahu k tématu.