Cestina a WWW

Marek Kubita marek at corpus.cz
Tue Mar 4 15:57:14 CET 1997


On 4 Mar 1997, Petr Kolar wrote:

> Date: 4 Mar 1997 14:36:16 +0100
> From: Petr Kolar <PETR.KOLAR at vslib.cz>
> Newsgroups: cz.net.internet
> Subject: Re: Cestina a WWW
>
> Puvodni zneni dopisu (bez hacku a carek)
> From: "Marek Chlup" <chlupm at risc.upol.cz> bylo:

Diky za preklad, ted se da reagovat na obsah a nejen na kodovani zpravy.

> Ma smysl nabizet na strankach nejake zmeny kodovani? Odpoved podle me znit
> NE! To k cemu to vede, je videt na prohledavacich - odkaz na jednu stejnou
> stranku (v ruznych kodovanich) vam vyjede treba i 7x. Nekdy napriklad
> zadate dotaz kteremu odpovida 5 stranek z nejakeho serveru, kde jsou
> nabizeny tyto vymozenosti, tedy to mame 35 odkazu, ktere vas napriklad ke
> vsemu vubec nezajimaji a nez se prosurfujete k dalsim odkazum, ktere
> prohledavac nabizi jste zeleny dale fialovy a pak...(no zname to). Je fakt,
> ze inteligentni cesky prohledavac by to mohl nejak eliminovat - ovsem
> jednoduche to uplne nebude.
> [...]

Cynicka odpoved: nabizet kodovani ANO, aby byly stranky Vasi firmy pri
vyhledavani 7x viditelnejsi nez konkurence, ktera ma stranky jen v jedne
cestine.

Necynicka odpoved: nabizet kodovani ANO, je to ohleduplne vuci tem
navstevnikum (=zakaznikum), kteri z nejruznejsich duvodu nechteji nebo
nemohou pouzivat defaultni kodovani.  Nelze je odbyt ikonkou "Nahrajte si
[doplnte oblibeny browser] ted a tady", nechcete-li riskovat, ze
neposlechnou a pujdou browsovat jinam.

Ze s kodovanim maji problem prohledavace, je problem, ktery musi resit
jejich tvurci. Prohledavac ceskeho Webu, ktery se chce stat oblibenym
nastrojem, musi brat v uvahu vsechny existujici nastroje pro prekodovani
cestiny, eliminovat podle toho duplicitni odkazy, desifrovat dokumenty
vytvorene nastroji, ktere z ceskych pismenek udelaji &eacute; &agrave;
&oslash;..., rozpoznavat u neoznacenych dokumentu, jestli jsou v
ISO-8859-2 nebo CP-1250, poradit si se sklonovanim a casovanim, vsechno
indexovat v jedne cestine a nabidnout pri prohledavani vyber cestiny :-)

Sledujme, kteremu z dosavadnich pokusu (Atlas, Telecom -
- http://194.228.2.35:8000/searchCZ/, pavouk.cesnet.cz) se to povede
nejdriv.

#-# Marek Kubita -#- Corpus s.r.o. #-# Praha 10, Sluzeb 4
-#- tel. 420-2-771990, 701719, 701748 #-# fax 704814  -#-





More information about the net mailing list