Cestina a WWW

Marek Chlup chlupm at risc.upol.cz
Tue Mar 4 18:27:18 CET 1997


Predem se omlouvam vsem, kteri moji predchazejici zpravu nedostali tak jak meli. Byla odeslana v poradku - Mime Quoted Printable a cestina v ISO-8859-2. Bohuzel stale asi neni cesky Inet pripraven na komunikaci v cestine. Dekuji take za "preklad".

S nize uvedenou cynickou odpovedi nezbyva asi nez souhlasit, ale mela by se zachovavat jista etika...

Ovsem s dalsi odpovedi nesouhlasim. Dnes pouzivaji snad vsichni MS IE nebo Netscape Navigator a ty oba umeji automaticky prepnout kodovani na Windows-1250 nebo na ISO-8859-2, je-li na strance uveden prislusny META TAG (predpokladam, ze to tak funguje u vsech platforem). Uzivatel tedy neni odkazan na nejake default kodovani v browseru. Jedina rozumna nabidka prekodovani je ASCII, pro pripady, kdy natahujeme stranky z nejakych zarizeni, ktere neumi zobrazovat diakritiku.

Dale musim souhlasit s treti reakci. Ano cesky prohledavac by mel tohle zvladat (alespon po prechodove obdobi nez vsichni pochopi, ze mam pravdu:). Ovsem napriklad AltaViste nic takoveho asi nikdy nevysvetlite.

Marek Chlup
chlupm at risc.upol.cz
http://risc.upol.cz/~chlupm

--------------------
Marek Kubita <marek at corpus.cz> wrote in article <Pine.LNX.3.95q.970304145212.108B-100000 at ws14.corpus.cz>...
On 4 Mar 1997, Petr Kolar wrote:

Diky za preklad, ted se da reagovat na obsah a nejen na kodovani zpravy.

> Ma smysl nabizet na strankach nejake zmeny kodovani? Odpoved podle me znit
> NE! To k cemu to vede, je videt na prohledavacich - odkaz na jednu stejnou
> stranku (v ruznych kodovanich) vam vyjede treba i 7x. Nekdy napriklad
> zadate dotaz kteremu odpovida 5 stranek z nejakeho serveru, kde jsou
> nabizeny tyto vymozenosti, tedy to mame 35 odkazu, ktere vas napriklad ke
> vsemu vubec nezajimaji a nez se prosurfujete k dalsim odkazum, ktere
> prohledavac nabizi jste zeleny dale fialovy a pak...(no zname to). Je fakt,
> ze inteligentni cesky prohledavac by to mohl nejak eliminovat - ovsem
> jednoduche to uplne nebude.
> [...]

Cynicka odpoved: nabizet kodovani ANO, aby byly stranky Vasi firmy pri
vyhledavani 7x viditelnejsi nez konkurence, ktera ma stranky jen v jedne 
cestine.

Necynicka odpoved: nabizet kodovani ANO, je to ohleduplne vuci tem
navstevnikum (=zakaznikum), kteri z nejruznejsich duvodu nechteji nebo
nemohou pouzivat defaultni kodovani.  Nelze je odbyt ikonkou "Nahrajte si
[doplnte oblibeny browser] ted a tady", nechcete-li riskovat, ze
neposlechnou a pujdou browsovat jinam.

Ze s kodovanim maji problem prohledavace, je problem, ktery musi resit
jejich tvurci. Prohledavac ceskeho Webu, ktery se chce stat oblibenym
nastrojem, musi brat v uvahu vsechny existujici nastroje pro prekodovani
cestiny, eliminovat podle toho duplicitni odkazy, desifrovat dokumenty
vytvorene nastroji, ktere z ceskych pismenek udelaji &eacute; &agrave; 
&oslash;..., rozpoznavat u neoznacenych dokumentu, jestli jsou v
ISO-8859-2 nebo CP-1250, poradit si se sklonovanim a casovanim, vsechno
indexovat v jedne cestine a nabidnout pri prohledavani vyber cestiny :-) 

Sledujme, kteremu z dosavadnich pokusu (Atlas, Telecom -
- http://194.228.2.35:8000/searchCZ/, pavouk.cesnet.cz) se to povede
nejdriv.

#-# Marek Kubita -#- Corpus s.r.o. #-# Praha 10, Sluzeb 4 
-#- tel. 420-2-771990, 701719, 701748 #-# fax 704814  -#-







More information about the net mailing list