cas...

Dusan Malik malik at mbox.bts.sk
Tue Jul 21 16:32:32 CEST 1998


At 09:52 21.7.1998 +0100, you wrote:
>> > > > Co si pote na mem serveru vezme HOTBOT, ALTAVISTA ci KOMPAS?
>> > >    To je velice jednoduche -- kodovani defaultni, jake si
>> > > vyberete. Ja osobne bych si vybral ASCII.
>> > Ja mam Windows-1250 ...
>>    To je docela pekne vysvetleni, proc Altavista ignoruje cokoli krome
>> ISO-8859-1. Situace je neprehledna, trh neni az zas tak velky, zapadni
>> Evrope staci ISO-8859-1, tak nez se s tema desitkama kodovani pro ty
>> ostatni babrat, lepsi je je proste ignorovat... az pujde o nejake rozumne
>> penize, tak to tam dodelame. :- )
>
>Pocitejme spolu: 5 nebo 7 ruznych kodovani cestiny, podobny pocet
>kodovani rustiny, radeji nechci vedet, jak to funguje ve Vietnamu...
>
>Spider by mel toto vsechno detekovat? Lide casto kodovani neuvedou a cpou
>proste 'to svoje', takze by bylo nutne pouzivat nejakou heuristiku. :(
>
>IMHO vyhodnejsi je vymyslet algoritmy na
>
>1) zjistovani (i)relevantnich dokumentu, aby i na 'hloupy' dotaz vracela
>rozumne vysledky
>
>2) vylepseni takoveho toho nahledu/naznaku obsahu dokumentu. Altavista ma
>pry prijit s necim novym od Inxightu

Moj laicky nazor je, ze by sme mali (server a client) dodrzovat
urcite pravidla. (RFC je asi iba odporucanie a nie norma ==> ale rozumny
tvorca SW to asi dodrzi). Pritom ale ISO asi uz norma je!!
 Hovorime o tom, ako sa ponahlame do EUROPY!
To mimo ine znamena i zosuladenie NORIEM a pravidiel.
ISO je snad dost vyznamny a zauzivany standard/predpis i pre narodne
jazyky. Takze podla mna aka diskusia ISO L2/CP 1250?

  Zda sa, ze ISO pozna pre x- jazykovych stranok presne pravidla,
 dokonca mam dojem, ze  uz i pre 2bytove znaky.
Tak preco pouzivat umelu CP 1250, ktora vobec neni normovana (v ISO)

 Argument, ze to ludia pouzivaju, nie je v tejto chvili mozno az tak
podstatny.

Nuz Kamenici boli tiez celkom slusna varianta. A kde skoncili?

 Zalezi na nas, nielen spravcoch serverov (i ked je to podstatne)
ale i uzivateloch, ci budeme chciet stranky v ISO, alebo v historickych
mutaciach (slangu). Nehnevajte sa ale  co, vzhladom k vyvoju su napr.
 KOI-8 a pod.

Zdravi



	Dusan Malik
e-mail :   malik at mbox.bts.sk



More information about the net mailing list