Re: diakritika apod.


From: Vaclav Trojan <TROJAN@EARN.CVUT.CZ>
Subject: Re: diakritika apod.
Date: Mon, 8 Jan 1996 09:28:20 EST

Next Article (by Subject): Re: diakritika apod. Petr Snajdr
Previous Article (by Subject): Re: diakritika apod. Martin Kamin
Top of Thread: diakritika apod. Pavel Svoboda
Next in Thread: Re: diakritika apod. Petr Snajdr
Articles sorted by: [Date] [Author] [Subject]


>Ono to neni az tak jednoznacne. RFC1521 rika:
>   An initial list of predefined character set names can be found at the
>   end of this section.  Additional character sets may be registered
>   with IANA, although the standardization of their use requires the
>   usual IESG [RFC-1340] review and approval.  Note that if the
>   specified character set includes 8-bit data, a Content-Transfer-
>   Encoding header field and a corresponding encoding on the data are
>   required in order to transmit the body via some mail transfer
>   protocols, such as SMTP.
 
  Nevidim v tom nic nejednoznacneho. Sice v duchu volnosti, ktery vladne
mozna prilis v RFC je povoleno tam dat cokoliv co si zaregistruje, ale kdo
podporuje MIME, tak musi umet ty preddefinovane mnoziny znaku (t.j.
zakladni ISO-8859-x. Pokud by nekdo chtel treba Kamenickych, at si zazada
beznou IANA procedurou o registraci. Ale delal by hloupost: protoze vsechny
ceske a slovenske znaky o ktere jde, uz stejne jsou v ISO 8859-2. Je treba
si uvedomit, ze to neznamena, ze vas pocitac musi pouzivat kod ISO 8859-2,
ale znamena to, ze vas pocitac musi umet prevest znaky ISO 8859-2 do sveho
kodu. Jinymi slovy, musi prevadet 8bitovoy kod z poslane zpravy podle
tabulky ISO -> mistni kod. Takova tabulka obsahuje 96 polozek, ktere mapuji
kodove hodnoty 170..255 z kodu ISO na hodnoty vaseho kodu. Je to prace tak
na dve hodiny, kdyz mate k dispozici popis obe kodove tabulky. Ty dve
hodiny podle me stoji za to.
 
>A upresnuje to RFC1522, takze je napr. mozne posilat mail v UNICODE.
 
jiste; a dale RFC1641. Unikod je dalsi pohadka. Pokud jsme lini kodovat
svou vlastni abecedu, kdo tam bude udrzovat vsechny turectiny a
uzbekistanstiny? A kdo bude psat mapovani Kamenickych do unikodu?
 
>Take aliasu pro jednotlive charsety registrovanych IANA je vice, takze
>napr. charset=iso-ir-101 znamena take ISO-8859-2.
 
Nastesti jsou to jen Aliasy. Prilis velka otevrenost RFC... ale v RFC1340,
na ktery se odkazuje 1521 nic takoveho jeste neni. RFC1700, ktery by mel
nahrazovat 1340 jsem si zatim nestahl. Ono je toho nejak moc... Ale dej
Buh at tech aliasu nepribyva.
 
>Jina otazka je urcita dohoda co pouzivat prednostne v ramci Ceske
>republiky a co umi vetsina maileru.
 
Pro pana krale! no prece pokud nemusim jinak, tak vezmu to zakladni,
a to je ISO 8859-2. Opakuji, to neznamena, ze nemuzete pouzivat na
vasich pocitacich Kamenickych, CP852 nebo CO12xx atd! To jen znamena,
ze ceske znaky pujdou po dratech internetu v ISO 8859-2. Jakmile doleti
na nejaky pocitac, ten si je prevede podle tabulky do ceho chce. A naopak,
kdyz posilate ceske znaky ven, budou v 8859-2 letet po dratech k cili.
Tady uz neni moznost nejakych prednosti a neprednosti. Je to jako kdybyste
chtel mit v jedne zastrce na elektricke siti 220V, na jine 120 V a pak
trebas 12V. Technicky je to mozne, ale je to holy nesmysl. Naopak, dohodli
jsme se, ze budeme mit 220V (ta dohoda je ISO, jehoz byvalo Ceskoslovensko
clenem a melo moznost specifikovat naroky na kodove sady, coz necinilo
a tak se toho chopili zivelne Kamenicti) a tam, kde potrebujem jine napeti,
mame transformator. Je v kazde televizi, pocitaci a gramofonu.
Kodova tabulka je proti tomu jen par byte v pameti.
 
>If the body
>   contains data in any bit-width other than 7-bit, the appropriate
>   bit-width Content-Transfer-Encoding token must be used (e.g., "8bit"
>   for unencoded 8 bit wide data).
>BTW, ani Vas mailovy program nepodporuje MIME tak jak ma. Vas mail
>obsahuje hlavicky
>  Mime-Version:  1.0
>  Content-Type: text/plain; charset=ISO-8859-2
>ale chybi v nem
>
>  Content-Transfer-Encoding: 8bit
>a pritom obsahuje non-ASCII znaky.
 
To by skutecne byla chyba, ale doufam, ze to je na Vasi strane, t.j.
Vas mailer prevedl ty trojznaky do 8bit. Pokud by to tak nebylo,
pak by to bylo spatne. Tudiz pouzivam 7bit encoding, coz je pripustne
v hlavicce nehlasit, takze je to snad dobre. Pokud by tam byl skutecne
nejaky znak nad 127, dejte mi prosim vedet.
 
Vaclav Trojan

Next Article (by Subject): Re: diakritika apod. Petr Snajdr
Previous Article (by Subject): Re: diakritika apod. Martin Kamin
Top of Thread: diakritika apod. Pavel Svoboda
Next in Thread: Re: diakritika apod. Petr Snajdr
Articles sorted by: [Date] [Author] [Subject]


Go to listserv.cesnet.cz LWGate Home Page.