WWWCPCONV - program pro WWW s ceskou diakritikou pro Win95/NT (fwd)
Petr Nachtmann
petrnach at web.natur.cuni.cz
Tue Mar 17 15:19:09 CET 1998
---------- Forwarded message ----------
Date: Sun, 15 Mar 1998 22:59:12 +0100
From: Jiri Kvarda <kvarda at VC.CVUT.CZ>
Reply-To: Diskuzní skupina o sluzbe World-Wide-Web <WWW-L at LIST.FAF.CUNI.CZ>
To: WWW-L at LIST.FAF.CUNI.CZ
Subject: WWWCPCONV - program pro WWW s ceskou diakritikou pro Win95/NT
Dobry den,
po delsi dobe overovaciho provozu na nekolika serverech a pote,
co jsem se konecne dokopal k sepsani dokumentace, Vam mohu
nabidnout svuj program WWWCPCONV, ktery rozsiruje moznosti
starsiho NTCPConv.
Program je urcen zejmena pro WWW servery poskytujici dokumenty
s ceskou diaktrikou ve vice znakovych sadach, a to se statickym
ulozenim techto variant.
Program s dokumentaci je dostupny jako freeware na
http://web.cvut.cz/iso-8859-2/cc/icsc/software/wwwcpconv/
Zakladni vlastnosti:
- konverze HTML a textovych souboru mezi ruznymi kodovymi stranami
s ceskymi znaky
- napsano v C++ jako konzolova aplikace pro Win32 API: Windows 95 a NT
- mimo konvertovani take kopiruje a maze ostatni soubory v zavislosti
na nastaveni voleb
- v HTML dokumentech pridava do sekce HEAD prikaz META a odpovidajicim
charsetem
- v HTML dokumentech prevadi linky na nejpouzivanejsi systemy cestiny
na WWW (CaCzech, WWWdia, KOD, NTCPConv, Apache/Lampa)
- pouziva stejne tabulky znakovych sad jako programy ze sady NTCPCONV
Porovnani s dynamickou konverzi znakovych sad na serveru:
Vyhody
- Mensi spotreba vykonu WWW serveru ve spicce oproti resenim zalozenym
na CGI skriptech, ASP skriptech a ISAPI filtrech. Updatovaci batche
se mohou spoustet automaticky v dobe relativniho klidu.
- Vetsi odolnost WWW serveru proti chybam. V pripade spatne naprogramovanych
CGI a ASP muze dojit k zahlceni WWW serveru. U ISAPI muze dojit az k
uplnemu
zhrouceni systemu v dusledku jedine chyby ve filtru.
- Protoze HTML soubory vydava primo server, je vyuziti HTTP protokolu
zavisle
pouze na WWW serveru. To napriklad znamena, ze v dane dobe se u mnohych
serveru vyuzije vykonnejsi protokol HTTP/1.1 . Ten by autori CGI skriptu
a ISAPI filtru museli do svych reseni naprogramovat.
- Ze stejneho duvodu je u takto vydavanych souboru spravne nastaven cas
vytvoreni a velikost prenasenych dat. Obzvlaste cas vytvoreni u nekterych
reseni zalozenych na CGI a dokonce i ASP a ISAPI nebyva uvaden. Takove
pristupy pak nemohou byt cachovany ani lokalne, ani v proxy, a servery
jsou tak zbytecne zatezovany vice nez je nutne.
- WWW server sam zpracovava pozadavky If-Modified-Since. Ty jinak musi byt
do CGI naprogramovany, pokud nema dojit ke zbytecnemu opetovnemu vydavani
nezmenenych souboru.
- URL neobsahuje znak otaznik (?). Ten (napr. u WWDia) zpusobi, ze takove
dokumenty neulozi zadna proxy cache.
Nevyhody
- Vetsi spotreba diskoveho prostoru, kterou je vsak mozne znacne eliminovat,
pokud se binarni soubory jako obrazky, dokumenty v Acrobatu (PDF) a
podobne
ukladaji do zvlastnich stromu, napr. /images apod.
- Soubory mimo publikacni znakovou sadu jsou neaktualni do pristiho spusteni
batche pro update. Je ale mozne vyrobit vice batch souboru a prislusnych
INI
nastaveni tak, aby si je mohli spoustet prislusni publikovatele v
okamziku,
kdy to uznaji za nutne.
- Vetsi narocnost na administratory prislusneho serveru s udrzovanim
poradku,
nastavovanim pristupovych cest a prav, administraci batch souboru.
S pozdravem,
Jiri Kvarda
More information about the Smajlik
mailing list