WWWCPCONV - program pro WWW s ceskou diakritikou pro Win95/NT (fwd)

Petr Nachtmann petrnach at web.natur.cuni.cz
Tue Mar 17 15:19:09 CET 1998


---------- Forwarded message ----------
Date: Sun, 15 Mar 1998 22:59:12 +0100
From: Jiri Kvarda <kvarda at VC.CVUT.CZ>
Reply-To: Diskuzní skupina o sluzbe World-Wide-Web <WWW-L at LIST.FAF.CUNI.CZ>
To: WWW-L at LIST.FAF.CUNI.CZ
Subject: WWWCPCONV - program pro WWW s ceskou diakritikou pro Win95/NT

Dobry den,

po delsi dobe overovaciho provozu na nekolika serverech a pote,
co jsem se konecne dokopal k sepsani dokumentace, Vam mohu
nabidnout svuj program WWWCPCONV, ktery rozsiruje moznosti
starsiho NTCPConv.

Program je urcen zejmena pro WWW servery poskytujici dokumenty
s ceskou diaktrikou ve vice znakovych sadach, a to se statickym
ulozenim techto variant.
Program s dokumentaci je dostupny jako freeware na
  http://web.cvut.cz/iso-8859-2/cc/icsc/software/wwwcpconv/


Zakladni vlastnosti:
- konverze HTML a textovych souboru mezi ruznymi kodovymi stranami
  s ceskymi znaky
- napsano v C++ jako konzolova aplikace pro Win32 API: Windows 95 a NT
- mimo konvertovani take kopiruje a maze ostatni soubory v zavislosti
  na nastaveni voleb
- v HTML dokumentech pridava do sekce HEAD prikaz META a odpovidajicim
  charsetem
- v HTML dokumentech prevadi linky na nejpouzivanejsi systemy cestiny
  na WWW (CaCzech, WWWdia, KOD, NTCPConv, Apache/Lampa)
- pouziva stejne tabulky znakovych sad jako programy ze sady NTCPCONV


Porovnani s dynamickou konverzi znakovych sad na serveru:

Vyhody
- Mensi spotreba vykonu WWW serveru ve spicce oproti resenim zalozenym
  na CGI skriptech, ASP skriptech a ISAPI filtrech. Updatovaci batche
  se mohou spoustet automaticky v dobe relativniho klidu.
- Vetsi odolnost WWW serveru proti chybam. V pripade spatne naprogramovanych
  CGI a ASP muze dojit k zahlceni WWW serveru. U ISAPI muze dojit az k
uplnemu
  zhrouceni systemu v dusledku jedine chyby ve filtru.
- Protoze HTML soubory vydava primo server, je vyuziti HTTP protokolu
zavisle
  pouze na WWW serveru. To napriklad znamena, ze v dane dobe se u mnohych
  serveru vyuzije vykonnejsi protokol HTTP/1.1 . Ten by autori CGI skriptu
  a ISAPI filtru museli do svych reseni naprogramovat.
- Ze stejneho duvodu je u takto vydavanych souboru spravne nastaven cas
  vytvoreni a velikost prenasenych dat. Obzvlaste cas vytvoreni u nekterych
  reseni zalozenych na CGI a dokonce i ASP a ISAPI nebyva uvaden. Takove
  pristupy pak nemohou byt cachovany ani lokalne, ani v proxy, a servery
  jsou tak zbytecne zatezovany vice nez je nutne.
- WWW server sam zpracovava pozadavky If-Modified-Since. Ty jinak musi byt
  do CGI naprogramovany, pokud nema dojit ke zbytecnemu opetovnemu vydavani
  nezmenenych souboru.
- URL neobsahuje znak otaznik (?). Ten (napr. u WWDia) zpusobi, ze takove
  dokumenty neulozi zadna proxy cache.

Nevyhody
- Vetsi spotreba diskoveho prostoru, kterou je vsak mozne znacne eliminovat,
  pokud se binarni soubory jako obrazky, dokumenty v Acrobatu (PDF) a
podobne
  ukladaji do zvlastnich stromu, napr. /images apod.
- Soubory mimo publikacni znakovou sadu jsou neaktualni do pristiho spusteni
  batche pro update. Je ale mozne vyrobit vice batch souboru a prislusnych
INI
  nastaveni tak, aby si je mohli spoustet prislusni publikovatele v
okamziku,
  kdy to uznaji za nutne.
- Vetsi narocnost na administratory prislusneho serveru s udrzovanim
poradku,
  nastavovanim pristupovych cest a prav, administraci batch souboru.


S pozdravem,

Jiri Kvarda





More information about the Smajlik mailing list