Zrcadleni (?) WWW
Petr Her~man
Petr.Herman at lfmotol.cuni.cz
Thu Aug 10 17:37:33 CEST 1995
> > po predchozi diskusi ohledne mirroru mne napadlo: nevite nekdo o
> > necem podobnem pracujicim s HTTP? Vim, ze uplne stejne to byt nemuze,
> > ale jde mi o balik, ktery by mi bez nutnosti pouzivat WWW browser
> > stahnul dokument a odkazy z nej az do nejake x te urovne.
> >
> > Nebylo by to asi zas az tak tezke napsat, ale proc delat neco, co
> > uz maji nekde hotove ...
>
> Dobry den,
>
> presne na tom pracuji. Nepracuje zanoreni do x te urovne. Zadate seznam
> dokumentu a ono je to stahne a umisti spravne do adresaru a zaroven z nich
> stahne podle odkazu vsechny obrazky, ktere se v nich nachazeji. Bezi to
> obdobne jako netscape, tedy pracuje na nekolika dokumentech zaroven.
>
> Dalsi utilita prevede vsechny absolutni odkazy v dokumentech na relativni.
> Tim ziskam kopii casti HTTP serveru nezavislou na umisteni na disku.
>
> Reseni, kdy se stahnou vsechny dokumenty do jiste urovne, mi nepripada
> stastne. Nevim totiz, jak zjistit, ktere vsechny dokumenty se v danych
> urovnich nachazeji jinak, nez analyzou jisteho HTML a jeho odkazu.
> Cistejsi reseni je zadat seznam dokumentu a ten stahnout. (Coz je ovsem
> mene automaticke)
>
> Dnes to existuje v alfa verzi, ktera je jiz dnes dobre pouzitelna.
Nejsem si jisty, jestli opravdu nedelate neco co uz je davno udelane.
Znate htget od Oscara Nierstrasze ? To je script v perlu, ktery vam
stahne specifikovany html dokument do Vaseho direktorare. Prepinac
-s to strka do stdout, -abs konvertuje vsechny relativni URLy na
absolutni, a prepinac -r zpusobi rekursi, tj. vytvari i dalsi
subdirektorare, stahuje graficke soubory atd. - tj. vytvori
mirror vzdaleneho stromu. Pokud jsou v tom stromu hyperlinky jinam,
ty uz nestahuje a URL zachova tak jak jsou (abyste omylem nemirrorovali
pul sveta :-) ).
Stary Oscar's Shell Script Archive je jeste stale (jako zkamenelina)
na universite v Zeneve:
http://cuiwww.unige.ch/ftp/PUBLIC/oscar/scripts/Old/README.html
Je tam par desitek ruznych scriptu pro praci s HTML.
Novy archiv nyni udrzuje SCG (= Software Composition Group)
na universite v Bernu:
http:///iamwww.unibe.ch/~scg/Src/
presneji:
http:///iamwww.unibe.ch/~scg/Src/Scripts
htget nejak vylepsil Gorm Haug Eriksen z Norska a jmenuje se w3mir
a je k dostani take tam.
Znate to?
V cem se ten Vas script nebo program (v cem to mate napsane) lisi?
Dale na
http:///iamwww.unibe.ch/~scg/Src/PerlLib
je nekolik baliku perlovskych skriptu na ruzne veci vcetne
htgrepu coz je prohledavaci masina pro http servery a na
http:///iamwww.unibe.ch/~scg/Src/Doc/htgrep.html
je zvlast dokumentace k htgrepu. (To uz ale s puvodnim dotazem
nesouvisi to jen na doplneni.)
> S pozdravem
>
> Martin Rysanek
Zdravi
Petr Herman
More information about the net
mailing list