Zrcadleni (?) WWW

Petr Her~man Petr.Herman at lfmotol.cuni.cz
Thu Aug 10 17:37:33 CEST 1995


> > po predchozi diskusi ohledne mirroru mne napadlo: nevite nekdo o
> > necem podobnem pracujicim s HTTP? Vim, ze uplne stejne to byt nemuze,
> > ale jde mi o balik, ktery by mi bez nutnosti pouzivat WWW browser
> > stahnul dokument a odkazy z nej az do nejake x te urovne.
> >
> > Nebylo by to asi zas az tak tezke napsat, ale proc delat neco, co
> > uz maji nekde hotove ...
>
> Dobry den,
>
> presne na tom pracuji. Nepracuje zanoreni do x te urovne. Zadate seznam
> dokumentu a ono je to stahne a umisti spravne do adresaru a zaroven z nich
> stahne podle odkazu vsechny obrazky, ktere se v nich nachazeji. Bezi to
> obdobne jako netscape, tedy pracuje na nekolika dokumentech zaroven.
>
> Dalsi utilita prevede vsechny absolutni odkazy v dokumentech na relativni.
> Tim ziskam kopii casti HTTP serveru nezavislou na umisteni na disku.
>
> Reseni, kdy se stahnou vsechny dokumenty do jiste urovne, mi nepripada
> stastne. Nevim totiz, jak zjistit, ktere vsechny dokumenty se v danych
> urovnich nachazeji jinak, nez analyzou jisteho HTML a jeho odkazu.
> Cistejsi reseni je zadat seznam dokumentu a ten stahnout. (Coz je ovsem
> mene automaticke)
>
> Dnes to existuje v alfa verzi, ktera je jiz dnes dobre pouzitelna.

Nejsem si jisty, jestli opravdu nedelate neco co uz je davno udelane.

Znate htget od Oscara Nierstrasze ? To je script v perlu, ktery vam
stahne specifikovany html dokument do Vaseho direktorare. Prepinac
-s to strka do stdout, -abs konvertuje vsechny relativni URLy na
absolutni, a prepinac -r zpusobi rekursi, tj. vytvari i dalsi
subdirektorare, stahuje graficke soubory atd. - tj. vytvori
mirror vzdaleneho stromu. Pokud jsou v tom stromu hyperlinky jinam,
ty uz nestahuje a URL zachova tak jak jsou (abyste omylem nemirrorovali
pul sveta :-) ).

Stary Oscar's Shell Script Archive je jeste stale (jako zkamenelina)
na universite v Zeneve:

    http://cuiwww.unige.ch/ftp/PUBLIC/oscar/scripts/Old/README.html

Je tam par desitek ruznych scriptu pro praci s HTML.

Novy archiv nyni udrzuje SCG (= Software Composition Group)
na universite v Bernu:

    http:///iamwww.unibe.ch/~scg/Src/

presneji:

    http:///iamwww.unibe.ch/~scg/Src/Scripts

htget nejak vylepsil Gorm Haug Eriksen z Norska a jmenuje se w3mir
a je k dostani take tam.

Znate to?
V cem se ten Vas script nebo program (v cem to mate napsane) lisi?

Dale na

    http:///iamwww.unibe.ch/~scg/Src/PerlLib

je nekolik baliku perlovskych skriptu na ruzne veci vcetne
htgrepu coz je prohledavaci masina pro http servery a na

    http:///iamwww.unibe.ch/~scg/Src/Doc/htgrep.html

je zvlast dokumentace k htgrepu. (To uz ale s puvodnim dotazem
nesouvisi to jen na doplneni.)

> S pozdravem
>
> Martin Rysanek

Zdravi
	Petr Herman



More information about the net mailing list