Jeste k diskusi o vykonnosti serveru

Petr Snajdr snajdr at firma.seznam.cz
Wed Aug 11 14:38:57 CEST 1999


Dobry den,
  neda mi to, abych neragoval na nekolik mailu
na toto tema. Nechci obhajovat Linux, to rad
prenecham jinym a snad jsem ztoho jiz vyrostl,ale:

Pavel Satrapa wrote:

> Nejde mi ani tak o to, ze bezi na Linuxu, ale spise o odpoved na otazku,
> na jakem hardware bezi. Dovolim si ocitovat: "Jsou to klasicke pocitace
> s Pentiem, spise stredni nebo nizsi trida mezi servery."

Problem velice zatizenych serveru je ten, ze od jiste urovne maji
zcela jine problemy nez ty servery male a jit ciste cestou lepsiho
hardware je nekdy nemozne (vemte si treba kdyby Yahoo
slo cestou - vic pameti a vic CPU kam by asi doslo). Od jiste
urovne hardware neprinasi az takovy zisk nebo presneji ten zisk je tak
maly, ze je zbytecne do nej investovat. Pak nastupuje kupodivu
takova prace jako je optimalizace software atd. a ze tady je
co delat.
  Zajimave je predvidat na zaklade toho co by ten pocitac mohl zvladnout.
Na zaklade zkusenosti mohu rici, ze zmena zateze v nekolika radech je
nepredvidatelna. Pokud bych mel vzit vyvoj navstevnosti treba
www.seznam.cz za posledni rok, mohl bych temer rici, ze aktualni
optimalizace software by mela zvladnou tak 20 nasobny napor. Realne by
tomu tak ovsem urcite nebylo jelikoz posunem tech urovni se
objevuji problemy, ktere na jinych urovnich nejsou.


> Pritom srovnavaci testy byvaji casto realizovany na hardware, ktery se
> pohybuje na horni hranici toho, co se vubec vyrabi (tedy v dnesni dobe
> neco jako 4x Xeon 500 MHz, alespon 1 GB pameti a nejaky obludny RAID).
> Pak

Kazda konfigurace je pro neco vhodna  a pro neco ne, testy casto
ukazuji pouzitelnost jedne konkretni konfigurace pro nejaky ucel
a stejne tak casto zapominaji rici jaky ucel to je. Problem  mnoha
testu je zobecnovani. Takove testy jsou pak opravdu o nicem.

> se snadno dospeje k zaveru, ze Windows NT na tom chodi velmi pekne a
> jejich cena je v porovnani s cenou HW v podstate zanedbatelna.

Ale cena SW je opravdu zanedbatelna. To, ze treba Seznam pouziva dnes
Linux jako svou primarni platformu neni tim, ze by byl zadarmo.
Ta cena hraje opravdu zanedbatelnou roli (tedy pokud neni
v radech milionu apod :-)

> Ja se uz delsi dobu klonim k nazoru, ze v drtive vetsine pripadu
> potrebam
> bohate vyhovi celkem normalni server za nejakych 50 az 100 tisic (pokud
> jej realizujete beznym pocitacem) a realna potreba pro vyse uvedena
> monstra je miziva.

Jsem naprosto tehoz nazoru, ale jak jsem rekl - nezobecnovat!

> Mimochodem - vyjadreni, ze instalaci serveru s obrazky pro Seznam u
> nekolika provideru poklesl peeringovy provoz o 50%, je velmi smutnou
> vizitkou o stavu WWW proxy cachingu u nas.

:-(

Michal Krsek wrote:

Ahoj Michale :-)

> minimalne jeden ze stoju Seznamu je normalni PCcko an P100 a 128 MB RAM.
> Bezi na nem NTcka a MS SQL server.

Doplnim jen , ze sluzby na techto servrech, ktere jsou opravdu dva
jsou oproti samotnemu Seznamu (www.seznam.cz) nebo Seznamu Dnes
(dnes.seznam.cz) ci Novinkam (www.novinky.cz) navstevovany pomerne vyrazne
mene. Pouziti Windows NT je vice mene z historickych duvodu a
nebo duvodu "tretich stran".

U MS SQL serveru se navic ukazalo, ze nevyhovuje pozadavkum na nej kladeny
a bude nahrazen produktem firmy Oracle jejichz technologie
jsou asi o generaci napred. Rozbor toho je asi an jinou konferenci.

> Nicmene pokud se budeme bavit o cene, tak cena te krabice se softem je
> OPRAVDU zanedbatelna. Tedy, pokud uvazime, ze lidska prace neco stoji.

Presne tak.

> Mimochodem, Seznam je nadhernou ukazkou toho, ze spoustu veci lze resit
> staticky. Nicmene si povsimni, ze nektere aplikace proste staticky resit
> nelze (mapy a lide) a tam nastupuji uplne jine sorty pocitacu - pro
> provoz mimo CR.

Ano, nekdy to opravdu nelze, ale nezminoval bych prave tyto sluzby.
Peknym prikladem je Seznam Dnes dnes.seznam.cz, ktery je hodne
dynamicky a pritom dosti navstevovany.
(Dosti = z pohledu naseho, z pohledu mensich serveru ta navstevnost muze
byt celkem velka :-)

Michal Blaha wrote:
>
> Neda mi to nezareagovat, a to k dvema bodum.
> 1) Testy se delaji na vykonnych pocitacich, protoze se predpoklada
> pouziti
> testovanych aplikacich na velkych zatezich. Pentium 120 by zadnou vyssi
> zatez nezvladla (desitky az stovky odpovedi na cokoliv za sekundu,
> apod).

To sice pravda, ale je to omezeno jakymsi "standardnim" nazorem
na design aplikaci, ktery tomuto nazoru je naklonen. Problem tedy neni v
hardware, vyrazne ani v OS (ten zas moc jinak navrhnout na x86 nejde), ale
navrhem aplikaci. Bezne aplikace zerou prilis mnoho CPU a prilis mnoho
pameti, ale je to nutne? Neni. Proto v Seznamu vznikaji naprosto
unikatni technologie :-), kterym je vcelku jedno na cem je kdo
nuti bezet.

> 2) udaje uvadene Seznamem v clanku jsou dosti tendencni. Ano, oni
> provozuji cast Seznamu na nizsich pocitacich, ale napr. postu uz na maji na
> nekolika (tusim 3nebo 4, viz posledni CHIP) PC a v predposlednim
> tiskovem prohlaseni priznavaji znacne problemy se zatezi techto pocitacu.
> O rychlosti Map se kazdy muze presvedcit sam.

natazeni jedne stranky netrva vice nez 2-3 sekundy, zrejme merite
vasi konektivitu a a nebo jste zorvna trefil nepravy okamzik :-)

> Pro zajimavost, posta ATLASu bezi na 2 PC, vzdy 2xPII 350 MHz, 128 a 256
> MB RAM se zatezi 10% procesoru ve spicce. BTW, tento system je navrzen a
> otestovan na zatez 1 milionu mailoboxu.

Aktualni stav je, ze Email Seznam bezi na 2 pocitacich (s 1 CPU).
Standardni stav je, ze pocitace jsou 3, ale bohuzel doslo k vypadku HW,
ktery mel za nasledek vyrazeni celeho pocitace. Diky designu aplikace
nedoslo ke ztrate dat, ulohu "odpadlika" okamzite prevzal dalsi
pocitac ukolem spravce bylo pouze vyzvednout pokazeny pocitac,
dat do neho novy disk a nainstalovat OS a aplikace coz
se nekdy brzo stane. Zadny dalsi zasah nebylo treba udelat, ale
ten design ma mouchy.

Kazdopadne aktualni navrh Seznam Emailu je jiz prekonan
a behem nekolika mesicu bude dispozici nova verze, ktera
bude skalovatelna z teoretickeho hlediska na neomezeny pocet
uzivatelu (radove miliony mailboxu), prakticky se samozrejme
uvidi az kdyz dojde na lamani chleba. Zadny test neudela to
co dokaze "Internet".

> Mapy.atlas.cz majici 2,5x vetsi navstevnost nez mapy Seznamu bezi na
> 1xCeleron 300, 128 MB RAM. Taktez v pohode, se spickovou zatezi
procesoru
> 40-45% pri 4-5 zadostech o mapu za sekundu.
>

Takhle by slo argumentovat do nekonecna. Je otazkou co to znamena,
kazdopadne na pocitaci na kterem bezi Seznam a Kompas je zatez CPU
tak kolem 15% pricemz navstevnost (shlednut. stran viz. audit.dcci.cz)
je 7 nasobna oproti sluzbe  Muj Web, 3 nasobna oproti tomu co je
v auditu oznacovano jako "Atlas" (roumim-li dobre je to Atlas, Atlas mail
tj. vse krome Muj Web a Mapy?) a asi 21 nasobna oproti zminovanym "Atlas
Mapy". Nerd bych se pletl, pocital jsem to na rychlo, ale kdokoliv si to
muze prepocitat dle auditu na http://audit.dcci.cz.
Cimz bych diskusi zakoncil.

--

S pozdravem
   Petr Snajdr

Seznam Ceskeho Internetu: http://www.seznam.cz/
Magazin pro kazdeho: http://www.novinky.cz/
Seznam Dnes: http://dnes.seznam.cz/
Navody, recenze, technika:
http://www.novinky.cz/Index/TechDesk/
------------------------------------------------------
Zacit se dnes ucit Perl je jako koupit si listek na Titanic







More information about the net mailing list