IIS lassulás probléma – help needed – Microsoft technologies by Zsolt Soczo

11 COMMENTS

Peter September 5, 2017

És amikor beáll a lassulás, akkor az képes magától helyre jönni, vagy onnantól az az állapot van?

Az ugrás szerintem túl kicsi ahhoz, hogy infrastrukturális baja legyen, de azért kíváncsi lennék a VM-ek specifikációjára [0.5 GiB memóriát én keveslem, mint szabad], illetve a w3wp-k memóriafoglalására. Ami még érdekes lehet, hogy nem-e a load balancer-ek játszanak valamit a socket-ekkel, illetve kérdés még, hogy egyáltalán a service-eket min keresztül lehet elérni, HTTP(1.0, 1.1), más?

Ha a web service log-jában is látszik a lassú hívás, akkor gondolom, nem szabad kapcsolatra vagy hasonlóra vár a web app, nem tudom, visszairányban ki lehet-e ilyenkor még éheztetni az app-ot vagy sem hasonló módon.

A 200ms plusz egyébként nekem nagyon annak tűnik, mikor a service hívásban a request sok időt tölt el az “AcquireRequestState” fázisban, olyan, mintha a shared session-re várna, hogy tudja lock-olni. Ilyet látok minden nap “nálunk”, még nem sikerült kijavíttatni…

Én mindenképpen ilyen shared state-eket keresnék.

Amit még ki lehetne próbálni, az egy New Relic vagy hasonló megoldás, ami meg tudná mutatni összefüggésében is a dolgokat.

Soczó Zsolt September 5, 2017

Csak app recycling segit.

Rici September 5, 2017

Szerintem nézd meg, hogy nincs-e valami a Nagle algorithm-mel (még TCP NoDelay néven is ismert, ez az, amikor ki van kapcsolva a Nagle algorithm).

https://msdn.microsoft.com/hu-hu/library/system.net.sockets.socket.nodelay(v=vs.85).aspx

Azért jutott eszembe, mert az pont 200 msec defaultból.

Soczó Zsolt September 5, 2017

Rici: igen, Nagle képbe került, de nem kapcsoltuk ki, mivel azt valószínűleg nem oldaná meg az IIS reset. Mindenesetre egy mérést megér.

Soczó Zsolt September 5, 2017

Peter: Dynatrace fut, a szerint a WebClient mélyén a windows api recv-jére vár a hívó webapp.

Rici September 6, 2017

Megnézném egy Wireshark-kal vagy hasonló network capture programmal a pontos időzítést, pontosabban összevetném a Dynatrace eredménnyel. A kérdés, hogy a recv hívás kezdete és befejezése hogyan viszonyul a hálózati csomag beérkezéséhez.

Ha a recv kezdete környékén már ott van a csomag, akkor a fogadó gépen és a kliens processzben kell tovább nézegetni, pl. nem lehetséges-e, hogy a sok szál miatt van valami gond.

Ha csak a recv hívás befejeződése környékén érkezik meg a csomag, akkor úgymond jogosan várakozik a recv hívás. Ez utóbbi esetben az egy elég érdekes kérdés, hogyan tudja rávenni a szervert egy adott kliens processz, hogy csak és kizárólag neki késleltetve küldje a válaszokat.

Még egy tipp, hogy esetleg a hálózati kártya driverében van valami bug. Főleg, ha TCP offload be van kapcsolva, amikor is a TCP logika egy részét a hálózati kártya és a driver implementálja.

Peter September 15, 2017

Sikerült kideríteni valami izgalmasat?

Robert September 19, 2017

A virtualizált környezetben dedikált cpu magokon fut a windows?
Egy ügyfelünknél többszáz millis várakozásokat okozott a webcontainer
szálaknak, hogy az oprendszer elemi műveleteire vártak. Minél több virtuális magot
rendeltek a guesthez annál gyakrabban fordult elő a probléma.
Egyetlen dedikált mag megoldotta a problémájukat, az alkalmazás végig
hibátlan volt.

Soczó Zsolt September 22, 2017

Rici, ez jó ötlet, köszönöm, ha lesz rá mód, összevetem.

Soczó Zsolt September 27, 2017

Robert: ez bizarr, de elvileg dedikált magon futnak.

Soczó Zsolt November 14, 2017

Valószínűleg megvan a megoldás. Ha a szerverfarm minden gépén implementálva lesz, és stabil, akkor leírom.

IIS lassulás probléma – help needed

LEAVE A COMMENT

11 COMMENTS