ibicis 10 Geschrieben 14. Januar 2011 Melden Teilen Geschrieben 14. Januar 2011 Hallo, mein Anliegen dreht sich um immer wiederkehrende Netzwerkverbindungsverluste in demselben Netz. Speziell geht es um einen Webserver, der mehr oder minder regelmäßig die Verbindungen zu anderen Servern und zu einem DB-Server verliert, alle Server befinden sich in einer Arbeitsgruppe. Kurz zur Konfig: Webserver: 82.169.59.200 Server 2003 R2 Standard SP2 x86 NIC: aut. Metrik, NetBIOS default Settings Loopback-Adapter 83.169.59.161 Web-Cluster DB-Server: bevorzugte IP 82.169.59.190, weitere IP 82.169.59.191 Server 2008 R2 Enterprise x64 NIC: aut. Metrik, NetBIOS default Settings Nun kann der Webserver regelmäßig nicht mehr zur DB connecten, auch Ping zum DB-Server funktioniert dann nicht mehr, weder per Namensauflösung, noch über die direkte IP. De- und reaktiviert man die NIC des Webservers, ist die Verbindung danach IMMER wieder hergestellt, DB-Connection und Ping funktionieren dann wieder. Das Leeren des DNS-Caches, der Neustart der Dienste "DNS-Client", "TCP/IP NetBIOS Helper" brachten keine Abhilfe. Da ich diese Vorgänge per RDP anschubse, ist das Netzwerk also nicht komplett weg, sondern nur die Verbindung zu anderen Servern im selben Netz ging verloren. Der Webserver wurde bereits auf eine andere Hardware migriert (Image), als auch auf einer anderen Hardware neu installiert. Mittlerweile wurde er auf einem VM-Host als virtuelle Maschine neu installiert mit denselben Symptomen. Ich vermute die Ursache mittlerweile nicht mehr bei den Servern, sondern evtl. im Netzwerk und der Switch-Hardware, mit der die Server verbunden sind. Jeder der beiden Server hängt an einem separaten Switch, beide Switches sind per Netzwerkkabel miteinander verbunden. Mittlerweile behelfe ich mir, indem ich einen Dauerping zum DB-Server mache, bis jetzt riss die Verbindung auch nicht mehr ab. Eine Dauerlösung sehe ich darin aber nicht. Trotz intensiver Suche im WWW fand ich bislang keine Doku dazu, was im Windows TCP/IP-Stack bzw. in anderen Windowsmodulen genau passiert, wenn man die NIC de-/reaktiviert. Warum also dieses Vorgehen zur temporären Problemlösung als einziges Mittel geeignet ist, weiß ich ob mangelnder Tiefenkenntnisse über die Vorgänge im Windowssystem bei diesem Vorgang leider nicht. Kann mir evtl. jemand Infos darüber geben bzw. hatte jemand ähnliche Erfahrungen in seinem Netzwerk machen müssen und kann mir einen heißen Tipp geben, wo ich noch ansetzen kann? Wenn noch weitere Einzelheiten zu den Serversystemen notwendig sind, liefere ich diese gern nach. Danke vorab. Zitieren Link zu diesem Kommentar
carlito 10 Geschrieben 14. Januar 2011 Melden Teilen Geschrieben 14. Januar 2011 Loopback-Adapter 83.169.59.161 Web-Cluster Was meinst du damit? Welche Switche werden verwendet? Haben andere Server, die an einem der beiden Switche hängen dasselbe Problem? Zitieren Link zu diesem Kommentar
ibicis 10 Geschrieben 16. Januar 2011 Autor Melden Teilen Geschrieben 16. Januar 2011 Was meinst du damit? Welche Switche werden verwendet? Haben andere Server, die an einem der beiden Switche hängen dasselbe Problem?Es ist ein Software-Loopbackadapter von MS, alle Switche sind vom Typ "Netgear GS 748T". Der Loopbackadapter ist mit identischen Einstellungen auf allen anderen 5 Webservern installiert, die im Webcluster betrieben werden. Es gibt noch wenige weitere Server, die vereinzelt nicht zu der DB auf oben erwähntem DB-Server connecten können, dies passiert zeitlich in größeren Abständen als beim erwähnten Webserver. Reproduzierbar ist das Verhalten leider nicht, ebenso brechen nicht alle DB-Connections zeitgleich ab, sondern sporadisch und vereinzelt, ein System ist in diesem Verhalten nicht zu erkennen.Ich vermute, dass es evtl. einen Zusammenhang mit den eingesetzten Switches im Sinne einer Fehlfunktion derselben gibt, sicher bin ich mir da aber nicht. Zitieren Link zu diesem Kommentar
carlito 10 Geschrieben 16. Januar 2011 Melden Teilen Geschrieben 16. Januar 2011 Ich vermute, dass es evtl. einen Zusammenhang mit den eingesetzten Switches im Sinne einer Fehlfunktion derselben gibt, sicher bin ich mir da aber nicht. Wurden die beiden Switche schon ausgetauscht? Falls diese managebar sind, mal die Error Rate etc auslesen. Falls nicht, evtl. mal einen Sniffer auf dem DB Server laufen lassen und auf merkwürdige Pakete achten. Zitieren Link zu diesem Kommentar
ibicis 10 Geschrieben 16. Januar 2011 Autor Melden Teilen Geschrieben 16. Januar 2011 Deine Vermutung geht also ebenfalls in diese Richung. Managebar sind die Switche nicht, noch nicht einmal Log-Funktionen konnte ich entdecken. Es ist geplant, die Netgears komplett durch managebare, VLAN-fähige, Switche zu ersetzen. Zitieren Link zu diesem Kommentar
carlito 10 Geschrieben 16. Januar 2011 Melden Teilen Geschrieben 16. Januar 2011 Deine Vermutung geht also ebenfalls in diese Richung. Na ja. An den NICs wird es wohl kaum liegen. Es sei denn, der VM Host hat diesselbe NIC wie die physischen Server vorher. Dann könnte es auch eine NIC/Switch Inkompatibilität sein. Es ist geplant, die Netgears komplett durch managebare, VLAN-fähige, Switche zu ersetzen. Das ist sicher nicht verkehrt. Wie gesagt, bei Interesse mal einen Sniffer anwerfen ... Zitieren Link zu diesem Kommentar
ibicis 10 Geschrieben 16. Januar 2011 Autor Melden Teilen Geschrieben 16. Januar 2011 Was ich noch fragen wollte - gibt es Quellen, wo man, unabhängig vom geschilderten Problem, nachlesen kann, was explizit beim de-/reaktivieren der NIC in einem Windowssystem passiert? Mich würde schon interessieren, warum danach die Verbindung wieder hergestellt wird. Davon abgesehen ist es evtl. gar nicht Windows, das für die Rekonnektierung sorgt, sondern ein Signal, das beim reaktivieren der NIC ins Netz geschickt wird und den Switch "aufweckt" (na gut, indirekt wäre es ja dann doch wieder Windows, falls dem so ist). Hm... :confused: Zitieren Link zu diesem Kommentar
carlito 10 Geschrieben 16. Januar 2011 Melden Teilen Geschrieben 16. Januar 2011 Was ich noch fragen wollte - gibt es Quellen, wo man, unabhängig vom geschilderten Problem, nachlesen kann, was explizit beim de-/reaktivieren der NIC in einem Windowssystem passiert? Wenn es um die Details geht, vielleicht in "Windows Internals"? :D Mich würde schon interessieren, warum danach die Verbindung wieder hergestellt wird. Davon abgesehen ist es evtl. gar nicht Windows, das für die Rekonnektierung sorgt, sondern ein Signal, das beim reaktivieren der NIC ins Netz geschickt wird und den Switch "aufweckt" (na gut, indirekt wäre es ja dann doch wieder Windows, falls dem so ist). Hm... :confused: Sagte ich schon, dass ich mal einen Sniffer anwerfen würde? ;) Zitieren Link zu diesem Kommentar
zahni 559 Geschrieben 16. Januar 2011 Melden Teilen Geschrieben 16. Januar 2011 Sagst Du uns bitte mal, wozu der Software-Loopback-Adapter gut ist, was das mit einem "Cluster" zu tun hat, und warum der im gleichen Subnet (Vermutung) wie die NIC liegt ? Dann hast Du auch gleich den Fehler. Bei Multihoming versucht Windows eine Lastverteilung über beide NIC's zu machen. Leider kann der DB-Server nicht über den Loopbak-Adapter erreicht werden. Du hast da nicht zufällig eine Software drauf, die auf eine spezielle IP-Adresse lizensiert wird ? Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.