Jump to content

Netzwerkverbindungsverluste und anderes Ungemach


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo,

 

mein Anliegen dreht sich um immer wiederkehrende Netzwerkverbindungsverluste in demselben Netz.

Speziell geht es um einen Webserver, der mehr oder minder regelmäßig die Verbindungen zu anderen Servern und zu einem DB-Server verliert, alle Server befinden sich in einer Arbeitsgruppe. Kurz zur Konfig:

Webserver: 82.169.59.200 Server 2003 R2 Standard SP2 x86

NIC: aut. Metrik, NetBIOS default Settings

Loopback-Adapter 83.169.59.161 Web-Cluster

 

DB-Server: bevorzugte IP 82.169.59.190, weitere IP 82.169.59.191 Server 2008 R2 Enterprise x64

NIC: aut. Metrik, NetBIOS default Settings

 

Nun kann der Webserver regelmäßig nicht mehr zur DB connecten, auch Ping zum DB-Server funktioniert dann nicht mehr, weder per Namensauflösung, noch über die direkte IP. De- und reaktiviert man die NIC des Webservers, ist die Verbindung danach IMMER wieder hergestellt, DB-Connection und Ping funktionieren dann wieder. Das Leeren des DNS-Caches, der Neustart der Dienste "DNS-Client", "TCP/IP NetBIOS Helper" brachten keine Abhilfe.

Da ich diese Vorgänge per RDP anschubse, ist das Netzwerk also nicht komplett weg, sondern nur die Verbindung zu anderen Servern im selben Netz ging verloren.

Der Webserver wurde bereits auf eine andere Hardware migriert (Image), als auch auf einer anderen Hardware neu installiert. Mittlerweile wurde er auf einem VM-Host als virtuelle Maschine neu installiert mit denselben Symptomen. Ich vermute die Ursache mittlerweile nicht mehr bei den Servern, sondern evtl. im Netzwerk und der Switch-Hardware, mit der die Server verbunden sind. Jeder der beiden Server hängt an einem separaten Switch, beide Switches sind per Netzwerkkabel miteinander verbunden.

Mittlerweile behelfe ich mir, indem ich einen Dauerping zum DB-Server mache, bis jetzt riss die Verbindung auch nicht mehr ab. Eine Dauerlösung sehe ich darin aber nicht.

 

Trotz intensiver Suche im WWW fand ich bislang keine Doku dazu, was im Windows TCP/IP-Stack bzw. in anderen Windowsmodulen genau passiert, wenn man die NIC de-/reaktiviert. Warum also dieses Vorgehen zur temporären Problemlösung als einziges Mittel geeignet ist, weiß ich ob mangelnder Tiefenkenntnisse über die Vorgänge im Windowssystem bei diesem Vorgang leider nicht.

 

Kann mir evtl. jemand Infos darüber geben bzw. hatte jemand ähnliche Erfahrungen in seinem Netzwerk machen müssen und kann mir einen heißen Tipp geben, wo ich noch ansetzen kann? Wenn noch weitere Einzelheiten zu den Serversystemen notwendig sind, liefere ich diese gern nach.

Danke vorab.

Link zu diesem Kommentar
Was meinst du damit? Welche Switche werden verwendet? Haben andere Server, die an einem der beiden Switche hängen dasselbe Problem?
Es ist ein Software-Loopbackadapter von MS, alle Switche sind vom Typ "Netgear GS 748T". Der Loopbackadapter ist mit identischen Einstellungen auf allen anderen 5 Webservern installiert, die im Webcluster betrieben werden. Es gibt noch wenige weitere Server, die vereinzelt nicht zu der DB auf oben erwähntem DB-Server connecten können, dies passiert zeitlich in größeren Abständen als beim erwähnten Webserver. Reproduzierbar ist das Verhalten leider nicht, ebenso brechen nicht alle DB-Connections zeitgleich ab, sondern sporadisch und vereinzelt, ein System ist in diesem Verhalten nicht zu erkennen.

Ich vermute, dass es evtl. einen Zusammenhang mit den eingesetzten Switches im Sinne einer Fehlfunktion derselben gibt, sicher bin ich mir da aber nicht.

Link zu diesem Kommentar
Ich vermute, dass es evtl. einen Zusammenhang mit den eingesetzten Switches im Sinne einer Fehlfunktion derselben gibt, sicher bin ich mir da aber nicht.

 

Wurden die beiden Switche schon ausgetauscht? Falls diese managebar sind, mal die Error Rate etc auslesen. Falls nicht, evtl. mal einen Sniffer auf dem DB Server laufen lassen und auf merkwürdige Pakete achten.

Link zu diesem Kommentar
Deine Vermutung geht also ebenfalls in diese Richung.

 

Na ja. An den NICs wird es wohl kaum liegen. Es sei denn, der VM Host hat diesselbe NIC wie die physischen Server vorher. Dann könnte es auch eine NIC/Switch Inkompatibilität sein.

 

Es ist geplant, die Netgears komplett durch managebare, VLAN-fähige, Switche zu ersetzen.

 

Das ist sicher nicht verkehrt. Wie gesagt, bei Interesse mal einen Sniffer anwerfen ...

Link zu diesem Kommentar

Was ich noch fragen wollte - gibt es Quellen, wo man, unabhängig vom geschilderten Problem, nachlesen kann, was explizit beim de-/reaktivieren der NIC in einem Windowssystem passiert? Mich würde schon interessieren, warum danach die Verbindung wieder hergestellt wird. Davon abgesehen ist es evtl. gar nicht Windows, das für die Rekonnektierung sorgt, sondern ein Signal, das beim reaktivieren der NIC ins Netz geschickt wird und den Switch "aufweckt" (na gut, indirekt wäre es ja dann doch wieder Windows, falls dem so ist). Hm... :confused:

Link zu diesem Kommentar
Was ich noch fragen wollte - gibt es Quellen, wo man, unabhängig vom geschilderten Problem, nachlesen kann, was explizit beim de-/reaktivieren der NIC in einem Windowssystem passiert?

 

Wenn es um die Details geht, vielleicht in "Windows Internals"? :D

 

Mich würde schon interessieren, warum danach die Verbindung wieder hergestellt wird. Davon abgesehen ist es evtl. gar nicht Windows, das für die Rekonnektierung sorgt, sondern ein Signal, das beim reaktivieren der NIC ins Netz geschickt wird und den Switch "aufweckt" (na gut, indirekt wäre es ja dann doch wieder Windows, falls dem so ist). Hm... :confused:

 

Sagte ich schon, dass ich mal einen Sniffer anwerfen würde? ;)

Link zu diesem Kommentar

Sagst Du uns bitte mal, wozu der Software-Loopback-Adapter gut ist, was das mit einem "Cluster" zu tun hat, und warum der im gleichen Subnet (Vermutung) wie die NIC liegt ?

 

Dann hast Du auch gleich den Fehler. Bei Multihoming versucht Windows eine Lastverteilung über beide NIC's zu machen. Leider kann der DB-Server nicht über den Loopbak-Adapter erreicht werden.

 

Du hast da nicht zufällig eine Software drauf, die auf eine spezielle IP-Adresse lizensiert wird ?

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...