Jump to content

Ausfall HyperV-Failovercluster - Zweifel an NIC-Teamingfunktion


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Guten Morgen,

 

ich versuche die Umgebung mal auf das Wesentliche zusammenzufassen:
Wir betreiben einen HyperV-Failovercluster (WinServer2012R2, 8 Nodes) mit einem darauf gesetzten SCVMM.
Wir haben einen virtuellen Switch für das VM-Netzwerk, der aus 6 physikalischen NICs je Host geteamt ist. die Kabel der 6 NIC verteilen sich auf 3 physikalische Switches.

Heute ist einer dieser Switches ausgefallen. Unsere Annahme:
2 der 6 NICs des NIC-Teams fallen aus, das Team besteht nur noch aus 4 NICs. Die VMs bleiben allesamt online.

 

Es kam anders:
Alle VMs liefen zwar weiterhin, diverse VMs gingen jedoch offline. Höchstwahrscheinlich die, welche über die 2 NICs des ausgefallenen Switches kommunizierten.

Frage: Wird ein Switchausfall nicht durch das Teaming kompensiert? Geschieht dies nur, wenn die NICs selbst einen Defekt aufweisen oder auf eine andere Weise deaktiviert sind/werden?

 

Vielen Dank schon mal für die Antworten.

Link zu diesem Kommentar

Wir haben auch sowas, aber halt nur 2 NICs im Team. Das hält einen Switch Ausfall (Modul getauscht) und einen Ausfall einer Verbindung (Kabel ziehen) problemlos aus. Die Verbindung läuft ja über die virtuelle NIC des NIC Team da sollte der Ausfall einzelner Mitglieder nicht so viel machen.

 

Wir verwenden Switch Independent. Habt ihr evtl. LACP verwendet und euch da bei der Konfiguration vertan?

Link zu diesem Kommentar

Hallo,

 

Wir sind auch zu dem Ergebnis gekommen, dass die NICs auf den Hosts nicht als down gekennzeichnet waren. Der Switch war lt. unserem Netzwerkkollegen in einem undefinierbaren Defekt-Zustand. Er hat nicht funktioniert, hat aber kein Link-down-Signal an den Host weitergeben können. Für die HyperV-Hosts war der Switch in Ordnung, die Fehlfunktion HINTER dem Port am Switch konnte der Host nicht erahnen. Deswegen liefen die VMs auch weiterhin auf diesen beiden NICs, dessen Pakete den Switch aber nicht verlassen haben.

Wäre das so erklärbar?

Link zu diesem Kommentar

Moin,

 

ja, denkbar wäre das.

 

Sowas in der Art haben wir auf anderer Ebene auch schon mal bei einem Storagesystem gesehen. Da war eine Platte in einem seltsamen Zwischenzustand, was das Storagesystem nicht richtig erkannt hat. Im Ergebnis ist das ganze Storage ausgefallen, weil keiner seiner Verfügbarkeitsmechanismen angesprungen ist. Das sind "schöne" Beispiele, dass technische Verfügbarkeitsmechanismen bei weitem nicht alle Schadensszenarien abdecken.

 

Gruß, Nils

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...