Jump to content

HV-Failover-Cluster Wartung


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo liebe Community.

 

Ich hab mal eine Verständnisfrage zur allgemeinen Wartung bzw. zum Failover-Vorgang.

 

Bisher bin ich eigentlich davon ausgegangen, wenn ein Knoten angehalten wird, dieser keinen Failover ausführt, auch wenn er kurz die Netzwerkverbindung verliert.

 

Zitat Technet: 

 

Wenn Sie einen Knoten anhalten, bleiben vorhandene Gruppen und Ressourcen online, es können jedoch keine zusätzlichen Gruppen und Ressourcen für den Knoten online geschaltet werden. Das Anhalten eines Knotens erfolgt normalerweise, wenn Softwareupdates auf dem Knoten installiert werden.

 

Folgendes ist gestern passiert:

Wir haben kurz, um einen Switch zu tauschen, das Netzkabel eines Knotens abgezogen und in den neuen Switch gesteckt, der auch im Netz hing.

 

Der Gedanke war, dass die VMs weiterlaufen, da diese ihre eigene Netzanbindung auf einem anderen Switch haben und die Verbindung zum Storage via FC angebunden ist. Die VMs sind auch nicht alle abgestürzt (2-3 Maschinen waren offline), wurden aber sofort auf den anderen Knoten verschoben.

 

An sich, wurden beide Knoten angehalten. Nach dem Kappen der Netzverbindung hat der Knoten 1, trotzdem ein Failover auf den angehaltenen Knoten 2 gemacht. Warum? Im Zitat oben steht ja eindeutig, dass keine Ressourcen online geschaltet werden können.

 

Wie kann man verhindern, dass ein Failover automatisch ausgeführt wird? Es kann ja auch durchaus sein, dass ein Knoten kurz die Verbindung (Heartbeat) zum Cluster verliert, aber die restlichen anderen Verbindungen dennoch voll funktionsfähig sind. Der Failover legt in diesem Fall ja unnötigerweise die VMs lahm.

Ich habe nirgends die Einstellungen gefunden, wie man die "Empfindlichkeit", der Heartbeat-Anwortzeit ändern kann.

 

Danke!

 

PS: 2 Knoten HV-Failover-Cluster mit FC-Storage. VMs haben eigenes Netzwerk. 

bearbeitet von dalmatino
Link zu diesem Kommentar

Ja, das ist mir schon klar. Aber wie gesagt, bin ich eigentlich davon ausgegangen, wenn die Knoten angehalten sind, dass er nicht verschieben kann.

Deswegen ja auch die Frage, wie ich es verhindern kann bzw. die Toleranzzeit ändern kann.

 

Wie gesagt, es kann ja auch durchaus mal sein, dass kurzzeitig ein Switch die Grätsche macht. Und trotz voll funktionsfähiger VMs, der Failover eingeleitet wird.

Ich will keinen automatischen Failover. 

Link zu diesem Kommentar

Ja, das ist mir schon klar. Aber wie gesagt, bin ich eigentlich davon ausgegangen, wenn die Knoten angehalten sind, dass er nicht verschieben kann.

Es geht ja auch nicht um das Verschieben von Resourcengruppen, sondern um einen Failover.

 

Deswegen ja auch die Frage, wie ich es verhindern kann bzw. die Toleranzzeit ändern kann.

Behebe die Ursache, nicht das Symptom.

 

Wie gesagt, es kann ja auch durchaus mal sein, dass kurzzeitig ein Switch die Grätsche macht. Und trotz voll funktionsfähiger VMs, der Failover eingeleitet wird.

Nein, kann nicht sein. Das ist ein Designfehler.

 

Ich will keinen automatischen Failover.

Doch willst du. Behebe die Ursache, nicht das Symptom. Dir fehlt es offenbar an Redundanz im Netzwerk und an Verständnis für die Arbeitsweise eines Clusters. Das Cluster hat genau das gemacht, was es machen soll. Was du aber hast, ist ganz offenbar ein hässlicher Designfehler.

Link zu diesem Kommentar

Ihr habt da irgendwas im Konzept falsch, der Ausfall eines Switches sollte nicht VMs oder den Cluster lahmlegen. Vermutlich Netzwerke nicht redundant ausgelegt. Bei uns sind alle Verbindungen redundant mit eigenen Switches. Klar, da meckert der Chef dann weil man so viel Switches kauft. Aber ich kann da auch mal im laufenden Betrieb die Firmware der Swtiches patchen ohne irgendwelche Ausfälle oder Failover. 

Link zu diesem Kommentar

Nein, nicht wenn man es Richtig macht. In diesem Fall verwendet das Cluster andere Netzwerkanbindungen für den Heartbeat.

Die Knoten verfügen über zwei NICs. 1x Cluster, 1x Domänennetz. Beide Netzwerke sind im HVC konfiguriert. Wie bereits erwähnt, die Installation/Konfiguration wurde nach MS-Leitfaden durchgeführt. 

 

Edit:

 

If you connect cluster nodes with a single network, the network will pass the redundancy requirement in the Validate a Configuration Wizard. However, the report from the wizard will include a warning that the network should not have single points of failure.

Quelle: http://technet.microsoft.com/de-de/library/cc732181(v=ws.10).aspx 

 

Wie ich auch bereits erwähnt habe, hat die Konfigurationsüberprüfung keine Fehler oder Warnungen ausgegeben. 

bearbeitet von dalmatino
Link zu diesem Kommentar

Moin,

 

Du müsstest schon etwas mehr Informationen liefern.

Welche Felermeldungen sind aufgetreten?

Wie sieht das Netzwerksetup genau aus (physisch und logisch)?

Nach welchem 'MS-Leitfaden' wurde der Cluster aufgebaut (es gibt mehr als nur einen)?

 

Das die Clustervalidierung keine Warnung ausgibt, sagt alleine betrachtet nichts aus. Ich kann auch mit nur einer Realtek Karte einen Cluster bauen, den der Assistent für 'toll' hält

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...