dalmatino 10 Geschrieben 12. Oktober 2011 Melden Teilen Geschrieben 12. Oktober 2011 Hallo Allerseits, ich bräuchte mal wieder ein wenig Hilfe um einen Fehler zu finden. In unregelmäßigen Abständen (mal morgens, mal nachts), kommt es zum Ausfall des Hyper-Clusters. (2 Knoten, 1 Storage) Die beiden Knoten sind redundant via FC (2x FC-Switche über Kreuz) an das Storage angebunden. MPIO ist installiert. Heute morgen um 04:27 Uhr ist die Kommunikation wieder abgebrochen. Unter den Clusterereignissen wurde folgendes geloggt: 04:27:06 Das freigegebene Clustervolume "Volume1" ("VMs_VHDs") ist auf dem Knoten aufgrund von "STATUS_MEDIA_WRITE_PROTECTED(c00000a2)" nicht mehr verfügbar 04:27:06 Dieser Knoten hat unerwartet die Besitzrechte für den Clusterdatenträger "ASQLServer" verloren 04:27:06 Bei der Clusterressource "BSQLServer" im geclusterten Dienst oder in der geclusterten Anwendung "7fd76a31-949d-42f9-a92e-fdfc0bb00afe" ein Fehler aufgetreten. 04:27:06 Das freigegebene Clustervolume "Volume8" ("SQLServer") ist auf dem Knoten aufgrund von "STATUS_DEVICE_BUSY(80000011)" nicht mehr verfügbar. Alle E/A-Aktivitäten werden vorübergehend in eine Warteschlange aufgenommen, bis wieder ein Pfad zum Volume eingerichtet ist. Dann kommt paar Sekunden danach die Meldung für beide Knoten: Der Clusterknoten "HVS-1" wurde aus der aktiven Failovercluster-Mitgliedschaft entfernt Der Clusterknoten "HVS-2" wurde aus der aktiven Failovercluster-Mitgliedschaft entfernt Dann bricht die Verbindung zum Quorum ab: Der Clusterdienst wird heruntergefahren, da die Quorumverbindung getrennt wurde Dann wird in der Ereignisanzeige des Knoten folgendes geloggt. 04:27:11 Network interface HVS-1 - LAN-Chassis(rechts)-Heartbeat has changed its state. Der "Cluster" an sich läuft danach dann aber wieder ohne Probleme. Clustervalidierung zeigt keinen einzigen Fehler, VM's sind alle da und hochgefahren. Jedoch haben einige Maschinen einen Neustart durchgeführt. Alles Knoten sind Updatetechnisch auf dem neusten Stand. Wenn der Fehler auftritt sind weder Backups noch sonstige Arbeiten am Laufen. Sprich es ist keine Überlast vorhanden. Virenscanner sind auf den Knoten auch nicht vorhanden. Das Problem tritt erst auf, seitdem SP1 auf den Knoten installiert wurde. Auf den Knoten unter den "ClusterSharedVolumes" (c:\cluster\volume1) wurde um 04:27 Uhr die Datei "ClusterHBfile" geändert. Genau dann, als der Fehler auftrat. Ich kann damit aber leider nichts anfangen. Irgendwelche Ideen? Bin für jeden Tipp dankbar. Grüße Zitieren Link zu diesem Kommentar
Necron 71 Geschrieben 12. Oktober 2011 Melden Teilen Geschrieben 12. Oktober 2011 Hi, vielleicht ist hier ein Hotfix für dich dabei: Recommended hotfixes and updates for Windows Server 2008 R2 SP1 Failover Clusters Zitieren Link zu diesem Kommentar
dalmatino 10 Geschrieben 12. Oktober 2011 Autor Melden Teilen Geschrieben 12. Oktober 2011 Hi, naja, bevor ich irgendwelche Hotfixes installiere, würde ich das Problem doch schon gerne ein wenig eingrenzen. Die Frage ist nur, woran es eher liegen könnte. Storage? FC-Karte? Netzwerkkarte? OS? Und warum tritt der Fehler so sporadisch auf? Gruß Zitieren Link zu diesem Kommentar
Lian 2.421 Geschrieben 12. Oktober 2011 Melden Teilen Geschrieben 12. Oktober 2011 Das Problem tritt erst auf, seitdem SP1 auf den Knoten installiert wurde.Leider kann das Verhalten wie Du es beschreibst nach SP1 auftreten. Installiere die Post-SP1 Hotfixe (siehe Daniel's Link) und teste nochmals. Die Liste der Recommended Hotfix für Server Cluster sollte ein Cluster Admin regelmäßig prüfen ;) Zitieren Link zu diesem Kommentar
dalmatino 10 Geschrieben 12. Oktober 2011 Autor Melden Teilen Geschrieben 12. Oktober 2011 Hi, welche von den Fixes soll denn passen? 1. Ein Windows Server 2008 R2-Failover-Cluster sein Quorum verliert, tritt eine asymmetrische-Kommunikationsfehler Sie erstellen einen Windows Server 2008 R2-Failover-Cluster, der drei oder mehr Knoten hat.Asymmetrische Verbindungsfehler im Cluster. Beispielsweise können nicht zwei Knoten miteinander kommunizieren. Die beiden Knoten kommunizieren mit anderen Knoten im Cluster möglicherweise. Es sind aber nur zwei Knoten vorhanden und die können untereinander kommunizieren. 2. The Cluster service stops unexpectedly on a Windows Server 2008 R2 failover cluster node when you perform multiple backup operations in parallel on a cluster shared volume Sie haben einen Windows Server 2008 R2-Failovercluster, auf dem die freigegebene Clustervolumes-Funktion aktiviert ist.Sie haben mehrere backup-Vorgänge parallel auf einem freigegebenen Clustervolume durchführen. Wie gesagt, zu dem Zeitpunkt laufen keine Backups. Die Symptome passen, aber nicht die Umstände. Zitieren Link zu diesem Kommentar
Necron 71 Geschrieben 12. Oktober 2011 Melden Teilen Geschrieben 12. Oktober 2011 Ich würde beide Hotfixes installieren. Auch wenn die Beschreibungen im KB Artikel anders lauten. Zitieren Link zu diesem Kommentar
dalmatino 10 Geschrieben 13. Oktober 2011 Autor Melden Teilen Geschrieben 13. Oktober 2011 Wird installiert. Berichte dann. Danke! Zitieren Link zu diesem Kommentar
dalmatino 10 Geschrieben 25. Oktober 2011 Autor Melden Teilen Geschrieben 25. Oktober 2011 Hallo, für die, die es interessiert. Der Hotfix "KB2552040" scheint das Problem gelöst zu haben. Bisher hat er ab und an mal, laut Log, die Verbindung zur LUN verloren, dies aber nicht als Fehler sondern als Hinweise dargestellt. Zudem wurden die Maschinen auch nicht neugestartet. Danke für die Unterstützung. Zitieren Link zu diesem Kommentar
Lian 2.421 Geschrieben 25. Oktober 2011 Melden Teilen Geschrieben 25. Oktober 2011 Danke für das Feedback! :) Zitieren Link zu diesem Kommentar
dalmatino 10 Geschrieben 25. Oktober 2011 Autor Melden Teilen Geschrieben 25. Oktober 2011 Ich hab zu danken! ;-) Zitieren Link zu diesem Kommentar
Necron 71 Geschrieben 25. Oktober 2011 Melden Teilen Geschrieben 25. Oktober 2011 Danke für das Feedback! :) Dito! :) Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.