Jump to content

ClusterStorage nicht von allen Nodes Ansprechbar


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Moin,

 

wir betreiben schon seit einiger Zeit ein Hyper-V-Cluster aus 6 Nodes. Alles funktioniert auch super, bis auf die letzte Zeit(ca. 3 Monate) treten immer mal wieder Probleme mit der benutzbarkeit einiger Volumes auf verschiedenen Nodes im Cluster auf. Die Ursache dafür habe ich bis jetzt nicht gefunden und in den Logs gibt es auch keine richtigie Anhaltspunkte dafür. Das Problem entsteht sporadisch auf einzelnen Nodes und ist meist auch nach Reboot des Nodes auch weg. Ohne dass vorher am Netzwerk oder SAN was geändert wird.

 

Aktuell habe ich wieder das Problem, dass eins der Volumes von einem der 6 Nodes nicht benutzbar ist(s.Bilder) und die VM's können somit auf diesen Node nicht verschoben werden. 

 

Kann mir jemand ein Tipp geben oder erklären wie sowas zustande kommen kann?

 

 

Volume.JPG

permissions.JPG

bearbeitet von ulitik
Link zu diesem Kommentar
vor 47 Minuten schrieb NorbertFe:

Schonmal auf den FC Switches nachgeschaut? Mal auf Errorcount usw. achten.

Ja, natürlich. Alles durchgegangen. Keine Fehler oder Hinweise in den Logs. Ich hatte die Switche auch schon mal vorsorglich restartet. Keine Besserung. 

vor 48 Minuten schrieb zahni:

Ist das Zoning korrekt konfiguriert?

Faustregel: Die Hosts dürfen sich untereinander nicht sehen. Das Storage-System muss pro Host  eine Zone haben. Sonst können  Bus Resets  die anderen Teilnehmer "verwirren".

 

Ja, ist das. Es funktioniert auch alles, Bis einer der Nodes das Volume nicht mehr ansprechen kann. Nachm Reboot ist auch meist alles wieder gut und funktioniert.

 

Link zu diesem Kommentar
vor 55 Minuten schrieb zahni:

Was hast Du denn für ein Hyper-V und welche Events  treten  im Eventlog  auf ?

Was genau meinst du? Die Hyper-V Version?  Hyper-V Version: 10.0.14393.2035

 

Im Eventlog finde ich nichts was auf Storage oder Netzwerk zurückzuführen ist. Nur so allgemeine Sachen wie Cortana konnte nicht ausgeführt werden(GPO), The WMI Performance Adapter service entered the stopped state. etc. und natürlich auch, dass 2 VM's nicht migriert werden konnten, weil die Volume, wo die Maschinen sind von der Node nicht erreichtbar ist.

 

 

 

bearbeitet von ulitik
Link zu diesem Kommentar
Gerade eben schrieb zahni:

Ist  die LUN von  allen Hosts auch über alle Pfade erreichbar? Ist MPIO korrekt konfiguriert? Wenn da ein Pfad ausfällt, setzt es Eventlog-Meldungen...

ja, ist es. MPIO ist auch von allen Servern aus funktional und beide Pfade sichtbar, obwohl das Volume selber momentan von einem der Nodes nicht zugriffsbereit ist.  Es war z.B gestern mittag alles erreichbar und von allen Nodes konnte ich die LUN auch sehen und zugreifen. Heute morgen hatte ich versucht 2 Maschinen auf den Node zu verschieben und das ging nicht. Dabei ist es mir aufgefallen, dass das Volume von dem Node nicht erreichbar ist. Ich hatte auch schon die LUN komplett neu gemacht, formatiert und als CSV neu eingebunden. Ich weiss langsamm nicht was ich noch prüfen/testen kann.

Link zu diesem Kommentar

Moin,

FC hatten wir auch mal, das muss sauber mit den Switchen eingerichtet sein, sonst kommt es genau zu den beschriebenen Problemen.

 

Zoning / Fabric muss einer machen, der sein Handwerk versteht.

 

Wenn das nicht eurer täglich Brot ist, würde ich einen externen Spezi dazu nehmen.

 

Wer hat das denn initial eingerichtet? :-)

 

Wir sind inzwischen auf iSCSI umgestiegen, da wir zu viele Ports brauchten und das sowohl Storageseitig als als Lizenztechnisch zu teurer geworden wären, wir haben jetzt mindestens 4* 10GB Ethernet per Maschine, auf dem Storage 4 Karten mit je 2 Ports.

Link zu diesem Kommentar

Die initiale Einrichtng der FC-Hardware hatten wir damals mal mit einer Firma aus Bochum und Brocade-Support gemacht. Wie ich schon sagte, es hat eine ganze zeit funktioniert und nach einem Reboot des Hosts funktioniert auch wieder, also gehe ich nicht davon aus, dass FC-Konfig buggy ist. Sonst müsste das Problem inner schon vorhanden gewesen sein? Weil dann müsste es immer zu dem Problem gekommen sein. Was aber nicht der Fall war/ist.

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...