thomas_hind 10 Geschrieben 7. Februar 2007 Melden Teilen Geschrieben 7. Februar 2007 Hallo. Uns ist gerade die gesamte ESX-Farm hart gecrasht. Beide Server haben den Lila-Screen-of-Death gezeigt. Beide Server sind IBM x3850, SAN ist IBM DS4700. Habt ihr sowas schon mal gesehen? Habt ihr nen Tipp, damit unser Dienstleister nicht alles durchsuchen muss? Ca. 15 Windows-Server laufen eigentlich okay. Ein Linux-Server (Redhat 4 Upd. 2) ist heute vormittag abgebröselt. An meinem Geburtstag (letzte Woche) hats den Mailserver zerbröselt (Exchange 2003 privater Informationsspeicher beschädigt, ein Anwender hat 4 Monate Mails verloren). Das gab Anrufe auf dem Handy, die nicht so erfreulich waren wie Glückwünsche. Das ist leicht, wenn es 150 Anwender sind. Das SAN ist neu, die Serverhardware sind neu, das VMware ist auf 3.01 mit ca. 1 Monat Patchrückstand. Die Dienstleister sind teilweise noch nicht so erfahren, drum frage ich hier. Ciao. Zitieren Link zu diesem Kommentar
nerd 28 Geschrieben 7. Februar 2007 Melden Teilen Geschrieben 7. Februar 2007 Hi, also mein ESX selber ist noch nie gecrashed. Was ist denn genau passiert? Wenn beide Systeme down gegangen sind würde ich mal auf einen Fehler des SAN's tippen - hast du mit dem Hersteller schon mal gesprochen. Gruß Zitieren Link zu diesem Kommentar
Surf-Pit 10 Geschrieben 7. Februar 2007 Melden Teilen Geschrieben 7. Februar 2007 Hallo erstmal, mir kommt das ziemlich bekannt vor. Was steht denn im Lila-Screen-of-Death? Wann ist denn der Absturz passiert? Ich kann nur eine Diagnose für HP-Server abgeben. Vielleicht ist es für IBM ähnlich. Bei hoher Speicherbelastung (ab 80 % Volllast)? Dann ist laut HP sehr wahrscheinlich der Lastenausgleich zwischen den Speicherriegeln nicht gegeben. Bei HP müssen die Speicherriegel, die zueinander zugeordnet sein absolut gleich sein (Bauart, Größe, Spezifikation usw.). Tausche doch am besten die Speicherriegelpaare. Wenn im Fehlerprotokoll dann die anderen Speicherbänke als Fehler auftauchen, sind es diese Speicherriegel. Probiere doch mal mit der Diagnose-Software den Fehler einzugrenzen. MfG Surf-Pit Zitieren Link zu diesem Kommentar
winhar01 10 Geschrieben 7. Februar 2007 Melden Teilen Geschrieben 7. Februar 2007 Hallo, also ich tippe auch auf das SAN, da es doch sehr unwahrscheinlich ist, dass 2 verschiedene Geräte zur gleichen Zeit abrauchen, abgesehen davon, dass ESX eigentlich sehr zuverlässig läuft. Gruß winhar01 P.S. Wie kann es sein, dass die Mails von 4 Monaten fehlen, nur weil der Server crasht. Hast Du schonmal was von Backup gehört? Wenn sowas bei uns passieren würde, hättest sich der Verantwortliche um die aktuellen Probleme nicht mehr kümmern müssen. :D Zitieren Link zu diesem Kommentar
TheDonMiguel 11 Geschrieben 7. Februar 2007 Melden Teilen Geschrieben 7. Februar 2007 Ich hatte mal einen purple screen, als wir eine SAN-Disk erweiterung gemacht haben, welche dann kräftig schief gieng. Es gibt Situationen wo ein ESX "nervös" reagiert wenn das SAN nicht mehr da ist. Die VM's und der ESX Server sind nach dem SAN repair wieder hochgekommen. Würde jedenfalls nichts am System experimentieren. Da das System neu ist, hast du Hersteller-Support. Bei OEM bietet dir ev. IBM Hilfe (bei HP ist das so). Da hast du Experten die dir kompetent auskunft geben. Für VMware empfehle ich dir auch das VMware Forum bei Portal - VMware Forum und VMware Technology Network (VMTN) und die offizielle knowledge base. Gruss, TDM Zitieren Link zu diesem Kommentar
zacker 10 Geschrieben 8. Februar 2007 Melden Teilen Geschrieben 8. Februar 2007 Hi bisher hatte ich noch keinen Crash aber auch diverse Probleme bei denen sich der VMware Support meistens als recht kompetent erwiesen hat. Also mein Tipp: Support request bei Vmware öffnen. Ohne Gold-Support kein ESX Server !!! Zacker Zitieren Link zu diesem Kommentar
rziwin 10 Geschrieben 8. Februar 2007 Melden Teilen Geschrieben 8. Februar 2007 Ich hatte mal einen purple screen, als wir eine SAN-Disk erweiterung gemacht haben, welche dann kräftig schief gieng. Es gibt Situationen wo ein ESX "nervös" reagiert wenn das SAN nicht mehr da ist. Die VM's und der ESX Server sind nach dem SAN repair wieder hochgekommen. Ich betreue 5 ESX 3.0.1 auf Dell 1955 Blade's und bisher hatte ich erst einen Ausfall weil der Strom weg war. Ansonsten kann man im laufenden Betrieb das SAN abklemmen (Herunterfahren der Storageeinheit) und ausser der dann nicht mehr laufenden VM passiert da garnix. Erweiterungen machen wir immer im laufenden Betrieb und Abstürze gab es da ebenfalls noch nicht. Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.