themastar 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Guten Morgen die Herren, ich habe in regelmässigen Abständen ein ständig wiederkehrendes Problem, und zwar einen Freeze. Ausgangssituation: Unser Front-End (DELL PE750) läuft auf Windows 2003, IIS, Exchange 2003, GFI Mailsecurity und Kaspersky Anti-Virus. Das Problem besteht schon seit ungefähr seit 3 Monaten, damals mal sporadisch aufgetaucht; nun tritt er fast jede Woche auf, verdächtigerweise mittlerweile jedes Mal von Mittwoch auf Donnerstag. Der Freeze äusserst sich in der Weise, dass die Maschine augenscheinlich abstürzt. Der Monitor ist komplett schwarz, also kein Freeze im eigentlichen Sinne, wo das Bild stehen bleibt. Mein Problem ist nun, dass nichts! in den Eventviewer geschrieben wird, keine Fehlerursache, kein Treiber, der dies vielleicht hervorruft, einfach gar nichts. Nach einem Reset fährt der Server normal hoch und das einzige, was man im EV dann anschliessend sieht, ist die Meldung "The previous system shutdown @ xxxx was unexpected". DELL Support wurde kontaktiert, um einen Hardwareschaden auszuschliessen; mit DSET und der 32 Bit Diagnose-CD mehrere Loops durchlaufen, Fehler=0. Gut, somit kommt eigentlich nur noch die Software in Frage. Der Server an sich ist aktuell, sprich, alle Service Packs für 2003 + Exchange SP, Treiber wurden ebenfalls aktualisiert, Best Practices Analyzer Tool von Exchange durchlaufen und die angegebenen Komponenten (es wurde vorgeschlagen, die Netzwerkkartentreiber zu aktualisieren) auf den neuesten Stand gebracht. Resultat: Fehlanzeige, letzte Woche Donnerstag war die Kiste wieder weg, diesmal sogar ohne eine Zeitangabe des Absturzes. Ich werde die Kiste gleich mal neustarten um auszuschliessen, dass der Freeze zufällig alle 7 Tage auftritt (ich muss ja jede Möglichkeit in Erwägung ziehen). Frage: hat jemand von den SysAdmins irgend eine Idee, die mich eventuell weiterbringen könnte? Oder: gibt es eine Software, die alle Zugriffe auf das System (egal ob Hard- oder Software oder Service) mitloggt? Dann könnte man eventuell nach einem Absturz sehen, was wann worauf zugegriffen hat und eventuell Rückschlüsse ziehen? Ich habe nämlich leider keinerlei weitere Ideen, wie ich dieses Problem sonst lösen könnte (Microsoft´s kostenpflichtige Supporttickets mal ausgeschlossen). Was morgen noch ansteht, ist ein Forced Dump, also Server mittels Tastatur abstürzen lassen und die Dump file analysieren. Vielleicht werde ich daraus ja irgendwie schlau. Vielen Dank im Voraus an alle Mitwirkenden und einen schönen und ruhigen Mittwoch im neuen Jahr. Zitieren Link zu diesem Kommentar
mfrank 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Hallo, passiert denn was besonderes in der Nacht von Mittwoch auf Donnerstag? Backup, DB-Reorg oder so etwas? Spannungsschwankungen (USV vorgeschaltet?)? Thermische Probleme (Klimaanlage wird gewartet?)? Ich weiß, das klingt ziemlich an den Haaren herbeigezogen, aber ich halte es da mit Sherlock Holmes: "Wenn man alles wahrscheinliche ausgeschlossen hat, muß das, was über bleibt, egal wie unwahrscheinlich es aussieht, die Lösung sein." Jedenfalls so ähnlich. Es grüßt MF Zitieren Link zu diesem Kommentar
Schluml 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 ...Und ein hardwaredefekt kann wirklich ausgeschlossen werden? Zitieren Link zu diesem Kommentar
phoenixcp 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Hm, klingt ja spannend. Sherlock Holmes passt hier gut rein. Guter Ansatz, erstmal die Sieben-Tage-Anomalie zu untersuchen. Dann wissen wir erstmal ob es an der Laufzeit oder dem Wochentag liegt, an der Server wegraucht. BTW: wann kommt bei euch die Putzfrau? bzw. wann macht die im Serverraum sauber? Nicht das die irgendwas abzieht, was der Server zum überleben braucht. Muss ja nicht immer der Server selber sein. Zitieren Link zu diesem Kommentar
mfrank 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Und ich hab mir den Hinweis auf das Putzgeschwader verkniffen :) Kann natürlich sein, das die den Stecker ziehen, die USV blutet aus und der Server fährt aus irgendeinem Grund nicht sauber herunter... Es grüßt MF Zitieren Link zu diesem Kommentar
Gulp 263 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Tja, sowas hatte ich auch schon und es war ..... tatsächlich jemand der den Server absichtlich hart ausgeschaltet hat (ohne sauberes Herunterfahren natürlich). Wenn wirklich kein Eintrag im Eventlog auftaucht, der nach Fehler riecht, gibt es nur eins um das manuelle Ausschalten wirklich auszuschliessen. Server/Serverschrank/Serverraum absperren! (übrigens war das die Antwort auf die Frage im Netware CNE Test, wie man am effektivsten seinen Server absichert!) Grüsse Gulp Zitieren Link zu diesem Kommentar
themastar 10 Geschrieben 4. Januar 2006 Autor Melden Teilen Geschrieben 4. Januar 2006 Hallo zusammen und vielen Dank schon mal für die Lösungsansätze. Es ist bei uns allgemein so, dass der Server-Raum tabu ist für jegliche Person ausser dem Admin und dem Testteam. Ich reinige den Raum selbst jede Woche, also kann ich diese Möglichkeit fast 100% ausschliessen. Alle Server hängen an einer USV und die Stecker sind auch alle fest genug angestöpselt. Spannunsspitzen würden also abgefangen werden und das Problem tritt ja nur bei dem Front-End auf (alle anderen 16 Server liefen und laufen bisher ohne Probleme). Von Mittwoch auf Donnerstag fällt nichts besonderes an, die Datensicherung läuft jeden Tag über Nacht und es gab diesbezüglich keinerlei Probleme. Die Klimaanlage wird ebenfalls nicht gewartet und der Server-Raum wird konstant bei 18 Grad gekühlt, thermische Probleme daher ebenfalls eher unwahrscheinlich (as mentioned before, alle anderen Server laufen ohne Probleme). Auf dem Front-End läuft auch nicht Prozessorintensives, er übernimmt halt nur das Forwarding der mails nach innen/aussen und zusätzlich die VPN-Einwahl ins Netzwerk. Diese Option habe ich aber auch schon ausgeschlossen; ich hatte eine andere kleine Workstation mit VPN installiert und den Dienst auf dem Front-End vollends geschmissen, Resultat: immer noch Freeze. Tja, was nun? Hat jemand noch irgendwelche Vorschläge? Wenn nicht, warten wir die Nacht ab, dann wissen wir weiter :) Zitieren Link zu diesem Kommentar
pixelbrain 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 mhhh diese probleme hatten wir auch mit hp ml370 g4 servern ... bs war nen w2003 mit sp1 .. nach diversen hardwaretauschaktionen, neuinstallation vom bs und nachtelngen warten hab ich das sp1 deinstalliert und siehe da ... die kiste läuft seit 8 wochen anstandslos ..... Zitieren Link zu diesem Kommentar
themastar 10 Geschrieben 4. Januar 2006 Autor Melden Teilen Geschrieben 4. Januar 2006 Hmm, sollte die Kiste heute nacht wieder abschmieren, nehme ich diese Maßnahme mal in die To-Do Liste auf.... Zitieren Link zu diesem Kommentar
pixelbrain 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 ich hab sogar ne support case bei ms geöffnet ... im endeffekt gabs von ms unter hand die info ... lass es ohne sp laufen ... sie könnens nicht erklären ... bei mir wars nen 2003er enterprise mit terminalserver und nen 2003er mit exchange 2003. wie gesagt sp1 im endeffekt runter und alles is schön . :) Zitieren Link zu diesem Kommentar
autowolf 12 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Kann man sich auf den Server noch draufschalten per RDP oder läst er sich noch anpingen ? Zitieren Link zu diesem Kommentar
themastar 10 Geschrieben 4. Januar 2006 Autor Melden Teilen Geschrieben 4. Januar 2006 Naja, noch ja, noch läuft die Kiste ja :) Sobald sie jedoch einmal abschmiert ist selbstverständlich alles weg.... Wie gesagt, der Lösungsansatz mit dem SP klingt gar nicht mal schlecht, zumal das SP ca. 1(Zufall? *g*) Woche vorher eingespielt wurde. Irgendwie verlier ich immer mehr das Vertrauen in Hot- und Bugfixes und den desammten Servicepacks :D Zitieren Link zu diesem Kommentar
hcibis 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 welche usv? usv software installiert??? hatte das gleiche problem, nach der deinstallation der usv software lief die kiste ohne probleme Zitieren Link zu diesem Kommentar
themastar 10 Geschrieben 4. Januar 2006 Autor Melden Teilen Geschrieben 4. Januar 2006 Wir setzen eigentlich alles ein, von der Smart UPS 1400 bis zu den ganz grossen; Software ist die Powerchute Business Edition, jedoch lübbt diese schon eine Ewigkeit, nie Probleme damit gehabt. Zitieren Link zu diesem Kommentar
hh2000 10 Geschrieben 4. Januar 2006 Melden Teilen Geschrieben 4. Januar 2006 Hallo, in einem Heise Artikel wurde vor der PowerChute Business Edition-Software 6.X gewarnt, man "solle" doch möglichst auf 7.x umsteigen. Trifft aber Dein Problem nicht genau zu siehe hier: http://www.heise.de/newsticker/result.xhtml?url=/newsticker/meldung/62344&words=APC Gruß hh2000 Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.