Chris_30 10 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 Hallo, habe hier folgendes Problem - ein W2K3 TS server bei einem Kunden der in unregelmässigen Abständen abschmiert (mal ein Tag, mal eine Woche), keinerlei verdächtige Einträge im Ereignisprotokoll. Kiste ist auf kleines Speicherabbild erstellen und automatisch neustarten eingestellt (Kunde hat keine eigene EDV - sonst würde die Kiste stehen und die Fillialen wären aufgeschmissen) So, da habe ich also mein Memory Dump-File - nur wie finde ich jetzt raus was im BSOD steht um der Ursache auf den Grund gehen zu können? Merci vorab, Chris Zitieren Link zu diesem Kommentar
Dr.Melzer 191 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 Schalte den automatischen nNeustart bei BSOD ab, dann bleibt der Bluescreen stehen und du siehst die Fehlernummer. Zitieren Link zu diesem Kommentar
Chris_30 10 Geschrieben 13. Januar 2005 Autor Melden Teilen Geschrieben 13. Januar 2005 ... nicht so einfach ... der Server steht in der Verwaltung, die nur zu normalen Bürozeiten besetzt ist - die Aussenstellen müssen jedoch rund um die Uhr auf den TS zugreifen können! Einfach den BSOD stehen lassen um zu lesen was da steht geht also nicht, da sonst im Extremfall eine ganze Nacht oder ein ganzes WE kein Zugriff möglich ist! Andere Alternativen den Inhalt des BSOD zu "erhaschen" ? Merci, Chris Zitieren Link zu diesem Kommentar
Das Urmel 10 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 Hole dir die memory.dmp (mini_mitdatum.dmp) rüber besorg dir Dumpchk, damit kannste den Dump analysieren. Im Eventlog am Server wird aber zumindest der Stopcode stehen, Systemprotokoll, Save Dump. Zitieren Link zu diesem Kommentar
amichel 10 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 Hallo, Ich empfehle Dir mal einen kompletten Memory Dump zu machen, dann bekommst Du mehr Infos. Dann lade Dir unter http://www.microsoft.com/whdc/devtools/debugging/default.mspx die Debugging Tools für Windows runter. Weiter unten auf der Seite findest Du auch einen Link wie man den Symbols Server nutzt (http://www.microsoft.com/whdc/devtools/debugging/symbols.mspx). Dann starte mal den Debugger und lade den Dump. Mit <!analyze -v> solltest Du schon mal einen Anhaltspunkt bekommen. lg am PS.: Ich hatte auch mal Probleme mit einerm TS. Da war ein Druckertreiber die Ursache, jedesmal wenn ein User auf einem bestimmten (nicht häufig gebrauchten Drucker) ausgedruckt hat, ist der ganze Server weg gewesen. Zitieren Link zu diesem Kommentar
Chris_30 10 Geschrieben 13. Januar 2005 Autor Melden Teilen Geschrieben 13. Januar 2005 Hm - nicht ein einziger Eintrag im Ereignissprotokoll - nur nach dem Neustart der "schlaue" Eintag das der Server unerwartet heruntergefahren wurde ... Das mit Dumpchk habe ich versucht - der wichtige wert ist da ja wohl die Exeptionaddress - in meinem Fall 0x80543AC9 Dann schön brav mit Pstat nachgeguckt welche Adresse direkt darunter ist - ... die ntoskernel Prima :) jetzt habe ich einen Anhaltspunkt ... nur kann es jetzt fast alles sein ... Hilft wirklich nur der Weg mit den Debuggingtools von MS? Zitieren Link zu diesem Kommentar
amichel 10 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 hallo chris, mir fällt da nix mehr dazu ein. Sind in letzter Zeit neue HW Komponenten dazugekommen, oder neue Treiber installiert worden? Kann es sein, daß der Server zu heiß wird? Wie schaut es mit der Strom(spannung) aus. Vielleicht ist es ein Memory fehler. Aber das ist halt nur ein ausprobieren. lg amichel Zitieren Link zu diesem Kommentar
wirtnix 10 Geschrieben 13. Januar 2005 Melden Teilen Geschrieben 13. Januar 2005 öhm, wenn das ein 19zoll rack server ist, hatte ich schon mal die schlaue fehlerursache, dass der sensor, der misst ob der Gehäusedeckel geöffnet wurde, ein event auslöste und dadurch einen neustart auslöste. nach dem tausch des sensors wars gut. das fanden wir raus, indem wir auch die BIOS-logs analysierten... Zitieren Link zu diesem Kommentar
Chris_30 10 Geschrieben 13. Januar 2005 Autor Melden Teilen Geschrieben 13. Januar 2005 Das Problem besteht wohl schon länger - habe das System erst übernommen, kann also nicht sagen, ob es an "neuer" HW liegt. Kann ja jetzt nicht anfangen im Try and Error Verfahren erst mal wild zu tauschen :rolleyes: Bioslog analysieren ? Wie geht das denn ? (ist nämlich ein 19" HP ML350 T03) Spannung kanns nicht sein - hängt an einer USV - Temperatur auch nicht, z.T. raucht er in völlig Lastschwachen Zeiten ab. merci, Chris Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.