Peter Diebold 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 Hallo zusammen, ich habe auf unserem SBS2003 Server seit Monaten jede nacht um 00:29:xxh einen Serverneustart. Leider ist es uns nicht gelungen den Fehler bzw die Ursache dafür herauszufinden. Auch das Debugging des Memory.dmp ist wenig aufschlussreich. Zumindest wissen wir das aus welchen gründen auch immer csrss.exe mit am STOP beteiligt ist. Ich habe den Debugging-Bericht mal hier drangehängt. Wer kann mir da helfen? Microsoft ® Windows Debugger Version 6.6.0003.5 Copyright © Microsoft Corporation. All rights reserved. ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* CRITICAL_OBJECT_TERMINATION (f4) A process or thread crucial to system operation has unexpectedly exited or been terminated. Several processes and threads are necessary for the operation of the system; when they are terminated (for any reason), the system can no longer function. Arguments: Arg1: 00000003, Process Arg2: 89c4d020, Terminating object Arg3: 89c4d184, Process image file name Arg4: 80965a86, Explanatory message (ascii) Debugging Details: ------------------ PROCESS_OBJECT: 89c4d020 IMAGE_NAME: csrss.exe DEBUG_FLR_IMAGE_TIMESTAMP: 0 MODULE_NAME: csrss FAULTING_MODULE: 00000000 EXCEPTION_RECORD: b99d09dc -- (.exr ffffffffb99d09dc) ExceptionAddress: 7597b705 ExceptionCode: c0000006 (In-page I/O error) ExceptionFlags: 00000000 NumberParameters: 3 Parameter[0]: 00000000 Parameter[1]: 7597b705 Parameter[2]: c000009d Inpage operation failed at 7597b705, due to I/O error c000009d EXCEPTION_CODE: (NTSTATUS) 0xc000009d - STATUS_DEVICE_NOT_CONNECTED DEFAULT_BUCKET_ID: DRIVER_FAULT PROCESS_NAME: csrss.exe CURRENT_IRQL: 0 ERROR_CODE: (NTSTATUS) 0xc0000006 - Die Anweisung "0x%08lx" verweist auf Speicher bei "0x%08lx". Die Daten wurden wegen eines E/A-Fehlers in "0x%08lx" nicht in den Arbeitsspeicher bertragen. IO_ERROR: (NTSTATUS) 0xc000009d - STATUS_DEVICE_NOT_CONNECTED EXCEPTION_STR: 0xc0000006_c000009d FAULTING_IP: +7597b705 7597b705 ?? ??? BUGCHECK_STR: 0xF4_IOERR_C000009D STACK_TEXT: b99d0528 809a222d 000000f4 00000003 89c4d020 nt!KeBugCheckEx+0x1b b99d054c 80965a3c 80965a86 89c4d020 89c4d184 nt!PspCatchCriticalBreak+0x75 b99d057c 80834d3f ffffffff c0000006 b99d09b4 nt!NtTerminateProcess+0x7a b99d057c 8083d3a9 ffffffff c0000006 b99d09b4 nt!KiFastCallEntry+0xfc b99d05fc 8085b4a1 ffffffff c0000006 b99d09fc nt!ZwTerminateProcess+0x11 b99d09b4 8087d22d b99d09dc 00000000 b99d0d64 nt!KiDispatchException+0x390 b99d0d34 8083869f 0068fbb0 0068fbd0 00000000 nt!KiRaiseException+0x120 b99d0d50 80834d3f 0068fbb0 0068fbd0 00000000 nt!NtRaiseException+0x33 b99d0d50 7597b705 0068fbb0 0068fbd0 00000000 nt!KiFastCallEntry+0xfc WARNING: Frame IP not in any known module. Following frames may be wrong. 0068feb8 00000000 00000000 00000000 00000000 0x7597b705 STACK_COMMAND: kb FOLLOWUP_NAME: MachineOwner FAILURE_BUCKET_ID: 0xF4_IOERR_C000009D_IMAGE_csrss.exe BUCKET_ID: 0xF4_IOERR_C000009D_IMAGE_csrss.exe Followup: MachineOwner --------- Zitieren Link zu diesem Kommentar
Hirgelzwift 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 also wenn mein server jeden tag um die gleiche zeit abstürzt bzw. neu startet dann würde ich mal zuerst schauen ob es für 0:30 einen geplanten task oder at gibt. evtl löst ja ein task genau um die uhrzeit den fehler aus! hast du das schon kontrolliert? Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 20. Februar 2006 Autor Melden Teilen Geschrieben 20. Februar 2006 Ja klar haben wir alles auf Programmstarts hin überprüft. Es ist weder ein Task geplant um diese zeit, noch wird irgendein Dienst der Spuren in logfiles hinterlässt aktiv. Peter Zitieren Link zu diesem Kommentar
Velius 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 Kuckst du hier: http://support.microsoft.com/kb/228753/en-us 0xC000009D, or STATUS_DEVICE_NOT_CONNECTED: bad cabling, non-termination, or the controller is not able to obtain access to the hard disk. Klingt als müsste man mal Checkdisk laufen lassen, oder die physische Konsistenz der Sektoren auf den Platten prüfen. Gruss Velius Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 20. Februar 2006 Autor Melden Teilen Geschrieben 20. Februar 2006 An diesen möglichen Fehler haben wir auch schon gedacht, aber warum sollte der Controller oder die Platte immer zur gleiche Zeit Mist bauen? Peter Zitieren Link zu diesem Kommentar
Velius 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 Es geht ja nicht um den Controller, der Mist baut, sondern um einen Sektor der möglicherwiese defekt ist. Kann gut sein, dass dieser bei einem wiederholten Vorgang abgefragt wird (z.B.: Exchange maintenance...). Einfach mal ausführen, dann wisst ihr mehr. ;) Zitieren Link zu diesem Kommentar
santiago 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 Hallo, vielleicht liegt die Ursache in der automatischen Defragmentierung? Gruß santiago Zitieren Link zu diesem Kommentar
buitoni31 10 Geschrieben 20. Februar 2006 Melden Teilen Geschrieben 20. Februar 2006 Prüft doch mal ob um 00.30 zufällig Windows update läuft. Oder eine tägliche Sicherung? Ich hatte ein ähnliches Problem mit einem SBS2003, die Sicherung (orig. backup) wurde auf einer anderen Partition gemacht, hier schlug die Größenbegrenzung (4GB) zu, da diese Partition dummerweise FAT statt NTFS war. Vielleicht hilft es ja. Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 20. Februar 2006 Autor Melden Teilen Geschrieben 20. Februar 2006 Nachdem wir unsere Platten schon mehrmals auch mit Systemstart auf fehler geprüft haben, habe ich Velius Ratschlag befolgt und den möglichen Start der Exchange maintenance überprüft und mit 00:00h - 04:00h festgestellt. Da ich jetzt zur Bürozeit nichts von Hand starten kann habe ich mal zum Test die Startzeit für heute Nacht um 30min verzögert. Wenn hier der Fehler liegen sollte, dürfte der Server erst um 0:59:xxh stehenbleiben. buiton meinte Sicherung, ist es nicht, die läuft früher am Vorabend, Datensicherung auf externe Platten mit NTFS :) Santiago meint, Defragmentierung, die läuft aber erst nach 1:30h :) Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 21. Februar 2006 Autor Melden Teilen Geschrieben 21. Februar 2006 Also, mein Problem ist leider nicht um 30min. nach hinten gerutscht. Der Exchange Server maintenance task hat wohl auch nichts mit dem abschmieren des Servers zu tun. Um auch Plattenfehler nochmal auszuschliessen habe ich nach Büroschluss chckdisk für alle Platten bei Systemstart laufen lassen. Kein Problem erkannt. Wer hat noch Ideen? Danke Peter Zitieren Link zu diesem Kommentar
Velius 10 Geschrieben 21. Februar 2006 Melden Teilen Geschrieben 21. Februar 2006 Hast du auch das RAID Toll des Herstellers laufen lassen? Wenn du mit einem Hardware RAID arbeitest kann Chkdsk lediglich die logische Integrität des Datenträgers überprüfen, nicht die physische. Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 21. Februar 2006 Autor Melden Teilen Geschrieben 21. Februar 2006 Danke Velius, das habe ich in der tat noch nicht gemacht. Aber da das natürlich wiederum beim Booten gemacht wird, muss ich wieder mal Überstunden machen. Ergebnis wird morgen bekannt gemacht. Danke einstweile! Peter Zitieren Link zu diesem Kommentar
maverice 10 Geschrieben 21. Februar 2006 Melden Teilen Geschrieben 21. Februar 2006 also was mir so einfällt schau mal die schatten copy an .. wenn eingeschaltet zu welcher uhrzeit .. lg maverice Zitieren Link zu diesem Kommentar
Peter Diebold 10 Geschrieben 22. Februar 2006 Autor Melden Teilen Geschrieben 22. Februar 2006 Danke Maverice, werde das noch mal überprüfen. Also meine Raid- Disk Verify gestern Abend hat leider auch kein Ergebnis gebracht. Wieder 3h umsonst im Büro verbracht. Was könnte ich noch tun um dem Auslöser auf die Spur zu kommen? Danke Peter Zitieren Link zu diesem Kommentar
networker31 10 Geschrieben 22. Februar 2006 Melden Teilen Geschrieben 22. Februar 2006 Im Klartext heißt das, dass die csrss.exe eine Seite in den Speicher einlagern wollte, dies ist jedoch fehlgeschlagen (Status 0xc0000006), weil ein E/A (Ein/Ausgabe) Fehler aufgetreten ist. Als Hauptfehler wird der Status DEVICE_NOT_CONNECTED (Gerät nicht angeschlossen) ausgegeben. Das führte dazu, dass die csrss.exe beendet wurde (BugCheck 0xF4 CRITICAL_OBJECT_TERMINATION). Normalerweise führt das in Deinem Falle auch noch oder nur zu BugCheck 0xC000021A. In beiden Fällen wird das System aber heruntergefahren. Das Problem ist jetzt, dass man herrausfinden muss, welches Gerät sich unplanmäßig vom System trennt und vorallem, warum es sich trennt. Leider läßt sich das aus dem .log nicht wirklich entnehmen. Als Hauptursache für einen Einlagerungsfehler kommen in Frage: Speicher, Memory Controller (CPU), ATA Controller, Festplatte oder die Treiber für die Komponenten. Timing Fehler in Verbindung mit der Festplatte können auch dafür verantwortlich sein (Nach einer gewissen Häuffigkeit an Fehlern trennt das System die Platte ab). Spannungsschwankungen auf der +12V/+5V Leitung konnen auch zum abtrennen eines Laufwerkes führen (von daher Netzteil nicht ausgeschlossen). http://support.microsoft.com/kb/130801/de Kabel wechseln incl. terminierung Controller-Fehler oder defekt (Firmware update auf die HW) http://searchwinit.techtarget.com/tip/0,289483,sid1_gci841587,00.html Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.