Howard 10 Geschrieben 5. August 2008 Melden Teilen Geschrieben 5. August 2008 Hallo zusammen, wir haben aktuell ein großes Problem mit unserem Exchange-Server. Der Server ist in immer kürzeren Intervallen (Anfangs stündlich zum Schluss im minutentakt) abgestürzt. Zwar wurden unendlich viele Dumps generiert, alle weisen aber eine andere Fehlermeldung aus. Wir haben uns nach diversen Hardwaretest (mit der HP SmartStart CD) und der Installation der aktuellen Treiber (mit der HP Firmware-CD) dazu entschlossen, eine Reparaturinstallation durchzuführen. Die Reparaturinstallation startet auch korrekt mit dem kopieren der Daten, startet neu und sollte dann eigentlich in die grafischen Oberfläche kommen. Nur bevor er das tut steigt der Server aus und bootet neu. In den abgesicherten Modus komm ich noch rein, nur kann das Setup dort nicht weiter durchgeführt werden. Wenn ich die Reparaturinstallation neu anstossen möchte weißt mich Windows daraufhin, das noch eine aktuelle Installation (oder Update) ausgeführt wird. Ich kann dann lediglich diese Installation fortsetzen mit dem gleichem Ergebniss. Hat jemand eine Idee, wie ich aus der Bootschleife rauskommen (abgesehen von einer Neuinstallation) bzw. wie ich die noch aktive Reparaturinstallation abbrechen kann? Die Hardware scheint, sofern man den HP Tools Glauben schenken darf, in Ordnung zu sein. RAM, Prozi etc. wurden auch schon getauscht... Zitieren Link zu diesem Kommentar
CoolAce 17 Geschrieben 5. August 2008 Melden Teilen Geschrieben 5. August 2008 was sagt dein Eventlog Zitieren Link zu diesem Kommentar
zahni 554 Geschrieben 5. August 2008 Melden Teilen Geschrieben 5. August 2008 Welche Fehler kamen ? Speicher mit diesem Tool testen: Memtest86+ - Advanced Memory Diagnostic Tool Der aktuelle Ram-Test von HP auf den Smartstart-CD's findet in der Regel RAM-Fehler nicht vernünftig. -Zahni Zitieren Link zu diesem Kommentar
Howard 10 Geschrieben 5. August 2008 Autor Melden Teilen Geschrieben 5. August 2008 Hallo, danke erstmal für Eure Antworten. Nachfolgend die Ergebnisse des ersten und des letzten Minidumps: Der erste Dump vom Samstag: *********************** Probably caused by : Pool_Corruption ( nt!ExDeferredFreePool+33c ) Followup: Pool_corruption --------- DRIVER_CORRUPTED_EXPOOL (c5) An attempt was made to access a pageable (or completely invalid) address at an interrupt request level (IRQL) that is too high. This is caused by drivers that have corrupted the system pool. Run the driver verifier against any new (or suspect) drivers, and if that doesn't turn up the culprit, then use gflags to enable special pool. Debugging Details: ------------------ BUGCHECK_STR: 0xC5_2 CURRENT_IRQL: 2 FAULTING_IP: nt!ExDeferredFreePool+33c fffff800`011a9eba 488908 mov qword ptr [rax],rcx CUSTOMER_CRASH_COUNT: 1 DEFAULT_BUCKET_ID: DRIVER_FAULT_SERVER_MINIDUMP PROCESS_NAME: GetEngineFiles. TRAP_FRAME: fffffadf5cea7860 -- (.trap fffffadf5cea7860) NOTE: The trap frame does not contain all registers. STACK_COMMAND: kb FOLLOWUP_IP: nt!ExDeferredFreePool+33c fffff800`011a9eba 488908 mov qword ptr [rax],rcx SYMBOL_STACK_INDEX: 3 FOLLOWUP_NAME: Pool_corruption IMAGE_NAME: Pool_Corruption DEBUG_FLR_IMAGE_TIMESTAMP: 0 SYMBOL_NAME: nt!ExDeferredFreePool+33c MODULE_NAME: Pool_Corruption FAILURE_BUCKET_ID: X64_0xC5_2_nt!ExDeferredFreePool+33c BUCKET_ID: X64_0xC5_2_nt!ExDeferredFreePool+33c Followup: Pool_corruption ********************************* Und der letzte (verfügbare) Dump von gestern: ********************************* Unable to load image Ntfs.sys, Win32 error 2 *** WARNING: Unable to verify timestamp for Ntfs.sys *** ERROR: Module load completed but symbols could not be loaded for Ntfs.sys BugCheck 24, {19033d, fffffadf5d4be540, fffffadf5d4bdf50, fffffadf5c873ad1} Probably caused by : Ntfs.sys ( Ntfs+7aad1 ) Followup: MachineOwner NTFS_FILE_SYSTEM (24) If you see NtfsExceptionFilter on the stack then the 2nd and 3rd parameters are the exception record and context record. Do a .cxr on the 3rd parameter and then kb to obtain a more informative stack trace. Debugging Details: ------------------ CUSTOMER_CRASH_COUNT: 11 DEFAULT_BUCKET_ID: NULL_CLASS_PTR_DEREFERENCE PROCESS_NAME: System CURRENT_IRQL: 0 ERROR_CODE: (NTSTATUS) 0xc0000005 - Die Anweisung in "0x%08lx" verweist auf Speicher in "0x%08lx". Der Vorgang "%s" konnte nicht auf dem Speicher durchgef hrt werden. READ_ADDRESS: 0000000000000010 BUGCHECK_STR: 0x24 LAST_CONTROL_TRANSFER: from fffffa80006730f0 to fffffadf5c873ad1 FOLLOWUP_IP: Ntfs+7aad1 fffffadf`5c873ad1 8b4810 mov ecx,dword ptr [rax+10h] SYMBOL_STACK_INDEX: 0 FOLLOWUP_NAME: MachineOwner MODULE_NAME: Ntfs IMAGE_NAME: Ntfs.sys DEBUG_FLR_IMAGE_TIMESTAMP: 45d699c1 SYMBOL_NAME: Ntfs+7aad1 STACK_COMMAND: .cxr 0xfffffadf5d4bdf50 ; kb FAILURE_BUCKET_ID: X64_0x24_Ntfs+7aad1 BUCKET_ID: X64_0x24_Ntfs+7aad1 Followup: MachineOwner ****************************************** Zwischen diesen Dumps finden sich noch ca. 40 weitere, soweit ich das sehe wurden immer unterschiedliche Prozesse verantwortlich gemacht. Den Verifier.exe habe ich auch schon ausgeführt, damit fing das Schlamasel aber erst richtig an, der Verifier wollte einen Neustart, danach ging der Server nicht mal mehr in den abgesicherten Modus. Vor dem Verifier-Befehl fuhr das Ding wenigstens noch komplett hoch... Im Systemprotokoll finden sich nur Meldungen vom "eventlog": "Der Computer ist nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x000000c5 (0x0000000000000008, 0x0000000000000002, 0x0000000000000001, 0xfffff800011a9b28). Ein volles Abbild wurde gespeichert in: C:\WINDOWS\MEMORY.DMP. Memtest hab ich soeben noch mal angeworfen, bisher keine Fehler. Wir haben aber gestern schon mit den unterschiedlichsten RAM-Konfigurationen rumgetestet... Zitieren Link zu diesem Kommentar
zahni 554 Geschrieben 5. August 2008 Melden Teilen Geschrieben 5. August 2008 Pauschal bei deisem Fehler: unbedingt ein aktuelles Supportpack von HP installieren und dann diesen Hotfix: An update enables support for Storport virtual miniports in Windows Server 2003 Siehe dazu auch: You receive a Stop error message after you install update 932755 or 941276 on an HP ProLiant server that is running Storport in Windows Server 2003 Der storport.sys von 1. Link ist aber neuer. Siehe dazu auch Search HP US - Search results for 'storport.sys' Wie Du die vermurkste Installtion zum Laufen bekommst, kann ich Dir leider auch nicht sagen. -Zahni Zitieren Link zu diesem Kommentar
Howard 10 Geschrieben 5. August 2008 Autor Melden Teilen Geschrieben 5. August 2008 Hi Zahni, aktuellstes Support Pack für ProLiant ist drauf. Der Hotfix ist allerdings nicht installiert worden, ist nochmal ein versuch wert (sofern ich die ver***** Rep-Inst. irgendwie abwürgen kann....) Aber so richtig leuchtet mir nicht ein, warum der Server sich dann plötzlich entschließt permanent abzuschmieren und neu zu booten. Zu diesem Zeitpunkt hat sich an der Systemkonfig nichts verändert. Irgendwie deutet das doch eher auf ein Hardwareproblem hin... Memtest läuft im übrigens seit ca. 2 h ohne Probleme durch. Morgen wird dann erstmal das Systemboard von HP getauscht. Die waren sich nun doch nicht sicher, das es ein zwingend um ein Softwareproblem handelt. Zitieren Link zu diesem Kommentar
Howard 10 Geschrieben 6. August 2008 Autor Melden Teilen Geschrieben 6. August 2008 Kurze Abschlussmeldung: Heute morgen wurde das Systemboard getauscht, auf diesem lag eine kleine, abgebrochene Metallklammer. Evtl. könnte das Ding irgendwie was mit den ersten Abstürzen zu tun haben (zumindest lt. HP). Dann haben wir durch die fehlerhaften Reparaturinstallationen dem Server den Rest gegeben.:rolleyes: Es geht nichts über eine vernüftigen Datensicherung und die IDR-Option...;) Nu läuft es wieder... Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.