godfather 10 Geschrieben 27. April 2005 Melden Teilen Geschrieben 27. April 2005 Hallo liebe Mitleidenden, ich hab da ein ganz besonderes Problem bei dem ich dringend Rat bräuchte. Ein SBS 2003 ohne SP1 läuft auf einem ASUS P4C800-E Board mit SATA Raid 1 und 1024MB ECC Ram. GData AVK2004, Acronis True Image Server 8, AVM KEN!3 sowie eine Uralt Navision Version laufen noch drauf. So far so good. Doch leider hat die Kiste die dumme Angewohnheit regelmäßig einen Bluescreen zu präsentieren. Nach einer Laufzeit von ca. 2-5 Tagen hagelt es aus dem nichts plötzlich eine Unmenge an Fehlermeldungen im sekundentakt die dann in einem Bluescreen enden. Vorher läuft alles wunderbar. Der Grund dafür ist mir bislang noch unbekannt. Ein Sicherungsjob beginnt um 02:00Uhr mit Acronis. Hier ein paar Fehlermeldungen: Anwendungsprotokoll: (Diese erscheint sogar zig tausendmal pro sek.! bis zum Bluescreen) Typ: Warnung Ereignis-ID: 8031 Quelle: MSExchangeAL Generiert: 27.04.2005 03:27:28 Kategorie: LDAP-Operationen Nachricht: Öffnen der LDAP-Sitzung für Verzeichnis 'server.firma.local' über Anschlussnummer 389 fehlgeschlagen. Verzeichnis gab den LDAP-Fehler:[0x1] Fehler beim Vorgang zurück. Weitere Informationen erhalten Sie unter Verzeichnisdienst: Typ: Warnung Ereignis-ID: 1867 Quelle: NTDS Inter-site Messaging Generiert: 27.04.2005 02:29:23 Kategorie: Standortübergreifender Messagingdienst Nachricht: Die Aufgabe, die Active Directory auf Änderungen in der Standorttopologie für das folgende standortübergreifende Transportobjekt überwacht, konnte nicht gestartet werden. Standortübergreifendes Transportobjekt: C... Mögliche Fehlerursache könnte ein temporärer Ressourcenmangel sein. Der Dienst wird neu gestartet. Zusätzliche Daten Fehlerwert: 58Der angegebene Server kann den angeforderten Vorgang nicht ausführen. DNS Server: Typ: Fehler Ereignis-ID: 1866 Quelle: NTDS Inter-site Messaging Benutzer: N/A Generiert: 27.04.2005 02:29:23 Kategorie: Standortübergreifender Messagingdienst Nachricht: Der standortübergreifende Messagingdienst hat die folgenden erweiterten Fehlerzeichenfolgen-Informationen von LDAP empfangen. Erweiterte Fehlerzeichenfolge: Zusätzliche Daten LDAP-Fehlerwert: 34Nicht verfügbar Erweiterter WIN32-Fehlerwert: 0Der Vorgang wurde erfolgreich beendet. Typ: Fehler Ereignis-ID: 4000 Quelle: DNS Benutzer: N/A Generiert: 27.04.2005 02:27:23 Nachricht: Der DNS-Server konnte Active Directory nicht öffnen. Dieser DNS-Server ist für die Verwendung von Informationen vom Verzeichnis für diese Zone konfiguriert und kann die Zone ohne es nicht laden. Stellen Sie sicher, dass das Active Directory ordnungsgemäß funktioniert, und laden Sie die Zone neu. Die Ereignisdaten enthalten den Fehlercode. Daten: 2A ... Dateireplikationsdienst: Typ: Fehler Ereignis-ID: 13539 Quelle: NtFrs Benutzer: N/A Generiert: 27.04.2005 02:59:07 Nachricht: Der Dateireplikationsdienst kann c:\sysvol\domain nicht replizieren, weil der Pfadname des replizierten Verzeichnisses nicht der vollständige Pfadname eines bestehenden zugreifbaren lokalen Verzeichnisses ist. System: Typ: Warnung Ereignis-ID: 56 Quelle: fasttx2k Benutzer: N/A Generiert: 27.04.2005 03:26:06 Nachricht: Arbeitsspeicher konnte nicht zugewiesen werden. Daten: 00 00 10 00 ... Typ: Fehler Ereignis-ID: 1050 Quelle: DhcpServer Benutzer: N/A Generiert: 27.04.2005 03:22:09 Nachricht: Der DHCP/BINL-Dienst des lokalen Computers hat einen Netzwerkfehler festgestellt. Fehler: 0x 2747 Daten: 47... (Dieser beginnt schon um 23:38Uhr im Minutentakt) Typ: Fehler Ereignis-ID: 2019 Quelle: Srv Benutzer: N/A Generiert: 27.04.2005 02:57:40 Nachricht: Der Server konnte keinen nicht ausgelagerten Poolspeicher reservieren, da der Pool leer war. Daten: 00 00 04 ... Nach einem Telefonat mit Acronis kennen die allerdings solche Fälle in Bezug auf 2003 Server nicht! Vielen Dank im Voraus für eure Hilfe! Zitieren Link zu diesem Kommentar
edv-olaf 10 Geschrieben 27. April 2005 Melden Teilen Geschrieben 27. April 2005 Hi, habe nur die erste Meldung (LDAP) gesehen. Vermute mal, dass dies die Ursprungs-Fehlerquelle sein könnte, auch wenn die Uhrzeit weiter hinten liegt. Welche Meldung kommt denn eigentlich als allererstes?? Scheint, als ob der LDAP-Zugriff auf den Verzeichnisdienst plötzlich nicht klappt, damit hängen alle anderen Dienste hintendran und sterben Stück für Stück ab. (AD-Replikation, NDS-Replikation, Messaging Dienst usw.). Alle Anfragen werden solange gepuffert (gecacht), bis kein Speicher mehr da ist. Da du auch schreibst, die eine Fehlermeldung kommt mehrere 1000x pro Sekunde, würde ich mit meinen Analysen dort (also mit LDAP, Port 389) beginnen. Ist leider nur ein Denkanstoß... Grüße Olaf Zitieren Link zu diesem Kommentar
dmetzger 10 Geschrieben 27. April 2005 Melden Teilen Geschrieben 27. April 2005 Wenn ich mir den zeitlichen Ablauf ansehe, halte ich auch ein Abschmieren des Arbeitsspeichers für möglich. Ich würde zuerst die RAM-Module prüfen. Zitieren Link zu diesem Kommentar
godfather 10 Geschrieben 27. April 2005 Autor Melden Teilen Geschrieben 27. April 2005 Ja, die Idee mit dem Arbeitsspeicher klingelte bei mir auch sofort... Allerdings die Tatsache das es ECC Speicher von Kingston ist, der von ASUS für dieses Board freigegeben worden ist... Tja, ist halt kein Intel Board :-( Ich glaube auch, ich werde testhalber mal den Speicher tauschen! Zitieren Link zu diesem Kommentar
DB1973 10 Geschrieben 29. April 2005 Melden Teilen Geschrieben 29. April 2005 Hallo godfather, das Problem ist höchstwahrscheinlich der Promise IDE Raid Controller auf dem P4C800. Auch ich habe exakt die gleichen Probleme, undefinierte Abstürze nach X Tagen. In deinem Ereignisprotokoll findest du die Event ID 56 (fasttx.sys) und 2019 (Poolspeicher). Diese habe ich auch, und in diesem Forum findest du einige Threads zu exakt diesem Problem (Gib mal ein in der Suche: promise 875). fasttx.sys ist der Promise RAID Treiber, die anderen Fehler ausser dem 2019 sind m.M. nur Sekundärfehler. Zu deinem Board: Du hast doch S-ATA Platten drin, nutzt den Promise überhaupt ? So viel ich weiss, war der doch nur für IDE ? Wenn du ihn nicht nutzt, kannst du ihn im Bios disablen, so wie die Leute schreiben ist nämlich nicht der Controller das Problem, sondern der Treiber bzw. die Promise Management Software, da streiten sich die Meinungen. Ich werde bei mir den RAID Controller disablen und den 3ware 7506 einbauen. (dieses Wochenende). Dann sollten die Probleme gelöst sein. Grüsse, Dieter Zitieren Link zu diesem Kommentar
godfather 10 Geschrieben 29. April 2005 Autor Melden Teilen Geschrieben 29. April 2005 Ja, habe ich auch schon durch Zufall gelesen. Fand aber nirgends eine Lösung für das Problem. Habe jetzt mal bei ASUS angefragt... Das kam für mich auch als mögliche Fehlerquelle in Betracht, dachte aber das es an mehr liegen müsste. Bin mal gespannt was bei dir rauskommt wenn Du den Promise deaktiviert hast. Leider kann ich den Promise nicht deaktivieren da daran zwei gespiegelte Platten dran hängen. Ich geb bescheid sobald von ASUS was kommt. Viel Spass am WE mit der Kiste!!! Zitieren Link zu diesem Kommentar
DB1973 10 Geschrieben 29. April 2005 Melden Teilen Geschrieben 29. April 2005 Hi, hatte gerade im Handbuch nochmal nachgeschaut, weil es mich interessiert hat, klar kann der Promise auch SATA (ich weiss sowas schon nach 2 Monaten nicht mehr *g)... Es wird der Promise sein ... ganz sicher.. da aber der Fehler bei uns nur alle 10 Tage auftritt, kann ich erst in einiger zeit ein hoffentlich positives Feedback liefern, Grüsse Dieter Zitieren Link zu diesem Kommentar
godfather 10 Geschrieben 2. Mai 2005 Autor Melden Teilen Geschrieben 2. Mai 2005 Bisher kam von ASUS nur eine lapidare Antwort: "Unsere Antwort: Hallo, das PROMISE ARRAY MANAGMENT Tool sollte nicht installiert werden, dieser verursacht speziell unter 2003 erhebliche Probleme. " Ist aber garnicht installiert!!! Zitieren Link zu diesem Kommentar
F-l-A 10 Geschrieben 2. Mai 2005 Melden Teilen Geschrieben 2. Mai 2005 Hallo zusammen, hatte das gleiche Prob auch schon mit W2k3, Asus und Promise. Bei uns hat leider auch nur ein neues Board geholfen. Nus so als Hinweis, die Windowsreperatur mit anderen Controller-Treibern hilft leider auch nicht. Viel Erfolg! Zitieren Link zu diesem Kommentar
Darkmind 10 Geschrieben 2. Mai 2005 Melden Teilen Geschrieben 2. Mai 2005 hallo, könnte es sowas in die richtung sein ?: http://www.mcseboard.de/showthread.php?t=17074&highlight=event+2019 Zitieren Link zu diesem Kommentar
DB1973 10 Geschrieben 3. Mai 2005 Melden Teilen Geschrieben 3. Mai 2005 hi Godfather, habe letztes WE unseren SBS umgebaut, d.h. den promise disabled und dafür den 3ware 7506 Raid Controller eingebaut. Bisher läuft der Rechner gut, nur noch ein paar Hinweise falls du dir auch einen Raid Controller von 3ware holen möchtest: Unter Windows Server ist der Rechner "fühlbar" schneller geworden, habe keine Leistungstests gemacht, die das belegen können, aber es fällt auf jeden Fall auf. Der 3ware ist unter DOS (z.B. Ghost) super langsam, mein 250GB Backup hat fast 8 Stunden gedauert. Dazu die Hotline von 3ware: Das wär normal, Ghost würde den 3ware nicht untersützen. Mir wurde Acronis Backup empfohlen, damit sollte es sehr schnell gehen. In ca. 10 bis 14 Tagen erzähle ich dir mal, ob alle Probleme gelöst sind, so lange lief unserer Server nämlich immer, bevor er dann mit den promise Fehler abstürzte. Grüsse, Dieter Zitieren Link zu diesem Kommentar
DB1973 10 Geschrieben 21. Mai 2005 Melden Teilen Geschrieben 21. Mai 2005 Hallo Godfather, unserer SBS läuft nach der Deaktvierung des Promise und Einbau eines RAID Controllers von 3 ware seit 17 Tagen ununterbrochen absolut stabil . Der Server gilt endgültig als stabil, wenn er 30 Tage durchgelaufen ist. Dann fahre ich ihn nochmals herunter, um Bandlaufwerke einzubauen, Backups zu machen und VPN einzurichten. Grüsse, Dieter Zitieren Link zu diesem Kommentar
edv-olaf 10 Geschrieben 23. Mai 2005 Melden Teilen Geschrieben 23. Mai 2005 @DB1973 Danke für die Rückmeldung, gut zu wissen! Zitieren Link zu diesem Kommentar
godfather 10 Geschrieben 31. Mai 2005 Autor Melden Teilen Geschrieben 31. Mai 2005 Also, es müssen die 2 Dienste gestoppt werden. Überprüfen sie ob der Service "Promise Array Message Agent/Server" nicht doch aktiv ist, bzw. MsgAgt.exe und/oder SrvAgt.exe. Seit dem läuft die Kiste stabil! ;-) Zitieren Link zu diesem Kommentar
DB1973 10 Geschrieben 21. Juni 2005 Melden Teilen Geschrieben 21. Juni 2005 Unser Server lief mit dem 3ware über 45 Tage absolut stabil, dann erst haben wir ihn wegen der Installation von SP1 heruntergefahren Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.