Deatheye 10 Geschrieben 6. April 2009 Melden Teilen Geschrieben 6. April 2009 Hallo zusammen Hab hier einen Server der unerwartete beendet wurde am Wochenende. Neben diesem Eintrag ist noch folgendes nach dem Neustart zu finden: Protokollname: System Quelle: Microsoft-Windows-WHEA-Logger Datum: 04.04.2009 15:03:47 Ereignis-ID: 19 Aufgabenkategorie:Keine Ebene: Warnung Schlüsselwörter: Benutzer: LOKALER DIENST Computer: ************ Beschreibung: Behobener Hardwarefehler. Fehlerquelle: Behobene Computerüberprüfung Fehlertyp: Bus-/Verbindungsfehler Prozessor-ID gültig: Ja Prozessor-ID: 0x2 Steckplatznummer: 0 Transaktionstyp: Nicht zutreffend Prozessorteilnahme: Lokaler Knoten ist Ursprung der Anforderung Anforderungstyp: Generischer Fehler Arbeitsspeicher/EA: Arbeitsspeicher Arbeitsspeicher-Hierarchieebene: Ebene 0 Zeitlimit: Nein Ereignis-XML: <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" /> <EventID>19</EventID> <Version>0</Version> <Level>3</Level> <Task>0</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2009-04-04T13:03:47.718Z" /> <EventRecordID>16320</EventRecordID> <Correlation ActivityID="{03D560C6-2E65-4CF3-AF99-326F0ABC3885}" /> <Execution ProcessID="1064" ThreadID="1528" /> <Channel>System</Channel> <Computer>************</Computer> <Security UserID="S-1-5-19" /> </System> <EventData> <Data Name="ApicIdValid">1</Data> <Data Name="ApicId">0x2</Data> <Data Name="MCABank">0</Data> <Data Name="MciStat">0xd200084000000800</Data> <Data Name="MciAddr">0x0</Data> <Data Name="MciMisc">0x0</Data> <Data Name="ErrorType">10</Data> <Data Name="TransactionType">256</Data> <Data Name="Participation">0</Data> <Data Name="RequestType">0</Data> <Data Name="MemorIO">0</Data> <Data Name="MemHierarchyLvl">0</Data> <Data Name="Timeout">0</Data> <Data Name="Length">1730</Data> Zitieren Link zu diesem Kommentar
Deatheye 10 Geschrieben 6. April 2009 Autor Melden Teilen Geschrieben 6. April 2009 Raw datan hab ich mal nicht mitgeposted. die Einträge sind sonst bei weitem zu lange. Die restlichen auch noch in kurzer Form: Protokollname: System Quelle: Microsoft-Windows-WHEA-Logger Datum: 04.04.2009 15:04:45 Ereignis-ID: 19 Aufgabenkategorie:Keine Ebene: Warnung Schlüsselwörter: Benutzer: LOKALER DIENST Computer: *********** Beschreibung: Behobener Hardwarefehler. Fehlerquelle: Behobene Computerüberprüfung Fehlertyp: Bus-/Verbindungsfehler Prozessor-ID gültig: Ja Prozessor-ID: 0x2 Steckplatznummer: 5 Transaktionstyp: Nicht zutreffend Prozessorteilnahme: Generisch Anforderungstyp: Generischer Fehler Arbeitsspeicher/EA: Generisch Arbeitsspeicher-Hierarchieebene: Generisch Zeitlimit: Nein Protokollname: System Quelle: Microsoft-Windows-WHEA-Logger Datum: 04.04.2009 15:05:46 Ereignis-ID: 19 Aufgabenkategorie:Keine Ebene: Warnung Schlüsselwörter: Benutzer: LOKALER DIENST Computer: *********** Beschreibung: Behobener Hardwarefehler. Fehlerquelle: Behobene Computerüberprüfung Fehlertyp: Bus-/Verbindungsfehler Prozessor-ID gültig: Ja Prozessor-ID: 0x3 Steckplatznummer: 5 Transaktionstyp: Nicht zutreffend Prozessorteilnahme: Generisch Anforderungstyp: Generischer Fehler Arbeitsspeicher/EA: Generisch Arbeitsspeicher-Hierarchieebene: Generisch Zeitlimit: Nein Hab bis jetzt leider keine Infos gefunden was der WHEA-Logger eigentlich ist und wie man die Einträge interpretiert. Jemand von euch ne Ahnung? Zitieren Link zu diesem Kommentar
JHD 10 Geschrieben 3. August 2009 Melden Teilen Geschrieben 3. August 2009 Hallo Deatheye, wir haben einen Server, bei dem dasselbe Problem auftritt. 2x Intel Xeon W5580 auf Supermicro X8DTN+ mit 6x8 GB DDR-3 PC3-8500 Reg. ECC Der Fehler tritt sowohl auf Prozessor-ID 0x0 als auch 0x10 auf: Protokollname: System Quelle: Microsoft-Windows-WHEA-Logger Datum: 03.08.2009 16:09:16 Ereignis-ID: 19 Aufgabenkategorie:Keine Ebene: Warnung Schlüsselwörter: Benutzer: LOKALER DIENST Computer: XXXXXXXXXXX.YY.ZZ.de Beschreibung: Behobener Hardwarefehler. Fehlerquelle: Behobene Computerüberprüfung Fehlertyp: Speichercontrollerfehler Prozessor-ID gültig: Ja Prozessor-ID: 0x10 Steckplatznummer: 8 Transaktionstyp: Nicht zutreffend Prozessorteilnahme: Nicht zutreffend Anforderungstyp: Nicht zutreffend Arbeitsspeicher/EA: Nicht zutreffend Arbeitsspeicher-Hierarchieebene: Nicht zutreffend Zeitlimit: Nicht zutreffend Habt Ihr mittlerweile eine Lösung des Problems gefunden? Wenn ja: Woran lag es? Wie sah Eure System-Konfiguration aus? Grüße JHD Zitieren Link zu diesem Kommentar
LukasB 10 Geschrieben 3. August 2009 Melden Teilen Geschrieben 3. August 2009 Die W-CPUs sind für Workstations gedacht, nicht für Server. Nebenbei: Guckt in das Management-Log des Serviceprozessors (ILO/RSA/IMM/DRAC) - dort sollte sich wesentlich bessere Fehlermeldungen finden lassen. Zitieren Link zu diesem Kommentar
JHD 10 Geschrieben 3. August 2009 Melden Teilen Geschrieben 3. August 2009 Die W-CPUs sind für Workstations gedacht, nicht für Server. Nebenbei: Guckt in das Management-Log des Serviceprozessors (ILO/RSA/IMM/DRAC) - dort sollte sich wesentlich bessere Fehlermeldungen finden lassen. Das ist bekannt. Allerdings haben wir CPUs mit einer hohen Integer-Leistung pro Kern benötigt. Und da konnten die Schleicher aus der 7000er-Reihe nicht mithalten... Aus diesem Grund sind sie nun in einem Server gelandet. Supermicro-Boards unterstützen den offenen Standard "IPMI". Da werden wir jetzt in der Tat noch mal zur Analyse einsteigen, bevor wir das Board tauschen... Kann m. E. nur an einem defekten RAM-Slot liegen... Grüße JHD Zitieren Link zu diesem Kommentar
Deatheye 10 Geschrieben 1. Dezember 2009 Autor Melden Teilen Geschrieben 1. Dezember 2009 Doh, musste gerade intern nach schauen was das genau war, gerade zufällig hier drüber gestolpert. Wir hatten das damals nur einmal. Nach zwei weitern Monaten ohne jemals nochmal einen unerwarteten reboot zu haben haben wir den Fall intern abgeschlossen. Wir haben also nie wirklich herausgefunden was da genau passiert ist und es passierte bei uns nur einmal. Bei Euch das Problem öfters aufgetretten? Inzwischen behoben? Oder wie bei uns nicht öfter aufgetretten? Ich kann nur noch nachschauen was das System im moment für ne Hardware hat. Falls allerdings seit dem die HDDs in ein anderes Server gehäuse eingebaut wurden sehe ich das nicht. Könnte also sein, dass zum damaligen Zeitpunkt auch andere Hardware war. Supermicro X7DWN+ 1x Intel Xeon E5405 4 x 2 GB DDR 2 ECC PC2-5300 Zitieren Link zu diesem Kommentar
JHD 10 Geschrieben 2. Dezember 2009 Melden Teilen Geschrieben 2. Dezember 2009 Bei Euch das Problem öfters aufgetretten? Inzwischen behoben? Oder wie bei uns nicht öfter aufgetretten? Ich kann nur noch nachschauen was das System im moment für ne Hardware hat. Falls allerdings seit dem die HDDs in ein anderes Server gehäuse eingebaut wurden sehe ich das nicht. Könnte also sein, dass zum damaligen Zeitpunkt auch andere Hardware war. Supermicro X7DWN+ 1x Intel Xeon E5405 4 x 2 GB DDR 2 ECC PC2-5300 Jo, ist bei uns ständig aufgetreten. Dasselbe Problem hatten wir mit einem Austausch-Board der Firma Tyan, mit einer alternativen CPU sowie mit anderen Speichermodulen. Die Maschine war mittlerweile bei Supermicro, wo sie wochenlang nach der Ursache gesucht haben. Mittlerweile gibt es eine Lösung: Im BIOS den C1-State bei den CPU-Einstellungen disablen. Danach tritt der Fehler, der zu dem WHEA-Logger-Eintrag führt, nicht mehr auf... Ist vorerst wohl nur ein Workaround, aber eine endgültige Lösung scheint es noch nicht zu geben. (Wie gesagt: Scheint ein grundsätzliches Problem zu sein, da bei einem Tyan-Board derselbe Fehler aufgetreten ist.) Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.