Jump to content

Supermicro Server mit SBS 2011 friert sporadisch ein


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Guten Abend,

 

ich wende mich nun an Euch, da ich mit meinem Latein endgültig am Ende bin.

Könnt Ihr mir vielleicht weiterhelfen?

 

Folgende Situation:

 

Irgendwann ist der Server im Netzwerk nicht mehr vorhanden.

Wenn ich dann am Server stehe und mit der Maus hin und herfahre, startet der Monitor und der Anmeldebildschirm erscheint mit der Aufforderung "Drücken Sie STRG ALT und Entf....."

Nur kann ich diese Tastenkombination zwar drücken, es tut sich aber nichts.

Die Maus bewegt sich jedoch noch.

Am Server selbst, blinkt im ca. Sekundentakt die S-ATA-Controller-Zugriff's-LED, jedoch aber keine LED der Festplatten.

 

Ich habe einen neuen Supermicro-Server im Einsatz mit folgender Hardware-Ausstattung:

 

- Supermicro Mainboard X8DTL-iF

- 2x Intel Xeon E5606 (2,13GHz Quad-Core)

- 6x 4GB DDR3-1666ECC-Registered Speichermodule

- 3x Western Digital WD2003FYYS, 2TB, 64MB, Raid-Edition

- alles in einem Supermicro-Tower-Gehäuse mit 665Watt-Netzteil

- Software: Microsoft Server SBS 2011 & Symantec Endpoint Protection 12.1

 

Die Festplatten laufen im Raid1-Verbund, die dritte läuft als "Hotspare".

Zwei Partitionen:

c:\ Systemlaufwerk - 350GB

d:\ Datenlaufwerk - 1,5TB

 

Vor 2 Wochen habe ich das Betriebssystem zusammen mit allen aktuellen Treibern und Updates installiert sowie auch die SEP V12.1 von Symantec.

Danach lief der Server bis letzte Woche Donnerstag durch.

Am letzten Freitag habe ich dann den Server dort aufgestellt, wo er hin sollte und habe die auf USB-Platten gesicherten Daten (ca. 700GB) auf die Daten-Partition kopiert.

 

Anschließend habe ich nur noch die USB-Platten (2 Stück) formatiert und in die SBS 2011-Server-Sicherung eingebunden.

Mehr nicht.

 

Am Samstag in der früh gegen 5:00 Uhr ist der Server dann einfach stehengeblieben.

Am Montag habe ich ihn neu gestartet, dann ist er am Dienstag wieder gegen 1:00 Uhr stehengeblieben.

Das ganze ging nun so jeden Tag, seitdem ich die Daten auf den Server kopiert habe. Vorher lief er fast eine Woche ununterbrochen durch.

 

Die Laufzeiten sind jedoch sehr unterschiedlich.

Nach dem ersten "Reset" lief er nur 9 Stunden, nach dem zweiten, knapp 10 Stunden, nach dem dritten Reset dann 11 Stunden und nach dem vierten Reset dann sogar 16 Stunden.

Die Spannungsversorgung ist in Ordnung - drei verschiedene USV-Anlagen mit Dauerwandlertechnologie versucht.

 

In den Ereignisprotokollen ist nichts eingetragen.

Es wird kein Dienst oder ähnliches gestartet, nachdem der Server stehen bleibt.

 

Heute habe ich mittels "Toolhouse TestOS" mit seinem eigenen Betriebssystem den RAM-Speicher, sowie CPU's und die Laufwerke getestet - keine Probleme.

 

Nun habe ich den Server wieder am laufen und warte wieder ab - jedoch diesmal mit deaktiviertem Bildschirmschoner.

Auch habe ich die SuperDoctor-Software auf dem Desktop geöffnet, sowie die AntiViren-Software von Symantec.

Ich hoffe, hier morgen zu sehen, ob sich irgendetwas in Sachen Temperaturen oder Spannungen sehr arg verändert hat, was zu diesem "Stillstand" führen könnte.

 

Könnt Ihr mit diesem Verhalten etwas anfangen und mir vielleicht einen Rat geben?

 

Mittlerweile, durch die vielen Abstürze, musste ich die Symantec-Datenbank (ASA-DB) schon mehrmals zurücksichern bzw. wiederherstellen, wie auch die Exchange-Datenbank.

Beide wurden durch die Abstürze beschädigt, dass sie nicht mehr gestartet werden konnten.

 

Bitte, wenn Ihr etwas wisst, wo ich noch suchen kann, meldet Euch bei mir.

 

Vielen Vielen Dank

 

Grüße

Marcus

Link zu diesem Kommentar

Lass den Server über das WE mit einem gebooteten Linux oder im BIOS stehen. Dann siehst Du vielleicht ob es das OS oder die HW ist. Gibt es am Server ein Hardware-Event-Log.

 

Du hast auch beachtet entsprechend freigegebene Speicher und HDD zu verwenden? Hat der Server während des Transports bzw. danach Kondensationsfeuchtigkeit abbekommen?

Link zu diesem Kommentar

GGF. würde ich den Virenschutz deinstallieren. Zudem gibt es für w2k8 R2 keine Downloads, keine Ahnung ob das wichtig ist. Du hast auch alle Steckverbindungen geprüft? USV-Agent ist auch aktuell? Das USV-Kabel ist passend?

 

Anbei meine Verdachtsliste:

 

USB-HDD

Symantec

Mainboard

CPU

 

Die HDD an einem Onboard-RAID zu betrieben ist eher schlecht, die Performance dazu eher sehr mies. Du hast viel Spaß bei einem Mainboard-Tausch.

Link zu diesem Kommentar

Guten Morgen,

 

danke für Eure Antworten.

 

Gerade eben war ich wieder am Server.

Er "war" wieder gestanden.

Alles Desktopsymbole und Programme waren noch offen und blinkten sogar noch vor sich hin.

Auch die Spannungen wurden noch alle angezeigt und die zeiger bewegten sich noch.

 

Jetzt kommts - alle 3 Festplatten waren abgeschaltet (man hört sich normalerweise recht gut).

Ich habe jetzt einfach die zweite Festplatte kurz herausgenommen und wieder reingesteckt.

Beim Herausnehmen, starteten sofort auch die anderen Platten wieder und der Server lief wieder an.

 

Was ist denn das jetzt?

 

Gibt es hier irgendwelche Einstellungen, die die HDD's herunterfahren sollen - auch während des Betriebs?

 

Der SCAN vom AntiVirus lief nämlich noch, er hing zwar an einer Datei fest, als ich zum Server kam, aber er lief sofort weiter, nachdem ich eine Platte gezogen und wieder gesteckt hatte.

Natürlich kamen dann viele Fehlermeldungen, bzgl. RAID1 degraded usw.

Aber die 3. Platte (Hotspare) ist sofort eingesprungen.

 

Spinn ich? Gibts sowas?

 

Grüße

Marcus

Link zu diesem Kommentar

Guten Abend,

 

danke für den Tip.

Hier die Ergebnisse:

 

- im SBS2011 steht die Enegieeinstellung auf "ausbalanciert (default)" und die "Abschaltung der Festplatten" ist deaktiviert.

- im BIOS, weder im Mainboard-BIOS noch im Adaptec-BIOS des Onboard S-ATA-Controllers (ist ein ICH10 mit Adaptec-Codierung, kann aber auch auf INTEL umgeschaltet werden) gibt es eine Abschaltung der Festplatten, oder ähnliches.

 

Als ich vorhin im BIOS suchte, schalteten sich die Festplatten nach kurzer Zeit wieder aus - ich hörte dies an den Spindelmotoren, welche heruntergefahren sind.

Erst nachdem ich wieder aus dem BIOS ausgestiegen bin und der Rechner neu startete, liefen die Platten wieder an.

 

Von diesem Server habe ich dieses Jahr 4 stück aufgestellt, bis auf einen Unterschied - bisher hatte ich nur 1TB-Festplatten von Seagate verbaut, nur in diesem, welcher jetzt Probleme macht, sind 2TB-Festplatten verbaut.

 

Wisst Ihr, was ich jetzt tun kann?

Oder können die Platten selbst einen "Energiesparmodus" besitzen?

 

Grüße

Marcus

Link zu diesem Kommentar

Es gibt im BIOS die ACPI-Config.

Dort habe ich aber noch nicht wirklich etwas verändert.

 

Die Einstellungen lauten:

 

High Precision Event Timer - eingeschaltet (standard)

ACPI Aware O/S - eingeschaltet (standard)

ACPI APIC Support - eingeschaltet (standard)

APIC ACPI SCI IRQ - ausgeschaltet (standard)

Headless Mode - ausgeschaltet (standard)

ACPI Version Features - ACPI 2.0 (standard)

NUMA-Support - eingeschaltet (standard)

WHEA Support - eingeschaltet (standard)

 

Bei den anderen ausgelieferten Servern habe ich diese Einstellungen nie verändert.

 

Mit Supermicro werde ich morgen mal in Kontakt treten.

Hoffentlich spricht da jemand deutsch oder mein Englisch reicht soweit aus.

 

Ich kenne schon manche Einstellungen aus alten PC's, in denen man z.B. einstellen konnte, nach welcher Zeit sich die Festplatten abschalten sollten usw.

Aber in dem Supermicro-BIOS finde ich nicht mal etwas ähnliches.

 

Seltsam oder?

 

Ein Temperatur-Problem ist es jedenfalls nicht, denn ich habe die Platten vorhin mal ausgebaut - Handwarm.

Link zu diesem Kommentar
  • 2 Monate später...

Hallo,

 

etwas spät, aber jetzt doch noch:

 

Der Fehler lag an den drei Festplatten.

Dort war von WD eingestellt, dass sie sich nach einigen Sekunden in ein Art Ruhezustand setzen sollen, wenn keine Aktivität stattfindet.

 

WD konnte mir telefonisch nicht helfen, jedoch aber Supermicro.

 

Mit einem "DOS-Tool", konnte ich den Timer abschalten.

 

Grüße und Vielen Dank nochmals für Eure Hilfe

 

Marcus

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...