Fritz! 0 Geschrieben 24. Februar 2019 Melden Teilen Geschrieben 24. Februar 2019 (bearbeitet) Moin, habe hier gerade ein Problem mit einem SBS2011 Server, der eigentlich kurz vor der Rente steht, aber mich doch noch mal ärgern möchte. Seit ein paar Wochen stürtzt er ab & zu Mittags punkt 12 Uhr ab, bzw. machte einen Neustart. Da dort 2 gespiegelte SSDs als Systemplatten drinne sind, ist der nach 5 Minuten wieder da und viele Mitarbeiter haben das garnicht gemerkt (und somit wurde es mir auch erst vor 4 Tagen erzählt). Erst als ich vor ihren Ohren mal neulich einen Neustart machte, sagten sie mir, das Geräusch (Supermicro Hardware) würde er dann auch immer machen, wenn er "mal kurz weg war". Das ist aber nicht mein Problem, sondern er hat am Freitag wieder einen Neustart gemacht um 12:00, ich wurde angerufen, da ein Programm nicht mehr lief. Wahrscheinlich ein Dienst auf dem Server nicht sauber gestartet, also habe ich einen Neustart per RDP veranlaßt, aber dabei gleich eine einfache Festplattenüberprüfung von Laufwerk C: geplant. Die Mitarbeiter gingen dann schon mal nach Hause, hatte also keine Eile. Nch 2 Stunden konnte ich immer noch nicht auf den Server zugreifen, mußte aber dringent zu einer Klausur und dachte mir nur, dauert wohl noch ein wenig. Am Sonntag Mittag fährst du eh hin, wird bis dahin schon fertig sein. Sonntag Mittag dann einen Monitor (Server hat kein IPMI) an den Server angeschlossen, er war noch beim chkdsk, hing aber in einer Schleife (derselbe Block immer wieder). Also reset gedrückt und das wars. Beim ersten Mal 35 Minuten gewartet, nichts (nur der durchlaufende Balken vom SBS-Server), dann Reset, F8 (abgesicherter Modus mit Netzwerk, geht. Läuft, komme ins Internet mit dem Serer, aber sonst geht nichts im Lan (logisch). Da mir Hard Disk Sentinel schon vor 3 Wochen gesagt hat, ich solle die beiden SSDs mal tauschen (Samsung 850 evo 500 GByte), hatte ich 2 neue (Samsung 860 pro 512 GByte) schon liegen und habe die nacheinenader getauscht und die Software (hängt am Intel Onboard RAID 1 Controller) sie jeweils wieder neu aufbauen lassen, nach 2 x 1 Stunde waren die SSDs getauscht, geht trotzdem nicht. Wenn ich ein Systemprotokoll beim Start (F8) erstellen lasse, schreibt er beim normalen (abstürzenden) Modus nicht in die ntbtlog.txt, im abgesicherten Modus macht er das (hilft mir ja aber nicht wirklich weiter). Ist das normal? Habe außerdem ein sfc /scannow laufen lassen (ohne Fehler), auch habe ich die Datenplatten (2 x 2 TByte HDDs gespiegelt) prüfen lassen, auch OK. Auf dem Server läuft auch ein Exchange, der genutzt wird. Backup ist vorhanden (NetJapan Active Image), die Mistsoftware läuft aber nicht im abgesicherten Modus und ich Blödmann habe mir keinen Boot-USB-Stick gebaut. Hat da jemand eine Idee, wo ich noch suchen kann? Danke Edit: Achja, Speicher habe ich getauscht, keine Änderung (waren 4 Module). Der Server ist ein Supermicro X9SAE-V (BIOS fast aktuell) mit einem Xeon E3-1225 v2, 24 GByte Ram und 500 GByte System (2 x SSD gespiegelt) und 2 TByte Daten (2 x HDD gespiegelt). Das Ganze am Onboard Intel RAID-Controller (der dabei ist), kein Zusatz-Controller. Im BIOS Event log waren im Sommer 2018 mal 4 ECC-Fehler vom Speicher drinnen. Edit2: wenn ich auf „Computerrepatur“ gehe, fragt er mich nach dem Passwort des Administrators, der wurde ja bei der Installation vom SBS2011 damals garnicht benötigt. Auch das Passwort des damals angelegten Admin-Users geht nicht. Einen anderen User kann ich nicht auswählen. bearbeitet 25. Februar 2019 von Fritz! Edit Zitieren Link zu diesem Kommentar
MurdocX 957 Geschrieben 25. Februar 2019 Melden Teilen Geschrieben 25. Februar 2019 Wurde denn im Nachgang chkdsk.exe nochmal ordentlich ausgeführt? Zitieren Link zu diesem Kommentar
zahni 558 Geschrieben 25. Februar 2019 Melden Teilen Geschrieben 25. Februar 2019 Hört sich so an, als ob die SSDs Schrott sind. Die halten nicht ewig. Besonders wenn sie älter sind. Zitieren Link zu diesem Kommentar
Nobbyaushb 1.484 Geschrieben 25. Februar 2019 Melden Teilen Geschrieben 25. Februar 2019 (bearbeitet) vor 57 Minuten schrieb zahni: Hört sich so an, als ob die SSDs Schrott sind. Die halten nicht ewig. Besonders wenn sie älter sind. Hat er schon getauscht, jedenfalls geschrieben... Zitat (Samsung 850 evo 500 GByte), hatte ich 2 neue (Samsung 860 pro 512 GByte) schon liegen und habe die nacheinenader getauscht und die Software (hängt am Intel Onboard RAID 1 Controller) sie jeweils wieder neu aufbauen lassen, nach 2 x 1 Stunde waren die SSDs getauscht, geht trotzdem nicht. Da hilft m.E. nur, alle Logs anzuschauen, die sind auch bei F8 vorhanden. bearbeitet 25. Februar 2019 von Nobbyaushb Zitieren Link zu diesem Kommentar
zahni 558 Geschrieben 25. Februar 2019 Melden Teilen Geschrieben 25. Februar 2019 vor 21 Minuten schrieb Nobbyaushb: Hat er schon getauscht, jedenfalls geschrieben... Ok, hast recht. Aber "Intel OnBoard"... Möglicherweise ist der Dateisystem-Fehler mitgewandert, weil man zuerst die noch funktionsfähige SSD im RAID1 getauscht hat. Intel Onboard ist nix für Server. 1 Zitieren Link zu diesem Kommentar
Fritz! 0 Geschrieben 25. Februar 2019 Autor Melden Teilen Geschrieben 25. Februar 2019 Das der Intel OnBoard-Controller Mist ist, weiß ich inzwischen auch. Damals fand ich das eine gute Idee, aber man lernt ja dazu. Zwischenzeitlich hatte ich alle 4 Festplatten in meinen Leihserver (Supermicro X10SLM, etwas neuer) umgebaut, dort nicht wirklich zum laufen bekommen, aber es zumndest geschafft, den neuen Server mit den alten Platten in den "Computer reparieren" Modus (hier fragte er nicht nach dem Administrator Kennwort) zu starten und dort mehrfach chkdsk durchlaufen lassen. In der Tat, waren dort etliche Fehler vorhanden, die alle beseitigt wurden. Der dritte Durchlauf war dann auch fehlerfrei. Lief aber trotzdem nicht. Zurückgebaut in die alte Hardware, "Computer reparieren" scheitert immer noch am fehlenden Administrator-Kennwort, aber abgesicherter Modus geht nach wie vor. Dann den Intel-Raid-Treiber erneuert, Neustart, immer noch doof, dann den Grafiktreiber (ist eine Intel HD-Graphic P4000, nie wieder beim Server), danach brauchte er ewig für den Neustart und es ging! Da es 6:40 Uhr war (die ersten Mitarbeiter sind schon mal um 7:00 Uhr da...), habe ich ihn laufen lassen (Exchange da, Daten da, keine Fehlermeldung) und werde heute Abend noch mal ein wenig suchen, alles wieder zusammenbauen und schauen, ob er nach einem Neustart immer noch läuft. Auf jeden Fall schon mal ein Restore-Medium vom Backup-Programm gemacht und eine eMail an NetJapan angefangen, daß es ziemlich doof ist, mit deren Programm kein Backupmedium mehr herstellen zu können, wenn es im abgesicherten Modus läuft. Werde heute Abend berichten, was er beim Neustart gesagt hat, Danke schonmal. vor 3 Stunden schrieb zahni: Hört sich so an, als ob die SSDs Schrott sind. Die halten nicht ewig. Besonders wenn sie älter sind. Sind da die jeweiligen "pro" SSD merklich besser? Damals mußte ich eine 850 evo nehmen, weil die alte Systemplatte defekt war und innerhalb einer Stunde was neues rein mußte. Und lief "eigentlich" gut und vor allen Dingen schön schnell. In den neuen Server hat Extra-Computer jetzt "Micron 5200 ECO" vorgeschlagen, den neuen Server (Server 2016 mit HyperV und 3 VMs) wollte ich eigentlich nur noch mit SSDs bestücken. Aber mit MegaRAID 9361 Controller. Zitieren Link zu diesem Kommentar
Nobbyaushb 1.484 Geschrieben 25. Februar 2019 Melden Teilen Geschrieben 25. Februar 2019 vor 7 Minuten schrieb Fritz!: Sind da die jeweiligen "pro" SSD merklich besser? Damals mußte ich eine 850 evo nehmen, weil die alte Systemplatte defekt war und innerhalb einer Stunde was neues rein mußte. Und lief "eigentlich" gut und vor allen Dingen schön schnell. In den neuen Server hat Extra-Computer jetzt "Micron 5200 ECO" vorgeschlagen, den neuen Server (Server 2016 mit HyperV und 3 VMs) wollte ich eigentlich nur noch mit SSDs bestücken. Aber mit MegaRAID 9361 Controller. Es gibt irgendwo einen Blog von Jan Kappen, da zeigt er, wie er in unter 3 Stunden eine Consumer-SSD in einem Server zu Tode schreibt. Rate mal, warum Server-SSD´s so viel teurer sind.... Zitieren Link zu diesem Kommentar
daabm 1.366 Geschrieben 26. Februar 2019 Melden Teilen Geschrieben 26. Februar 2019 Jo, man vermeide in Servern alles, was mehr als MLC hat - und auch das halte ich persönlich schon für grenzwertig Wenn ich dran denke, daß die inzwischen QLC bauen, da sind 16x so viele Bitfehler systemimmanent... Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.