vedette 10 Geschrieben 13. Oktober 2005 Melden Teilen Geschrieben 13. Oktober 2005 AN ALLE, die sich interessieren. Ich bin Dienstleister. U.a. administriere ich Systeme für KMUs, die sich keinen eigenen Admin leisten können oder wollen. Ich handele weder mit HW noch mit SW. Das wird über Vor-Ort-Systemhäuser beschafft. Also reiner Dienstleister. Ich komme ziemlich rum und habe schon viel gesehen. Ich bin seit ca. 16 Jahren in der IT tätig. Heute ist etwas passiert, dass ich nur vom Hörensagen kenne. Mein Problem: Am Freitag 07.10 ist in einem 1/2 Jahr alten Rackmount-Server eine Festplatte in einem 3-Platten Raid5 System mit Adaptec-Controller kaputt gegangen. Diese wurde heute vom Hardwarelieferanten getauscht. Ich war dabei nicht vor Ort. Wozu auch. Heute morgen rief mich der Angestellte des Hardwarelieferanten an und behauptete, er bräuchte Treiber, um das System im laufenden Betrieb wieder zu rebuilden. Bisher dachte ich immer, man steckt im laufenden Betrieb die neue Festplatte in ihrem Gehäusekäfig rein und der Rebuild läuft auf der Basis des Controllers von alleine (Das habe ich übrigens auch schon mehrfach gemacht!) 1. FRAGE also an das Forum. Stimmt es dass man für bestimmte (auch moderne) Geräte zusätzliche Treibersoftware braucht, um im laufenden Betrieb zu rebuilden? (W 2003 Server. Reiner File- und Print-Server, kein SQL, kein Exchange, nix sonst) Vor zwei Stunden ruft mich der Angestellte des Hardwarelieferanten nun erneut an und erzählt mir, dass sich eine zweite Festplatte während des Rebuilds der ersten (getauschten) verabschiedet hat. Das heisst: Stripe-Set und Paritätsinformationen zerstört. Server und Domain neu aufsetzen. 2. Frage an das Forum? Wie wahrscheinlich ist es, dass der Mann irgendeinen Fehler gemacht hat im Vergleich zur Wahrscheinlichkeit, dass sich eine x-beliebige, ein halbes Jahr alte Festplatte genau in dem schmalen Zeitrahmen verabschiedet, in dem eine andere neue einen Rebuild des Arrays fährt? Und wenn ein Fehler nicht unwahrscheinlich ist, welcher könnte es gewesen sein? Natürlich habe ich dazu meine Meinung, aber ich bin grundsätzlich sachorientiert und werde niemandem ohne Begründung an die Karre fahren. Ich möchte aber unbedingt Eure Erfahrungen kennenlernen, denn ich selbst habe in all meiner Zeit so einen Fall noch nie erlebt, habe also gerade diese Erfahrung noch nicht gemacht. (und ich habe schon soooooo viel mit IT erlebt). Wer hat obigen Fall auch schon erlebt? Was waren die Ursachen? Bitte helft mir. Telegrammstil völlig o.k. Zitieren Link zu diesem Kommentar
tom tuba 10 Geschrieben 13. Oktober 2005 Melden Teilen Geschrieben 13. Oktober 2005 vielleicht isses ja der controller, der ne macke hat ? Ich kenn das von den schabbeligen mylex controllern. die hatten die schöne angewohnheit, bei einem defekt gleich noch ein paar platten mitzunehmen. Zitieren Link zu diesem Kommentar
Fantafisch 10 Geschrieben 13. Oktober 2005 Melden Teilen Geschrieben 13. Oktober 2005 Hi, Also zu 1, Wäre mir neu das man für´s rebuilden einen extra Treiber benötigt? Klingt irgendwie für mich nach Unsinn. Entweder die Hardware (also der Controller) kümmert sich um das rebuilden dann sind die Rebiuld Funktionalitäten in der Firmware implementiert oder man macht ein Software RAID per Windows. Dann braucht´s aber auch keinen Treiber. Sollte hier tatsächlich ein Treiber notwendig sein dann dürfte sich ja das RAID garn nicht ohne Treiber erstellen lassen. Zu 2, Ja das kann vorkommen und ist eigentlich gar nicht mal so selten wie immer angenommen. Ich hatte den Fall erst Gottseidank einmal. Besonders bei HDD´s aus der selben Charge kann es schon vorkommen das diese dann "gemeinsam" oder in kurzen Abständen den Geist aufgeben. Es gibt da auch Berechnungen z.B. das ab einer bestimmten Anzahl an HDD´s ein Multi HDD´s Ausfall immer wahrscheinlicher wird. Siehe hier: http://docs.hp.com/en/J6369-90011/apcs01.html?btnPrev=%AB%A0prev Deshalb gibt´s hier verschiedene Möglichkeiten z.B: Online Spare Platten die sofort einspringen wenn eine andere Ausfällt und mit dem Rebuilden beginnt oder RAID ADG das den gleichzeitigen Ausfall von 2 HDD´s verkraftet. Und nochwas: So schmal ist die Zeitspanne die das Rebuild nicht benötigt. Im Extrmfall kann es sein das bei sehr hoher Auslastung und je nach Controller das Rebuild nicht mehr als 1 GB pro Stunde schafft. Mein Rekord liegt hier bei ca. 48 Stunden für ca. 70 GB Daten. lg Fantafisch Zitieren Link zu diesem Kommentar
vedette 10 Geschrieben 14. Oktober 2005 Autor Melden Teilen Geschrieben 14. Oktober 2005 Vielen Dank für die bisherigen Infos. Der Hardwarelieferant hat meinem Kunden und mir relativ großzügige Regelungen angeboten. Wer noch was dazu weiss. Ich kann noch ein paar Infos vertragen. Zitieren Link zu diesem Kommentar
wirtnix 10 Geschrieben 14. Oktober 2005 Melden Teilen Geschrieben 14. Oktober 2005 der einzige fehler, den der mann gemacht haben könnte ist folgender: wenn dei defekte platte gezogen ist, muss man ca. 2-3 minuten warten, bis die neue platte eingesetzt werden darf, da der controller das ansonsten nicht mitbekommt. dann wird auch der rebuild nicht automatisch gestartet, sieht ganz danach aus, dass der techniker die wartezeit nicht eingehlaten hat. dann ist es in der tat möglich, dass der controller sich aufhängt und eine andere platte in mitleidenschaft gezogen wird. Zitieren Link zu diesem Kommentar
dippas 10 Geschrieben 14. Oktober 2005 Melden Teilen Geschrieben 14. Oktober 2005 Moin, meine Meinung zu den Fragen: zu 1: Treiber werden definitiv nicht benötigt, da wir von einem HW-RAID sprechen, welches vom Controller gemanged wird. Treiber für Controller -> ok, aber die sind ja drauf. Treiber für HDs oder gar für ein RAID Ich vermute, er meint eine Windows-Konfigurationsoberfläche zur Bedienung des Controllers von Windows aus. Nur wenn man diese installiert hat, kann man Konfigurationen von Windows aus anstoßen. Eben auch ein Rebuild. Ansonsten bleibt ja nur der Weg, das über das Controller-BIOS zu machen. zu 2. Kenne ich "ähnlich". Bei einem unserer Server hat sich im 2 Wochen Rhytmus eine Platte nach der anderen verabschiedet. Hier lag es daran, das die Platten (auch die Ersatzplatten) aus einer Charge bzw. aus einem Werk kamen. Macht man nix dran. Ach ja, ein Rebuild kann wirklich seeehhhhrrrr lange dauern. Ich bin insgsamt aber über einen Unstand verwundert, an dem Du ja auch nix ändern kannst: Wieso tauscht ein "Techniker" eine Platte erst nach knapp einer Woche, fragt nach Treibern und zerlegt dabei das System?? :suspect: Scheint mir persönlich ein nicht wirklich empfehlenswertes Systemhaus zu sein. grüße dippas Zitieren Link zu diesem Kommentar
vedette 10 Geschrieben 15. Oktober 2005 Autor Melden Teilen Geschrieben 15. Oktober 2005 Vielen Dank für Euren kompetenten Beiträge. @Dippas zu 1. Du hast vollkommen recht. Er hat Intel StorCon+ aufgespielt. Demzufolge handelt es sich also auch um einen Intel Controller und nicht, wie von mir zuvor behauptet, um einen Adaptec. Ich denke ich werde nach dem Neuaufsetzen einen kompletten Systemcheck wegspeichern, damit man mal einen Überblick hat. Selbst mit SIW bekommt man schon aussagekräftige Infos. Ich muss dazu sagen. Ich darf als Freelancer nichts machen, was mein Kunde nicht haben will. Ich kann nur beratend auf ihn einwirken. Ein Systemreport war für ihn uninteressant. Jetzt, nach dem "Unfall" wird eine IDR-Lizenz für BackupEexec 10 erworben oder es kommt TrueImage für Server drauf und ein paar zusätzliche Wartungssachen darf ich auch noch machen. Aber das kennt ihr Kollegen ja, dass das Kind erst in den Brunnen fallen muss. zu 2. Man hat uns vom Systemhaus grosszügige Regelungen angeboten und hat auch prophylaktisch alle Platten aus- getauscht. Auch die verbliebene intakte Platte. Auf einmal waren die Sachen in Stunden per Kurier da, auf die mein Kunde (und ich im Hintergrund) zuvor 5 Tage warten mussten. Wer sich aber auskennt, weiss, dass es nicht immer so einfach ist zu sagen. "Tja, das Systemhaus tauschen wir jetzt oder wir holen alles von DELL, HP, etc." Die Kunden- beziehung ist oft etwas komplexer. Zum Beispiel haben wir von diesem Systemhaus sehr gute Leasingkonditionen bekommen (und dahingehend berate ich meine Kunden auch und schlage was raus für sie). Wer von Euch hat schon das perfekte Systemhaus im Rücken und was heisst dann perfekt? Auch @ wirtnix Vielleicht haben sie ja doch ein schlechtes Gewissen. Sie stehen ja jetzt auf einmal nicht nur für die schlechte Qualität der Festplatten gerade, sondern haben auch die Domain wieder neu aufgesetzt und die Kopplung an den Kommunikations- Server (Email, Firewall, etc.) durchgeführt. Nochmal vielen Dank für Eure Beiträge. Ihr habt mir geholfen. Vedette Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.