umeyer 10 Geschrieben 9. Februar 2009 Melden Geschrieben 9. Februar 2009 Hallo zusammen, ich bin ein wenig ratlos, wie bei einem bestimmten Problem die Ursachenforschung aussehen kann... Da bräuchte ich mal eure Hilfe :wink2: Leidtragender des Problems ist unser Fileserver (2 Windows 2003 Enterprise- Server im Cluster, angeschlossen über FC an einen externen Plattenstapel mit Raid5). Wir haben recht häufig das Problem, dass morgens zwischen 8.00 und 8.30 die Antwortzeiten dramatisch in den Keller sacken, d.h. Zugriffe auf den Cluster werden unglaublich langsam... Dadurch verzögern sich Anmeldungen, Lotus Notes-Zugriffe... Schaut man sich im Systemmonitor eines Servers die aktuelle und auch die durchschnittliche Warteschlangenlänge des Datenträgers an, der die ganzen Netzlaufwerke für die User zur Verfügung stellt (liegt wie gesagt auf dem externen Plattenstapel), so sieht man hier auch deutlich, dass sich diese beiden Werte am oberen Anschlag bewegen... Irgendwann beruhigt sich die Situation wieder ganz von selbst! Das ist aber natürlich kein Zustand :( Ich geh mal stark davon aus, dass ein oder mehr User mit irgendeiner Aktion dieses Verhalten auslösen. Dienste auf den Fileservern selbst (Virenscanner o.ä.) kann ich, denk ich ziemlich sicher ausschließen! Weiß von euch jemand ein Tool mit dem ich irgendwie nachvollziehen kann, was mir gerade soviel Last verursacht? Mit Filemon seh ich nix und auch mit DameWare sehe ich zwar geöffnete Dateien, aber ich geh mal davon aus, dass es eher so was wie ne Suche oder ein Kopiejob ist?! Bin für jede Anregung und Idee dankbar :-)) Zitieren
MattesP 10 Geschrieben 9. Februar 2009 Melden Geschrieben 9. Februar 2009 Hi, da Du für jede Idde dankbar bist, probier ich es mal: Liegen auf dem Fileserver evtl. Userprofile? Das würde die Uhrzeit erklären. Morgens melden sich alle an, die Profile werden geladen... Wenn dann jemand große Dateiordner z.B. auf dem Desktop hat, dann dauert das halt. Gruß, Mattes Zitieren
umeyer 10 Geschrieben 9. Februar 2009 Autor Melden Geschrieben 9. Februar 2009 Hi, ja, auf dem Server liegen tatsächlich die Userprofile und als wir die damals auf den Cluster gezogen haben, konnte auch ein deutlicher Anstieg der Festplatten-Auslastung zu den Stoßzeiten verzeichnet werden... Aber ich fürchte das ist es nicht... Die weitaus meisten Mitarbeiter kommen, wenn der Spuck schon wieder vorbei ist und die Desktops werden bei jeder Anmeldung geleert und wieder neu bestückt, d.h. es kann auch nicht sein, dass sich mal jemand die 250 MB- PPT-Datei abgelegt hat ;) Die ganze temporäre Soße wird schon gar nicht mitrepliziert, d.h. die Profile sind alle relativ klein. Und es ist ja auch nicht so, dass es "nur" langsam wäre, weil es so viel zu laden gibt... Man sieht bei der Auslastung des Servers definitiv, dass die Maschine von der Zugriffszeit auf die Festplatte am Limit ist! Zitieren
MattesP 10 Geschrieben 9. Februar 2009 Melden Geschrieben 9. Februar 2009 ... dass die Maschine von der Zugriffszeit auf die Festplatte am Limit ist! Was heißt das denn genau? Gruß, Mattes Zitieren
umeyer 10 Geschrieben 9. Februar 2009 Autor Melden Geschrieben 9. Februar 2009 Nun im Systemmonitor gibt es für die aktuelle und die durchschnittliche Warteschlangenlänge für Datenträgerzugriffe eine Skala von 0-100... Im Normalbetrieb bewegen sich beide Anzeigen so zwischen 10-20%. Und wenns am Limit ist, dann gibt es eine durchgehende Linie der aktuellen Warteschlangenlänge bei 100% und die Linie der durchschnittlichen Warteschlangenlänge pendelt sich so bei 30-40 % ein. Dann ist jeder Zugriff auf den Fileserver, speziell von Programmen (Die Datenpartition der User für Notes liegt z.B. komplett auf dem Filer) schon extrem langsam... Absolut gar nichts geht mehr, wenn beide Linien sich bei 100% bewegen :-( Zitieren
Monarch 10 Geschrieben 9. Februar 2009 Melden Geschrieben 9. Februar 2009 Ähm, also mal zum Verständnis dieser Werte: die Warteschlangen sind keine Prozentangaben sondern Werte. Da gibts auch keine Skala von 0-100, es sind auch größere Warteschlangen als 100 möglich. Wie nun das Diagramm skaliert wird, muss der Admin selbst richtig einstellen ;) Wenn nun wirklich eine Queue von 100 Anfragen vorhanden sein sollte, ist dein Storage eindeutig der Flaschenhals. Was diese vielen Zugriffe nun verursacht, ist aber noch die offene Frage, wie es aussieht. Oder es gibt gar nicht zu viele Zugriffe, sondern der Storage selbst hat ein Problem und kann zeitweise die Anfragen nicht in einer vernünftigen Geschwindigkeit abarbeiten. mfg Monarch Zitieren
umeyer 10 Geschrieben 9. Februar 2009 Autor Melden Geschrieben 9. Februar 2009 Hi, aaalso... vergesst bitte all meine Prozentangaben... Im Systemmonitor bei einer Skala von 0-100 dümmpelt die Anzeige der Warteschlangenlänge im Normalbetrieb zwischen 10-20... Unschön wird es, wenn der (standardmässig voreingestellte und nie veränderte) WERT von 100 erreicht ist... Ich gehe mal davon aus, wenn ich diesen Wert vergrößere wird auch meine Anzeige höher ausschlagen, aber eigentlich ist der tatsächliche Wert mir relativ schnuppe ;) Ich wollte damit nur ausdrücken, dass man die Belastung des Filers tatsächlich visuel erfassen kann, es sich also nicht nur um ein gefühltes "zu langsam" handelt. Das die "Storage" generell der Flaschenhals ist, kann ich definitiv ausschließen... Wie gesagt, das Phänomen tritt auf, wenn noch nichtmal die Hälfte der Mitarbeiter angemeldet ist... Und den ganzen restlichen Tag ist das Ding tiefenentspannt! Deshalb ja die Frage, ob irgendjemand eine Idee hat, wie man rausfinden kann, was gerade zu besagtem Zeitpunkt so viele Zugriffe produziert?! Zitieren
heiner.hemken 10 Geschrieben 10. Februar 2009 Melden Geschrieben 10. Februar 2009 Wann läuft das Backup? Schon mal überlegt evtl. ein Leistungsindiokatorenprotokoll bzw. eine Ablaufverfolgung anzulegen? Zitieren
FLOST 10 Geschrieben 10. Februar 2009 Melden Geschrieben 10. Februar 2009 Hast du mal geschaut, welche Verzeichnise / Dateien zu der Zeit im Zugriff sind? Daraus solltest du Rückschlüsse ziehen können, um was es sich handelt. Zitieren
BrainStorm 10 Geschrieben 10. Februar 2009 Melden Geschrieben 10. Februar 2009 Hallo umeyer, kennst du folgenden Artikel? You experience slow file server performance and delays occur when you work with files that are located on a file server Zitieren
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.