mc02000 10 Geschrieben 10. März 2011 Melden Teilen Geschrieben 10. März 2011 (bearbeitet) Hallo zusammen, seit einigen Monaten haben wir das Problem, dass der Zugriff (speichern) auf die unterschiedlichsten Daten sporadisch nicht möglich ist. folgende Konstellation: - 2x W2K3 R2 32bit Enterprise zum File-, DHCP- und Printservercluster konfiguriert - 2 Daten-LUNs mit 800 und 600 GB und kleine Quorum und Print LUN - Clients WinXP 32bit Fehlerbild: Der Filezugriff friert gelegentlich ein. Hierbei ist es egal ob es sich um kleine oder große Dateien handelt. Die User erhalten folgende Meldung z.B. in Excel: "Auf ´<Dateiname>´ konnte nicht zugegriffen werden. Unter Umständen ist die Datei oder der Speicherplatz der Datei schreibgeschützt, oder der Server, auf dem das Dokument gespeichert ist, reagiert nicht mehr". In CAD-Anwendungen gibt es wieder andere Fehlermeldungen. Selbst das Verschieben / Kopieren von Daten auf dem Server ist dann fehlerhaft. Zusätzlich ist meist der RDP-Zugriff auf den Server nicht mehr möglich. (die mstsc schließt sich sofort wieder und kein Anmeldefenster erscheint). Wir haben daraus geschlossen, dass irgend ein Dienst, Prozess, Datei etc. den Server auslastet. Nach ein paar Sekunden oder Minuten läuft wieder alles ganz normal. Falls nicht schwenken wir den Node und alles ist wieder iO. Was haben wir bislang gemacht: - Am Anfang dachten wir es liegt am Spooler. Daraufhin haben wir diesen auf NodeA gelegt und die Files auf NodeB. Der Fehler tauchte aber wieder auf. - Spooler so konfiguriert das als "Print Prozessor" der "WinPrint" RAW verwendet wird - Es liegt auch nicht an einem Node, da der Fehler auf beiden auftritt. - Bei den Prozessen war nur der "tcpsrv" auffällig, da dieser sehr groß wurde (z.B. 630MB). Daraufhin habe ich eine Anpassungen gemacht und der Prozess bleibt nun unter 20MB. - Alle MS Updates installiert (ist bei uns Standard) - Alle Dell Updates installiert - Arbeitsspeicher erweitert (4 auf 8 GB; 3 GB Switch in der boot.ini war schon gesetzt) - Netzwerkkartentreiber aktualisiert und Teaming etc. entfernt - MS Patch (WindowsServer2003-KB939928-x86-DEU.exe) DNS_Memory_Leak installiert - AntiViren Programm deaktiviert und Node neu gestartet. Leider ist der Fehler heute wieder aufgetreten und ich weiß mir langsam keinen Rat mehr. Gruß und Danke bearbeitet 10. März 2011 von mc02000 Zitieren Link zu diesem Kommentar
zahni 562 Geschrieben 10. März 2011 Melden Teilen Geschrieben 10. März 2011 Hallo, - was ist denn alles auf den Servern installiert. - Bilden beide Server einen Cluster ? - Den Kernelspeicher auf 1Gb zu begrenzen ( 3GB-Switch) ist keine gute Idee. Dieser Schalter dient dazu im Userspace mehr RAM nutzen zu können. Z.B. für einen SQL-Server. Da sich bei File-, Print- und Cluster Service aber so ziemlich alles im Kernel Mode abspielt, ist es keine gute Idee den zu begrenzen. - Welche Virenscanner werden verwendt ? - Welche Service-Pack- und Hotfix-Stände sind installert ? Und wozu gehört tcpsrv ? Zitieren Link zu diesem Kommentar
mc02000 10 Geschrieben 10. März 2011 Autor Melden Teilen Geschrieben 10. März 2011 Da der Fehler gerade da ist und ich mich per RDP nicht anmelden kann habe ich mich direkt an die Console gehangen. Laut Prozessexplorer hat der - Sophos Antivirus 85 MB (das ist normal.) - System 39 MB - explorer.exe 19 MB ... CPU Last: - System Idle Process 95 bis 98 % - System 1 bis 3 % Alles in allem nicht auffälliges. Zitieren Link zu diesem Kommentar
mc02000 10 Geschrieben 10. März 2011 Autor Melden Teilen Geschrieben 10. März 2011 - was ist denn alles auf den Servern installiert. --> Dell Server Administrator, CA Arcserve Backup, Intel Network Treiber, Java, EMC PowerPath, Beyond Compare, Navisphere, SANsurver, Sophos AntivVirus (9.5), Treesize Prof. - Bilden beide Server einen Cluster ? --> Ja. Standard MS Cluster - Welche Virenscanner werden verwendt ? --> Sophos AntiVirus - Welche Service-Pack- und Hotfix-Stände sind installert ? --> SP2 inkl. aller Patche. (Stand vor ca. 2 Wochen) Und wozu gehört tcpsrv ? --> tcpsrv hängt mit dem dhcp Server zusammen. Laut Foren kann es zu fehler kommen wenn dieser zuviel Arbeitsspeicher verwendet. 3 GB Switch Könnte ich entfernen, wobei der Switch schon Jahre gesetzt ist und es sich bei den Dateien nur um kleine Dateien. (ein paar MB) Der Vollständigkeit halber pro Node: 2x Intel Xeon 3,2 GHz CPU 8 GB Ram Ein Task, Backup oder Virenscann läuft zu dem Zeitpunkt auch nicht Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.