Snowman_24 11 Geschrieben 20. Februar 2019 Melden Teilen Geschrieben 20. Februar 2019 Schönen Guten Tag, ich kämpfe mich einem sehr dubiosen Problem bei einem Kunden. Die nachfolgende Konstellation habe ich in identischer Form bei 7 Kunden laufen und bei keinem anderen treten Probleme auf. Server: HP Proliant DL380 (2x Intel XEON 16Core-CPUs, 192GB RAM, 5,2TB RAID 10 15k SAS-HDDs) System: Server 2016 als Hyper-V-Host VM's, alle basierend auf Server 2016 Standard: 1. Domain-Controller (und File-Server/WSUS/Kaspersky Security Center) (8 Kerne, 16GB) 2. Exchange Server 2016 (16 Kerne, 32GB) 3. Remotedesktopserver (32 Kerne, 32GB / Office 2016 Standard, Adobe Reader, kleine Anwendungsprogramme, Framework von der Warenwirtschaft) 4. Warenwirtschaft (8 Kerne, 16GB) Als Virenschutz kommt die Kaspersky Endpoint Security zum Einsatz. Bis auf dem Remotedesktopserver, ist auf den Servern lediglich die Kaspersky Security für Windows Server 10 im Einsatz, auf dem RDP-Server Kaspersky Endpoint Security. Windows Updates werden im 4-Wochen-Takt per WSUS eingespielt und hier auch die Server jeweils neu gestartet. Grundsätzlich arbeiten die meisten Mitarbeiter auf den lokalen PCs oder Notebooks mit ihrer Planungssoftware (Zeichnungssoftware). Einige Mitarbeiter, gerade im Bereich Buchhaltung, arbeiten aber auf dem RDP-Server. Nun passiert es immer wieder, dass z.B. im Word, Outlook, Explorer beim klicken irgendwann mal kommt "keine Rückmeldung". Selten kommt es vor, dass der Bildschirm dann schwarz wird und ein trennen und wieder anmelden nichts mehr bringt. Nur das manuelle Abmelden des Benutzerprofiles über die Administrator bringt Abhilfe. Das passiert aber alles nicht immer bei allen Benutzern, lediglich mal bei einem Mitarbeiter. Was auch ab und zu passiert, auf den RDP-Clients (ThinClients oder alte PCs), kommt es vor, dass die RDP-Sitzung schwarz wird und das Fenster erscheint, die Verbindung wurde unterbrochen, Verbindungsversuch 1von xx. Dann verbindet sich die Sitzung wieder automatisch. Wie wenn jemand das Netzwerkkabel zieht, was aber nicht passiert. Die lokale Verbindung zum Exchange und zum File-Server bleibt ja vorhanden, nur die Verbindung zum RDP-Server trennt sich. Ich habe das soweit mal über den Taskmanager und Ressourcenmonitor des RDP-Servers und des HVs beobachtet. Nichts! Keine CPU-Last, der RAM-Speicher ist mehr als ausreichend frei (12% vergeben) und die "Festplattenauslastung" liegt zwischen 4 und 15 %. So und nun kommts, es gibt seit einiger Zeit einen Mitarbeiter vor Ort, welcher mir "zuarbeiten" soll - er bekommt keine Administrationskennwörter vom Server! Der Mitarbeiter war nun einige Zeit nicht im Betrieb und in dieser Zeit gab es keinerlei Probleme mit dem RDP-Server. Nachdem wir nun ein Gespräch führten, noch mehrere Mitarbeiter auf dem RDP-Server arbeiten zu lassen, merkte ich, dass der Mitarbeiter nichts von dem RDP-Server hält. Hier soll demnächst ein Gespräch mit der Geschäftsleitung des Kunden stattfinden. Komischerweise haben dann aber, nachdem ich von dem Kunden gefahren bin, die Probleme wieder auf dem RDP-Server zugenommen. Gleich nach dem Mittag rief ein Mitarbeiter an, der Bildschirm ist wieder schwarz. Ich musste dann das Profil des Mitarbeiters manuell abmelden, damit er wieder arbeiten konnte. Der Mitarbeiter, welcher mir zuarbeiten soll, ist nur halbtags da ist kurz nach mir gefahren. Ich möchte hier niemand etwas unterstellen, doch ist es schon seltsam, dass die Probleme über einen Zeitraum, an dem der Mitarbeiter nicht da war, weg waren und nun wieder da sind. Vielleicht ist es nur ein Zufall. Mein Problem ist einfach, wo soll ich zum suchen anfangen? Danke im Voraus Grüße Marcus Zitieren Link zu diesem Kommentar
NilsK 2.968 Geschrieben 20. Februar 2019 Melden Teilen Geschrieben 20. Februar 2019 (bearbeitet) Moin, spontan würde ich sagen, du hast zu viele Cores (in Hyper-V eher vCPUs) vergeben. Der Host hat 32 Cores. Wenn du die alle gleichzeitig mit VMs belegst, hat der Host selbst für seine Aufgaben keine CPU-Ressourcen mehr frei. Das führt zu Problemen, durchaus in der Art, wie du sie beobachtest. Pauschal würde ich alle VMs auf die Hälfte reduzieren. Für den RDS ist 8 sicher auch ausreichend. Reicht dicke, und der Host kann seiner Scheduling-Aufgabe nachkommen. Nur weil "viel" im Host steckt, muss man nicht auf Biegen und Brechen versuchen, das auszureizen. Gruß, Nils bearbeitet 20. Februar 2019 von NilsK Zitieren Link zu diesem Kommentar
Snowman_24 11 Geschrieben 20. Februar 2019 Autor Melden Teilen Geschrieben 20. Februar 2019 Hallo Nils, vielen lieben Dank für Deine Nachricht. Okay, werde ich gerne ändern. Was mich wirklich wundert, das System habe ich in der identischen Form bei 7 Kunden am laufen und nur bei dem einen tritt der Fehler sporadisch auf. Grüße Marcus Zitieren Link zu diesem Kommentar
zahni 558 Geschrieben 20. Februar 2019 Melden Teilen Geschrieben 20. Februar 2019 Und Du solltest die NUMA-Architektur beachten. Du musst mit starken Performance-Einbußen rechnen, wenn Du die NUMA-Grenzen sprengst. Ich gehe mal davon aus, dass der Server beim RAM korrekt bestückt ist (also symmetrisch auf beide CPUs verteilt. Zitieren Link zu diesem Kommentar
Snowman_24 11 Geschrieben 20. Februar 2019 Autor Melden Teilen Geschrieben 20. Februar 2019 Hallo Zahni, vielen lieben Dank für Deine Nachricht. Damit habe ich mich tatsächlich noch nicht wirklich befasst - mit der NUMA-Architektur. Werde ich mir anschauen, oder hast Du da einen Tipp für mich bzw. wo kann ich mich damit vertraut machen. Die RAM ist korrekt bestückt, es handelt sich um identische Module und es sind alle Steckplätze ausgereizt. Grüße Marcus Zitieren Link zu diesem Kommentar
NilsK 2.968 Geschrieben 20. Februar 2019 Melden Teilen Geschrieben 20. Februar 2019 Moin, ob in deinem Setup die NUMA-Einstellungen tatsächlich ernsthafte Auswirkungen haben, halte ich nicht für ausgemacht. Du findest dazu einiges im Web (oder auch im Hyper-V-Buch von Rheinwerk). Wichtig: Relevant ist nur, was sich auf Hyper-V und NUMA bezieht. Vorsicht, ist starker Tobak. Um Leistungseinschränkungen durch die NUMA-Belegung auszuschließen (oder zu testen, ob sich was ändert), öffnest du die Eigenschaften des Hosts im Hyper-V Manager, dort findest du NUMA-Einstellungen. Da muss das Häkchen leer sein (nicht gesetzt). Das ergibt aber nur Sinn, wenn du die Zahl der zugewiesenen vCPUs auf ein sinnvolles Maß reduzierst. Beim oben genannten Setup werden sonst VMs gar nicht mehr starten. Aus dem Grund sind solche Änderungen oder Tests auch heikel - nur in einer Downtime. Gruß, Nils Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.