illumina7 3 Geschrieben 23. Januar 2023 Melden Teilen Geschrieben 23. Januar 2023 Guten Morgen zusammen, ich habe hier ein Problem mit unseren virtuellen RDSH Server, in der Anzahl insgesamt 7 Stück für je 10-15 User, meistens eher bei Richtung 10 User. Sowohl unter Hyper-V als auch unter proxmox muss ich wahnsinnig viele vCPUs zuweisen, damit die überhaupt halbwegs gut laufen, die Performance ist trotzdem nicht der Hit. Mit 4 vCPUs (was so eine gängige Empfehlung bis 10 User bei Office-Workload ist) brauche ich überhaupt nicht anfangen, schon mit einem User habe ich da duchgehend ~50-60% Auslastung, ohne direkt einen Prozess dafür identifizieren zu können (auch der Process Explorer zeigt mir keinen Prozess an, der die Last erzeugt). Mit 8 VCPUs wirds langsam erträglich und die "Grund"-CPU-Last fällt in den 10% Bereich im Leerlauf (idle, nix geöffnet) ab, langsam wird der Betrieb erträglich, ist aber noch immer sehr zäh, Programme starten mit spürbarer Verzögerung, scrollen in Word hat deutliche Ruckler. Bis 6-7 User ists okay, danach wird das komplette System so träge, dass eigentlich kaum noch zu Arbeiten ist, Anwendungen haben wahnsinnig lange Wartezeiten beim Starten, teilweise bis zu 30s. 12 vCPUs unverändert zu 8, ab 16 vCPUs läuft es dann wie es soll, alles schön schnell und geschmeidig, scrollen ruckelt nicht, im idle liegt die last bei 1-3%, auch bis 15 User ists jetzt kein Problem zu arbeiten, falls einer der anderen RDSH mal offline ist, gehen hier auch bis zu 20 Sessions relativ problemlos, dann liegen wir aber schon bei dauerhaften 80-90% Auslastung auf 16 vCores. Mehr zuweisen bringt dann keine Veränderung mehr. Gleichzeitig habe ich VMs mit 1 oder 2 vCPUs, Fileserver, Domaincontroller, Webserver, etc, die rennen mit den wenigen zugewiesenen vCPUs wie verrückt, absolut kein Vergleich zu den RDSH. Da kann ich mit einem vCPU ein FHD Video im Firefox abspielen und das läuft selbst über RDP fast ruckelfrei, an den RDSH brauch ich mit mit einer vCPU nicht mal als lokaler Admin anmelden, durchgehend 100% CPU Auslastung, ständige Disconnects. Ach ja die Host: Supermicro Server, Dual Socket AMD Epyc 7302 (16C/32T, 3,3Ghz), jeweils 384GB Ram, je 12 SSDs, 2 im Raid1 für proxmox, 10 im Raid-Z2 für den ZFS Pool. Raid-Z2 Benchmark liegt am Speicherbandbreitenlimit von PCIe3.0, die Maschinen rennen prinzipiell. Sowohl unter Hyper-V als unter proxmox verhalten sich die RDS identisch bescheiden, ob ich Numa aktiviere oder nicht macht auch keinen Unterschied. Hat jemand eine Idee, warum die RDSH bis zu unbedienbarkeit langsam werden, bzw erst ab extrem vielen Ressourcenzuweisung überhaupt benutzbar werden? Danke und Gruß Zitieren Link zu diesem Kommentar
Sunny61 811 Geschrieben 23. Januar 2023 Melden Teilen Geschrieben 23. Januar 2023 Auf dem Host prüfen wie die Energieoptionen eingestellt sind. Auch im BIOS des Host prüfen ob es hier Einschränkungen gibt. Zitieren Link zu diesem Kommentar
illumina7 3 Geschrieben 23. Januar 2023 Autor Melden Teilen Geschrieben 23. Januar 2023 (bearbeitet) Danke für deine Antwort, steht alles auf Max Performance, BIOS der Hosts halte ich auch immer aktuell. Zum Gegentesten hatte ich auch mal BIOS auf defaults zurückgestellt, ohne spürbaren Unterschied zu alles auf Max und C-States deaktiviert etc. Edit: was auch gegen die Energieoptionen spricht: alle anderen VMs rennen ja, also es steht alles auf Höchstleistung und im BIOS alles mögliche an Energiesparoptionen abgeschaltet. Alles Server 2019 Datacenter übrigens, aktuell durchgepatcht. Was micht stutzig macht, dass der Fehler unter Hyper-V und proxmox identisch ist (habe kürzlich die Plattform migriert, weil wir mit Hyper-V aus diversen Gründen unzufrieden waren). Jetzt könnte man meinen es liegt an den RDSH, die ich migriert habe, aber ich habe extra einen RDSH von 0 neu installiert (nicht geklont), der weitestgehend alles auf default stehen hat (die anderen sind optimiert), damit verhält es sich exakt gleich zu den bestehenden RDSH. Ich verstehe es einfach nicht, vielleicht teste ich das die Tage mal mit Server 2016, 2019 scheint ja insgesamt etwas "problematischer" zu sein. bearbeitet 23. Januar 2023 von illumina7 Zitieren Link zu diesem Kommentar
cj_berlin 1.356 Geschrieben 23. Januar 2023 Melden Teilen Geschrieben 23. Januar 2023 Moin, ich würde, bevor ich weiter forsche, folgende Versuchsanordnung anfertigen: eine VM so installieren, wie Du Infrastruktur-VMs installierst, also vermutlich eher mit wenig drauf, aber inklusive Browser der Wahl. 2vCPU / 8GB RAM sollten reichen. syspreppen und klonen beide zum AD hinzufügen, in der gleichen OU platzieren auf einer VM nur die RDSH-Rolle hinzufügen und Lizenzierung konfigurieren. A/B-Vergleich. beispielsweise mit Video im Browser oder auch mit dem Task Manager, machen. Wenn hier bereits einer der von Dir beschriebenen Unterschiede besteht, kann man anfangen das gezielt zu untersuchen . PerfMon, ProcExp usw. Denn der einzige wirkliche Unterschied hier ist ja die Umschaltung von Hintergrund- auf Vordergrund-Verarbeitung mit der Aktivierung der RDSH-Rolle. Ich glaube allerdings nicht, dass diese Art Troubleshooting im Rahmen eines Internet-Forums sinnvoll begleitet werden kann. Eins kann ich Dir allerdings mitgebebn: Es ist kein Problem, das ALLE Server 2019-Terminalserver haben, da hätte ich Hunderte von Gegenbeispielen Zitieren Link zu diesem Kommentar
testperson 1.729 Geschrieben 23. Januar 2023 Melden Teilen Geschrieben 23. Januar 2023 Hi, was für Anwendungen laufen auf den Workern bzw. was machen die User? Je nach Anwendung(en) könnte "TS Fair Share" Probleme machen. Alternativ noch die "per User Firewall Rules" (DeleteUserAppContainersOnLogoff). Was für einen Virenschutz setzt du ein? Gruß Jan Zitieren Link zu diesem Kommentar
illumina7 3 Geschrieben 23. Januar 2023 Autor Melden Teilen Geschrieben 23. Januar 2023 Hi Jan, danke für deinen Denkanstoss, sowohl die FW Rules sind bereits bereinigt, als auch die Reg-Einträge gesetzt, dass diese bei Logoff gelöscht werden. Mit TS Fair Share habe ich auch schon rumgespielt, jedoch ohne spürbare Veränderungen, ist aktuell wieder aktiviert. Wir nutzen Defender, Regeln werden per GPO verteilt, UPDs und deren UNC Pfade sind alle als Ausnahme definiert (inkl. noch einiger weiteren Pfade). @cj_berlin Danke für deinen Tipp zum Problem eingrenzen, ich werde da heute Abend direkt mal loslegen, ich werde auch mal direkt einen leeren 2016er mit einem leeren 2019er RDSH vergleichen. Generell kann ich nichts schlechtes zu 2019 sagen, allerdings hatten wir durchaus das ein oder andere Performance Problem bei vielen kleinen Files über SMB, das erst nach etlichen Anpassungen anständig läuft, das betraf aber ausschließlich die Fileserver und nicht die RDSH. Gruß Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.