autowolf 12 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 (bearbeitet) Hi, ich habe die Anforderung, dass ich zwei ESX Server (RZ1 und RZ2) Hochfahrfügbar einrichten soll. Hier ist die Vorgabe, dass alle VMs 6 Stück auf dem RZ1 Server liegen sollen und im Falle eines Ausfalles der Server im RZ2 die Arbeit übernimmt. Die Umschaltzeit darf maximal 2 Sekunden betragen. Die einzige Lösung die mir hierzu einfällt ist VMWare Fault Tolerance. Kennt ihr noch andere Lösungen? Die Server sollen nur interne Festplatten bekommen. VM sind ausschließlich Windows Server Systeme bearbeitet 16. April 2020 von autowolf Zitieren Link zu diesem Kommentar
Dukel 455 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Je nach Applikation wäre auch ein Applikationscluster möglich. Dann ist das unabhängig von der VMWare Lösung. Wieso darf die Umschaltzeit nur 2 Sekunden betragen? Zitieren Link zu diesem Kommentar
mwiederkehr 382 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Zwei Sekunden Umschaltzeit und das noch verteilt über mehrere Rechenzentren? Sportlich! Fault Tolerance habe ich bisher in der Praxis noch nie angetroffen, nur auf Demos. Es stellt hohe Anforderungen an die Infrastruktur. Ich würde versuchen, die Verfügbarkeit auf Anwendungsebene sicherzustellen (Cluster, Load Balancer etc.). Um was für Anwendungen handelt es sich denn? Zitieren Link zu diesem Kommentar
Nobbyaushb 1.475 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 2 Sekunden ist noch nicht mal mit unserer Hardware in einem Rack möglich, und ich habe hier Mellanox 100GB drin und nur nVME Platten... Zitieren Link zu diesem Kommentar
NilsK 2.957 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Moin, das ist ein typischer Fall für: Bitte zurück an den Tisch und die Anforderungen wirklich im Detail herausarbeiten. So, wie es formuliert ist, ist die Aufgabe nicht lösbar. Mit "im Detail" meine ich: kein Unternehmen hat nur hochkritische Anwendungen. Der Fileserver, auf dem die IT ihre ISOs ablegt, muss nicht hochverfügbar sein. Was also ist wirklich kritisch? Und was heißt überhaupt kritisch? Das ist in keinem Unternehmen der Punkt "jetzt wird es unbequem", sondern es ist der Punkt "jetzt tritt ein Schaden ein, der das Unternehmen gefährdet". Viele überrascht es dabei, dass man z.B. für das Mailsystem fast immer feststellt, dass auch ein Ausfall von mehreren Stunden kein "echtes" Problem ist ... Gruß, Nils 1 Zitieren Link zu diesem Kommentar
testperson 1.707 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Hi, losgelöst von Nils' Hinweis würde ich technisch noch ergänzen, dass nur 4 VMs (Primary + Secondary) pro Host im Cluster per Fault Tolerence supported sind. Ebenfalls dürfen die FT VMs in Summe pro Host (Primary + Secondary) insgesamt max. 8 vCPUs zugewiesen haben. Bei Standard / Enterprise darf eine VM max 2 vCPUs bekommen mit Enterprise Plus sind es dann 8 vCPUs. Ein weiterer Punkt wäre die Netzwerkanbindung zwischen den RZs. VMware empfiehlt (im LAN) für FT 10 GBit Anbindungen mit (sehr) niedriger Latenz. AFAIK benötigst du für FT auch Shared Storage. Zu guter Letzt müssen natürlich auch die Anwendungen mit FT zurecht kommen / supported sein. Gruß Jan 1 Zitieren Link zu diesem Kommentar
NilsK 2.957 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Moin, nicht ganz off-topic, aber auch nicht ganz on-topic: Hat überhaupt schon mal jemand VMware FT in Produktion gesehen? Ich nicht. Und ich komme viel rum. Gruß, Nils Zitieren Link zu diesem Kommentar
testperson 1.707 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 vor 10 Minuten schrieb NilsK: Hat überhaupt schon mal jemand VMware FT in Produktion gesehen? Ein Kunde hat(te?) die VCSA im FT laufen. Da ist es aber auch eher "Haben statt brauchen" bzw. weil FT in der Lizenz "eh da ist". Zitieren Link zu diesem Kommentar
autowolf 12 Geschrieben 16. April 2020 Autor Melden Teilen Geschrieben 16. April 2020 Super erstmal vielen Dank für die Antworten. Die 2 Sekunden kommen nicht von mir sondern vom Kunden. Auf den Server soll eine Gebäudesteuerung laufen. FT hatte ich auch mal bei einme Kunden im Einsatz. Hier hat dann aber die Anwendung gezickt. Der Masterserver war zwischen durch einfach mal per LAN nicht mehr erreichbar. LAN Karte aus LAN Karte an und schon ging es wieder. Ob VMXNet3 oder NET1000 war total egal. Habe es jetzt abgeschaltet und das System läuft "nur" im HA Betrieb. vor 1 Stunde schrieb testperson: Hi, losgelöst von Nils' Hinweis würde ich technisch noch ergänzen, dass nur 4 VMs (Primary + Secondary) pro Host im Cluster per Fault Tolerence supported sind. Ebenfalls dürfen die FT VMs in Summe pro Host (Primary + Secondary) insgesamt max. 8 vCPUs zugewiesen haben. Bei Standard / Enterprise darf eine VM max 2 vCPUs bekommen mit Enterprise Plus sind es dann 8 vCPUs. Ein weiterer Punkt wäre die Netzwerkanbindung zwischen den RZs. VMware empfiehlt (im LAN) für FT 10 GBit Anbindungen mit (sehr) niedriger Latenz. AFAIK benötigst du für FT auch Shared Storage. Zu guter Letzt müssen natürlich auch die Anwendungen mit FT zurecht kommen / supported sein. Gruß Jan Super vielen Dank für die Hinweise. Die genauen Eckdaten waren mir nicht wirklich bewust. Bei FT brauch man Shared Storage? Soweit ich gesehen haben müssen die Master VM und die Slave VM nur auf unterschiedlichen Storages liegen. Zitieren Link zu diesem Kommentar
testperson 1.707 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 vor 5 Minuten schrieb autowolf: Bei FT brauch man Shared Storage? Soweit ich gesehen haben müssen die Master VM und die Slave VM nur auf unterschiedlichen Storages liegen. https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-83FE5A45-8260-436B-A603-B8CBD2A1A611.html Zitat Virtual machine files (except for the VMDK files) must be stored on shared storage. Acceptable shared storage solutions include Fibre Channel, (hardware and software) iSCSI, vSAN, NFS, and NAS. Zitieren Link zu diesem Kommentar
Nobbyaushb 1.475 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Hat mal einer nach dem Preis dafür gefragt? Wieso braucht eine Gebäudesteuerung max 2 sec? Wenn meine Homematic einen reboot macht, arbeiten alle Aktoren immer noch... und ich habe das Ding voll ausgebaut... Zitieren Link zu diesem Kommentar
NilsK 2.957 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 Moin, selbst wenn das "zwei Sekunden braucht" - man sollte sich bewusst sein, dass FT immer nur eine Krücke ist und auch nur so konzipiert wurde. Es bietet "Ausfallsicherheit" für Applikationen, die selbst keine solche Funktion bieten. In sehr engen Grenzen. Sollten tatsächlich nicht mehr als zwei Sekunden Ausfall akzeptabel sein (so eine, sorry, irrwitzige Anforderung habe ich noch nie gehört) - dann wäre doch zu fragen, warum die Applikation dafür selbst keine Mechanismen bietet. Passt dann vielleicht die Applikation nicht zum Setting? Irgendwann würde ich mich schlicht weigern, das umzusetzen. Dafür kann niemand geradestehen. Normalerweise aber gibt es weit vor dieser Weigerung die Erkenntnis, dass doch alles ganz anders ist ... Gruß, Nils 1 Zitieren Link zu diesem Kommentar
autowolf 12 Geschrieben 16. April 2020 Autor Melden Teilen Geschrieben 16. April 2020 Ja ich bin auch gestern vom Stuhl gefallen. Die Uhrzeit (NTP) soll alle 60 Sekunden gesynct werden. Katstart des ganzen Anlage 10 Minuten. Das ist auch kaum machbar, da meist die Management Karte auf dem Server erst startet und dann geht der Server erst an. Ich schweife ab.... Wie handhabt Ihr das mit den Vcenter? Wenn man "nur" zwei Server im HA hat mit FC Storage und das Vcenter auf dem Server liegt der Ausfällt, dann funktioniert ja HA nicht. Zitieren Link zu diesem Kommentar
testperson 1.707 Geschrieben 16. April 2020 Melden Teilen Geschrieben 16. April 2020 vor 3 Minuten schrieb autowolf: Wenn man "nur" zwei Server im HA hat mit FC Storage und das Vcenter auf dem Server liegt der Ausfällt, dann funktioniert ja HA nicht. Dafür gibts den HA Agent auf den ESXi Hosts. Zitieren Link zu diesem Kommentar
autowolf 12 Geschrieben 16. April 2020 Autor Melden Teilen Geschrieben 16. April 2020 vor 41 Minuten schrieb testperson: Dafür gibts den HA Agent auf den ESXi Hosts. Muss man den noch aktivieren? Hat bei mir nie geklappt, wenn der komplette Server mal stehen geblieben ist, wo auch das VCenter drauf läuft. Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.