Andy_Ladde 10 Geschrieben 7. Juni 2010 Melden Teilen Geschrieben 7. Juni 2010 Moin, ich habe ein kleines Problem mit meinem neu installierten File Server Cluster. Der Cluster funktioniert soweit einbandfrei, auch beim Failover. Wenn man aber die Virtuelle IP oder den Clusternamen pingt, dann bekommt man von einigen Servern eine Antwort und von einigen Servern nicht. Teilweise ist die Virtuelle IP nach x Std. plötzlich nicht mehr erreichbar. Beide Nodes sind erreichbar und antworten durchgehend. DNS Einträge, Netzwerkeinstellungen stimmen und es wird innerhalb des Supnetzes nichts durch die Firewall verboten oder geblockt. OS: Windows Enterprise Server 2003 R2 SP2,alle Security Patche und Hotfixe System: 2x Dell 2950 1x MD3000 SCSI Storage Hat jemand ne Idee woran das liegen könnte? Gibts da noch nen Trick beim Einrichten? Vorab schon mal viel Dank für die Antworten. Andy Zitieren Link zu diesem Kommentar
Lian 2.482 Geschrieben 8. Juni 2010 Melden Teilen Geschrieben 8. Juni 2010 Hallo Andy, wie wurde der Cluster aufgesetzt? Wieviele Nodes und welches Quorum Model? Welche Clustergruppen hast Du und wie sind diese eingerichtet? Poste ggf. in der Eingabeaufforderung die Ausgabe von: cluster res Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 8. Juni 2010 Autor Melden Teilen Geschrieben 8. Juni 2010 Moin Lian, danke für deine Antwort. Der Cluster wurde mit dem Assistenten aufgesetzt nicht per cmd. Es sollen 2 Nodes werden (die 2. werden ich morgen hinzufügen), auch den Befehl werde ich mal ausführen und morgen posten. Interessant ist, dass es anscheinend nur Schwierigkeiten im gleichen IP-Adressbereich gibt. Von nem anderen IP-Adressbereich scheint es ohne Problem zu funktionieren... Zitieren Link zu diesem Kommentar
NorbertFe 2.110 Geschrieben 8. Juni 2010 Melden Teilen Geschrieben 8. Juni 2010 Was hängt denn an Switches am Netz? Bye Norbert Zitieren Link zu diesem Kommentar
Lian 2.482 Geschrieben 9. Juni 2010 Melden Teilen Geschrieben 9. Juni 2010 wie wurde der Cluster aufgesetzt? Ich dachte eher an die Netzwerkkonfiguration und die Clustergruppen. ;) Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 9. Juni 2010 Autor Melden Teilen Geschrieben 9. Juni 2010 (bearbeitet) Moin, also ich habe den Cluster heute noch mal neu aufgesetzt, aber das Problem besteht immer noch. Leider habe ich es auch Zeitgründen noch nicht geschafft die 2. Note hinzuzufügen, sollte allerdings auch nicht im Zusammenhang mit dem Problem stehen. Hier das Resultat aus cluster res Resource Group Node Status -------------------- -------------------- --------------- ------ Disk E: Cluster Group Clusterserver02 Online Cluster IP Address Cluster Group Clusterserver02 Online Cluster Name Cluster Group Clusterserver02 Online Clustername: Clusterserver01 Viruelle IP: 162.23.22.100 Subnetmask: 255.255.254.0 1. Node: Clusterserver02 NIC1: 162.23.22.101 Subnetmask: 255.255.254.0 Gateway: 162.23.22.1 NIC2: 192.168.22.101 Subnetmask: 255.255.255.0 Gateway: 192.168.22.1 2. Node: Clusterserver02 NIC1: 162.23.22.102 Subnetmask: 255.255.254.0 Gateway: 162.23.22.1 NIC2: 192.168.22.102 Subnetmask: 255.255.255.0 Gateway: 192.168.22.1 Der Switch ist per LWL mit einen LWL Verteiler angeschlossen, der wiederum an alle ander Schränke verteilt. Die anderen Server inkl. der Nodes sind ohne Probleme zu erreichen. Auch aus einem anderen Netz ist der Cluster immer erreichbar. Danke für Infos! bearbeitet 9. Juni 2010 von Andy_Ladde Zitieren Link zu diesem Kommentar
Lian 2.482 Geschrieben 9. Juni 2010 Melden Teilen Geschrieben 9. Juni 2010 Sieht soweit richtig aus, zumindest was die Cluster Gruppe "Cluster Group" angeht. Sieht so aus, daß Du eine NIC für den Client Access (Public NIC) und eine für die interne Cluster Kommunikation (Heartbeat NIC) hast - passt auch. Für die Heartbeat NIC gibt MS folgende Empfehlungen: http://support.microsoft.com/kb/258750/en-us Sicher, daß das Routing und die Netzwerk-Anbindung physikalisch absolut sauber ist? Schau Dir auch mal die cluster.log an (%systemroot%\Cluster), ob Fehler vom Typ ERR oder WARN geloggt sind. Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 10. Juni 2010 Autor Melden Teilen Geschrieben 10. Juni 2010 Ich habe jetzt die Empfehlungen mal nachvollzogen, aber es klappt nicht. Ich denke schon das der Switch und die Anbindung funktioniert, denn es sind noch 10 andere Server im Schrank die keine Probleme haben. Auch die Nodes ist ja von allen Servern aus ohne Probleme erreichbar. Nur halt eben die Virtulle IP nicht. Hab mal nen Teil des Logs rein kopiert, die meisten errors wiederholen sich. Vielleicht sollte ich den Cluster noch mal per cmd erstellen und nicht per wizzard.. Der Cluster wurde mit nen DomainAdmin ACC erstellt. Windows IP Configuration Host Name . . . . . . . . . . . . : clusterserver02 Primary Dns Suffix . . . . . . . : mydomain.net Node Type . . . . . . . . . . . . : Hybrid IP Routing Enabled. . . . . . . . : No WINS Proxy Enabled. . . . . . . . : No DNS Suffix Search List. . . . . . : mydomain.net Ethernet adapter Puplic Connection: Connection-specific DNS Suffix . : Description . . . . . . . . . . . : Broadcom BCM5708C NetXtreme II GigE Physical Address. . . . . . . . . : 00-18-8B-82-23-71 DHCP Enabled. . . . . . . . . . . : No IP Address. . . . . . . . . . . . : 162.23.22.100 Subnet Mask . . . . . . . . . . . : 255.255.254.0 IP Address. . . . . . . . . . . . : 162.23.22.101 Subnet Mask . . . . . . . . . . . : 255.255.254.0 Default Gateway . . . . . . . . . : 162.23.22.1 DNS Servers . . . . . . . . . . . : 162.23.22.60 162.23.22.61 Primary WINS Server . . . . . . . : 162.23.22.61 Secondary WINS Server . . . . . . : 162.23.22.60 Ethernet adapter Internal Connection: Connection-specific DNS Suffix . : Description . . . . . . . . . . . : Broadcom BCM5708C NetXtreme II GigE #2 Physical Address. . . . . . . . . : 00-18-8B-82-23-73 DHCP Enabled. . . . . . . . . . . : No IP Address. . . . . . . . . . . . : 10.10.10.10 Subnet Mask . . . . . . . . . . . : 255.0.0.0 Default Gateway . . . . . . . . . : NetBIOS over Tcpip. . . . . . . . : Disabled Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 10. Juni 2010 Autor Melden Teilen Geschrieben 10. Juni 2010 00000df8.00000dac::2010/06/09-15:47:01.316 INFO [CS] Cluster Service started - Cluster Node Version 4.3790 00000df8.00000dac::2010/06/09-15:47:01.316 INFO OS Version 5.2.3790 - Service Pack 2 (ADS 03000112L) 00000df8.00000dac::2010/06/09-15:47:01.316 INFO Local Time is 2010/06/09-17:47:01.316 00000df8.00000900::2010/06/09-15:47:01.316 INFO [CS] Service Starting... 00000df8.00000900::2010/06/09-15:47:01.316 INFO [iNIT] ClusterInitialize called to start cluster. 00000df8.00000900::2010/06/09-15:47:01.316 INFO [EP] Initialization... 00000df8.00000900::2010/06/09-15:47:01.316 INFO [DM] Initialization 00000df8.00000900::2010/06/09-15:47:01.316 ERR [DM] DmInitialize: The hive was loaded- rollback, unload and reload again 00000df8.00000900::2010/06/09-15:47:01.925 WARN [NM] Failed to open cluster parameters key, status 2. 00000df8.00000bcc::2010/06/09-15:47:35.972 WARN [JOIN] JoinVersion data for sponsor 172.24.32.100 is invalid, status 1722. 00000df8.00000900::2010/06/09-15:47:35.972 INFO [JOIN] Got out of the join wait, CsJoinThreadCount = 1. 00000df8.00000900::2010/06/09-15:47:35.972 ERR [JOIN] Unable to connect to any sponsor node. 00000df8.00000900::2010/06/09-15:47:35.972 WARN [iNIT] Failed to join cluster, status 53 00000df8.00000900::2010/06/09-15:47:35.972 INFO [iNIT] Attempting to form cluster Clusterserver01 00000df8.00000900::2010/06/09-15:47:35.972 INFO [API] Online read only 00000df8.00000900::2010/06/09-15:47:35.972 ERR [FM] Failed to get quorum disk signature, error 2. 00000df8.00000900::2010/06/09-15:47:36.128 WARN [DM] DmpGetRegistrySequence failed 2 00000df8.00000900::2010/06/09-15:47:36.394 WARN [NMJOIN] Cluster Instance ID not found in cluster database, status 2. 00000df8.00000900::2010/06/09-15:47:38.378 ERR [FM] FmpSetGroupEnumOwner:: MM returned MM_INVALID_NODE, chose the default target 00000e00.00000e58::2010/06/09-15:47:38.378 ERR IP Address <Cluster IP Address>: Unable to open node parameters key, status 2. 00000e00.00000efc::2010/06/09-15:47:38.378 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2 00000e00.00000efc::2010/06/09-15:47:38.378 WARN Network Name <Cluster Name>: Unable to read CreatingDC parameter, error=2 00000e00.00000b5c::2010/06/09-15:47:38.519 WARN IP Address <Cluster IP Address>: Patch with network GUID 5f5086a2-b62a-4845-a8d5-cdbab79d67c1, status 0. 00000e00.00000b5c::2010/06/09-15:47:38.519 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry. 00000df8.00000dec::2010/06/09-15:47:38.894 WARN [NM] Network 5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Local Area Connection) is up. 00000df8.00000dd8::2010/06/09-15:47:38.894 WARN [NM] Network e9d85338-4ed2-4780-a3f6-0f415e2162c7 (Custer-intern) is up. Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 10. Juni 2010 Autor Melden Teilen Geschrieben 10. Juni 2010 00000794.000007a0::2010/06/10-07:35:16.224 WARN [MM] MmQuorumArbitrationTimeout 60. 00000c0c.00000c1c::2010/06/10-07:35:16.698 INFO IP Address <Cluster IP Address>: Resource open, resource ID = 680656. 00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] FmpRmCreateResource: created resource d8961702-bc3c-45db-8076-59a5772899dc, resid 1064112 00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] Initializing resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 from the registry. 00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] Name for Resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 is 'Cluster Name'. 00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] FmpRmCreateResource: creating resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 in shared resource monitor 00000c0c.00000c24::2010/06/10-07:35:16.698 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2 00000c0c.00000c24::2010/06/10-07:35:16.698 WARN Network Name <Cluster Name>: Unable to read CreatingDC parameter, error=2 00000c0c.00000c24::2010/06/10-07:35:16.698 INFO Network Name <Cluster Name>: Successful open of resid 690344 00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Checking for network match: network masks 00FEFFFF=00FEFFFF and addresses 642018AC^002018AC, role 2. 00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Online: Opened object handle for netinterface be63cf25-1157-4009-bbbc-6f5516e706c3. 00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Online: Registered notification for netinterface be63cf25-1157-4009-bbbc-6f5516e706c3. 00000c0c.00000c50::2010/06/10-07:35:16.714 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry. 00000c0c.00000c50::2010/06/10-07:35:17.727 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry. 00000c0c.00000c50::2010/06/10-07:35:18.739 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry. 00000794.000007a4::2010/06/10-07:35:18.755 INFO [NM] Interface be63cf25-1157-4009-bbbc-6f5516e706c3 is up (node: Clusterserver02, network: Puplic Connection). 00000794.000007a4::2010/06/10-07:35:18.755 WARN [NM] Network 5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Puplic Connection) is up. 00000794.00000c40::2010/06/10-07:35:18.755 WARN [NM] Network b6ab46c9-64fd-4a1e-9e49-88931c2d3707 (Internal Connection) is up. 00000c0c.00000c5c::2010/06/10-07:35:22.805 WARN IP Address <Cluster IP Address>: WorkerThread: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 changed to state 3. Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 10. Juni 2010 Autor Melden Teilen Geschrieben 10. Juni 2010 00000c0c.00000c9c::2010/06/10-07:35:22.805 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2 00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Replaced DNS name Clusterserver01.mydomain.net with IP Address 162.23.22.100 over adapter 'Puplic Connection'. 00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Registered DNS PTR record 100.22.23.162.in-addr.arpa. for host Clusterserver01.mydomain.net over adapter 'Puplic Connection' 00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Modified DNS name Clusterserver01.mydomain.net with IP Address 162.23.22.100 over adapter 'Puplic Connection'. 00000c0c.00000c9c::2010/06/10-07:35:23.137 INFO Network Name <Cluster Name>: Registered server name Clusterserver01 on transport \Device\NetBt_If1. 00000c0c.00000c9c::2010/06/10-07:35:27.701 INFO Network Name <Cluster Name>: Registered workstation name Clusterserver01 on transport \Device\NetBt_If1. 00000c0c.00000c9c::2010/06/10-07:35:27.701 INFO Network Name <Cluster Name>: Network Name Clusterserver01 is now online 00000794.000007c8::2010/06/10-07:35:36.940 WARN [FM] FmDeleteResourceType: Resource type Microsoft Message Queue Server does not exist... 00000794.000007a0::2010/06/10-07:35:36.956 WARN [EVT] Set propagation state to 0001 00000794.00000c90::2010/06/10-07:35:37.699 WARN [FM] FmDeleteResourceType: Resource type IIS Server Instance does not exist... 00000794.000007c8::2010/06/10-07:35:37.793 WARN [FM] FmDeleteResourceType: Resource type SMTP Server Instance does not exist... 00000794.000007c0::2010/06/10-07:35:37.904 WARN [FM] FmDeleteResourceType: Resource type NNTP Server Instance does not exist... 00000794.00000c90::2010/06/10-07:35:37.999 WARN [FM] FmDeleteResourceType: Resource type IIS Virtual Root does not exist... 00000794.000007c8::2010/06/10-07:35:38.093 WARN [FM] FmDeleteResourceType: Resource type Time Service does not exist... Zitieren Link zu diesem Kommentar
Lian 2.482 Geschrieben 10. Juni 2010 Melden Teilen Geschrieben 10. Juni 2010 Seid doch bitte so gut und hänge die Datei an oder lade sie bei einem Upload Service hoch. So haben wir nichts davon und Du letztendlich auch nicht... ;) Es sind haufenweise Fehler (Quorum/Netzwerk) im Log die nicht sein sollten, soviel schon mal vorab. Zitieren Link zu diesem Kommentar
NorbertFe 2.110 Geschrieben 10. Juni 2010 Melden Teilen Geschrieben 10. Juni 2010 Ich denke schon das der Switch und die Anbindung funktioniert, denn es sind noch 10 andere Server im Schrank die keine Probleme haben. Die haben aber auch keine virtuellen IP Adressen. ;) Was für ein Switch hängt denn nun im Netz an der Cluster hängt? Hab mal nen Teil des Logs rein kopiert, die meisten errors wiederholen sich. Vielleicht sollte ich den Cluster noch mal per cmd erstellen und nicht per wizzard.. Wenns dich beruhigt, ich habe bisher noch nie einen Windows 2003 Cluster per cmd erstellt und es hat trotzdem immer funktioniert. Tippfehler kannst du ausschliessen? Bye Norbert Zitieren Link zu diesem Kommentar
Andy_Ladde 10 Geschrieben 10. Juni 2010 Autor Melden Teilen Geschrieben 10. Juni 2010 So hab die Cluster Log mal hochgeladen: Cluster.log Switche sind Dell PowerConnect 6224. Die erste NIC auf dem Switch 1 und die 2. auf Switch2. Zitieren Link zu diesem Kommentar
Lian 2.482 Geschrieben 10. Juni 2010 Melden Teilen Geschrieben 10. Juni 2010 Im Log ist sichtbar, daß die Netzwerkverbindungen umbenannt wurden auf "Puplic Connection" und "Internal Connection", das ist aber kein Problem. Ansonsten sind die letzten beiden Startvorgänge und Logeinträge weitestgehend sauber. Die beiden Einträge vom Typ Warning machen mich stutzig: 00000c28.00000c70::2010/06/10-07:06:40.925 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry. Deine NetInterfaces sind 5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Puplic Connection). b6ab46c9-64fd-4a1e-9e49-88931c2d3707 (Internal Connection). Was ist die be63cf25-1157-4009-bbbc-6f5516e706c3? Hast Du noch eine dritte Netzwerkverbindung/NIC? Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.