Jump to content

DFSR Service bleibt hängen


Direkt zur Lösung Gelöst von Doso,
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo zusammen,

 

ich habe gerade ein Problem mit meiner DFS Replikation.

Der Dienst bleibt bei der Initialen Replikation nach einiger Zeit mit 100% CPU Last hängen.

 

Aber hier erst mal mein Szenario:

SERVER A - Produktivsystem

Ist ein Cluster, gebildet aus "Server A1" & "Server A2", beide auf VM.

 

SERVER B - Backup

Ist nativ, hat ein DFS Replikat, von dem dann Backups gezogen werden.

 

SERVER C - Backup

Ist nativ, hat ein DFS Replikat, von dem dann Backups gezogen werden.

 

Die Kombi lief bereits ohne Probleme.

Nachdem die DFSR Datenbank auf B & C irreparabel beschädigt war, habe ich folgendes gemacht:

  • Alle Mitglieder der DFSR Gruppe deaktiviert
  • DFSR Dienst auf B & C beendet
  • Datenbank und DFSRPrivate auf B & C gelöscht
  • DFSR Dienst auf B aktiviert
  • Server A in der DFSR Gruppe aktiviert und gewartet bis er sich als Primärer meldet "Ereignis ID 4112"
  • Server B in der DFSR Gruppe aktiviert

 

Server B startet auch brav die Erst-Replikation (ID 4102) und initialisiert das Laufwerk (ID 2002).

Ansonsten gleicht er einen Haufen Dateien ab (ID 4412).

 

Nach einigen Stunde steht dann der DFSR Dienst bei 100% und es passier nichts mehr.

Die Gegenstelle, Server A, meldet irgendwann dann einen Fehler bei der Kommunikation mit der Gegenstelle (ID 5002).

 

Ich habe bereits verschiedene Szenarien ausprobiert, immer mit dem gleichen Ergebnis.

 

Hat vielleicht jemand eine Idee, was dem Automaten fehlen könnte?

 

Schon mal Danke für Eure Mühen & Gruß

 

Andre P

 

 

 

Das hier sind die letzten Einträge des DFS-Logfiles von Server B:

20160601 22:43:27.262 1496 MEET  6356 Meet::LocalDominates Remote version dominates localgvsn:{A75068D7-1A92-4CEE-B522-255E30BF3A5E}-v279540 updateName:MZ-3312.jpg uid:{16345316-A1C6-4DC3-982E-8C2BF0239749}-v33198684 gvsn:{16345316-A1C6-4DC3-982E-8C2BF0239749}-v33198684 connId:{15F710BB-9C4A-49B2-BA29-B941511710F6} csName:Abteilungen

20160602 06:47:37.781 3252 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1804FDB60
20160602 06:47:37.781 2420 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1809FD530
20160602 06:47:42.859  256 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1802FDC90
20160602 06:47:42.859 3136 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F180BFD810
20160602 06:47:44.890  164 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F18107D520
20160602 06:47:44.890 2188 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F180E7D5B0
20160602 06:47:47.937 1372 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1806FD6C0
20160602 06:48:43.688 1104 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F180D7D910
20160602 06:48:44.703 1492 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F18047D600
20160602 06:48:49.735 2412 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F180FFD6B0
20160602 06:49:04.922 3528 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F180B7D4E0
20160602 06:49:13.016  412 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F18067D580
20160602 06:49:16.063 1496 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F18097D590
20160602 07:06:33.682 2452 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F18037DBB0
20160602 07:06:41.682  680 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1807FDAB0
20160602 07:06:42.682 1696 DOWN  1290 [WARN] WrapRpcInitializeFileTransferAsync RPC Async call is taking a long time rpcAsyncState:000000F1827BD9B0
 
Link zu diesem Kommentar
  • 2 Wochen später...

Hallo,

 

ich habe in den letzten Tagen diverse Szenarien ausprobiert, aber das Ergebnis ist immer wieder das Gleiche: der DFSR Dienst bleibt irgendwann mit 100% CPU Auslastung stehen.

Selbst das löschen und Neuanlegen der Replikationsgruppe brachte keinen Erfolg.

Aktuell lasse ich den DFSR Dienst den Datenbestand zum Replikationsziel kopieren (ohne Pre-seed). Mal sehen, was daraus wird...

 

Bei der Recherche in den Logs, ob er immer an bestimmten Files hängen bleibt, ist mir folgendes aufgefallen:

 

Eine Menge Verzeichnisse/Dateien überschreiten die Pfad-Länge von 255 Zeichen und

auf einigen Verzeichnissen habe die User die Berechtigungen "angepasst" und dabei sowohl SYSTEM, als auch den ADMINISTRATOR entfernt.

 

Kann das den Dienst absterben lassen?

Dann stellt sich mir auch noch die Frage, wie haben die User es überhaupt geschafft so lange Verzeichnisstrukturen anzulegen, dass die Länge von 255 Zeichen überschritten werden konnten?

 

Hat keiner einen Tipp, wie ich dem Fehler auf die Spur komme?

Oder kennt jemand jemanden, der einen kennt, der DFSR Profi ist?  :shock:

 

Gruß

Andre P.

Link zu diesem Kommentar

Die Pfade bringt man schon länger hin. Kann die Hälfte des Windows auch damit umgehen (irgendwo um 32'000 oder warens doch 65'000 zeichen ist Schluss). Die andere Hälfte von Windows hat aber Mühe wens mehr als 255 Zeichen sind. Allen voran - was ich gar ned verstehe das es nach so vielen Jahren immer noch so ist - der Explorer. Der Windows Unterbau, also das Filesystem an sich, hat 0 Probleme mit langen Strukturen. Robocopy packts z.B. auch. Manche andere Programme wiederum ned. Ein Relikt aus alten Tagen das leider immer noch bei weitem nicht durchgefixt ist.

 

DFSR und Rechte: Nun, das ist theoretisch möglich, dass hier die fehlenden Berechtigungen mit reinpfuschen. Allerdings dürfte er deswegen ned hängenbleiben sondern müsste eigentlich Fehler produzieren wenn er tatsächlich keinen Zugriff hat.

Wenn es gewollt ist, das Admin und System keinen Zugriff haben und es Probleme macht, muss man mit Dienstkonten für die benötigten Dienste arbeiten, die dann auch in den entsprechenden Gruppen Mitglied sind.

 

Solche Konstrukte machen gerne immer wieder mal Probleme, weshalb manche Admins die Berechtigungen für System und oder Admin jeweils über Nacht hart setzen. Wiederum andere machen sich diese Mühe weil es - zumindest theoretisch - etwas weniger einfach ist, an die Daten zu kommen und passen eben alles auf Dienstkonten an. Ich entziehe dem System und den Admins vor allem im VDI-Bereich auch gerne Schreibrechte in Registry oder Filesystem die viele IO's produzieren oder mit Spy/Telemetry-Tätigkeit zusammenhängen. Man glaubt kaum, was da alles an unnötigen IO's zusammen kommen. Gleichzeitig gibts dann eine Dienst-Gruppe welche genau diese Rechte hat. Bei Problemen bzw. deren Lösung kommen Admin und System in die Gruppe rein und Problem wird gesucht.

Link zu diesem Kommentar

Hallo Weingeist,

Danke für Deine Antwort!

 

Das Robocopy diese Probleme nicht hat, habe ich auch schon gelesen und gemerkt. Ich hatte zuvor mit Robocopy den Pre-seed gemacht -ohne Probleme.

 

Ein Dienstkonto würde wahrscheinlich nicht helfen.

Die User sind hingegangen und haben die Vererbung in einigen Verzeichnissen ausgeschaltet und die übergeordneten Rechte nicht kopiert, sondern eigene (einzelne User) eingetragen.

Damit waren dann SYSTEM und Administrator weg. Oder kann man irgendwie gewisse Konten/Gruppen "erzwingen"?

 

Zu den IOs, wie kann ich die moitoren/analysieren?

Ist jetzt zwar ein anderes Thema, aber die Auslastung am Fileserver würde mich mal interessieren.

 

Gruß

Andre P.

Link zu diesem Kommentar

Hallo,

 

wir haben diverse Abteilungs-/Gruppenverzeichnisse, auf denen die entsprechenden User via Gruppenzugehörigkeit Vollzugriff haben.

Damit sollen die User die Möglichkeit haben eigene Unterstrukturen anzulegen und ggf. die Rechte selber weiter einschränken können für "sensiblere" Daten.

Leider und offensichtlich scheitert es aber an den Fähigkeiten und dem Verständnis der Vererbungslehre...

 

Der DFS Dienst ist diese Nacht wieder hängen geblieben, obwohl er den kompletten Datenbestand selber kopieren musste.

Also gehe ich jetzt mal davon aus, dass die Ursache in der Quelle (SERVER A) zu suchen ist, obwohl der Dienst auf Server B & C stirbt.

 

Ich sterb auch bald...

Link zu diesem Kommentar

Wir hatten auf 2012R2 Servern nach Aktivierung von DFS-Namepsaces das problem das wir in einen Memory Leak gelaufen sind, Workaround:

 

https://blogs.technet.microsoft.com/core/2015/06/26/memory-leak-verursacht-von-dem-remote-registry-dienst-unter-windows-8-8-1-und-server-2012-2012r2/

 

Evtl. einen Versuch Wert. Bei der Suche dazu habe ich auch Fehler zum DFS in anderen Serverversionen gefunden. Evtl. läufst du da in einen Bug der irgendwo schon bekannt ist und dafür gibt es einen Patch/Hotfix/Workaround irgendwo.

Link zu diesem Kommentar

Hallo Doso,

 

VIELEN DANK!!!!

 

Genau das ist der Fehler.

Das Update deinstalliert, Replikationsgruppen neu eingerichtet und siehe da, er läuft durch.

 

Hier der Vollständigkeit halber noch der Link zur MS Doku des KB3156418, in dem Microsoft das Problem mit dem DFSR Dienst auch nennt:

https://support.microsoft.com/en-us/kb/3156418

 

Noch mal vielen Dank für die Hilfe!

Problem ist damit gelöst.

 

Gruß

Andre P.

bearbeitet von AndreP
Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...