Jump to content

Dateien vom Webserver per http downloaden und verwaiste löschen?


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hi,

 

ich weiß nicht wohin ich mich wenden soll daher versuche ich einfach mal mein Glück in diesem Forum:

 

Ich habe einen Linux-Webserver vor die Nase gesetzt bekommen welcher per HTTP Dateien zum Download anbietet (ca. 130 GB / Apache mit Directory Listing). Diese Dateien lade ich mittels wget per Taskplaner herunter und synchronisiere sie auf andere Server mit DFS. Klappt wunderbar! Mein Problem: Löscht der Hersteller auf seinem Webserver Dateien, bekomme ich das nicht mit. Demnach verbleiben diese bei mir und der Speicherplatz wächst schnell an (ca. 10GB pro Woche). Offensichtlich kann wget per http keine verwaisten Dateien erkennen und löschen; wie könnte man das Problem lösen bzw. wie würdet ihr das machen?

 

cu,

cjmatsel

Link zu diesem Kommentar

Ich würde (k.a. ob das so mit wget geht oder das ein eigenes Script / Programm benötigt) folgendes machen.

 

Lokal die Daten Temporär verschieben, alle Dateien auf dem Webserver auflisten (z.B. Name, Größe, Datum) und mit den Lokalen vergleichen. Wenn eine Datei lokal existiert diese kopieren, wenn nicht herunterladen und am Ende das Temporäre verzeichnis löschen.

 

Oder (einfacher, braucht aber mehr Bandbreite):

Lokal alle Daten löschen und jedes mal neu ziehen.

Link zu diesem Kommentar

Hi,

 

die Bandbreite hätte ich, aber bei über 100GB wird das zum einen ein Zeit- und HDD-Problem und zum anderen werden die Daten ja per DFS (und dann über dürre WAN-Verbindungen) repliziert. Das schlägt dann kräftig zu!

 

Soweit ich lesen konnte ist das Thema "orphaned files" bei den wget-Entwicklern zwar angekommen aber bisher noch nicht gelöst worden. Wenn ein anderes Tool gibt was das kann dann nehme ich das gern...

 

Ich hatte schon so eine ähnliche Lösung: Einfach alles herunterladen in ein temporäres Verzeichnis und dann in das DFS-Verzeichnis verschieben, dabei mittels robocopy nicht enthaltene Dateien löschen. Das temporäre Verzeichnis wird dann immer schön geleert... Das Problem: doppelter Speicherplatz ist notwendig!

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...