Jump to content

Namens- oder Größenähnliche Dateien finden


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Moin!

 

Wir haben hier in der Uni eine Art von Datenbank (Rauschdaten), die jeden Datensatz in einer Datei speichert - Diese Dateien sind jeweils einige MB gross, wobei das ja eigentlich nicht weiter von interesse ist.

 

Im Dateinamen werden Keywords angegeben, was der einzelne Datensatz jeweils enthält.

 

Die Daten haben sich jetzt über 6-7 Jahre angesammelt und daher sind viele Fast-Duplikate in der Datenbank, also Dateien welche ungefähr dieselben Daten enthalten und sehr ähnliche Keywords im Dateinamen haben und auch teilweise Größenmässig ähnlich sind. Mit Dateinamenähnlichkeit sind einmal gleiche Wörter / Buchstabenfolgen und auch phonetische Ähnlichkeit gemeint.

 

Gibt es ein Programm mit dem ich zB Solche Dateipaare, -tripel, usw. finden und die Dateidaten anzeigen lassen kann kann und dann auswählen kann welches gelöscht wird? Oder gar einstellen kann dass immer der grösste Datensatz behalten wird?

 

Ich stelle mir das so vor, daß einfach Ein Ordner eingegeben wird, den das programm dann (samt unterordnern) durchsucht und dann die gefundenen duplikate zum bearbeiten übergibt.

 

Danke schonmal,

OPP

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...