Namens- oder Größenähnliche Dateien finden

opp · 20. Dezember 2004

Moin!

Wir haben hier in der Uni eine Art von Datenbank (Rauschdaten), die jeden Datensatz in einer Datei speichert - Diese Dateien sind jeweils einige MB gross, wobei das ja eigentlich nicht weiter von interesse ist.

Im Dateinamen werden Keywords angegeben, was der einzelne Datensatz jeweils enthält.

Die Daten haben sich jetzt über 6-7 Jahre angesammelt und daher sind viele Fast-Duplikate in der Datenbank, also Dateien welche ungefähr dieselben Daten enthalten und sehr ähnliche Keywords im Dateinamen haben und auch teilweise Größenmässig ähnlich sind. Mit Dateinamenähnlichkeit sind einmal gleiche Wörter / Buchstabenfolgen und auch phonetische Ähnlichkeit gemeint.

Gibt es ein Programm mit dem ich zB Solche Dateipaare, -tripel, usw. finden und die Dateidaten anzeigen lassen kann kann und dann auswählen kann welches gelöscht wird? Oder gar einstellen kann dass immer der grösste Datensatz behalten wird?

Ich stelle mir das so vor, daß einfach Ein Ordner eingegeben wird, den das programm dann (samt unterordnern) durchsucht und dann die gefundenen duplikate zum bearbeiten übergibt.

Danke schonmal,

OPP

Damian · 20. Dezember 2004

Hi.

Schau dir das mal an: http://www.alldup.de/alldup.htm

Damian

opp · 21. Dezember 2004

Oho! Das sieht doch gut aus! Probier ich mal an einer Kopie der Datenbank! Danke!!

Noch jemand was? :)

Anmelden

Namens- oder Größenähnliche Dateien finden

Empfohlene Beiträge

opp 10

Damian 1.668

opp 10

Schreibe einen Kommentar

Menu

Aktivitäten