Wenn auf einem heimischen Daten- und Backupserver Bilder, Videos, Musik und Texte von etlichen Smartphones und Notebooks landen, sind Redundanzen durch doppelte und mehrfache Instanzen identischer Dateien unvermeidlich. Wenn es zu arg wird oder gar der Speicherplatz eng, gibt es Tools, die zumindest die Vorarbeit leisten.
Der Einsatz automatischer Lösch-methoden ist nie zu empfehlen, weil identische Dateien in diversen Ordnern ihren Sinn und Zweck haben können. Dublettensuche ist daher zeitraubend und mühsam, aber clevere Tools helfen immerhin zur Einschätzung, wo sich die Arbeit lohnt.
Das Paket „rdfind“ (Redundant Data Find) finden Sie überall in den Standard-Paketquellen. Es ist das beste Terminalwerkzeug zur Suche nach Dateidubletten mit mehrstufiger Analyse (Größenvergleich, binärer Header- & Footer-Vergleich der Dateien gleicher Größe, finale Checksummenprüfung verbleibender Redundanzen): Wenn rdfind Dubletten meldet, dann sind es auch welche. Ein Analyselauf sieht etwa so aus:
rdfind -minsize 2000000/srv/Archiv
Der Schalter „-minsize“ gibt eine Dateigröße vor (hier 2 MB) vor, die alle kleineren Dateien von vornherein aussortiert. Für den Start ist das zu empfehlen, um die Menge zu reduzieren und mit den lohnendsten Objekten zu beginnen. Die Kandidaten schreibt rdfind in die Datei „results.txt“ in das aktuelle Verzeichnis.
Tipp: rdfind sortiert nach Größe, sodass sich die größten Dubletten am Ende der Datei befinden. Von automatischen Löschoptionen mit Schalter „-deleteduplicates true“ raten wir ab.
Auf grafischen Linux-Desktops ist Czkawka aktuell das beste grafische Werkzeug, um Dateidubletten zu finden. Statt einer Installation als Snap oder Flatpak, wie es eventuell Ihre Linux-Distribution vorschlägt, ist das das Appimage direkt von der Herstellerseite https://czkawka.com/#download die schlankere Alternative. Wirklich einfacher als rdfind ist Czkawka aber auch nicht: Für eine Dublettensuche wählen Sie oben mit „Neu“ das Verzeichnis und als Modus „Gleiche Dateien“. Der Klick auf „Suchen“ startet den Suchlauf. Am Ende präsentiert Czkawka die Ergebnisse im Hauptfenster. Das Aufräumen müssen Sie manuell erledigen. Immerhin kann man über die Schaltfläche „Auswählen“ Massenmarkierungen von Dateien vornehmen (etwa „Alle außer Neuester auswählen“), die dann ein Klick auf „Löschen“ in einem Rutsch entfernt.

