PDF-Duplikatfinder

Ein leistungsstarkes Werkzeug zum Finden und Verwalten doppelter PDF-Dateien auf Ihrem Computer. Der PDF-Duplikatfinder hilft Ihnen, doppelte PDF-Dokumente zu identifizieren und zu entfernen, um Speicherplatz zu sparen und Ihre Dateien effizienter zu organisieren.

✨ Funktionen

🔍 Intelligenter PDF-Vergleich: Finden Sie doppelte PDFs basierend auf dem Inhalt, nicht nur nach Dateinamen oder -größen
📝 Textbasierter Vergleich: Identifizieren Sie Duplikate auch bei geringfügigen visuellen Unterschieden durch fortschrittliche Textanalyse
👁 Integrierter PDF-Viewer: Betrachten Sie PDFs direkt in der Anwendung
📋 Zweigeteilte Benutzeroberfläche: Zeigen Sie sowohl die Dateiliste als auch Duplikatgruppen in separaten Tabs an
🎯 Erweiterte Filterung: Filtern Sie nach Dateigröße, Änderungsdatum und Namensmustern
🚀 Schnelles Scannen: Optimierte Algorithmen für schnelles Scannen großer PDF-Sammlungen
🎨 Intuitive Benutzeroberfläche: Übersichtliche und benutzerfreundliche Oberfläche mit Unterstützung für Hell/Dunkel-Designs
🔄 Stapelverarbeitung: Verarbeiten Sie mehrere Dateien oder ganze Ordner auf einmal
📊 Detaillierte Analyse: Zeigen Sie Dateidetails, Vorschauen und Vergleichsergebnisse an
🛠 Erweiterte Werkzeuge: Mehrere Auswahlmodi, Filter- und Sortieroptionen
🌍 Mehrsprachige Unterstützung: In mehreren Sprachen verfügbar
📊 Fortschrittsverfolgung: Echtzeit-Fortschrittsbalken für Dateiverarbeitungsvorgänge
⏱ Zuletzt geöffnet: Schneller Zugriff auf zuletzt geöffnete Dateien mit Kontextmenüoptionen

📦 Installation

Voraussetzungen

Python 3.8 oder höher
pip (Python-Paketmanager)
Optionale Backends für das PDF-Rendering (automatischer Fallback bei Fehlschlagen):
- PyMuPDF (fitz) — Standard und in den Anforderungen enthalten
- Ghostscript (für Wand) — Installieren Sie Ghostscript und legen Sie den ausführbaren Pfad in den Einstellungen fest

Siehe VORAUSSETZUNGEN.md für plattformspezifische Einrichtung.

Installation aus dem Quellcode

Klonen Sie das Repository:

git clone https://github.com/Nsfr750/PDF_finder.git
cd PDF_finder

Erstellen und aktivieren Sie eine virtuelle Umgebung (empfohlen):

python -m venv venv
.\venv\Scripts\activate  # Windows
source venv/bin/activate  # Linux/Mac

Installieren Sie die erforderlichen Abhängigkeiten:
```
pip install -r requirements.txt
```

Verwendung

Starten Sie die Anwendung:
```
python main.py
```
Klicken Sie auf “Ordner durchsuchen”, um ein Verzeichnis für die Suche nach doppelten PDFs auszuwählen.
Überprüfen Sie die Ergebnisse im Hauptfenster. Nach Abschluss eines Scans wird die Dateiliste automatisch mit den gescannten PDFs und Duplikatgruppen gefüllt.
Verwenden Sie die Werkzeuge zum Verwalten von Duplikaten:
- Markieren Sie zu behaltende Dateien
- Löschen Sie unerwünschte Duplikate
- Zeigen Sie Vorschauen der Dateien an, bevor Sie Aktionen durchführen

Wichtige Funktionen im Detail

Intelligenter PDF-Vergleich

Vergleicht PDF-Inhalte mit fortschrittlichen Hash-Algorithmen
Erkennt ähnliche Dokumente auch bei unterschiedlichen Dateinamen oder Metadaten
Konfigurierbarer Ähnlichkeitsschwellenwert für optimale Ergebnisse

Leistungsoptimierungen

Multithread-Scanning für schnelleres Verarbeiten
Speichereffiziente Handhabung großer PDF-Dateien
Fortschrittsverfolgung und Abbruchmöglichkeit

Benutzererfahrung

Moderne, reaktionsschnelle Oberfläche
Anpassbare Ansichtsoptionen
Umfassende Tastenkombinationen
Detaillierte Dateiinformationen und Vorschauen
Symbolleiste mit verbessertem Abstand und besserer Lesbarkeit
Das Einstellungsfenster enthält eine Schaltfläche “Backends testen”, um die Verfügbarkeit von PyMuPDF und Ghostscript zu überprüfen

PDF-Backends und Fallback

Wählen Sie Ihr bevorzugtes Backend in Einstellungen → PDF-Rendering
Verwenden Sie “Backends testen”, um zu überprüfen, ob Ghostscript korrekt konfiguriert ist
Wenn das ausgewählte Backend fehlschlägt, wechselt die Anwendung automatisch zu einem verfügbaren Backend und zeigt eine Warnung in der Statusleiste an (lokalisiert)

Versionsverlauf

Siehe CHANGELOG.md für eine vollständige Liste der Änderungen in jeder Version.

Mitwirken

Beiträge sind willkommen! Bitte lesen Sie unsere Beitragsrichtlinien für Details, wie Sie zu diesem Projekt beitragen können.

📄 Lizenz

Dieses Projekt ist unter der GNU General Public License v3.0 lizenziert - siehe LIZENZ für Details.

🙏 Danksagungen

Vielen Dank an alle Mitwirkenden, die zur Verbesserung des PDF-Duplikatfinders beigetragen haben
Mit ❤️ erstellt mit Python und PyQt6

🐞 Bekannte Probleme

Die Sprachauswahl funktioniert nicht

📅 Letzte Aktualisierung: August 2025
🐍 Python-Version: 3.8+
📜 Lizenz: GPL-3.0