Chercheur de PDF en double

Un outil puissant pour trouver et gérer les fichiers PDF en double sur votre ordinateur. Le Chercheur de PDF en double vous aide à identifier et supprimer les documents PDF dupliqués, économisant ainsi de l’espace disque et organisant vos fichiers plus efficacement.
✨ Fonctionnalités
- 🔍 Comparaison intelligente des PDF : Trouvez les PDF en double en fonction du contenu, pas seulement des noms ou des tailles de fichiers
- 📝 Comparaison basée sur le texte : Identifiez les doublons même avec des différences visuelles mineures grâce à une analyse de texte avancée
- 👁 Visionneuse PDF intégrée : Apercevez les PDF directement dans l’application
- 📋 Interface à double vue : Visualisez à la fois la liste des fichiers et les groupes de doublons dans des onglets séparés
- 🎯 Filtrage avancé : Filtrez par taille de fichier, date de modification et motifs de noms
- 🚀 Analyse rapide : Algorithmes optimisés pour une analyse rapide de grandes collections de PDF
- 🎨 Interface intuitive : Interface épurée et conviviale avec support des thèmes clair/sombre
- 🔄 Traitement par lots : Traitez plusieurs fichiers ou dossiers entiers en une seule fois
- 📊 Analyse détaillée : Affichez les détails des fichiers, les aperçus et les résultats de comparaison
- 🛠 Outils avancés : Modes de sélection multiples, filtrage et options de tri
- 🌍 Multilingue : Disponible en plusieurs langues
- 📊 Suivi de la progression : Barre de progression en temps réel pour les opérations de traitement de fichiers
- ⏱ Fichiers récents : Accès rapide aux fichiers récemment ouverts avec options de menu contextuel
📦 Installation
Prérequis
- Python 3.8 ou supérieur
- pip (gestionnaire de paquets Python)
- Moteurs de rendu PDF optionnels (basculement automatique en cas d’échec) :
- PyMuPDF (fitz) — inclus par défaut via les dépendances
- Ghostscript (pour Wand) — installez Ghostscript et définissez son chemin d’exécution dans les paramètres
Voir PREREQUIS.md pour la configuration spécifique à chaque plateforme.
Installation à partir des sources
-
Clonez le dépôt :
git clone https://github.com/Nsfr750/PDF_finder.git
cd PDF_finder
-
Créez et activez un environnement virtuel (recommandé) :
python -m venv venv
.\venv\Scripts\activate # Windows
source venv/bin/activate # Linux/Mac
-
Installez les dépendances requises :
pip install -r requirements.txt
Utilisation
-
Lancez l’application :
-
Cliquez sur “Parcourir un dossier” pour sélectionner un répertoire à analyser à la recherche de PDF en double.
-
Consultez les résultats dans la fenêtre principale. Après une analyse, la liste des fichiers est automatiquement remplie avec les PDF analysés et les groupes de doublons.
-
Utilisez les outils pour gérer les doublons :
- Marquez les fichiers à conserver
- Supprimez les doublons indésirables
- Apercevez les fichiers avant toute action
Fonctionnalités clés en détail
Comparaison intelligente des PDF
- Compare le contenu des PDF à l’aide d’algorithmes de hachage avancés
- Détecte les documents similaires même avec des noms ou des métadonnées différents
- Seuil de similarité configurable pour des résultats précis
- Analyse multithread pour un traitement plus rapide
- Gestion efficace de la mémoire pour les fichiers PDF volumineux
- Suivi de la progression et possibilité d’annulation
Expérience utilisateur
- Interface moderne et réactive
- Options d’affichage personnalisables
- Raccourcis clavier complets
- Informations et aperçus détaillés des fichiers
- Barre d’outils avec un espacement amélioré et une meilleure lisibilité
- La boîte de dialogue des paramètres inclut un bouton “Tester les moteurs” pour vérifier la disponibilité de PyMuPDF et Ghostscript
Moteurs de rendu PDF et basculement
- Choisissez votre moteur préféré dans Paramètres → Rendu PDF
- Utilisez “Tester les moteurs” pour vérifier si Ghostscript est correctement configuré
- Si le moteur sélectionné échoue, l’application bascule automatiquement vers un moteur disponible et affiche un avertissement dans la barre d’état (localisé)
Historique des versions
Consultez CHANGELOG.md pour une liste complète des modifications de chaque version.
Contribution
Les contributions sont les bienvenues ! Veuillez lire nos Directives de contribution pour plus de détails sur la façon de contribuer à ce projet.
📄 Licence
Ce projet est sous licence GNU General Public License v3.0 - voir le fichier LICENCE pour plus de détails.
🙏 Remerciements
- Merci à tous les contributeurs qui ont aidé à améliorer le Chercheur de PDF en double
- Développé avec ❤️ en utilisant Python et PyQt6
🐞 Bugs connus
- La sélection de la langue ne fonctionne pas
📅 Dernière mise à jour : août 2025
🐍 Version de Python : 3.8+
📜 Licence : GPL-3.0