Supprimer partie de texte dans PDF

Résolu/Fermé
Pierre - 23 avril 2015 à 12:15
Pierre-Branka Messages postés 7 Date d'inscription lundi 21 février 2011 Statut Membre Dernière intervention 27 septembre 2015 - 30 avril 2015 à 16:40
Bonjour,
Votre article "Comment modifier un PDF gratuitement ?" paru dans le dernier numéro Comment ça marche.net est très utile. Cependant, souvent il faut faire des sélections (découpes) dans les textes *.PDF pour les supprimer, puis combler les vides avec le reste des textes qu'on veut garder. Ce problème se pose souvent puisqu'on ne veut garder que la partie du texte numérisé ou reçu qui est d'intérêt et supprimer le reste. Quels sont les logiciels gratuits que vous pouvez nous conseiller? Merci.
Salutations,
P. Volkov
E-mail: ***@***
A voir également:

1 réponse

C-Claire Messages postés 4014 Date d'inscription samedi 8 novembre 2014 Statut Membre Dernière intervention 3 octobre 2016 2 213
27 avril 2015 à 11:57
Bonjour Pierre,

Pour modifier efficacement un PDF, il faut modifier le document source et le reconvertie en PDF.
Pour mémoire, un logiciel de traitement de PDF n'est pas un logiciel de création de documents. Sa fonction de base est de simuler une impression dans un fichier, en conservant la mise en page et en forme du document original et ce, quel que soit le système d'exploitation utilisé.
Au fil du temps, des fonctions ont été ajoutées comme la retouche de document.
Mais même avec Adobe Acrobat Pro, les modifications restent fastidieuses et ne permettent pas de remettre en page un document comme le ferait un traitement de texte par exemple.

Cela dit, tu peux essayer Inskape, logiciel gratuit de dessin vectoriel, mais qui semble donner de bons résultats avec la modification de PDF : https://inkscape.org/fr/

ou tenter Nitro Pro (la version d'essai car il n'est pas gratuit) :
https://www.gonitro.com/fr/pro
3
Pierre-Branka Messages postés 7 Date d'inscription lundi 21 février 2011 Statut Membre Dernière intervention 27 septembre 2015 1
Modifié par Pierre-Branka le 30/04/2015 à 16:42
Bonjour Claire,

Merci pour votre explication qui est très bien écrite et très claire.

Quant au document source, que vous mentionnez au début, c'est quand on numérise un document chez soi et c'est le cas le plus courant. Dans ce cas on peut utiliser les divers OCR, mais les gratuits sont de faible qualité.
Puis il y a la possibilité du scanner d'enregistrer soit en PDF, soit en JPG. Les JPG on peut les traiter avec un logiciel de photographie (Adobe Photoshop et autres) - faire des découpes, déplacements, augmenter le contraste etc. Mais le prix à payer est lourd - le fichier JPG est de grande taille.
La deuxième solution est d'utiliser le PDF sorti du scanner. Dans le Adobe ou Foxit Reader on copie le texte pour le coller dans nouveau document ouvert dans Word. Cependant ce texte DOC (ou DOCX) doit être mis en forme et il faut faire des corrections - il y a du travail. Mais on est gagnant par une mise en forme et présentation qu'on souhaite avoir et surtout une taille du fichier très réduite.
Toutefois, si on ne veut pas remanier le texte, le format PDF est imbattable de par sa taille et l'acceptation de faible résolution de numérisation (150 dpi souvent suffisent).
Je me permets de vous joindre le tableau ci-dessous qui illustre les diverses possibilités: le format PDF, le format JPG, le format JPG obtenu à partir du PDF (avec Photoshop) et le format DOCX obtenu à partir du fichier PDF.

Est-ce qu'il vous serait possible de donner votre avis? Merci d'avance.

Cordialement,
Pierre
-------------------------------------------------------------------------------
Le texte en DOCX est de plus petite taille que PDF. Mais il faut compter avec le travail de vérification et de mise en forme dans Word, DOCX - il y a du travail!
Exemple de page A4 dont texte 50%+images 50%
Couleur Exemple de page A4 dont texte 100%
N/B
Taille fichier JPG Taille fichier PDF Taille fichier Word DOCX + images JPG Taille fichier JPG Taille fichier PDF Taille fichier Word DOCX
Avec
150 dpi (faible qualité) Avec 300 dpi Avec 150 dpi
(bien lisible) Avec 300 dpi Avec 150 dpi
(passe encore) Avec 300 dpi Avec 150 dpi
(bien lisible) Avec 300 dpi
1,38 Mo 4,93 Mo 0,34 Mo 1,2 Mo 0,59
Mo 0,824 Mo 1,86
Mo 0,48 Mo 0,98
Mo 0,02 Mo
115% 411% 28,3% 100% 49,2% 84% 189% 49% 100% 2%
0