rss

[Logiciels] Extraire toutes les images d'un PDF

Publié par sebsauvage, dernière mise à jour le samedi 7 avril 2007 à 11:13:14 par sebsauvage
Voici comment extraire toutes les images d'un fichier PDF.

Avantage de cette méthode sur http://www.commentcamarche.net/faq/sujet-1036-: Les images sont extraites tel quel, sans perte de qualité (Par exemple, les JPEG sont extraits tel quel du fichier PDF, sans recompression.)

Note: Cette méthode extrait toutes les images bitmap contenues dans un PDF. Elle n'extraira pas les dessins vectoriels.


1) Téléchargez xpdf (gratuit): http://www.foolabs.com/xpdf/
Téléchargement direct pour Windows: ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02-win32.zip (1,8 Mo).

2) Dézippez ce fichier et récupérez pdfimages.exe

3) Récupérez les images de votre PDF:
pdfimages -j monpdf.pdf .


Cela va créer un ensemble de fichiers .ppm, .pbm et .jpg.
Vous pouvez convertir les ppm/pbm dans un autre format avec XNView, par exemple (www.xnview.com).


Dans certains fichiers PDF, il arrive que les images soient fragmentées en plein de petites images. Vous devrez manuellement les réassembler.

Vous pouvez aussi utiliser GhostScript / GSview pour extraire les images d'un PDF.

Autres Astuces dans la catégorie Logiciels