Rechercher : dans
Par :

[PDF] proleme avec un fichier pdf

Dernière réponse le 19 déc 2006 à 14:37:51 hwaourang, le 9 oct 2006 à 13:49:58 
 Signaler ce message aux modérateurs

Bonjour voila mon probleme on m a envoye un fichier pdf mais malheuresement quand je fais copier/coller ca me donne des signes et de chiffres comme suit:
texte original: materiel de laboratoire
texte colle : (@0I)KIa$bI$a@&[)@0[K)I
et de meme quand j essaye de le convertir en fichier word
si quelqu un a une solution je suis a son ecoute
merci

Meilleures réponses pour « [PDF] proleme avec un fichier pdf » dans :
Transformer un fichier Word (.doc) en PDF Voir Transformer en fichier PDF un fichier Microsoft Word (.doc) Rien de plus simple ! Ouvrez votre fichier *.doc avec OpenOffice.org Réglez éventuellement la mise en page par le menu Format / Page... Dès lors, 2 solutions pour transformer...
Transformer un fichier Microsoft Excel (.xls) en PDF Voir Transformer en fichier PDF un fichier Microsoft Excel (.xls) Rien de plus simple ! Ouvrez votre fichier *.xls avec OpenOffice.org Réglez éventuellement la mise en page par le menu Format / Page... Dès lors, 2 solutions pour transformer en...
Créer un fichier PDF VoirUn fichier PDF (abréviation de Portable Document Format) est un document pouvant contenir texte, dessins, images noir et blanc, en couleur ou en 3D, photos et éventuellement des fonctions de traitement. Le format PDF est un format ouvert,...
Réunir plusieurs fichiers PDF en un seul VoirPour réunir plusieurs fichiers PDF en un seul, on peut utiliser PDFCreator (gratuit) qui s'utilise comme une imprimante. Pour ce faire : Ouvrir tous les fichiers PDF que l'on veut réunir Puis, pour le premier fichier, faire Fichier/Imprimer,...
Convertir un fichier PPS en PDF VoirVoici comment exporter un fichier PPS ou PPT (fichier PowerPoint) en PDF tout en conservant les hyperliens cliquables. 1 Télécharger OpenOffice Télécharger et exécuter OpenOffice Impress 2 Ouvrir le fichier Ouvrir le fichier .PPT ou .PPS 3...
Fichier PDF VoirFormat PDF Un fichier PDF (abréviation de Portable Document Format) est un document documents pouvant contenir texte, dessins, images noir et blanc, en couleur ou en 3D, photos et éventuellement des fonctions de traitement. Le format PDF est un...
Formats et extensions de fichiers VoirRemarque : La liste ci-dessous n'est pas exhaustive et certains noms d'extension peuvent avoir plusieures fonctionnalités. Quant aux programmes proposés pour utiliser ces fichiers, ils ne sont pas forcément les seuls, ni les plus...
Fichier DAT VoirFormat DAT Un fichier DAT Un fichier .dat est un fichier de données (.DAT signifie data). En général, il s'agit d'un fichier binaire, créé par un programme et utilisable uniquement par ce programme, ce qui signifie qu'il n'est pas censé être ouvert...

1

sebsauvage, le 9 oct 2006 à 14:22:43

C'est impossible.
(ça tient à la manière dont a été créé le fichier PDF).

Le seul moyen de récupérer le texte, c'est de convertir le PDF en image haute résolution (300dpi) et de donner à manger à un logiciel de reconnaissance de caractères (OCR).

Il faudra bien entendu en plus extraire les images à la main.

Chercher PDF dans la base de connaissance.
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

2

premare, le 9 oct 2006 à 14:41:47

Bonjour,
Comment se présente votre fichier pdf quand vous essayer de le lire (avec Acrobat Reader, je suppose) ? Il devrait être lisible.

Pouvez-vous imprimer ce fichier pdf ?

Que voulez-vous en faire ?

Salut

Répondre à premare

3

sebsauvage, le 9 oct 2006 à 15:07:14

Inutile d'acharner, il ne pourra rien faire sans un logiciel d'OCR.

Les caractères bizarres signifient que le PDF n'a pas enregistré les lettre qui composent le texte, mais seulement la référence des symboles graphiques.

un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

4

premare, le 9 oct 2006 à 15:49:26

A l'attention de sebsauvage

Bonjour,

Que peut faire un OCR s'il n'y a que des références graphiques sur l'écran , transformé éventuellement en image haute résolution ?

Autre question : quel est l'intérêt pour le créateur de faire un tel fichier ?

Salutations

Répondre à premare

5

sebsauvage, le 9 oct 2006 à 16:30:07

Que peut faire un OCR s'il n'y a que des références graphiques sur l'écran , transformé éventuellement en image haute résolution ?

Le logiciel d'OCR pourra - à partir de l'image haute résolution obtenue à partir du PDF - ressortir le texte (comme il le ferait pour un document scanné).


quel est l'intérêt pour le créateur de faire un tel fichier ?

Il ne l'a probablement pas fait exprès.
Le format PDF n'a jamais été conçu pour être modifié.
Il arrive que les logiciels de génération de PDF enregistrent des symboles graphiques au lieu de lettres pour gagner de la place (par exemple en incluant une partie d'une police de caractères seulement).

un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

6

premare, le 9 oct 2006 à 16:56:06

Toujours à l'attention de sebsauvage.

En fait, je crois que le fichier pdf de notre ami hwaourang est corrompu et haute résolution ou pas, un OCR ne donnera aucun résultat s'il n'y a pas de caractères 'police d'écriture) apparaissant sur l'écran ou l'image en résultant!

Quelle serait votre méthode pour "convertir le pdf en image haute résolution" : imprime écran ?

Salut

Répondre à premare

7

sebsauvage, le 9 oct 2006 à 17:07:34

En fait, je crois que le fichier pdf de notre ami hwaourang est corrompu

Je ne crois pas.

D'après ce qu'il dit, il arrive à le lire à l'écran.
C'est uniquement lors du copier-coller qu'il y a problème.

Si le copier-coller ne marche pas, la seule solution consiste à convertir le PDF en image haute résolution et à lancer un logiciel d'OCR dessus, ce qui sortira le texte.

Conversion PDF --> image, voir: pdf convertir des pdf en images jpeg bmp gif etc
Je recommande la méthode PDF Creator, très simple.
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

8

premare, le 9 oct 2006 à 17:24:12

Bonsoir,

Si le pdf est lisible à l'écran, pourquoi ne peut-on le lire avec Acrobat Reader ou l'imprimer ?

Après cette réponse, peut-être en resterons-nous là sur ce problème !

Salutations

Répondre à premare

10

teebo, le 9 oct 2006 à 17:25:59

Salut,

Qui a dit que ce n'était pas possible?
Pas le posteur initial :)
Goutez l'amer ... Buvez le vinaigre

Répondre à teebo

9

sebsauvage, le 9 oct 2006 à 17:25:59

Si le pdf est lisible à l'écran, pourquoi ne peut-on le lire avec Acrobat Reader ou l'imprimer ?

Il n'a pas dit qu'il ne pouvait pas le lire ou l'imprimer.
Il a dit que le copier-coller depuis Acrobat Reader ne donnait pas de bon résultats.
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

11

premare, le 9 oct 2006 à 19:12:01

S'il est possible de lire à l'écran et d'imprimer le pdf, où est le problème ?
Pourquoi faire un copier-coller et pour coller dans quoi ?
Je n'ai pas compris la question !

Répondre à premare

12

sebsauvage, le 9 oct 2006 à 22:37:18

Si tu as un PDF et que tu veux récupérer le texte dans ton traitement de texte, le fait de pouvoir seulement afficher le PDF ou l'imprimer ne te serai pas d'une grande aide.
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

13

premare, le 9 oct 2006 à 22:41:08

Si on peut l'imprimer, on passe la copie dans le scanner et l'OCR !
On en restera là sur ce sujet, je pense.
Bonne soirée à tous

Répondre à premare

14

teebo, le 10 oct 2006 à 08:50:02

C'est ce que propose Seb...sauf que lui n'a pas besoin ni d'imprimante, ni de papier, ni de scanner, mais juste de l'OCR, c'est donc un raccourci en quelque sorte :)
Goutez l'amer ... Buvez le vinaigre

Répondre à teebo

15

sebsauvage, le 10 oct 2006 à 09:25:33

Comme dit teebo, ma solution évite de gaspiller une feuille et de l'encre.
(Puisque de toute façon, après avoir scanné, on se retrouve avec la même chose: une image haute résolution de la page).
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

16

premare, le 10 oct 2006 à 16:34:28

Bonjour,
Ma dernière contribution :
Je pense que le prix du papier et de l'encre compense largement le temsp passé avec l'usine à gaz "the Gimp" et tout le reste !

Salutations

Répondre à premare

17

sebsauvage, le 10 oct 2006 à 17:09:37

Je met moins de 30 seconde à sortir une image haute résoultion d'une page PDF: Je suis dans Acrobat Reader, je fais "Imprimer" > "PDF creator" > Save > et je choisis format TIFF > ayé terminé.

Pour obtenir le même résultat par papier, je dois allumer mon imprimante, attendre qu'elle soit prête, imprimer, attendre la fin d'impression, prendre la feuille et la mettre sur le scanner, lancer le logiciel de scan, et enfin scanner (en supposant que les paramètres de scan sont déjà ok).
un site Web avec Word? autant traire une vache avec une carabine! -- BashFR.org

Répondre à sebsauvage

18

 hwaourang, le 11 oct 2006 à 12:55:25

Bonjour a tous merci d avoir repondu aussi vite et aussi nombreux .
c bon j ai regle le probelme avec pdf creator j ai copie en format image et j ai pu recuperer le texte. si j ai besoin de copier coller c pour eviter de devoir retaper 17 pages de textes avec une police miniuscule.
merci bcp

Répondre à hwaourang