Rechercher : dans
Par :

Recherche de texte dans un pdf "image"

Dernière réponse le 24 oct 2008 à 14:12:38 alban56, le 24 oct 2008 à 13:30:23 
 Signaler ce message aux modérateurs

Bonjour à tous,

il m'arrive souvent de chercher des infos sur Google Books et j'aimerai savoir comment ils font pour permettre une recherche de texte dans des pdf ? En effet, lorsqu'on télécharge un des pdf, on s'apperçoit que chaque page est une image...

J'aimerai pouvoir créer une fonction comme celle là pour permettre la recherche dans certains documents numérisés mais je ne vois pas du tout comment ils font. A part peut-être l'utilisation de la reconnaissance de carractères supperposée à l'image de la page (je ne sais pas si je suis très clair...).

Merci d'avance à ceux qui pourront "éclairer ma lanterne" :)


PS : j'espère ne pas m'être trompé de section pour poster, ni d'avoir mis un titre trop flou...

1

hani_, le 24 oct 2008 à 13:55:23

Le principe est assez complexe. mais pour faire simple : Ils ont scannés les pages de livres en faisant une reconnaissance de caractères pour chaque page.

le processus est bien plus complexe que ça mais dans le principe c'est comme ça que c'est fait.

Répondre à hani_

2

 alban56, le 24 oct 2008 à 14:12:38

Comme vous insistez bien sur la complexité du principe, je suppose qu'il est impossible de le reproduire ?

En tout cas, merci pour votre réponse :)

Répondre à alban56