Reconnaissance caractere sur PDF en batch

Fermé
phil2000 Messages postés 68 Date d'inscription samedi 25 novembre 2006 Statut Membre Dernière intervention 3 janvier 2024 - 29 déc. 2016 à 11:24
contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 - 29 déc. 2016 à 16:35
Bonjour à tous,

je viens vers vous à la recherche d'un peu de vos expériences sur la numérisation et reconnaissance de caractères pour la gestion de mes pdfs.

Je m'explique, depuis un certain temps, je numérise en pdf tous mes documents administratifs.

Je voudrais rendre tous ces documents indexables pour effectuer des recherches dans ces doc.

ils sont tous dans un répertoire "pdfs numerisés". Connaissez vous un logiciel qui fait de la reconnaissance de caractère sur ces pdf en batch et les rende indexables ?

J'ai vu des choses comme abbyy, mais ça m'a l'air d’être une enclume pour mon petit besoin et je ne voudrai pas avoir un solution trop propriétaire .... sauf si vous me dites le contraire :-)

merci d'avance pour tout retour de votre part,
Phil
A voir également:

1 réponse

contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 6 050
Modifié par contrariness le 29/12/2016 à 16:22
Un logiciel d'OCR va vous restitue un fichier texte (pareil au PDF ou texte brut) mais ca sera different d'un PDF original.

Les scanners d'archive (le genre de ceux qui font de la numerisation recto/verso en un seul passage de chez "Plusteck" par ex.) ont des logiciels d’indexation qui incluent le texte reconnu a l'interieur du PDF. Si un element de texte n'est pas correctement reconnu, il est laisse sous forme d'image.

Acrobat version "Pro" le fait egalement et inclu un outil de recherche

Dans les logiciels gratuits.. ca existe peut-etre mais je n'en connais pas.
0
phil2000 Messages postés 68 Date d'inscription samedi 25 novembre 2006 Statut Membre Dernière intervention 3 janvier 2024 5
29 déc. 2016 à 16:30
Merci Contrariness, je vais regarder Acrobat, je ne cherche effectivement pas à créer un document word ou texte séparé, mais rendre le pdf consultable.
merci à vous
0
contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 6 050
29 déc. 2016 à 16:35
vous pouvez le tester avant d'acheter, mais je ne sais plus si dans les dernieres versions, le moodule de reconnaissance est inclu ou est telechageable une fois le logiciel achete (ca serait dommage si le soft ne vous convenait pas).

La fonction se trouve dans les outils "reconnaissance du texte"
0