Extraction de données dans plusieurs documents
Fermé
El_Pablo
Messages postés
5
Date d'inscription
mercredi 16 novembre 2005
Statut
Membre
Dernière intervention
24 août 2016
-
30 mars 2016 à 00:21
georges97 Messages postés 11877 Date d'inscription lundi 31 janvier 2011 Statut Contributeur Dernière intervention 11 mai 2024 - 30 mars 2016 à 08:40
georges97 Messages postés 11877 Date d'inscription lundi 31 janvier 2011 Statut Contributeur Dernière intervention 11 mai 2024 - 30 mars 2016 à 08:40
A voir également:
- Extraction de données dans plusieurs documents
- Effacer les données de navigation - Guide
- Reinstaller windows sans perte de données - Guide
- Germain veut gérer les activités de son association avec une base de données. il a commencé à créer des tables dans un fichier, mais il n’est pas sûr du résultat. le fichier à télécharger contient uniquement le schéma de cette base de données. en l’état actuel, que peut-on en déduire ? - Forum Outlook
- L'en-tête du document comporte une information qui n’apparaît pas à l'impression car elle est de couleur blanche. de quelle information s'agit-il ? ✓ - Forum Bureautique
- Tnt base de données vide ✓ - Forum TNT / Satellite / Réception
1 réponse
georges97
Messages postés
11877
Date d'inscription
lundi 31 janvier 2011
Statut
Contributeur
Dernière intervention
11 mai 2024
2 266
Modifié par georges97 le 30/03/2016 à 08:54
Modifié par georges97 le 30/03/2016 à 08:54
Bonjour,
Le datamining met en œuvre des logiciels dédiés et et de ce fait chers. Si vous êtes à l'origine de ces documents, ou si vous pouvez demander la coopération des émetteurs, il vaudrait mieux récupérer les données à partir d'une base de données (Access ou Base de la suite gratuite Libre Office) avant de les archiver au format PDF.
Ou alors, il faudrait regarder du côté d'un langage de programmation comme python avec des méthodes dites de parsing :
https://python.doctor/page-xml-python-xpath
Vous pouvez sans doute aussi regarder du côté de logiciels comme Bullzip PDF Writer qui, dans leur descriptif, intègrent des outils de script VBA pou VBsciipt et dont l'éditeur dispose d'outils MySQL.
https://www.bullzip.com/index.php
Cordialement
Le datamining met en œuvre des logiciels dédiés et et de ce fait chers. Si vous êtes à l'origine de ces documents, ou si vous pouvez demander la coopération des émetteurs, il vaudrait mieux récupérer les données à partir d'une base de données (Access ou Base de la suite gratuite Libre Office) avant de les archiver au format PDF.
Ou alors, il faudrait regarder du côté d'un langage de programmation comme python avec des méthodes dites de parsing :
https://python.doctor/page-xml-python-xpath
Vous pouvez sans doute aussi regarder du côté de logiciels comme Bullzip PDF Writer qui, dans leur descriptif, intègrent des outils de script VBA pou VBsciipt et dont l'éditeur dispose d'outils MySQL.
https://www.bullzip.com/index.php
Cordialement