Extraire texte placé entre balises html

Fermé
douic - 29 mars 2011 à 15:45
 douic - 30 mars 2011 à 15:49
Bonjour à tous,

Je suis étudiant actuellement en stage et je me retrouve confronté à un problème que je ne sais comment résoudre. Je cherche à extraire dans un fichier html, le texte placé à l'intérieur de deux balises.

Ex: "<name> blibla bli bla bla </name>" , je souhaite récupérer le texte "blibla bli bla bla"

Est-ce possible?
Peut on récupérer chaque texte d'un fichier html placé entre des balises et le mettre dans un tableau excel?
Quel langage de développement dois je utiliser?
Est-ce possible en VBA (j'ai quelques notions)?

Je ne cherche pas de solution clés en mains mais seulement une aide, un code qui pourrait m'inspirer, un programme qui ferait ça ou tout ce qui pourrait être utile pour cette tâche! Merci de m'aider ça m'éviteras de longues heures de copier/coller abrutissants.

Merci
A voir également:

4 réponses

Utilisateur anonyme
29 mars 2011 à 15:54
Bonjour,

Généralement le problème que vous posez se traite dans le sens inverse.

On part d'un fichier CSV ou d'une base de données et on fabrique une page HTML avec.

ëtes vous certain d'avoir pris le problème dans le bon sens ?
parce que l'intérêt de la manip, à moins que vous n'alliez chercher des informations sur des sites sur Internet pour le retraiter ensuite.
Mais dans ce cas vous allez être confronté au risque que le site que vous lisez ne change et que votre code ne fonctionne plus du coup.

Mais pour répondre à votre question ça doit se faire en VBA mais il vous faudra jouer avec les API Windows (inet.dll je crois) pour accéder au site web et en récupérer le contenu.
0
Bonjour,

J'avais pas vu que tu avais répondu...merci à toi! Du coup oui je suis sur que c'est dans ce sens là, pour plus d'explications je souhaite récupérer les coordonnées des points placés dans un kml (google earth> soit récupérer le texte placé entre les balises <coordinates> et </coordinates>.

J'ai trouvé quelques liens intéressants mais en php et je ne suis pas sur d'y arriver. Personne pour me venir en aide?

Merci à tous
0
Utilisateur anonyme
30 mars 2011 à 12:26
Ca se complique.
Le KML est un sous classe du XML, donc si tu veux bien faire les choses il faudrait en plus que tu utilises un parseur XML digne de ce nom, ça existe aussi sous Windows, donc ça doit être faisable.
Il y a quelques années j'ai fait ce genre de choses en VB6, quasi comme le VBA en fait, mais bon là je suis sous LINUX maintenant donc, je ne pourrais guère t'aider. Bon courrage
0
Char Snipeur Messages postés 9813 Date d'inscription vendredi 23 avril 2004 Statut Contributeur Dernière intervention 3 octobre 2023 1 297
30 mars 2011 à 12:32
une réponse possible là : https://www.w3schools.com/xml/xml_parser.asp
ensuite, tu cherches dans ton DOM de quoi extraire tes coordonnées. Dans ce cas là, il suffit juste de faire un petit script que tu lanceras depuis ton navigateur internet (super simple).
0
ok Merci mais là vous m'avez perdu! Je n'ai pas le temps de me lancer dans un script etc..., sachant que je ne suis pas sur au final d'y arriver. En tout cas merci pour votre aide.
Bonne continuation
0