Extraire les données XML d'une page HTML

Fermé
Infox - 24 août 2007 à 09:30
 Infox - 24 août 2007 à 11:20
Bonjour,

J'ai un grand nombre de fichiers HTML à retransformer.

Je dispose d'une page HTML et du fichier XSL ayant permis de générer cette dernière.

Connaissez-vous un moyen de récupérer un fichier XML (un seul parmi l'ensemble de ceux possibles), de manière à ce quen recombinant le fichier XSL avec le fichier XML trouvé, on obtienne de nouveau la page HTM L ?


Toutes vos réponses sont les bienvenues.

Cordialement,
Infox
A voir également:

2 réponses

Reivax962 Messages postés 3671 Date d'inscription jeudi 16 juin 2005 Statut Membre Dernière intervention 11 février 2021 1 011
24 août 2007 à 11:13
Première chose, il faut bien former ton fichier HTML de sorte qu'il soit lui-même un fichier XML valide.
Ensuite, j'imagine qu'il faut créer une feuille XSL qui va prendre un fichier XML (en l'occurence, le code HTML), et le transformer en ce que tu veux.
Par contre, il faut vraiment faire attention car la réversibilité parfaite de ce genre de transformation n'est vraiment pas assurée : à toi de t'arranger pour ne perdre aucune information du fait de la feuille de style !
0
Bonjour,

Merci pour ta réponse, Reivax962.

C'est effectivement une bonne idée de refaire une transformation XML (fichier HTML reformaté) + XSL (fichier réecrit) -> XML (données attendues).

Existe-t-il une méthode permettant de déduire du fichier XSL original le nouveau fichier XSL qui assurera la transformation ?
Existe-t-il des outils qui permettent de réaliser ce type d'opération de reversibilité ?

Cordialement,
Infox.
0