Posez votre question Signaler

Python : modifier balise html contenu ds var.

Mamy - Dernière réponse le 7 avril 2008 à 09:13
Bonjour,
Je possède une variable python contenant le code d'une page html
maVariable=<html xmlns="http://www.w3.org/1999/xhtml"><head>...
J'aimerais trouver la balise <title> et la remplacer par <title>Coucou.
Ainsi, j'aurai mon titre de page + le texte Coucou
Comment peut on faire ça avec python ?
J'ai essayé le re.sub sans succès...
Merci d'avance
Lire la suite 

Python : modifier balise html contenu ds var »

1 réponses
Réponse
+0
moins plus
Tu peux effectivement utiliser re.sub, ou bien beautifulsoup (un peu lent, mais marche bien).


Petit exemple de remplacement avec BeautifulSoup (à adapter):

import BeautifulSoup
htmlpage = open('mapage.html','rb').read()
soup = BeautifulSoup.BeautifulSoup(htmlpage)
soup.done()
for titre in soup('span',{'class' : ['comptitle','titre']}):
    titre.name = 'h1'   # Convert span to h1
    del titre['class']  # Remove class
Ajouter un commentaire
Ce document intitulé « Python : modifier balise html contenu ds var. » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.
Dossier à la une
Passage au tout numérique : quel coût pour les particuliers ?