|
|
|
|
Salut à tous ! je me met doucement au Python pour créer un parser. En fait pour essayer d'etre clair je souhaiterais récuperer l'ensemble du contenu d'une page html se trouvant entre deux tags spécifiques:
<!-- Premiere nouvelle de section -->
<span class="titreNouvelle">
C'est blalalblalabalbalbalablabalbalbal</span><BR><BR>
<span class="texteNouvelle">
<B>blabla</B>
<br>
<br>blalalblalabalbalbalablabalbalbal
<!-- / Premiere nouvelle de section -->
Ici le tag de début : <!-- Premiere nouvelle de section -->
Tag de fin : <!-- / Premiere nouvelle de section -->
Etant tout débutant qqu accepterait il de me montrer un code qui saurait faire ca ? sachant que j'ai en local le fichier .html contenant l'ensemble et que je souhaite creer un fichier output.html ne contenant que ce qui se présente entre les deux tags précités.
Merci par avance de toute l'aide que vous pourrez m'apporter !
PsyKotroP
Hello !
|
J'ai donné un exemple pour récupérer tout ce qui se trouve entre 2 tags précis sans utiliser ni expressions régulières ni HTMLParser.
|
Petite autre question. Dans le bout de fichier que je récupere j'ai des tags style </span><BR><BR>
|
Dans ce cas, tu peux prendre HTMLParser et:
|

