Téléchargement
illégal
Posez votre question Signaler

Sed enlever des balises [Résolu]

tlep 591Messages postés 21 février 2002Date d'inscription - Dernière réponse le 23 déc. 2011 à 11:23
Bonjour,
Je voudrais simplement enlever des balises html d'une page:
<table><tr><td>Bonjour</td></tr></table>
Pour récupérer "Bonjour"
J'ai essayé sed 's/\<.*\>//g' mais ca marche po.
je suis toujours aussi nul en sed :-))
Merci
Lire la suite 

Sed enlever des balises »

6 réponses
Réponse
+1
moins plus
Finalement c bon :

sed s/"<[^>]*>"/""/g

;-)
Ajouter un commentaire
Réponse
+1
moins plus
Salut,

Sinon :
 sed 's|</.*>||;s|<.*>||'
On n'est pas obligé de prendre le "/" comme séparateur... Pour ta solution ça donne :
 sed 's|<[^<]*>||g'
 sed 's%<[^<]*>%%g'
 sed 's=<[^<]*>==g'
;-))
alex - 23 déc. 2011 à 11:04
excuse mais est ce que tu pourrai juste expliquer ce que fait chaque lettre de la ligne ? histoire que j'essaye de comprendre pourquoi sa sa enleve les balises merci =)
zipe31- 23 déc. 2011 à 11:23
sed 's/<[^>]*>//g'


<
On cherche un motif qui commence par un chevron ouvrant


[^>]*
Suivi de 0, un ou plusieurs caractères à l'exception du caractère ">" (chevron fermant).

Le "[^>]*" remplace le ".*" normalement employé pour définir la regex 0, un ou plusieurs caractères, et nous sert donc à s'arrêter juste avant de trouver ce caractère (>)


>
Qui se termine par un chevron fermant
Ajouter un commentaire
Réponse
+0
moins plus
moi j'ai essayé ce que vous dites et ça ne marche pas^^
zipe31- 11 déc. 2011 à 16:24
T'as essayé quoi sur quoi ?
Ajouter un commentaire
Ce document intitulé « sed enlever des balises » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.
Dossier à la une
Passage au tout numérique : quel coût pour les particuliers ?