Bash-suppression des balises html

Résolu/Fermé
lily - 11 déc. 2011 à 16:50
 lily - 11 déc. 2011 à 19:22
Bonjour,


je fais appel à vous car
1) je voudrais supprimer les balises html d'un fichier
2) j'ai donc fais une sortie html de mon fichier mais la mise en forme n'est pas la meme que celle du fichier d'origine, je m'explique : mon fichier est sous forme de liste et en html tout est a la suite séparé par des espaces..

Merci par avance de l'aide que vous voudrez bien m'apporter
A voir également:

3 réponses

zipe31 Messages postés 36402 Date d'inscription dimanche 7 novembre 2010 Statut Contributeur Dernière intervention 27 janvier 2021 6 407
Modifié par zipe31 le 11/12/2011 à 16:55
Salut,

Merci de mettre un exemple de ton fichier ou ici (copier/coller) ou en pièce jointe sur https://www.cjoint.com/ ;-\

Zen my nuggets ;-)
Faites un geste pour l'environnement, fermez vos fenêtres et adoptez un manchot.
0
le fichier est sous la forme :
1804 a
1750 class
1364 div
943 http
885 fr
881 n
828 href
503 le
487 du

et en sortie html :
1804 a 1750 class 1364 div 943 http 885 fr 881 n 828 href 503 le 487 du


je voudrais donc que n'apparaissent pas les balises genre class div href ... et que il y ait un saut a la ligne apres chaque mot
0
zipe31 Messages postés 36402 Date d'inscription dimanche 7 novembre 2010 Statut Contributeur Dernière intervention 27 janvier 2021 6 407
11 déc. 2011 à 17:27
Je doute que ce soit ça que tu veuilles, mais comme j'ai du mal à comprendre ;-\

$ cat brol
1804 a
1750 class
1364 div
943 http
885 fr
881 n
828 href
503 le
487 du

$ sed 'G;s/class\|div\|href\|http//' brol 
1804 a

1750 

1364 

943 

885 fr

881 n

828 

503 le

487 du


$
0
non ce n'est pas ce que je veux faire. Je m'explique mieux, en fait mon script doit compter le nombre d'occurrences de chaque mot d'un fichier et le mettre dans un autre nommé par exemple truc.html . mais le problème c'est que ça me compte les balises.
0
zipe31 Messages postés 36402 Date d'inscription dimanche 7 novembre 2010 Statut Contributeur Dernière intervention 27 janvier 2021 6 407
11 déc. 2011 à 17:36
Je pige rien ;-\

Il est sous quelle forme ton fichier ? Texte ou html ?
0
ah non excuse moi le fichier de départ est une page web donc il y a les balises et je voudrais compter les mots sans compter les balises
0
zipe31 Messages postés 36402 Date d'inscription dimanche 7 novembre 2010 Statut Contributeur Dernière intervention 27 janvier 2021 6 407
11 déc. 2011 à 17:44
Ben alors la solution donnée devrait t'aider à solutionner ton problème ;-)
0
Maintenant passons au saut a la ligne. Comment faire que dans ma sortie html les comptes des mots soient sous forme de liste?
0
ça y est j'ai trouvé aussi! | awk '{ printf("%s<br/>\n", $0); }'
Un grand Merci a toi pour ton aide zipe31 =)
0