Rechercher : dans
Par :

[Java][RegExp] Extraire lien HTML

Dernière réponse le 8 aoû 2003 à 14:34:59 djschorn, le 8 aoû 2003 à 12:01:53 
 Signaler ce message aux modérateurs

Bonjour,

Voilà je voudrais extraire d'une page HTML tout les liens qui y sont contenu.
J'ai essayé un truc du style :

Pattern pattern = Pattern.compile("(<A HREF=).*(</A>)");
Matcher matcher = pattern.matcher(maChaine);

while(matcher.find())
System.out.println(matcher.group());

Mais ca m'affiche tout le texte contenu entre le 1er et le dernier lien (inclus) :-(

Il est évident que l'erreur vient du pattern, mais comment faire ?

Merci d'avance

Meilleures réponses pour « [Java][RegExp] Extraire lien HTML » dans :
Enlever la bordure sur une image dans un lien en HTML/CSS VoirVous avez fait une image cliquable en mettant une balise IMG au sein d'un lien et le navigateur vous affiche un cadre ou plus exactement une bordure autour de l'image. Il existe deux façons de supprimer cette bordure...
Enlever le soulignement sous les liens en HTML/CSS VoirPar défaut, les liens hypertextes en HTML sont soulignés, un trait de la couleur du lien apparaît en dessous du texte. Il est possible de supprimer ce soulignement à l'aide de la propriété CSS text-decoration:none : Grâce au CSS Grâce au CSS via...
Javascript - L'objet RegExp VoirLes particularités de l'objet RegExp L'objet RegExp est un objet permettant de manipuler des expressions régulières, c'est-à-dire des modèles créés à l'aide de caractères ASCII permettant de manipuler des chaînes de caractères, afin de trouver des...
Les liens hypertextes VoirPrésentation des ancrages Les liens hypertextes (ancrages) sont des éléments d'une page HTML (soulignés lorsqu'il s'agit de texte) permettant aux internautes de naviguer vers une nouvelle adresse lorsque l'on clique dessus. Ce sont les liens...
Javascript - Les fonctions VoirLa notion de fonction On appelle fonction un sous-programme qui permet d'effectuer un ensemble d'instructions par simple appel de la fonction dans le corps du programme principal. Cette notion de sous-programme est généralement appelée fonction...

1

asevere, le 8 aoû 2003 à 14:27:08

Salut,
Je ne me souviens plus des expressions regulieres en java,
Mais selon le standard des erxpressions il me semble qu'un patern comme celui là:
"<a href=[^>]*>[^<]*</a>" devrai te donner pour chaque lien quelque chose du type
<a href="...">nomdulien</a>

[^>]* et [^<]* représentent normalement n'importe quel caractére exepté '>', respectivement '<' .

essaye ca et dis moi si ca marche :o)

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !

Répondre à asevere

2

djschorn, le 8 aoû 2003 à 14:32:27

Yep, ca marche, merci bcp ;-))))

Répondre à djschorn

3

 asevere, le 8 aoû 2003 à 14:34:59

Cool :o)

De rien, ravi de t'avoir aidé !

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !

Répondre à asevere