[Java][RegExp] Extraire lien HTML

Résolu/Fermé
djschorn Messages postés 13 Date d'inscription mercredi 30 juillet 2003 Statut Membre Dernière intervention 11 novembre 2013 - 8 août 2003 à 12:01
asevere Messages postés 13084 Date d'inscription lundi 28 janvier 2002 Statut Webmaster Dernière intervention 3 février 2022 - 8 août 2003 à 14:34
Bonjour,

Voilà je voudrais extraire d'une page HTML tout les liens qui y sont contenu.
J'ai essayé un truc du style :

Pattern pattern = Pattern.compile("(<A HREF=).*(</A>)");
Matcher matcher = pattern.matcher(maChaine);

while(matcher.find())
System.out.println(matcher.group());

Mais ca m'affiche tout le texte contenu entre le 1er et le dernier lien (inclus) :-(

Il est évident que l'erreur vient du pattern, mais comment faire ?

Merci d'avance
A voir également:

3 réponses

asevere Messages postés 13084 Date d'inscription lundi 28 janvier 2002 Statut Webmaster Dernière intervention 3 février 2022 426
8 août 2003 à 14:27
Salut,
Je ne me souviens plus des expressions regulieres en java,
Mais selon le standard des erxpressions il me semble qu'un patern comme celui là:
"<a href=[^>]*>[^<]*</a>" devrai te donner pour chaque lien quelque chose du type
<a href="...">nomdulien</a>

[^>]* et [^<]* représentent normalement n'importe quel caractére exepté '>', respectivement '<' .

essaye ca et dis moi si ca marche :o)

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
2
djschorn Messages postés 13 Date d'inscription mercredi 30 juillet 2003 Statut Membre Dernière intervention 11 novembre 2013
8 août 2003 à 14:32
Yep, ca marche, merci bcp ;-))))
0
asevere Messages postés 13084 Date d'inscription lundi 28 janvier 2002 Statut Webmaster Dernière intervention 3 février 2022 426
8 août 2003 à 14:34
Cool :o)

De rien, ravi de t'avoir aidé !

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
0