Flux rss
Collection CommentCaMarche.net
Rechercher : dans
Par : Pertinence Date Nom d'utilisateur
Statut : Non résolu

[Java][RegExp] Extraire lien HTML

djschorn, le vendredi 8 août 2003 à 12:01:53
Bonjour,

Voilà je voudrais extraire d'une page HTML tout les liens qui y sont contenu.
J'ai essayé un truc du style :

Pattern pattern = Pattern.compile("(<A HREF=).*(</A>)");
Matcher matcher = pattern.matcher(maChaine);

while(matcher.find())
System.out.println(matcher.group());

Mais ca m'affiche tout le texte contenu entre le 1er et le dernier lien (inclus) :-(

Il est évident que l'erreur vient du pattern, mais comment faire ?

Merci d'avance
Répondre à djschorn  Signaler ce message aux modérateurs Aller au dernier message

1


  • Ce message vous semble utile, votez !
  • Signaler ce message aux modérateurs
asevere, le vendredi 8 août 2003 à 14:27:08
Salut,
Je ne me souviens plus des expressions regulieres en java,
Mais selon le standard des erxpressions il me semble qu'un patern comme celui là:
"<a href=[^>]*>[^<]*</a>" devrai te donner pour chaque lien quelque chose du type
<a href="...">nomdulien</a>

[^>]* et [^<]* représentent normalement n'importe quel caractére exepté '>', respectivement '<' .

essaye ca et dis moi si ca marche :o)

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
Répondre à asevere

2


  • Ce message vous semble utile, votez !
  • Signaler ce message aux modérateurs
djschorn, le vendredi 8 août 2003 à 14:32:27
Yep, ca marche, merci bcp ;-))))
Répondre à djschorn

3


  • Ce message vous semble utile, votez !
  • Signaler ce message aux modérateurs
 asevere, le vendredi 8 août 2003 à 14:34:59
Cool :o)

De rien, ravi de t'avoir aidé !

++

Na kaer eo va Breizh,
gand ar mor glaz èn-dro dezi !
Répondre à asevere
Liens Html Thunderbird/Firefox (Résolu) Bonjour, j'ai essayé de résoudre le problème de liaison thunderbird/firefox en liens HTML d'après votre rubrique astuce. Je ne trouve pas la configuration que vous proposez la boite de dialogue édition ne comporte pas préférences avancé... www.commentcamarche.net/forum/affich-3284321-liens-html-thunderbird-firefox
Lien html non surligné (Résolu) Lors de la création d'une page, par défaut les liens html sont toujours surlignés. Quelle est la solution pour qu'ils ne soient pas surlignés ? Merci d'avance www.commentcamarche.net/forum/affich-3346645-lien-html-non-surligne
[FreeMind] Publier une mindmap dans une page webFreeMind est un logiciel de mindmapping. Vous avez plusieurs possibilités pour publier votre mindmap dans une page web. Flash applet Java Simple image PNG HTML+Javascript (texte seulement) HTML+Javascript (texte+icônes) HTML+Javascript... www.commentcamarche.net/faq/sujet-4857-freemind-publier-une-mindmap-dans-une-page-web
Javascript - Connaître la hauteur d'un élément HTMLSi vous souhaitez connaître la hauteur (height) d'un bloc HTML en javascript, il existe deux façons selon les navigateurs : element.offsetHeight element.style.pixelHeight Ainsi, le code suivant permet d'obtenir la hauteur d'un bloc HTML... www.commentcamarche.net/faq/sujet-11739-javascript-connaitre-la-hauteur-d-un-element-html
[Javascript] Lien aléatoire / Choisir un lien au hasardLe script ci-dessous permet de créer un lien hypertexte dirigeant le visiteur vers une adresse choisie au hasard dans une liste. Le code ci-dessous est à insérer entre les balise et en début de page : www.commentcamarche.net/faq/sujet-895-javascript-lien-aleatoire-choisir-un-lien-au-hasard
Enlever l'encadrement image lien htm (Résolu)Voila, j'aimerais enlever le petit encadrement autour des images quand elle sont en lien html, quelqu'un connais? Merci d'avance www.commentcamarche.net/forum/affich-1118922-enlever-l-encadrement-image-lien-htm
Conversion de HTML vers le format RTF (Résolu)Bonjour à tous, J'ai vraiment besoin d'une aide d'urgence sur la conversion de HTML vers RTF. Si c'est possible, des scripts en PHP ou en javascript ou des liens pouvant m'aider à résoudre le problème. Merci de bien vouloir me... www.commentcamarche.net/forum/affich-620865-conversion-de-html-vers-le-format-rtf
[html]Comment suprimer le contour d'un lien?? (Résolu)Bonjour, Savez vous comment supprimer le contour d'une image sur un lien html?? En voilà un exemple sur le mot "Langage" sur le site suivant: http://site.voila.fr/test012/index.html?0.8555108389501282 Je vous remercie d'avance pour vos... www.commentcamarche.net/forum/affich-5561038-html-comment-suprimer-le-contour-d-un-lien
Télécharger HTTrack Website CopierHTTrack est un navigateur offline. Il vous permet de télécharger des sites Web à partir d'Internet vers votre répertoire local. Il reconstruit tous les répertoires, les liens HTML, les images et les autres fichiers constituant le site en entier, tout... www.commentcamarche.net/telecharger/telecharger-34056292-httrack-website-copier
Javascript - Implantation du codeA quel emplacement insérer le Javascript dans votre page HTML Il existe plusieurs façons d'inclure du JavaScript dans une page HTML : Grâce à la balise En mettant le code dans un fichier Grâce aux événements Dans la balise... www.commentcamarche.net/contents/javascript/jsimplant.php3
Les liens hypertextesPrésentation des ancrages Les liens hypertextes (ancrages) sont des éléments d'une page HTML (soulignés lorsqu'il s'agit de texte) permettant aux internautes de naviguer vers une nouvelle adresse lorsque l'on clique dessus. Ce sont les liens... www.commentcamarche.net/contents/html/htmlhypertxt.php3
Java - Premier programmePremière application avec Java La première chose à faire est de créer un simple fichier texte (sans mise en forme) et de taper les quelques lignes suivantes : // Votre premiere application en Java class FirstApp { public static void main... www.commentcamarche.net/contents/java/javaprem.php3