Les Allergies
Alimentaires
Posez votre question Signaler

Extraire une adresse d'une page web

lester - Dernière réponse le 14 mars 2007 à 15:22
Bonjour!
Quelle est la solution (programme?) la plus simple/efficace pour extraire les liens d'une page web? Non pas les liens des objets de la page, mais ceux indiqués en mode texte.
Par exemple, certains forums indiquent, pour information, des listes d'adresses
quelque fois en format texte, quelque fois entre deux balises
.

Ce sont ces adresses que je souhaite récupérer pour pouvoir retravailler les listes sous word ou excel.
Existe-t'il également un moyen de pratiquer cette extraction tout au long des multiples pages d'un 'fil de discussion' aulieu d'avoir à ouvrir chaque page suivante, puis sélectionner une adress, ctrl-C, ctrl-V dans un fichier texte, et ainsi de suite ... Très fastidieux vous imaginez bien!
Merci!
Lester
Lire la suite 

Extraire une adresse d'une page web »

1 réponses
Réponse
-1
moins plus
ça peut se programmer.

Par exemple, voici diverses manière d'extraire les adresses d'une page web en Python:

http://www.sebsauvage.net/python/snyppets/#getlinks1


Un autre exemple:
Faire une recherche sur Google et récupérer toutes les adresses renvoyées par Google, en parcourant automatiquement les pages suivantes:
http://www.sebsauvage.net/python/snyppets/#google_search
Ajouter un commentaire
Ce document intitulé « Extraire une adresse d'une page web » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.
Dossier à la une
Passage au tout numérique : quel coût pour les particuliers ?