Extraire une adresse d'une page web

Fermé
lester - 14 mars 2007 à 12:39
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 - 14 mars 2007 à 15:22
Bonjour!

Quelle est la solution (programme?) la plus simple/efficace pour extraire les liens d'une page web? Non pas les liens des objets de la page, mais ceux indiqués en mode texte.
Par exemple, certains forums indiquent, pour information, des listes d'adresses
quelque fois en format texte, quelque fois entre deux balises
.

Ce sont ces adresses que je souhaite récupérer pour pouvoir retravailler les listes sous word ou excel.

Existe-t'il également un moyen de pratiquer cette extraction tout au long des multiples pages d'un 'fil de discussion' aulieu d'avoir à ouvrir chaque page suivante, puis sélectionner une adress, ctrl-C, ctrl-V dans un fichier texte, et ainsi de suite ... Très fastidieux vous imaginez bien!

Merci!

Lester
A voir également:

1 réponse

sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
14 mars 2007 à 15:22
ça peut se programmer.

Par exemple, voici diverses manière d'extraire les adresses d'une page web en Python:

https://www.sebsauvage.net/python/snyppets/#getlinks1


Un autre exemple:
Faire une recherche sur Google et récupérer toutes les adresses renvoyées par Google, en parcourant automatiquement les pages suivantes:
https://www.sebsauvage.net/python/snyppets/#google_search
-1