Rechercher : dans
Par :

[python]script pour télécharger une page

Dernière réponse le 27 nov 2008 à 18:18:02 Gautier, le 26 nov 2008 à 18:14:40 
 Signaler ce message aux modérateurs

Bonjour,

je voudrais coder un script en python pour récuperer une page web contenant des parametres du genre id=....
et en fait je voudrais faire une boucle pour augmenter l'id de 1 a chaque tour ...
je ne sais pas du tout quel librairie utiliser et comment proceder !

merci d'avance !

Configuration: Windows XP
Firefox

Meilleures réponses pour « [python]script pour télécharger une page » dans :
[Windows] Fichier pagefile.sys VoirPagefile.sys est un fichier créé par Windows afin de pallier les manques de mémoire vive, on l'appelle ainsi "fichier d'échange" ou "fichier swap" (en anglais "swap file"). Cette technique permettant d'étendre la mémoire vive du système est appelée...
Plusieurs pages d'accueil pour son navigateur VoirPlusieurs pages d'accueil au démarrage Il est possible d'avoir plusieurs pages d'accueil au démarrage des navigateurs internet. Toutefois, il faut ruser pour y parvenir avec la version actuelle de Microsoft Internet Explorer. Le plus simple est...
[MacOS X] Pages de man en français VoirIl vous arrive d'utiliser le Terminal. Et les options des commandes disponibles vous intéressent. Vous souhaitez progresser… Malheureusement, l'anglais n'est pas votre fort et la lecture des pages de manuels vous est difficile. Une possibilité de...
Télécharger GreaseMonkey VoirGreaseMonkey permet de bidouiller à la volée les pages web que vous consultez. C'est à dire qu'il va modifier la page directement dans le navigateur. Cela vous permet de modifier à volonté toutes les pages de n'importe quel site selon vos désirs:...
Télécharger PSPad VoirPSPad est un excellent éditeur de texte. Il est utile pour travailler sur du simple texte, mais aussi sur du HTML, CSS, Javascript, php ou autres langages de programmation (C++, Java, Python...). Les fonctionnalités sont impressionnantes: ...
Télécharger Ghostscript Viewer VoirLe programme original pour visualiser les documents au format PostScript (fichiers portant l'extension .PS). Il peut également être utilisé pour voir les fichiers PDF, ou même pour convertir les Postscript (.ps) en PDF. Mise à jour effectuée...

1

sebsauvage, le 27 nov 2008 à 11:24:37

import urllib2
for i in range(50):
    html = urllib2.urlopen("http://blabla.com/page.php?id=%d" % i).read()

Répondre à sebsauvage

2

 n4pst3r, le 27 nov 2008 à 18:18:02

Bon ba en fait j'ai trouvé avant ! merci quand meme ! j'aurais d'autre questions mais j'ouvrirais un nouveau sujet !

voila mon code :

import urllib, urllib2
from urllib import urlretrieve
id = 1000

while id < 9999:
    id += 1
    html = urllib2.urlopen("http://mapage.com/mapage.php?id=%d" % id).read(1100)
    url = "%d" % id

    if 'XXXXXXXXXXX' in html:
        fichier = open("error.txt", "a")
        fichier.write(url)
        fichier.write("  --")
        fichier.write("\n")
        fichier.close()

    else:
        urllib.urlretrieve("http://mapage.com/mapage.php?id=%d" % id, "page_%d.html" % id)
        fichier = open("error.txt", "a")
        fichier.write(url)
        fichier.write("  OK")
        fichier.write("\n")
        fichier.close()

Répondre à n4pst3r