Bonsoir Balthazariv.
Pour la sauvegarde des recherches, google le fait déjà.
Pour le traitement de chaînes, perl est ton copain.
Si tu enregistres les résultats dans un fichiers "source_resultat_google.html", tu peux en sortir les urls avec un petit script comme celui-ci par exemple (si tu es sous win', je pense que perl ne va pas être dans /usr/bin/ ;) :
#!/usr/bin/perl
open HTM "source_resultat_google.html";
open CSV ">>resultat.csv";
while ( <HTM> ) {
if ( /<a\s*class=l\s*href="(http:\/\/.*?)">/g ) {
print CSV "$1,\n";
}
}
Donc si tu as quelque chose à faire sur la chaine, pas de probleme ici, tu bidouilles $1 avant le le rentrer dans le "*.csv".
A la limite tu peux même ouvrir un socket pour aller chercher directement les infos chez google, sans avoir à passer par un fichier (petite requête sur "
http://www.google.fr/search?q=mots_cles"), mais ce n'est pas le sujet.
Je te donne un exemple en perl, en esperant que la regex soit bonne (pas testé --> fleme. En plus c'est pas de moi, ça trainait dans mon home), mais perl n'est pas le seul à savoir faire cela.
Voilà...