rss
Rechercher : dans
Par : Pertinence Date Nom d'utilisateur
Statut : Non résolu

Qqes questions a propos de pages web

Posté par ROM88, le mardi 13 mai 2008 à 05:56:59
Bonjour,
j'essaie d'ecrire une sorte de crawler simplifie pour pouvoir sauvegarder une copie hors ligne d'un site web chez moi...
le tout etant encore experimental, j'ai rencontre ces qqes difficultes:

- pages web dynamique, comment savoir si une page est dynamique ou non, est ce qu'il y a un caractere special dans le URL ou qqe chose du genre?
- liens relatifs, comment savoir? suffit-il de verifier le nom du domaine?
- frames, comment les traiter comme de simples pages html? les telecharger separement?
- liens externes, comment eviter? suffit-il de verifier le nom du domaine?
- robots.txt , comment verifier ce fichier sur un site et comment interpreter l'information?
- cookies, authentification, serveur securise, comment gerer? j'utilise python mais je suis pas sur qu'il a toutes les fonctions necessaires

ceci dit, je rappelle que ce que je fait est un robot assez simplifie...
faites moi part aussi de qqe autre probleme qui m'aurait echappe, merci
Configuration: Windows XP
Firefox 2.0.0.14
Répondre à ROM88  Signaler ce message aux modérateurs Aller au dernier message

1


  • Ce message vous semble utile, votez !
  • Signaler ce message aux modérateurs
 ROM88, le mardi 13 mai 2008 à 15:00:38
ah oui j'ai oublie aussi, comment faire pour sauvegarder les images chez moi?
Répondre à ROM88
Logiciels pertinents trouvés dans les téléchargements
Télécharger Word Viewer 2003Word Viewer - La visionneuse Word Viewer vous permet d'ouvrir des documents Word 2003 et des documents créés avec toutes les versions...Catégorie: Traitement de texte
Licence: Freeware/gratuit
Télécharger Matizha Sublime 3.2Matizha Sublime - Matizha Sublime 3 est un outil de choix pour tout webmaster sérieux à propos de la création de pages web. D’abord un...Catégorie: Editeurs HTML
Licence: Freeware/gratuit
Télécharger NVU 1.0NVU - NVU est un éditeur HTML WYSIWIG (What You See Is What You Get) libre, c'est-à-dire un logiciel permettant de créer...Catégorie: Editeurs HTML
Licence: Open Source
Télécharger Firstpage 2006Firstpage - First Page 2006 est un éditeur html gratuit et excellent. Il permet de travailler un code HTML en couleur, ainsi que de...Catégorie: Editeurs HTML
Licence: Freeware/gratuit
Plus de logiciels gratuits sur « qqes questions a propos de pages web »