A voir également:
- Problème avec WebCopier
- WebCopier - Télécharger - Aspirateurs de sites
15 réponses
en fin quelque chose comme ... verifier que le site existe toujour..........verifier le proxy
et voila ce qui est écrit dans le journal
TTrack3.41-2+htsswf+htsjava launched on Mon, 05 May 2008 14:01:24 at https://openclassrooms.com/fr/courses +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
(winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2007], %s -->" -P web: -%l "fr, en, *" https://openclassrooms.com/fr/courses -O1 "C:\Mes Sites Web\cours" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )
Information, Warnings and Errors reported for this mirror:
note: the hts-log.txt file, and hts-cache folder, may contain sensitive information,
such as username/password authentication for websites mirrored in this project
do not share these files/folders if you want these information to remain private
14:01:24 Warning: Cache: damaged cache, trying to repair
14:01:24 Warning: Cache: 0 bytes successfully recovered in 0 entries
14:01:24 Warning: Cache: error trying to open the cache
14:01:25 Warning: link is probably looping, type unknown, aborting: www.siteduzero.com/tuto-3-4-0-un-site-dynamique-avec-php.html
14:01:25 Info: No data seems to have been transfered during this session! : restoring previous one!
et voila ce qui est écrit dans le journal
TTrack3.41-2+htsswf+htsjava launched on Mon, 05 May 2008 14:01:24 at https://openclassrooms.com/fr/courses +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
(winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2007], %s -->" -P web: -%l "fr, en, *" https://openclassrooms.com/fr/courses -O1 "C:\Mes Sites Web\cours" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )
Information, Warnings and Errors reported for this mirror:
note: the hts-log.txt file, and hts-cache folder, may contain sensitive information,
such as username/password authentication for websites mirrored in this project
do not share these files/folders if you want these information to remain private
14:01:24 Warning: Cache: damaged cache, trying to repair
14:01:24 Warning: Cache: 0 bytes successfully recovered in 0 entries
14:01:24 Warning: Cache: error trying to open the cache
14:01:25 Warning: link is probably looping, type unknown, aborting: www.siteduzero.com/tuto-3-4-0-un-site-dynamique-avec-php.html
14:01:25 Info: No data seems to have been transfered during this session! : restoring previous one!
Utilisateur anonyme
4 févr. 2010 à 13:30
4 févr. 2010 à 13:30
Salut c'est un peu vieux mais j'ai une solution pour HTTrack,
Bon voila à quoi ressemble le robot anti-aspirateur
Il détecte l'identifiant du navigateur et par foi l'en-tête HTML, alors il suffi d'aller dans "définitoire les options" -> l'onglet "Navigateur Internet" et de mettre n'importe quoi genre :
Ps: j'ai la version WinHTTrack Website Copier 3.43-9
Bon voila à quoi ressemble le robot anti-aspirateur
# Robots known or highly suspected of collecting email addresses for spam RewriteCond %{HTTP_USER_AGENT} ^(autoemailspider|Bullseye|CherryPicker|Crescent|ecollector|EmailCollector|EmailSiphon|EmailWolf|ExtractorPro|fastlwspider|.*LWP|Digger|Microsoft.URL|Mozilla/3.Mozilla/2.01|Mozilla.*NEWT|NICErsPRO|SurfWalker|Telesoft|WebBandit|WebEMailExtrac|Zeus.*Webster) [NC,OR] # Robots (sometimes called spiders) which regularly violate robots.txt RewriteCond %{HTTP_USER_AGENT} ^(ADSARobot|.*almaden\.ibm|ASSORT|big.brother|bumblebee|Digimarc|FavOrg|FAST|.*fluffy|.*Girafabot|HomePageSearch|IncyWincy|NPBot|Openfind|OpenTextSiteCrawler|OrangeBot|Robozilla|ScoutAbout|.*searchhippo|searchterms\.it|sitecheck|UIowaCrawler|.*webcraft@bea\.com|WEBMASTERS|WhosTalking|WISEbot|Yandex) [NC,OR] # Agents used for both good and bad purposes, such as sucking up bandwidth # by downloading entire sites, or probing servers for security exploits. RewriteCond %{HTTP_USER_AGENT} ^(ASPSeek|Deweb|Fetch|FlashGet|Teleport|TeleportPro|Getleft|GetURL|GetWebPage|.*HTTrack|KWebGet|libwww-perl|Mirror|NetAnts|NetCarta|netprospector|Net.Vampire|pavuk|PSurf|PushSite|reget|Rsync|Shai|SpiderBot|SuperBot|tarspider|Templeton|w3mir|web.by.mail|WebCopier|WebCopy|WebMiner|WebReaper|WebSnake|WebStripper|webvac|webwalk|WebZIP|Wget|XGET) [NC,OR] # Miscellaneous (suspicious -- more information would be appreciated) RewriteCond %{HTTP_USER_AGENT} ^(ah-ha|aktuelles|ATHENS|attache|bew|disco|.*DTS.Agent|Favorites.Sweeper|FEZhead|GetRight|go-ahead-got-it|.*Harvest|IBM_Planetwide|leech|MCspider|NetResearchServer|nost\.info|OpaL|PackRat|RepoMonkey|.*Rover|Spegla|SqWorm|.*TrueRobot|UtilMind|vspider|.*WUMPUS) [NC,OR] # A host which tries to hide itself in reverse DNS lookup RewriteCond %{REMOTE_HOST} ^private$ [NC,OR] # Web surveying sites (may require using ipchains) RewriteCond %{HTTP_REFERER} (traffixer|netfactual|netcraft)\.com [NC,OR] RewriteCond %{REMOTE_HOST} \.netcraft\.com$ [NC,OR] # A fake referrer that's often used -- use this unless your pages are related # in some way to atomic energy and could really be linked to from www.iaea.org RewriteCond %{HTTP_REFERER} ^[^?]*iaea\.org [NC,OR] # A fake referrer that's used in conjuncting with formmail exploits RewriteCond %{HTTP_REFERER} ^[^?]*\.ideography\.co\.uk [NC] # The rule which blocks out further access from the host RewriteRule .* - [F,L]
Il détecte l'identifiant du navigateur et par foi l'en-tête HTML, alors il suffi d'aller dans "définitoire les options" -> l'onglet "Navigateur Internet" et de mettre n'importe quoi genre :
Mozilla/10.08 [fr] (Win7; I) et <!-- Yohoow Yataaa \0/ -->
Ps: j'ai la version WinHTTrack Website Copier 3.43-9
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 12:27
5 mai 2008 à 12:27
C'est simple: www.go.out n'existe pas.
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 13:20
5 mai 2008 à 13:20
C'est quelle URL que tu as essayé de mettre ?
Et est-ce que webcopier a affiché des erreurs ?
Et est-ce que webcopier a affiché des erreurs ?
resalut,
j'ai entré cette url: https://openclassrooms.com/fr/courses
merci
nom il ma rien affiché, je lance le téléchargement après avoir entrer le nom du projet et l'enregistrer
j'ai entré cette url: https://openclassrooms.com/fr/courses
merci
nom il ma rien affiché, je lance le téléchargement après avoir entrer le nom du projet et l'enregistrer
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 13:42
5 mai 2008 à 13:42
Je ne connais pas webcopier, mais s'il t'a affiché: http://www.go.out au lieu de http://www.siteduzero.com... c'est que tu as mal entré l'adresse.
En plus du nom du projet, il faut entrer l'adresse à récupérer quelquepart.
En plus du nom du projet, il faut entrer l'adresse à récupérer quelquepart.
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
>
naima
5 mai 2008 à 13:53
5 mai 2008 à 13:53
Je ne connais pas webcopier, je ne pourrai donc pas te guider dans son utilisation, désolé.
(J'utilise HTTrack)
(J'utilise HTTrack)
naima
>
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
5 mai 2008 à 14:54
5 mai 2008 à 14:54
rsalut sebsauvage,
j'ai téléchargé httrack, mais j'ai pas su le bien configurer, il n'arrive pas à télécharger et m'affiche un message d'errur
merci bien de votre compréhension.
j'ai téléchargé httrack, mais j'ai pas su le bien configurer, il n'arrive pas à télécharger et m'affiche un message d'errur
merci bien de votre compréhension.
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 14:59
5 mai 2008 à 14:59
Il affiche quoi comme message d'erreur ?
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 15:17
5 mai 2008 à 15:17
Je ne vois pas. Il semble que ça soit un bug de la nouvelle version de httrack.
Bon, en dernier recours, je suggère Firefox + ScrapBook, en lui demandant de prendre uniquement un seul niveau de profondeur.
https://imageshack.com/
https://imageshack.com/
Bon, en dernier recours, je suggère Firefox + ScrapBook, en lui demandant de prendre uniquement un seul niveau de profondeur.
https://imageshack.com/
https://imageshack.com/
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 15:25
5 mai 2008 à 15:25
J'ai une ancienne version.
Essaie avec ScrapBook: Il est plus lent que httrack, mais il marche bien chez moi.
Essaie avec ScrapBook: Il est plus lent que httrack, mais il marche bien chez moi.
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
>
naima
5 mai 2008 à 16:09
5 mai 2008 à 16:09
ScrapBook ne fonctionne que dans Firefox.
Installe Firefox (en prime, c'est un bien meilleur navigateur qu'Internet Explorer).
Installe Firefox (en prime, c'est un bien meilleur navigateur qu'Internet Explorer).
bonjour a tous,
qui peut m'aider à configurer webcopier prceque j'ai eu un problème lors de son utilisation
lorsequ'il termine le téléchargement il m'affiche un message d'errur pour soit verifier l'éxistance du site soit verifier la configuration du proxy
merci
qui peut m'aider à configurer webcopier prceque j'ai eu un problème lors de son utilisation
lorsequ'il termine le téléchargement il m'affiche un message d'errur pour soit verifier l'éxistance du site soit verifier la configuration du proxy
merci
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 17:37
5 mai 2008 à 17:37
Avec webcopier, essaie de récupérer juste une page: https://sebsauvage.net/
(c'est un simple fichier html statique).
dis-nous déjà si ça fonctionne.
(c'est un simple fichier html statique).
dis-nous déjà si ça fonctionne.
resalut sébastien,
avec ton site ça fonctionne très bien il est entrain de télécharger pou le moment
donc ce webcopier il ne peut pas télécharger tous les site ou qoui???
merci infiniment pour l'aide
j'ai une chose à vous demandé, moi aussi je suis ingénieur en informatique option système d'information, j'aimerai bien vous contacter pour des sujets concernant : uml, mysql, sqlserver et d'autres
donc si c'est possible de m'envoyé votre e-mail
merci bien dans tous les cas..
je doit partire, je consulte votre réponse demain matain et je te rendrai rép concernant webcopier parcequ'il est en cours de téléchargement.
avec ton site ça fonctionne très bien il est entrain de télécharger pou le moment
donc ce webcopier il ne peut pas télécharger tous les site ou qoui???
merci infiniment pour l'aide
j'ai une chose à vous demandé, moi aussi je suis ingénieur en informatique option système d'information, j'aimerai bien vous contacter pour des sujets concernant : uml, mysql, sqlserver et d'autres
donc si c'est possible de m'envoyé votre e-mail
merci bien dans tous les cas..
je doit partire, je consulte votre réponse demain matain et je te rendrai rép concernant webcopier parcequ'il est en cours de téléchargement.
sebsauvage
Messages postés
32893
Date d'inscription
mercredi 29 août 2001
Statut
Modérateur
Dernière intervention
21 octobre 2019
15 655
5 mai 2008 à 22:46
5 mai 2008 à 22:46
Les logiciels de copie de site ne fonctionnent effectivement pas avec tous les sites.
donc si c'est possible de m'envoyé votre e-mail
Je n'aide pas par email. Je reçois trop de demandes.
Tu es ici sur un forum avec plus de 30000 membres. Tu peux utiliser le moteur de recherche du site et poser tes questions.
donc si c'est possible de m'envoyé votre e-mail
Je n'aide pas par email. Je reçois trop de demandes.
Tu es ici sur un forum avec plus de 30000 membres. Tu peux utiliser le moteur de recherche du site et poser tes questions.
En fait www.go.out est un re-routage effectué par un robot que l'on voit s'enclancher au début de l'auscultation de siteduzero.com
C'est un anti aspirateur qui route vers ce www.go.out qui fait mettre à genou les aspirateur quels que soit leur type ou génération
Le complications arrive avec www.go.out/robot.txt puis il essai de remonter mais se casse la figure. J'ai essayé de mettre dans les options des conditions de fltrage mais sans succès. Je vais faire un essai avec téléport pro
C'est un anti aspirateur qui route vers ce www.go.out qui fait mettre à genou les aspirateur quels que soit leur type ou génération
Le complications arrive avec www.go.out/robot.txt puis il essai de remonter mais se casse la figure. J'ai essayé de mettre dans les options des conditions de fltrage mais sans succès. Je vais faire un essai avec téléport pro