Problème avec WebCopier

Fermé
naima - 5 mai 2008 à 12:21
 Utilisateur anonyme - 4 févr. 2010 à 13:30
Bonjour,

j'utilise l'aspirateur webCopier version 4 démo, j'ai eu un problème lors du téléchargement d'un cours
voici le message dans le rapport:

Le téléchargement a démarré (11:12:36, Mai 5, 2008)

Erreur (n° -3) - 'http://www.go.out'

Le téléchargement est terminé (11:12:38, Mai 5, 2008)

Résumé :
Nbre de fichiers : 0 Taille totale : 0 octets


je ne sias pas c'est quoi le problème!!
merci
A voir également:
  • Problème avec WebCopier
  • WebCopier - Télécharger - Aspirateurs de sites

15 réponses

en fin quelque chose comme ... verifier que le site existe toujour..........verifier le proxy

et voila ce qui est écrit dans le journal

TTrack3.41-2+htsswf+htsjava launched on Mon, 05 May 2008 14:01:24 at https://openclassrooms.com/fr/courses +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
(winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2007], %s -->" -P web: -%l "fr, en, *" https://openclassrooms.com/fr/courses -O1 "C:\Mes Sites Web\cours" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )
Information, Warnings and Errors reported for this mirror:
note: the hts-log.txt file, and hts-cache folder, may contain sensitive information,
such as username/password authentication for websites mirrored in this project
do not share these files/folders if you want these information to remain private
14:01:24 Warning: Cache: damaged cache, trying to repair
14:01:24 Warning: Cache: 0 bytes successfully recovered in 0 entries
14:01:24 Warning: Cache: error trying to open the cache
14:01:25 Warning: link is probably looping, type unknown, aborting: www.siteduzero.com/tuto-3-4-0-un-site-dynamique-avec-php.html
14:01:25 Info: No data seems to have been transfered during this session! : restoring previous one!
2
Utilisateur anonyme
4 févr. 2010 à 13:30
Salut c'est un peu vieux mais j'ai une solution pour HTTrack,

Bon voila à quoi ressemble le robot anti-aspirateur

# Robots known or highly suspected of collecting email addresses for spam
RewriteCond %{HTTP_USER_AGENT} ^(autoemailspider|Bullseye|CherryPicker|Crescent|ecollector|EmailCollector|EmailSiphon|EmailWolf|ExtractorPro|fastlwspider|.*LWP|Digger|Microsoft.URL|Mozilla/3.Mozilla/2.01|Mozilla.*NEWT|NICErsPRO|SurfWalker|Telesoft|WebBandit|WebEMailExtrac|Zeus.*Webster) [NC,OR]

# Robots (sometimes called spiders) which regularly violate robots.txt
RewriteCond %{HTTP_USER_AGENT} ^(ADSARobot|.*almaden\.ibm|ASSORT|big.brother|bumblebee|Digimarc|FavOrg|FAST|.*fluffy|.*Girafabot|HomePageSearch|IncyWincy|NPBot|Openfind|OpenTextSiteCrawler|OrangeBot|Robozilla|ScoutAbout|.*searchhippo|searchterms\.it|sitecheck|UIowaCrawler|.*webcraft@bea\.com|WEBMASTERS|WhosTalking|WISEbot|Yandex) [NC,OR]

# Agents used for both good and bad purposes, such as sucking up bandwidth
# by downloading entire sites, or probing servers for security exploits.
RewriteCond %{HTTP_USER_AGENT} ^(ASPSeek|Deweb|Fetch|FlashGet|Teleport|TeleportPro|Getleft|GetURL|GetWebPage|.*HTTrack|KWebGet|libwww-perl|Mirror|NetAnts|NetCarta|netprospector|Net.Vampire|pavuk|PSurf|PushSite|reget|Rsync|Shai|SpiderBot|SuperBot|tarspider|Templeton|w3mir|web.by.mail|WebCopier|WebCopy|WebMiner|WebReaper|WebSnake|WebStripper|webvac|webwalk|WebZIP|Wget|XGET) [NC,OR]

# Miscellaneous (suspicious -- more information would be appreciated)
RewriteCond %{HTTP_USER_AGENT} ^(ah-ha|aktuelles|ATHENS|attache|bew|disco|.*DTS.Agent|Favorites.Sweeper|FEZhead|GetRight|go-ahead-got-it|.*Harvest|IBM_Planetwide|leech|MCspider|NetResearchServer|nost\.info|OpaL|PackRat|RepoMonkey|.*Rover|Spegla|SqWorm|.*TrueRobot|UtilMind|vspider|.*WUMPUS) [NC,OR]


# A host which tries to hide itself in reverse DNS lookup
RewriteCond %{REMOTE_HOST} ^private$                               [NC,OR]

# Web surveying sites (may require using ipchains)
RewriteCond %{HTTP_REFERER} (traffixer|netfactual|netcraft)\.com   [NC,OR]
RewriteCond %{REMOTE_HOST} \.netcraft\.com$                        [NC,OR]

# A fake referrer that's often used -- use this unless your pages are related
# in some way to atomic energy and could really be linked to from www.iaea.org
RewriteCond %{HTTP_REFERER} ^[^?]*iaea\.org                        [NC,OR]

# A fake referrer that's used in conjuncting with formmail exploits
RewriteCond %{HTTP_REFERER} ^[^?]*\.ideography\.co\.uk             [NC]

# The rule which blocks out further access from the host
RewriteRule .* - [F,L]



Il détecte l'identifiant du navigateur et par foi l'en-tête HTML, alors il suffi d'aller dans "définitoire les options" -> l'onglet "Navigateur Internet" et de mettre n'importe quoi genre :

Mozilla/10.08 [fr] (Win7; I)
et
<!-- Yohoow Yataaa \0/  -->


Ps: j'ai la version WinHTTrack Website Copier 3.43-9
1
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 12:27
C'est simple: www.go.out n'existe pas.
0
slt,
mais c 'est pas moi qui a entrer cette url : www.go.out (je sais quelle na aucun sens)
j'ai entrer celle du cours que je voulais télécharger.
est ce qu'il na pas pu se connecter au serveur concerné ou j'ai un broblème avec la configuration de webcopier?
merci j'attend votre réponse
0
slt,
ya culcun pour m'aider?
merci.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 13:20
C'est quelle URL que tu as essayé de mettre ?
Et est-ce que webcopier a affiché des erreurs ?
0
resalut,
j'ai entré cette url: https://openclassrooms.com/fr/courses

merci
nom il ma rien affiché, je lance le téléchargement après avoir entrer le nom du projet et l'enregistrer
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 13:42
Je ne connais pas webcopier, mais s'il t'a affiché: http://www.go.out au lieu de http://www.siteduzero.com... c'est que tu as mal entré l'adresse.

En plus du nom du projet, il faut entrer l'adresse à récupérer quelquepart.
0
resalut,
non il accèpte l'url que j'entre, il commence le téléchargement et le termine.mais quant j'essaye d'ouvrire le dossier du site téléchargé je le trouve vide, en cliquant sur l'onglet rapport dans l'interface de webcopier je trouve le message dont je vous parler
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655 > naima
5 mai 2008 à 13:53
Je ne connais pas webcopier, je ne pourrai donc pas te guider dans son utilisation, désolé.
(J'utilise HTTrack)
0
naima > sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019
5 mai 2008 à 14:54
rsalut sebsauvage,
j'ai téléchargé httrack, mais j'ai pas su le bien configurer, il n'arrive pas à télécharger et m'affiche un message d'errur
merci bien de votre compréhension.
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 14:59
Il affiche quoi comme message d'erreur ?
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 15:17
Je ne vois pas. Il semble que ça soit un bug de la nouvelle version de httrack.

Bon, en dernier recours, je suggère Firefox + ScrapBook, en lui demandant de prendre uniquement un seul niveau de profondeur.

https://imageshack.com/
https://imageshack.com/
0
j'ai téléchargé la version : HTTrack 3.41-2
c'est la même que vous utilisé ?
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 15:25
J'ai une ancienne version.

Essaie avec ScrapBook: Il est plus lent que httrack, mais il marche bien chez moi.
0
j'ai téléchargé scrapbook mais j'ai pas pu l'installer c'est un fichier compressé et en l'ouvrant avec winrar je trouve pas le fichier éxécutable pour l'installer!
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655 > naima
5 mai 2008 à 16:09
ScrapBook ne fonctionne que dans Firefox.
Installe Firefox (en prime, c'est un bien meilleur navigateur qu'Internet Explorer).
0
j'ai firefox il est installé
0
bonjour a tous,
qui peut m'aider à configurer webcopier prceque j'ai eu un problème lors de son utilisation
lorsequ'il termine le téléchargement il m'affiche un message d'errur pour soit verifier l'éxistance du site soit verifier la configuration du proxy
merci
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 17:37
Avec webcopier, essaie de récupérer juste une page: https://sebsauvage.net/
(c'est un simple fichier html statique).

dis-nous déjà si ça fonctionne.
0
resalut sébastien,

avec ton site ça fonctionne très bien il est entrain de télécharger pou le moment
donc ce webcopier il ne peut pas télécharger tous les site ou qoui???
merci infiniment pour l'aide
j'ai une chose à vous demandé, moi aussi je suis ingénieur en informatique option système d'information, j'aimerai bien vous contacter pour des sujets concernant : uml, mysql, sqlserver et d'autres
donc si c'est possible de m'envoyé votre e-mail
merci bien dans tous les cas..

je doit partire, je consulte votre réponse demain matain et je te rendrai rép concernant webcopier parcequ'il est en cours de téléchargement.
0
sebsauvage Messages postés 32893 Date d'inscription mercredi 29 août 2001 Statut Modérateur Dernière intervention 21 octobre 2019 15 655
5 mai 2008 à 22:46
Les logiciels de copie de site ne fonctionnent effectivement pas avec tous les sites.


donc si c'est possible de m'envoyé votre e-mail

Je n'aide pas par email. Je reçois trop de demandes.

Tu es ici sur un forum avec plus de 30000 membres. Tu peux utiliser le moteur de recherche du site et poser tes questions.
0
bonjour,

merci pour votre réponse.

Je vous ai envoyé un e-mail de ma boîte sur : sebsauvage@sebsauvage.net
merci une autre fois.
0
bonjour,
webcopier à pu aspirer votre site ( que je trouve vraiment formidable et très intéressent. merci .....)
mais il na rien fait avec le site: siteduzero dont je voulais aspirer le cours PHP

Je vais continuer ma recherche jusqu'à ce que je trouve un aspirateur pour mon cours PHP..

MERCI.
0
En fait www.go.out est un re-routage effectué par un robot que l'on voit s'enclancher au début de l'auscultation de siteduzero.com

C'est un anti aspirateur qui route vers ce www.go.out qui fait mettre à genou les aspirateur quels que soit leur type ou génération

Le complications arrive avec www.go.out/robot.txt puis il essai de remonter mais se casse la figure. J'ai essayé de mettre dans les options des conditions de fltrage mais sans succès. Je vais faire un essai avec téléport pro
0