problème avec WebCopierFermé

Question

Bonjour,

j'utilise l'aspirateur webCopier version 4 démo, j'ai eu un problème lors du téléchargement d'un  cours 
voici le message dans le rapport:

Le téléchargement a démarré (11:12:36, Mai 5, 2008)

Erreur (n° -3) - 'http://www.go.out'

Le téléchargement est terminé (11:12:38, Mai 5, 2008)

Résumé :
 Nbre de fichiers : 0 Taille totale : 0 octets
  

je ne sias pas c'est quoi le problème!!
merci

naima · Accepted Answer

en fin quelque chose comme ... verifier que le site existe toujour..........verifier le proxy

et voila ce qui est écrit dans le journal

TTrack3.41-2+htsswf+htsjava launched on Mon, 05 May 2008 14:01:24 at https://openclassrooms.com/fr/courses +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
(winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "" -P web: -%l "fr, en, *" https://openclassrooms.com/fr/courses -O1 "C:\Mes Sites Web\cours" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )
Information, Warnings and Errors reported for this mirror:
note: the hts-log.txt file, and hts-cache folder, may contain sensitive information,
 such as username/password authentication for websites mirrored in this project
 do not share these files/folders if you want these information to remain private
14:01:24 Warning:  Cache: damaged cache, trying to repair
14:01:24 Warning:  Cache: 0 bytes successfully recovered in 0 entries
14:01:24 Warning:  Cache: error trying to open the cache
14:01:25 Warning:  link is probably looping, type unknown, aborting: www.siteduzero.com/tuto-3-4-0-un-site-dynamique-avec-php.html
14:01:25 Info:  No data seems to have been transfered during this session! : restoring previous one!

sebsauvage · Answer

C'est simple: www.go.out n'existe pas.

naima · Answer

slt,
ya culcun pour m'aider?
merci.

sebsauvage · Answer

C'est quelle URL que tu as essayé de mettre ?
Et est-ce que webcopier a affiché des erreurs ?

sebsauvage · Answer

Je ne connais pas webcopier, mais s'il t'a affiché: http://www.go.out au lieu de http://www.siteduzero.com... c'est que tu as mal entré l'adresse.

En plus du nom du projet, il faut entrer l'adresse à récupérer quelquepart.

sebsauvage · Answer

Il affiche quoi comme message d'erreur ?

sebsauvage · Answer

Je ne vois pas.  Il semble que ça soit un bug de la nouvelle version de httrack.

Bon, en dernier recours, je suggère Firefox + ScrapBook, en lui demandant de prendre uniquement un seul niveau de profondeur.

https://imageshack.com/
https://imageshack.com/

sebsauvage · Answer

J'ai une ancienne version.

Essaie avec ScrapBook: Il est plus lent que httrack, mais il marche bien chez moi.

naima · Answer

j'ai firefox il est installé

naima · Answer

bonjour a tous,
 qui peut m'aider à configurer webcopier prceque j'ai eu un problème lors de son utilisation 
 lorsequ'il termine le téléchargement il m'affiche un message d'errur pour soit verifier l'éxistance du site soit verifier la configuration du proxy 
 merci

sebsauvage · Answer

Avec webcopier, essaie de récupérer juste une page: https://sebsauvage.net/
(c'est un simple fichier html statique).

dis-nous déjà si ça fonctionne.

naima · Answer

resalut sébastien,

avec ton site ça fonctionne très bien il est entrain de télécharger pou le moment
donc ce webcopier il ne peut pas télécharger tous les site ou qoui???
merci infiniment pour l'aide
j'ai une chose à vous demandé,  moi aussi je suis ingénieur en informatique option système d'information, j'aimerai bien vous contacter pour des sujets concernant : uml,  mysql, sqlserver et d'autres
donc si c'est possible de m'envoyé votre e-mail
 merci bien dans tous les cas..

 je doit partire, je consulte votre réponse demain matain et je te rendrai rép concernant webcopier parcequ'il est en cours de téléchargement.

sebsauvage · Answer

Les logiciels de copie de site ne fonctionnent effectivement pas avec tous les sites.


donc si c'est possible de m'envoyé votre e-mail

Je n'aide pas par email. Je reçois trop de demandes.

Tu es ici sur un forum avec plus de 30000 membres. Tu peux utiliser le moteur de recherche du site et poser tes questions.

jihelge · Answer

En fait www.go.out est un re-routage effectué par un robot que l'on voit s'enclancher au début de l'auscultation de siteduzero.com

C'est un anti aspirateur qui route vers ce www.go.out qui fait mettre à genou les aspirateur quels que soit leur type ou génération

Le complications arrive avec www.go.out/robot.txt puis il essai de remonter mais se casse la figure. J'ai essayé de mettre dans les options des conditions de fltrage mais sans succès. Je vais faire un essai avec téléport pro

Utilisateur anonyme · Answer

Salut c'est un peu vieux mais j'ai une solution pour HTTrack,

Bon voila à quoi ressemble le robot anti-aspirateur


# Robots known or highly suspected of collecting email addresses for spam
RewriteCond %{HTTP_USER_AGENT} ^(autoemailspider|Bullseye|CherryPicker|Crescent|ecollector|EmailCollector|EmailSiphon|EmailWolf|ExtractorPro|fastlwspider|.*LWP|Digger|Microsoft.URL|Mozilla/3.Mozilla/2.01|Mozilla.*NEWT|NICErsPRO|SurfWalker|Telesoft|WebBandit|WebEMailExtrac|Zeus.*Webster) [NC,OR]

# Robots (sometimes called spiders) which regularly violate robots.txt
RewriteCond %{HTTP_USER_AGENT} ^(ADSARobot|.*almaden\.ibm|ASSORT|big.brother|bumblebee|Digimarc|FavOrg|FAST|.*fluffy|.*Girafabot|HomePageSearch|IncyWincy|NPBot|Openfind|OpenTextSiteCrawler|OrangeBot|Robozilla|ScoutAbout|.*searchhippo|searchterms\.it|sitecheck|UIowaCrawler|.*webcraft@bea\.com|WEBMASTERS|WhosTalking|WISEbot|Yandex) [NC,OR]

# Agents used for both good and bad purposes, such as sucking up bandwidth
# by downloading entire sites, or probing servers for security exploits.
RewriteCond %{HTTP_USER_AGENT} ^(ASPSeek|Deweb|Fetch|FlashGet|Teleport|TeleportPro|Getleft|GetURL|GetWebPage|.*HTTrack|KWebGet|libwww-perl|Mirror|NetAnts|NetCarta|netprospector|Net.Vampire|pavuk|PSurf|PushSite|reget|Rsync|Shai|SpiderBot|SuperBot|tarspider|Templeton|w3mir|web.by.mail|WebCopier|WebCopy|WebMiner|WebReaper|WebSnake|WebStripper|webvac|webwalk|WebZIP|Wget|XGET) [NC,OR]

# Miscellaneous (suspicious -- more information would be appreciated)
RewriteCond %{HTTP_USER_AGENT} ^(ah-ha|aktuelles|ATHENS|attache|bew|disco|.*DTS.Agent|Favorites.Sweeper|FEZhead|GetRight|go-ahead-got-it|.*Harvest|IBM_Planetwide|leech|MCspider|NetResearchServer|nost\.info|OpaL|PackRat|RepoMonkey|.*Rover|Spegla|SqWorm|.*TrueRobot|UtilMind|vspider|.*WUMPUS) [NC,OR]


# A host which tries to hide itself in reverse DNS lookup
RewriteCond %{REMOTE_HOST} ^private$                               [NC,OR]

# Web surveying sites (may require using ipchains)
RewriteCond %{HTTP_REFERER} (traffixer|netfactual|netcraft)\.com   [NC,OR]
RewriteCond %{REMOTE_HOST} \.netcraft\.com$                        [NC,OR]

# A fake referrer that's often used -- use this unless your pages are related
# in some way to atomic energy and could really be linked to from www.iaea.org
RewriteCond %{HTTP_REFERER} ^[^?]*iaea\.org                        [NC,OR]

# A fake referrer that's used in conjuncting with formmail exploits
RewriteCond %{HTTP_REFERER} ^[^?]*\.ideography\.co\.uk             [NC]

# The rule which blocks out further access from the host
RewriteRule .* - [F,L]



Il détecte l'identifiant du navigateur et  par foi l'en-tête HTML, alors il suffi d'aller dans "définitoire les options" -> l'onglet "Navigateur Internet" et de mettre n'importe quoi genre :


Mozilla/10.08 [fr] (Win7; I)
et



Ps: j'ai la version WinHTTrack Website Copier 3.43-9

Problème avec WebCopier

15 réponses

Newsletters