Un aspirateur de site classique ne fonctionne pas dans le cas présent.
En effet, on indique à l'aspirateur classique la racine du site, puis il scanne les liens dans le code, les suit, et aspire le contenu pour en disposer hors ligne.
Le problème, c'est que dans le cas de pages, ou d'arborescence plus basse sans lien sur aucune page, alors c'est mort: aucun moyen de trouver ces pages.
Je cherche aussi le moyen de détecter des pages isolées sur un site, ca me rendrait de grands services. Mais je ne pense pas que des aspirateurs puissent dévoiler le contenu d'une arboresence de cette facon... Si certains ont des pistes toutefois, qu'il me tiennent au courant!!