Robots.txt Robots.txt Robots.txt Robots.txt Robots.txt

Présentation du fichier robots.txt

Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi tout moteur de recherche commence l'exploration d'un site web en cherchant le fichier robots.txt à la racine du site.

Format du fichier robots.txt

Le fichier robots.txt (écrit en minuscules et au pluriel) est un fichier ASCII se trouvant à la racine du site et pouvant contenir les commandes suivantes :

  • User-Agent: permet de préciser le robot concerné par les directives suivantes. La valeur * signifie "tous les moteurs de recherche".
  • Disallow: permet d'indiquer les pages à exclure de l'indexation. Chaque page ou chemin à exclure doit être sur une ligne à part et doit commencer par /. La valeur / seule signifie "toutes les pages du site".

Attention Le fichier robots.txt ne doit contenir aucune ligne vide !

Voici des exemples de fichier robots.txt :

  • Exclusion de toutes les pages :
    User-Agent: *
    Disallow: /
  • Exclusion d'aucune page (équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées) :
    User-Agent: *
    Disallow: 
  • Autorisation d'un seul robot  :
    User-Agent: nomDuRobot
    Disallow :
    User-Agent: *
    Disallow: /
  • Exclusion d'un robot :
    User-Agent: NomDuRobot
    Disallow: /
    User-Agent: *
    Disallow:
  • Exclusion d'une page :
    User-Agent: *
    Disallow: /repertoire/chemin/page.html
  • Exclusion de plusieurs page :
    User-Agent: *
    Disallow: /repertoire/chemin/page.html
    Disallow: /repertoire/chemin/page2.html
    Disallow: /repertoire/chemin/page3.html
  • Exclusion de toutes les pages d'un répertoire et ses sous-dossiers :
    User-Agent: *
    Disallow: /repertoire/

Quelques User-Agents

Voici quelques exemples de User-Agents pour les moteurs de recherche les plus populaires :

Nom du moteur User-Agent
Alta Vista Scooter
Excite ArchitextSpider
Google Googlebot
HotBot Slurp
InfoSeek InfoSeek Sidewinder
Lycos T-Rex
Voilà Echo

Pour plus d'informations

The web robots page

Dernière modification le mardi 14 octobre 2008 à 17:40:30.Ce document intitulé « Robots.txt » issu de Comment Ça Marche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.

Meilleures réponses pour « Robots.txt » dans :
Robots.txt, un fichier important Voir Sur votre site : le fichier robots.txt Sur votre site , vous essayez, dans la mesure du possible, de faire en sorte que vos pages soient indexées au mieux par les robots (spiders) des moteurs de recherche. Mais il peut également arriver que...
[Webmaster] Empêcher l'aspiration de mon site VoirMéthode 1 : Le fichier robots.txt Ce fichier sert à donner des instructions aux robots des moteurs de recherche qui se baladent sur les sites. Vous pouvez leur indiquer les URL à suivre ou ne pas suivre. Vous pouvez même donner des directives...
Convertir des fichiers de sous-titres (srt, sub, ssa, txt) VoirIl existe quatre principaux format de sous-titres : srt, sub, ssa et txt. Il peut arriver que pour une raison ou pour une autre, vous ayez à passer d'un de ces formats à un autre. Le problème, c'est que vous trouverez une multitude de logiciels...
Faire une voix de robot avec Audacity VoirPour se donner une voix de robot, il suffit d'utiliser le logiciel Audacity : Mettre la distance à 1 Régler le nombre de bande vocoder au maximum Régler l'amplitude originale audio à 0 L'amplitude du bruit dépend de ce que l'on souhaite obtenir...
Fichier TXT VoirFormat TXT Un fichier TXT est un fichier texte, c'est-à-dire un simple fichier contenant du texte au format ASCII. Pour ouvrir ou modifier un tel fichier, il suffit d'utiliser le bloc-notes ou un éditeur de texte traditionnel.
Collection CommentÇaMarche.net