Posez votre question Signaler

[référencement] Ne pas être référencé [Résolu]

kij_82 4070Messages postés 7 avril 2005Date d'inscription 24 septembre 2010Dernière intervention - Dernière réponse le 19 févr. 2012 à 16:40
Bonsoir,
Je voulais savoir comment ne pas référencer son site internet par google ou un autre moteur de recherche ?
Je pose la question pour le probleme suivant :
Quand je tape sous google le nom de mon domaine, je tombe sur l'une des pages d'un de mes sites hébergé sous mon domaine.
Je ne voudrais plus l'avoir via une recherche google car le chemin d'acces à mes pages apparait ^^
Merci de votre aide :)
Lire la suite 

[référencement] Ne pas être référencé »

8 réponses
Réponse
+13
moins plus
Oui exact, merci pour la réponse.
J'avais trouvé entre temps également, je me permet donc de compléter la réponse.

Voici les différentes valeur pour l'attribut 'content' :
- all : permet à tous les robots d'indexer, archiver, etc. vos pages
- noindex : permet d'interdire l'indexation à tous les robots
- nofollow : permet de ne pas faire suivre vos pages / liens
- noarchive: permet de ne pas archiver vos pages
- none : équivalent à 'noindex,nofollow'

Ex : <META NAME="ROBOTS" content="none,noarchive">


Si vos pages sont déjà référencé sur le net par google ou un autre robot, il vous faudra placer un fichier nommé 'robot.txt' à la racine de votre site. Dans ce fichier vous mettrez la ligne suivante :
# robots.txt
User-agent: *
Disallow: /


User-agent: permet de spécifier quel type de robot. '*' signifie donc tous les robots. Si vous ne souhaitez interdire l'indexation que sur google, remplacez '*' par 'googleBot'
Disallow: permet de spécifier quel répertoire de votre site ne doit pas être indexé.
Vous pouvez donc mettre autant de ligne qu'il faut pour chaque répertoire à interdire comme suit par exemple :
# robots.txt
User-agent: *
Disallow: /toto/
Disallow: /mesPhotos/


Le '/' du premier exemple signifie le répertoire courant (ou est mis le fichier texte robot.txt)

Voilou :)


EDIT : Autant pour moi Jérémi, je n'avais pas vu ton post ^^

Par contre, je cite :
pour les robots.txt (de google) 

En fait c'est le standard pour n'importe quel robot normalement, donc ca fonctionne pour d'autre que google.
zupo13 - 3 déc. 2010 à 15:01
En tant qu'expert en référencement, je ne saurais que vous conseiller d'utiliser les sites qui vous référence dans tous les moteurs, c'est rapide et efficace, par exemple : http://referencement.w00tz.info , c'est vraiment rapide et pratique !

A bientôt
sunbim - 3 déc. 2010 à 15:04
Merci zupo13 pour ton site, comme tu dis, c'est vraiment rapide et efficace :)
snouz - 19 févr. 2012 à 16:40
sunbim t'es fort pour découvrir et juger de l'utilité d'un site en moins de 3min =)
Ajouter un commentaire
Réponse
+5
moins plus
<META NAME="ROBOTS" content="noindex"> dans toutes les pages à exclure
Ajouter un commentaire
Réponse
+2
moins plus
Salut

Pour ne pas être référencé (bizarre) il faut mettre quelques indications sur l'index de ton site pour les robots.txt (de google)

Voici des exemples de fichier robots.txt :

* Exclusion de toutes les pages :

User-Agent: *
Disallow: /

* Exclusion d'aucune page (équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées) :

User-Agent: *
Disallow:

* Autorisation d'un seul robot :

User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /

* Exclusion d'un robot :

User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:

* Exclusion d'une page :

User-Agent: *
Disallow: /repertoire/chemin/page.html

* Exclusion de toutes les pages d'un répertoire et ses sous-dossiers :

User-Agent: *
Disallow: /repertoire/
Ajouter un commentaire
Réponse
+2
moins plus
Idem, je ne vois rien de bizarre à ne pas vouloir être référencé.

Genre tu développe un site pour un client, tu as une version en prod qui doit être référencé, et une version de dev ou tu peux bidouiller et faire voir l'avancement au client. La version de dev n'a aucune raison et ne doit pas être référencé.

Vous allez me dire que si aucun lien extérieur ne pointe vers la version de dev, il n'y a aucune raison que les google vienne dessus!!! C'est vrai, mais il suffit qu'un blaireau (et les clients le sont souvent!!!) mette le lien de la version de dev dans un forum pour en parler à un ami, et hop les robots se font l'incruste en suivant le lien!!!!

La théorie de se brillant algorithme qu'est pageRank veut que les robots se contentent de suivre les liens et se baladent de page en page. En pratique, ces gentils petits robots sont bien plus indiscret qu'ils ne devraient!!! Une fois qu'ils ont mis le nez sur votre site, ils scannent, référencent, et mettent en cache tout ce qu'ils trouvent.

Je parle en connaissance de cause en vous disant que des documents placés dans un répertoire de votre site web peuvent être référencé et mis en cache même si aucun lien ne pointe dessus!!!

La prudence s'impose, Big Brother vous observe!!!!
Ajouter un commentaire
Ce document intitulé « [référencement] Ne pas être référencé » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.
Dossier à la une
Passage au tout numérique : quel coût pour les particuliers ?