Rechercher : dans
Par :

[référencement] Ne pas être référencé

Dernière réponse le 15 sep 2009 à 14:08:46 kij_82, le 13 sep 2007 à 20:48:29 
 Signaler ce message aux modérateurs

Bonsoir,

Je voulais savoir comment ne pas référencer son site internet par google ou un autre moteur de recherche ?
Je pose la question pour le probleme suivant :

Quand je tape sous google le nom de mon domaine, je tombe sur l'une des pages d'un de mes sites hébergé sous mon domaine.
Je ne voudrais plus l'avoir via une recherche google car le chemin d'acces à mes pages apparait ^^


Merci de votre aide :)
~ N'oubliez pas la balise "Résolu" lorsque votre problème est... résolu :) ~

Configuration: Windows XP
Firefox 2.0.0.6

Meilleures réponses pour « [référencement] Ne pas être référencé » dans :
Référencer son site : les moteurs de recherche Voir Voici quelques autres "trucs" à savoir pour référencer un site. Les moteurs de recherche où il faut à tout prix présenter son site : 1) DMOZ ( www.dmoz.org). Ce site est très important car Google, Yahoo, Lycos, Voila... vont tous rechercher des...
Choisir sa carte graphique en fonction de sa référence Voir Classement des cartes graphiques par leur référence Les conseils pour le choix d'une carte graphique sont donnés dans l'astuce : Choisir une carte graphique pour son PC Ici, on va donner les clés de décodage pour comprendre comment les...
Référencer un/son site Voir Comment référencer un site 1- Renseigner les balises méta 2- Référencer son site 3 - Les logiciels qui peuvent vous aider 4 - Autres liens sur ce sujet 1- Renseigner les balises méta Insérées dans chaque en-tête de page, les metatags...
Les bases pour référencer votre site professionnel facilement VoirLes bases pour référencer son site professionnel facilement Avoir un site Internet c'est bien mais faire en sorte qu'il attire un grand nombre de visiteurs c'est indispensable ! En effet, le Web abrite une quantité colossale de contenus et sortir...
PC : les configurations de référence (unités centrales) VoirLes principes généraux sont décrits dans cet article. Ici seront décrits les choix les plus intéressants pour son Unité Centrale. Les différents éléments sont choisis en fonction de leur rapport performances/prix intéressant, ou pour une...
[Référencement] Les critères de Google VoirQuels sont les critères de positionnement de Google ? 1 - Les échanges de liens 2- Le titre de vos pages 3 - Le contenu de vos pages 4 - La hiérarchie 5 - Les balises méta 6 - Les sitemaps Les choses à ne PAS faire Liens utiles Quels
Les Méta Tags VoirIntroduction aux méta tags Les métadonnées sont des informations situées au sein d'un document afin de le décrire. Les métadonnées sont ainsi utilisées par les moteurs de recherche lors du référencement de la page web. Grâce à ces balises non...
Référencement d’une plage de cellules VoirPLAGE DE CELLULES CONTIGUËS Une plage de cellules se note en indiquant les références de la cellule de début et de fin, séparées par le caractère : (deux-points) : Reference_Cellule_Debut:Reference_Cellule_Fin La référence à une ligne ou à une...

1

gryzzly, le 13 sep 2007 à 21:29:27
  • +3

<META NAME="ROBOTS" content="noindex"> dans toutes les pages à exclure On peut pardonner beaucoup à autrui, sauf de vous avoir aidé.
B. Werber

Répondre à gryzzly

2

jérémy1664, le 14 sep 2007 à 10:21:18

Salut

Pour ne pas être référencé (bizarre) il faut mettre quelques indications sur l'index de ton site pour les robots.txt (de google)

Voici des exemples de fichier robots.txt :

* Exclusion de toutes les pages :

User-Agent: *
Disallow: /

* Exclusion d'aucune page (équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées) :

User-Agent: *
Disallow:

* Autorisation d'un seul robot :

User-Agent: nomDuRobot
Disallow :
User-Agent: *
Disallow: /

* Exclusion d'un robot :

User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:

* Exclusion d'une page :

User-Agent: *
Disallow: /repertoire/chemin/page.html

* Exclusion de toutes les pages d'un répertoire et ses sous-dossiers :

User-Agent: *
Disallow: /repertoire/

Répondre à jérémy1664

3

kij_82, le 14 sep 2007 à 10:29:26
  • +2

Oui exact, merci pour la réponse.
J'avais trouvé entre temps également, je me permet donc de compléter la réponse.

Voici les différentes valeur pour l'attribut 'content' :
- all : permet à tous les robots d'indexer, archiver, etc. vos pages
- noindex : permet d'interdire l'indexation à tous les robots
- nofollow : permet de ne pas faire suivre vos pages / liens
- noarchive: permet de ne pas archiver vos pages
- none : équivalent à 'noindex,nofollow'

Ex : <META NAME="ROBOTS" content="none,noarchive">


Si vos pages sont déjà référencé sur le net par google ou un autre robot, il vous faudra placer un fichier nommé 'robot.txt' à la racine de votre site. Dans ce fichier vous mettrez la ligne suivante :

# robots.txt
User-agent: *
Disallow: /


User-agent: permet de spécifier quel type de robot. '*' signifie donc tous les robots. Si vous ne souhaitez interdire l'indexation que sur google, remplacez '*' par 'googleBot'
Disallow: permet de spécifier quel répertoire de votre site ne doit pas être indexé.
Vous pouvez donc mettre autant de ligne qu'il faut pour chaque répertoire à interdire comme suit par exemple :
# robots.txt
User-agent: *
Disallow: /toto/
Disallow: /mesPhotos/


Le '/' du premier exemple signifie le répertoire courant (ou est mis le fichier texte robot.txt)

Voilou :)


EDIT : Autant pour moi Jérémi, je n'avais pas vu ton post ^^

Par contre, je cite :
pour les robots.txt (de google) 

En fait c'est le standard pour n'importe quel robot normalement, donc ca fonctionne pour d'autre que google. ~ N'oubliez pas la balise "Résolu" lorsque votre problème est... résolu :) ~

Répondre à kij_82

4

BostAndBim, le 1 mai 2009 à 20:51:26

Ce n'est pas forcément "bizarre" de ne pas vouloir référencer son site sur Google; pour ma part, j'ai développé un outil pour un jeu en ligne, et j'ai pas envie que nos adversaires puissent nous espionner ou même tenter de hacker l'application.

Merci :)

Répondre à BostAndBim

5

 Kyoshiro38, le 15 sep 2009 à 14:08:46

Idem, je ne vois rien de bizarre à ne pas vouloir être référencé.

Genre tu développe un site pour un client, tu as une version en prod qui doit être référencé, et une version de dev ou tu peux bidouiller et faire voir l'avancement au client. La version de dev n'a aucune raison et ne doit pas être référencé.

Vous allez me dire que si aucun lien extérieur ne pointe vers la version de dev, il n'y a aucune raison que les google vienne dessus!!! C'est vrai, mais il suffit qu'un blaireau (et les clients le sont souvent!!!) mette le lien de la version de dev dans un forum pour en parler à un ami, et hop les robots se font l'incruste en suivant le lien!!!!

La théorie de se brillant algorithme qu'est pageRank veut que les robots se contentent de suivre les liens et se baladent de page en page. En pratique, ces gentils petits robots sont bien plus indiscret qu'ils ne devraient!!! Une fois qu'ils ont mis le nez sur votre site, ils scannent, référencent, et mettent en cache tout ce qu'ils trouvent.

Je parle en connaissance de cause en vous disant que des documents placés dans un répertoire de votre site web peuvent être référencé et mis en cache même si aucun lien ne pointe dessus!!!

La prudence s'impose, Big Brother vous observe!!!!

Répondre à Kyoshiro38