Rechercher : dans
Par :

Fichier robots.txt

Dernière réponse le 8 mai 2008 à 12:01:21 Pat42, le 6 mai 2008 à 20:05:14 
 Signaler ce message aux modérateurs

Bonjour à tous.

Je viens de mettre en ligne sur mon site un fichier text : robots.txt

Le contenu est le suivant :

User-agent: *
Disallow: /default.swf

Il s'agit que les moteurs ne prennent pas en consideration cette animation flash... default.swf

Ma question est :

Comment savoir que les moteurs ne prennent pas en consideration cette animation.

J'anticipe car je pense qu'il faut un moment pour que ce soit pris en considération... mais comment verifier cela dans les jours qui suivent ?

PS : Suis un débutant de chez débutant !

Merci à tous pour votre aide.

Configuration: Windows XP
Internet Explorer 7.0

Meilleures réponses pour « Fichier robots.txt » dans :
Robots.txt, un fichier important Voir Sur votre site : le fichier robots.txt Sur votre site , vous essayez, dans la mesure du possible, de faire en sorte que vos pages soient indexées au mieux par les robots (spiders) des moteurs de recherche. Mais il peut également arriver que...
Robots.txt Voir Présentation du fichier robots.txt Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi...
[Webmaster] Empêcher l'aspiration de mon site VoirMéthode 1 : Le fichier robots.txt Ce fichier sert à donner des instructions aux robots des moteurs de recherche qui se baladent sur les sites. Vous pouvez leur indiquer les URL à suivre ou ne pas suivre. Vous pouvez même donner des directives...
Convertir des fichiers de sous-titres (srt, sub, ssa, txt) VoirIl existe quatre principaux format de sous-titres : srt, sub, ssa et txt. Il peut arriver que pour une raison ou pour une autre, vous ayez à passer d'un de ces formats à un autre. Le problème, c'est que vous trouverez une multitude de logiciels...
Les Méta Tags VoirIntroduction aux méta tags Les métadonnées sont des informations situées au sein d'un document afin de le décrire. Les métadonnées sont ainsi utilisées par les moteurs de recherche lors du référencement de la page web. Grâce à ces balises non...

1

s.spark, le 7 mai 2008 à 16:56:26

Salut,

Le robots.txt permet de ne pas indexer du contenu, étant donné qu'une animation flash est un fichier et non un contenu texte, il est impossible qu'il apparaissent dans une recherche. Sauf si on tape le nom du fichier (uniquement pour google en principe).

Autre chose, ce fichier permet de pas indexer des pages, pas le contenu d'une page. Si tu met ce fichier dans une page HTML, la page HTML sera indexé.

Je pense que le robots.txt est lut systématiquement avant indexation. Ce fichier est une règle donné au moteur de recherche qui respect ton choix, ce n'est pas une barrière anti indexation.

Répondre à s.spark

2

Pat42, le 7 mai 2008 à 17:06:22

Bonjour,

J'ai oublié de dire que dans l'animation flash, il y a du texte (car il y a 6 sequence (6 onglets)), environ 1 000 mots

Le but de robots.txt est de ne pas faire du duplicate content entre les pages html car l'animation flash se repete dans toutes les pages.

d'ou je garde dans ll'index l'animation home.swf
et je la renomme pour les autres pages html : default.txt et la mets dans un robots.txt.

Toujours est-il comment savoir que les moteurs ne prennent pas en consideration cette animation.
Pas possibl avec "spider" carr il prend que le html.

A+

Répondre à Pat42

3

s.spark, le 7 mai 2008 à 17:07:33

Je le répète, une animation flash est un fichier lu par un plugin.

Répondre à s.spark

4

bg62, le 7 mai 2008 à 17:10:37

Bonjour
tu devrais trouver ton bonheur ici :
http://www.commentcamarche.net/faq/sujet 10609 robots txt un fichier important
et si tu veux 'bloquer' ce fichier il faut donc mettre la bonne ligne de code, car même un fichier swf peut se retrouver indexé (désolé spark ...) car il suffit d'un lien, et les moteurs évoluent aussi dans leurs critères de recherche, de plus pas mal de fchiers (swf, mais aussi pdf etc ...) peuvent contenir des balises pour leur indexation ...
il te faut donc 'bloquer' ... à la condition que le fichier soit seul dans son coin et non lié à une page (ou alors une utilisation de balises dans la dite page) ... et dans ce cas il sert à quoi le fichier ???
@+
b g
le 'www' est fait aussi pour communiquer, partager et échanger, non ?

Répondre à bg62

6

s.spark, le 7 mai 2008 à 17:17:29

"peuvent contenir des balises pour leur indexation ... "

;-)

Un robot ne peut pas décompiler un swf. Je t'ai cité pour bien montrer qu'il faut une volonté et mettre des moyen en œuvre pour faire indexer le contenue d'un flash.

Répondre à s.spark

11

 bg62, le 8 mai 2008 à 12:01:21

Oui ... mais sais-tu que les sites en flash commencent à fleurir sérieusement et qu'il y a une foule de manière de les référencer ... dont celle qui consiste à mettre des tags dans le fichiers lui-même ?
@+
b g
le 'www' est fait aussi pour communiquer, partager et échanger, non ?

Répondre à bg62

5

Pat42, le 7 mai 2008 à 17:15:25

Rebonjour,

Spark à dit : "une animation flash est un fichier lu par un plugin".

Tu veux dire que robots.text dans mon cas ne sert à rien !!

Google lui commence à lire le flash et s'il tombe sur une page, ou il y une animation flash avec 1 000 mots plus du texte normal de 600 mots, il additionne = 1 600 mots et il doit faire ca avec toutes les pages.

Et comme l'animation flash se repete dans toutes les pages, il y a risque de duplicate content d'ou il faut bloquer le fichier flash. !

Répondre à Pat42

7

s.spark, le 7 mai 2008 à 17:22:41

Regardes cette page, elle as du texte dans une animation flash :

Animation flash dans une page

Maintenant on va cherche un extrait spécifique contenu dans ce flash :

"TTMC & CO" sur google

Tu vois bien qu'on ne trouve rien, alors que si on cherche du texte contenu dans la page :

bah la "vache tout ca pour intégrer un service pack" sur gogle

On tombe dessus direct.

Répondre à s.spark

8

Pat42, le 7 mai 2008 à 17:41:13

Puisqu'on est dans les exemple :

Voici un site avec animation flash

http://www.melkior.fr

Allons faire un tour à la sequence reference et prenons un bout de texte : "un bon spectacle de magie qui a su rassembler"

Maintenant faisons une recherche dans google :

http://www.google.fr/...

On voit que l'animation flash resort, preuve que google sait lire le flash... bon tu vas dire que l'url de la page n'apparait pas dans les recherches.. mais google en garde sous la dent :)

Répondre à Pat42

9

s.spark, le 7 mai 2008 à 18:02:49

Google me mets sur le cul. Bon c'est le seul à avoir indexé le flash, mais google ne peut être négligé. J'aimerais bien savoir comment il a pu indexé ça ...

Répondre à s.spark

10

Pat42, le 7 mai 2008 à 18:13:04

On en apprend tous les jours...

Nous sommes bien d'accord.. il faut se mefier du duplicate content..

Si tu scroll le site de melkior.. tu t'apercois qu'il y a des liens.. d'autres pages ..

http://www.melkior.fr/magicien.html
http://www.melkior.fr/magie-enfants.html
http://www.melkior.fr/spectacle-enfants.html

etc..

il y a l'animation flash qui se repete + du texte....1000 mots + 600 mots .. environ 600 mots

Le robots.text concerne uniquement 1 page http://www.melkior.fr/magicien.html

pour l'instant. pour voir

Donc la question :

Comment savoir que les moteurs ne prennent pas en consideration cette animation default.swf ! grace au robots-text
A+

Répondre à Pat42