Google - Exploiter les URL de Google

Décembre 2016


Pour introduire ce sujet, intéressons-nous au bouton « J'ai de la chance ». Dans la zone de texte de la page d'accueil de Google, entrez l'expression « find chuck norris » et cliquez sur le fameux bouton précité. En guise de résultat, vous obtenez la phrase suivante : « Google won't search for Chuck Norris because it knows you don't find Chuck Norris, he finds you ». Pour les non-anglophones, cela signifie que Google ne recherchera pas Chuck Norris parce qu'il sait que vous ne le trouverez pas, mais que c'est lui qui vous trouvera...

Vous pensez sans doute à une blague orchestrée par quelques développeurs de la société Google. Eh bien, ce n'est pas le cas ! La page de résultats ressemble à du Google, mais ce n'est pas du Google. Pour vous en convaincre, jetez un oeil sur la barre d'adresse du navigateur Web ; vous apercevez http://clients.arranschlosberg.com/, c'est-à-dire une URL qui n'appartient pas au domaine Google.
En fait, lorsque vous tapez une requête et que vous la validez à l'aide du traditionnel bouton « Recherche Google », le moteur affiche une page de résultats qui est associée à une adresse commençant toujours par « www.google.fr/search? ».

Exemple : Sur la page d'accueil de Google, tapez « windows vista » dans la zone de saisie et cliquez sur le bouton « Recherche Google ».
La page de résultats s'affiche aussitôt.
Dans la barre d'adresse du navigateur vous voyez l'URL http://www.google.fr/search?hl=fr&q=windows+vista&btnG=Recherche+Google&meta=.

À première vue, cette adresse est totalement absconse pour la plupart des internautes. Toutefois, nous parvenons tout de même à reconnaître quelques mots : search, windows, vista, recherche, google... En réalité, avec de l'expérience et quelques connaissances, les utilisateurs avertis sont capables de lancer une requête directement à partir de la barre d'adresse du navigateur Web, sans passer par l'interface Google. L'objectif de cette section n'est pas de vous transformer en expert informatique, mais de vous faire découvrir la logique syntaxique de Google.

La structure élémentaire d'une recherche Google est la suivante : www.google.fr/search?q=. Le paramètre q est le seul argument qui soit vraiment obligatoire. Il suffit ensuite d'accoler n'importe quel terme au signe = pour créer une requête simple.

Exemple : Pour trouver des sites Web consacrés aux dauphins, tapez :
http://www.google.fr/search?q=dauphin

Cette requête, qui ne paie pas de mine, retourne pourtant des résultats très pertinents. Les quatre premiers sites sont ainsi entièrement consacrés à ce mammifère marin.

Astuce : Les requêtes Google sont dynamiques. Cela signifie que leurs résultats sont toujours susceptibles de varier à chaque indexation d'un site Web. Par conséquent, vous pouvez sauvegarder n'importe quelle requête dans vos Favoris Internet, afin de la lancer en un seul clic.

Comme vous pouvez l'imaginer, il est bien évidemment possible de saisir plusieurs paramètres dans une requête Google. Ceux-ci sont séparés les uns des autres par une esperluette (&). Chaque paramètre est suivi du signe =, lequel précède une valeur assignée au paramètre.

Exemple : Voici la structure d'une requête composée de plusieurs arguments :
www.google.fr/search?param1=valeur1¶m2=valeur2¶m3=valeur3

Dans le tableau suivant, nous vous présentons plusieurs paramètres que vous pouvez employer dans une requête via la barre d'adresse du navigateur Web :


Liste des paramètres
Paramètre Description
hl Code de la langue utilisée dans l'interface google ( fr = français, en = anglais, de = allemand, es = espagnole, nl = hollandais, etc. )
num Nombre de résultats affichés par page (100 étant la valeur maximale autorisé)
lr Restreint l'affichage aux pages rédigées dans une langue déterminée ( lang_fr = français, lang_en = anglais, lang_de = allemand, lang_es = espagnole, lang_nl = hollandais, etc. )
restrict Restreint l'affichage aux pages provenant d'un pays déterminé (countryUK = Grande bretagne, countryBE = Belgique, countryAU = Australie, countryIS = Islande, etc.)
+ Représente l'opérateur booléen AND
as_oq Représente l'opérateur booléen OR
as_lq Recherche les pages pointant vers un site web déterminé
as_rq Recherche des pages semblable à un site web donné
as_ft Inclut (i) ou exclut (e) le type de fichier défini par le paramètre "as_filetype"
as_filetype Précise le type de fichier à inclure ou à exclure de la recherche
as_qdr Affiche les pages publiées les 3 derniers mois (m3), les 6 derniers mois (m6) ou au cours de l'année écoulée (y)
as_occt Recherche n'importe où dans la page (any), dans son titre (title), dans le texte (body), dans son adresse (URL), dans les liens hypertextes présents (links)
as_epq Recherche l'expression exacte (il est inutile de saisir les guillemets)
+- Exclut le mot de la recherche



Afin que vous compreniez bien le fonctionnement des URL Google, voici plusieurs exemples combinant les différents paramètres répertoriés dans le tableau.

Exemple 1 : Pour rechercher des pages anglaises traitant du poète français Rimbaud dans une interface Google espagnole, tapez : http://www.google.fr/search?hl=es&lr=lang_en&q=rimbaud

Exemple 2 : Pour rechercher des sites parlant de Rimbaud et Verlaine (avec affichage de 5 résultats par page), tapez :
http://www.google.fr/search?q=rimbaud+verlaine&num=5

Exemple 3 : Pour rechercher des sites parlant de Rimbaud ou Verlaine (avec affichage des pages belges uniquement), tapez : http://www.google.fr/search?as_oq=rimbaud+verlaine&restrict=countryBE

Exemple 4 : Pour rechercher Rimbaud (en excluant Verlaine) dans le titre des pages modifiées depuis moins de 3 mois, tapez : http://www.google.fr/search?q=rimbaud+-verlaine&as_occt=title &as_qdr=m3

Exemple 5 : Pour trouver l'expression « le bateau ivre » dans des documents PDF, tapez :
http://www.google.fr/search?as_epq=le bateau ivre&as_ft=i&as_filetype= pdf

Le texte original de cette fiche pratique est extrait de «Tout sur le web 2.0» (Capucine Cousin, Collection CommentCaMarche.net, Dunod, 2008)

A voir également :

Ce document intitulé «  Google - Exploiter les URL de Google  » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.