Google Hacks - Automatiser les requêtes complexes

Décembre 2016

Google Hacks est un logiciel open source totalement gratuit qui permet de générer automatiquement des requêtes complexes pour rechercher de la musique, des livres, des programmes, des polices, des vidéos, etc.

Google Hacks est une véritable application, ce qui signifie que vous devez la télécharger depuis Internet et ensuite l’installer sur votre ordinateur.

Pour commencer, connectez-vous au site http://code.google.com/p/googlehacks/. Activez ensuite l’onglet « Downloads » et cliquez sur la version correspondant à votre système d’exploitation (Windows, Mac OS ou Linux) pour la récupérer.

Notez que vous pouvez également télécharger le code source du logiciel et l’améliorer le cas échéant, si vous avez des compétences en programmation.

Sous Windows, cliquez à présent sur le fichier exécutable récupéré pour lancer la procédure d’installation. Acceptez les termes de la licence en cliquant sur le bouton « I Agree ».

Puis, choisissez d’installer uniquement le programme principal (vous pouvez renoncer à la barre d’outils proposée, elle n’est pas d’une grande utilité). Après un clic sur le bouton « Next », précisez le répertoire de destination. Un nouveau clic sur « Next » puis sur « Install » démarre l’installation du logiciel.

Une fois cette opération terminée, il n’est pas nécessaire de relancer Windows pour pouvoir utiliser Google Hacks. Lancez le programme à partir du menu « Démarrer ».



L’interface minimaliste du logiciel se compose d’une seule fenêtre regroupant toutes les commandes. L’activation de ces dernières est vraiment très simple, puisqu’il suffit de saisir des mots-clés dans la zone de texte, de sélectionner des boutons radio et/ou des cases à cocher, puis de valider en cliquant sur le bouton « Search ». Voici les différents types de recherche qu’il est possible d’effectuer :
  • Music – ce bouton radio est sélectionné par défaut. Sous « File Types » cochez les cases correspondant aux formats audio que vous désirez trouver. Tapez ensuite un ou plusieurs mots-clés dans le champ « Search String » (attention, l’ordre de saisie des termes est important). Validez enfin en cliquant sur le bouton « Search ». Inutile de vous dire que Google Hacks est un outil très puissant qui ne doit pas être utilisé pour dénicher des fichiers protégés par le droit d’auteur. Recherchez exclusivement de la musique libre de droits (il en va de même pour les vidéos, les paroles de chansons, etc.).
  • Book – sélectionnez une ou plusieurs extensions correspondant au type de fichier que vous voulez récupérer (document PDF, texte Word, présentation PowerPoint, archive Zip ou Rar, etc.).
  • Video – recherchez des fichiers vidéo au format Mpeg, AVI, DivX, Windows Media et Flash.
  • Tools – les outils « Links » et « Related » correspondent aux opérateurs avancés éponymes. Avec « Add url », vous demandez à Google d’examiner un site Web en vue d’une éventuelle indexation. « Indexing » correspond à l’opérateur avancé « site ». Quant à « Map », lorsqu’une page contenant les mots-clés est trouvée, Google vérifie si une ville est également citée dans le texte. Une carte est affichée à droite des résultats de manière à ce que vous puissiez repérer géographiquement les localités. Pour accéder immédiatement à celles-ci, il suffit de cliquer sur les étiquettes A, B, C, etc. Deux remarques toutefois :

- Les pages Web trouvées sont en anglais ;
- La fonction de localisation n’est pas toujours au point. Nous avons par exemple tapé « Victor Hugo » dans le champ « Search String ». Google a retourné plusieurs résultats, dont l’un mentionne la bataille de Waterloo. Or, ce n’est pas la ville belge qui a été affichée sur la carte, mais une ville nord-américaine portant le même nom.
  • Hacks – cette option est avant tout réservée aux internautes expérimentés qui sont à la recherche de failles dans leur système informatique. Par exemple, en saisissant une URL dans le champ « Search String », puis en choisissant successivement les boutons radio « Passwords » et « 2 », Google recherche la chaîne de caractères « auth_user_file.txt » dans les liens. Cela permet de trouver potentiellement des fichiers .txt contenant des données utilisateurs sensibles. Une fonction à exploiter avec modération, pour un usage préventif uniquement.
  • Proxy – cette option propose deux méthodes pour transformer Google en serveur proxy. Ce terme désigne un ordinateur intermédiaire, placé entre la machine de l’utilisateur et le réseau Internet, qui permet de contourner les filtres d’accès à certains sites Web (des filtres sont par exemple mis en place dans les entreprises pour éviter que des salariés n’accèdent à des sites non autorisés). La première méthode fait appel au serveur de traduction de Google. Malheureusement, nous avons effectué plusieurs essais qui sont demeurés infructueux, Google renvoyant un message d’erreur du type « Translation from English into English is not supported » (la traduction de l’anglais vers l’anglais n’est pas supportée). Il y a fort à parier que Google a modifié son service de traduction afin qu’il ne puisse pas servir de proxy.

La seconde méthode fonctionne, mais la mise en pages n’est pas respectée. À noter que le proxy de Google n’offre pas d’anonymat. Par conséquent, votre adresse IP n’est pas masquée.
  • Lyrics – tapez le nom d’un artiste ou d’une chanson pour obtenir des informations sur le site Lyrics.com.
  • Font – tapez un ou plusieurs mots-clés pour trouver des polices de caractères.
  • Application – tapez un ou plusieurs mots-clés pour trouver des logiciels.
  • Torrent – tapez un ou plusieurs mots-clés pour trouver des fichiers torrent (réseaux peer to peer).
  • Cache – contrairement à ce que l’on pourrait penser, cette option n’est pas similaire à l’opérateur avancé du même nom. Vous accédez en fait à un site Web intitulé « Internet Archive : Wayback Machine ». Celui-ci recense 85 milliards de pages Web archivées depuis 1996.
  • Web hosting – vous pouvez rechercher des fichiers enregistrés sur des serveurs de stockage en ligne comme Megaupload.com ou Rapidshare.com.


Le texte original de cette fiche pratique est extrait de «Tout sur le web 2.0» (Capucine Cousin, Collection CommentCaMarche.net, Dunod, 2008)

A voir également :

Ce document intitulé «  Google Hacks - Automatiser les requêtes complexes  » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.