You are currently viewing Devenir le pro de la recherche sur Google

Devenir le pro de la recherche sur Google

  • Post category:Google / Technologie
  • Commentaires de la publication :1 commentaire
  • Temps de lecture :49 min de lecture
  • Dernière modification de la publication :23 janvier 2023

Google, on ne le présente plus.

Ce moteur de recherche s’est invité sur presque tous les ordinateurs de la planète. En effet, plus de 90% des recherches sur Internet dans le monde se font grâce à Google.

img_63cd77a9a21d0
En décembre 2022, 92.58% des recherches se font sur Google. Chiffres StatCounter

Et ce n’est pas étonnant vu le travail acharné des ingénieurs de la firme pour proposer des résultats toujours plus pertinents aux utilisateurs du monde entier. Si vous voulez avoir un aperçu de ce travail de titan, je vous recommande de visionner la vidéo dont je vous donne le lien en fin d’article. Une petite heure que vous ne verrez pas passer en compagnie de ceux qui font Google !

Sommaire

Savez-vous utiliser le moteur de recherche Google ?

Mais savez-vous tout ce qu’il y a à savoir quant à la bonne utilisation de ce moteur de recherche ? Pensez-vous exploiter tout le potentiel de ce puissant outil ? Si vous avez répondu non, je ne sais   pas, je n’en suis pas sûr, ou tout ce qui s’éloigne de “OUI”, alors vous êtes au bon endroit !

Avertissement

Les capacités de recherche de Google peuvent dans certains cas vous faire frôler l’illégalité.
En effet, vous pouvez parfois accéder à des informations sensibles ou protégées ou qui ne devraient pas être accessibles ou publiques. Le fait d’accéder à certaines informations ne doit pas vous autoriser pour autant à les télécharger et/ou à les exploiter.  
Les informations données dans cet article le sont à titre pédagogique.
Je ne suis pas responsable de ce que vous en ferez.

Trop puissant Google ?

Dès que l’on parle un peu chiffres concernant Google, ça donne vite le tournis. Voici quelques chiffres pour 2021 : 

  • Nombre de pages indexées par Google : 130 000 milliards,
  • Nombre de sites visités chaque jour : 20 milliards,
  • Nombre de requêtes traitées chaque seconde : 80 000, soit 6,9 milliards par jour,
  • Nombre de nouvelles requêtes quotidiennes, c’est à dire nombre de requêtes encore jamais formulées par quiconque : 15 % soit 500 millions par jour,
  • Taille des données stockées sur les serveurs de Google : Plus de 110 millions de Go.

Source : le blog du modérateur

La principale difficulté lorsqu’il s’agit d’exploiter les résultats du moteur de recherche, c’est la quantité monstrueuse d’informations disponibles et donc de résultats proposés. 

Pour répondre à cet aspect de la recherche sur Internet, les ingénieurs déploient des merveilles d’intelligence pour restreindre au maximum les contenus inappropriés et sans intérêt. Il n’en reste pas moins que si vous tapez quelques mots dans le moteur de recherche, le nombre de résultats qui va vous être proposé est tout simplement gigantesque.

Grâce à des opérateurs à utiliser dans la barre de recherche, vous pouvez optimiser grandement la qualité des résultats fournis par le moteur.

Partons à la découverte de ces petites astuces qui feront de vous un maître incontesté de la recherche googlesque ! (oui, je sais, ce mot n’existe pas, mais c’est mon article et je fais ce que je veux !).

Comment mieux chercher dans Google

Google et le langage naturel

La première chose à savoir (à apprendre, à découvrir, ou à redécouvrir),  c’est que vous pouvez demander quelque chose à Google en utilisant le langage naturel.

Il fut un temps (lointain) durant lequel on recommandait de n’utiliser que des mots clefs dans les moteurs de recherche. Tous les mots “vides” (de, à, étaient supprimés et n’étaient pas pris en compte par les algorithmes). 

Ce n’est plus vrai du tout. Grâce à l’intelligence artificielle, le moteur de recherche est désormais capable de comprendre le sens précis d’une phrase et vous fournira des résultats plus pertinents si vous utilisez le langage naturel. N’hésitez donc pas à formuler de vraies questions.

Les opérateurs booléens

Rechercher une expression exacte (“”)

Si vous tapez dans le moteur de recherche : La véritable épouse de Louis XIV, vous obtiendrez un milliard cinq cent vingt millions de résultats. Cependant aucun de ces résultats ne contient la phrase exacte : la véritable épouse de Louis XIV.

img_63cd77aa6e97e
Ça fait beaucoup de pages sur le sujet quand même !

Pour le vérifier, mettez cette phrase entre guillemets. Ceci a pour effet de dire à Google, trouve moi cette expression exacte, tous les mots dans cet ordre précis.

img_63cd77aac5392
La phrase exacte n’est disponible nulle part… Sans doute que « la question ne se pose pas » 😉

La réponse est ici très claire, aucun site ne contient cette expression exacte. Google vous liste alors les résultats de votre recherche sans les guillemets.

Exclure un terme d’une recherche (-)

Le signe – (moins) est utilisé pour extraire un terme d’une recherche. 

Si vous cherchez comment faire un gâteau aux fruits, il vous suffit de taper “recette de gâteau aux fruits” dans la zone de recherche.

Mais si vous n’aimez pas les fraises, sans doute que bon nombre des recettes proposées ne vous conviendront pas. Pour supprimer des résultats les recettes de gâteaux avec des fraises, il vous suffit de taper

gâteau aux fruits -fraise.

img_63cd77ab800c0

Attention à bien laisser un espace avant le signe -.

Utiliser une fourchette de valeurs avec l’opérateur ..

Imaginons que vous recherchez une voiture d’occasion. Votre budget est de 6000 euros maximum. Vous ne voulez donc pas que Google vous propose des voitures au-delà de ce prix. 

Si vous tapez simplement “occasion renault twingo”, vous obtenez  28 millions de résultats avec des prix hors budget.

img_63cd77abd4543
Plein de résultats, mais c’est trop cher !

Mais si vous modifiez votre recherche comme ceci : occasion renault twingo 0 .. 6000 euros, on descend à 1 millions de résultats, lesquels seront tous dans la fourchette indiquée.

occasion renault twingo 0 .. 6000 euros

img_63cd77ac68a9e
Voila qui rentre mieux dans mon budget !

L’opérateur AND

Cet opérateur signifie “ET” et indique à Google que vous recherchez uniquement des sites qui contiennent les deux termes. 

Attention, pour être compris par Google comme opérateur, AND doit être écrit en majuscules.

Exemple, “Traitement de texte” AND “libre Office” ne produira comme résultat que des pages qui contiennent à la fois les termes Traitement de texte ET Libre Office.

“traitement de texte” AND “libre office”

img_63cd77ac9627b

Notez que j’ai placé les termes recherchés entre guillemets pour demander les chaînes exactes.

 L’opérateur OR (ou) – pour avoir le choix

OR permet de demander à Google de présenter des résultats qui correspondent à un terme OU à un autre. 

Comme pour AND, pour être compris par Google comme opérateur, OR doit être écrit en majuscules.

Par exemple, vous avez Microsoft Word et LibreOffice sur votre ordinateur et vous vous demandez comment insérer une note de bas de page. On peut demander à Google de nous donner des résultats pour les deux logiciels en une seule commande : 

créer une note de bas de page « Word » OR « Libreoffice »

img_63cd77acc877f

Pratique aussi si vous voulez chercher des pages en français ou en anglais qui traitent, par exemple, du changement de climat. Tapez  “climate change” OR “changement climatique” et vous aurez des résultats à la fois en français et en anglais .

Pour les trous de mémoire, l’opérateur astérisque : (*)

L’astérisque est utilisé pour remplacer un mot. SI vous recherchez une phrase ou un proverbe et que l’un des mots vous échappe, demandez à Google !

Dans l’exemple ci-dessous, imaginons que nous ne sachiez plus exactement si l’expression c’est : “à bon chat bon rat” ou “à bon rat bon chat”.

à bon * bon *

img_63cd77ad071f5

Les opérateurs avancés

L’opérateur AROUND

Cet opérateur permet de préciser le nombre de mots qui séparent les deux expressions que vous recherchez. C’est pratique pour s’assurer que les résultats traitent bien des deux expressions que vous recherchez sans que la première ne soit présente en début de page et la seconde tout à la fin. Ici on s’assure que les deux termes sont proches.

Par exemple, je souhaite trouver toutes les pages qui parlent de Barack Obama et de Joe Biden, en précisant que les deux présidents ne doivent pas être séparés de plus de 20 mots. 

“Barack Obama” AROUND(20) “Joe Biden”

img_63cd77ad36899

Rechercher sur un site en particulier avec site:

Si vous connaissez un site de référence et que vous voulez uniquement des résultats en provenance de ce site, vous pouvez demander au moteur de recherche de se limiter au site en question. 

Par exemple, vous voulez vous documenter sur la Covid 19… Si vous tapez simplement covid 19 dans le champ de recherche, le nombre de résultats produits est tout simplement ahurissant (pas loin de 8 milliards au moment où je saisis ces lignes…).

Mais si je veux limiter ma recherche aux publications de l’INSERM (par exemple), il suffit d’utiliser l’opérateur site :

site:inserm.fr covid 19

J’accède aux 51500 résultats disponibles sur ce site. Attention à ne pas mettre d’espace entre site et les deux points.

img_63cd77ad8f21c

J’aurai pu tout aussi bien demander à ne voir que des résultats en provenance des sites du gouvernement français (2 millions de résultats) : 

site:gouv.fr covid 19

img_63cd77adcf5d3

L’opérateur site: utilisé seul permet de savoir combien de pages sont référencées par Google sur ce site.

site:inserm.fr = 370 000 résultats

L’opérateur before: 

Cet opérateur permet de ne chercher que les résultats publiés avant une certaine date.
Reprenons notre précédent exemple et demandons à ne voir que les publications avant le 1er janvier 2020 (66 résultats) : 

site:gouv.fr “covid 19” before:01/01/2020

img_63cd77ae1b371

L’opérateur after:

Sans surprise, cet opérateur et l’inverse de before:.

Pour accéder à des publications récentes du gouvernement sur la covid 19, demandons celles qui ont été publiées après le 1er janvier 2023, ce qui nous donne 36 résultats : 

site:gouv.fr « covid 19 » after:01/01/2023

img_63cd77ae56207

Trouver des documents PDF, Word, PowerPoint, etc. avec filetype:

Truc de pros : ext: est plus court et c’est la même chose.

L’opérateur filetype: (type de fichier) permet de rechercher des types de document précis. Par exemple, si vous voulez trouver des présentations PowerPoint sur un sujet précis, vous pouvez taper filetype: suivi du format de fichier pour les PowerPoint : .ppt ou .pptx. Pour un fichier au format Word, vous utiliserez .doc ou .docx et pour les PDF l’extension .pdf. Ça fonctionne avec tous les types de fichiers (.xls ou .xlsx pour Excel, .odt pour les fichiers texte de  LibreOffice, .psd pour les fichiers photoshop, etc.).

Prenons un exemple simple : vous recherchez un exemple de rapport de stage au format PDF pour votre enfant qui est en 3ème. Pour cela vous allez utiliser l’opérateur filetype:pdf dans votre requête.

 filetype:pdf rapport de stage 3eme

img_63cd77ae82866

Avertissement

J’ai masqué le nom du collégien qui ressort dans cette requête pour préserver son identité. Notez que nous commençons à récupérer des données “sensibles”, comme je l’évoquais dans l’avertissement en début d’article. Ici, sans grande difficulté, je viens de trouver une identité ce qui peut poser un problème.

L’opérateur intext:

Cet opérateur permet de rechercher des pages contenant un mot spécifique dans leur contenu. Exemple: intext:artificial intelligence

Trouver des liens avec link:

Avec link:, il est facile de trouver les sites qui pointent vers une adresse particulière où vers votre propre site ! Dans cet exemple, je découvre que le site synonyme-du-mot.com a créé un lien vers mon site internet dans l’un de ses articles (merci à eux !).

link:kitcreanet.fr

img_63cd77aedc5db
Un petit lien ça fait toujours plaisir !

Vérifier la version d’un site présent dans le cache de Google

Il suffit pour cela de taper la commande cache: suivi de l’url de votre site. 

cache: monsite.com

Trouver des sites similaires avec related:

Si vous tapez related:google.com vous trouverez d’autres moteurs de recherche.

related:google.com

Les requêtes spécialisées SEO

Ces requêtes peuvent être utilisées par tout le monde bien entendu mais ce sont plutôt les spécialistes du SEO et du marketing qui trouveront des intérêts réels avec ces opérateurs.

Trouver les sites qui ont un mot clé particulier dans leur URL

Par exemple, trouver les sites internet qui ont le mot gratuit dans leur URL (l’URL c’est l’adresse de la page, le truc qui commence par https://…, etc.) : 

inurl:gratuit

inurl:gratuit cadeau

Trouver des pages qui contiennent tous les mots spécifiés dans l’URL

L’opérateur à utiliser est allinurl:

allinurl:turing deep learning

Le résultat renvoie (entre autres) cette URL qui contient bien les bons mots https://www.turing.ac.uk/research/theory-and-method-challenge-fortnights/theorydeeplearning

img_63cd77af0a9c9

Trouver des pages qui ont un mot spécifique dans leur titre

On parle ici du titre de la page, dans le corps de la page elle-même.

intitle:choucroute

… vous enverra probablement plusieurs recettes de choucroute alsacienne ! Et si vous ne voulez pas de la recette de la choucroute alsacienne, il suffit d’ajouter l’opérateur moins (-).

intitle:choucroute -alsace

Trouver des pages qui contiennent un mot en particulier dans le corps de la page (pas dans le titre ou dans l’URL).

C’est l’opérateur allintext:

allintext:Pneumonoultramicroscopicsilicovolcanoconiosis

Oui, ce mot existe en anglais, il comprend 45 lettres et désigne une maladie pulmonaire… … et il est trouvé dans 244 000 résultats !

img_63cd77af3cd74

Trouver des pages qui contiennent plusieurs mots particuliers dans le corps de la page (pas dans le titre ou dans l’URL).

intext: c’est le même principe que allintext, mais pour les phrases complètes.

Rechercher des pages qui contiennent un mot particulier dans une ancre de lien (une cible)

inanchor: alan turing deep learning

Le résultat renverra toutes les pages qui contiennent un ou plusieurs mots de la requête dans une ancre de lien.

Rechercher des pages qui contiennent tous les mots de la requête dans une ancre de lien

allinanchor: alan turing deep learning

Cette fois-ci, tous les mots doivent être présents dans l’ancre du lien.

Encore plus puissant, combinez les opérateurs

Maintenant que vous en savez un peu plus sur tous les opérateurs qui sont à votre disposition lorsque vous faites une recherche sur Google, vous commencez certainement à avoir une vue plus précise de l’énorme potentiel de ces outils. Et bien entendu, c’est en les combinant que tout devient encore plus fou.

Par exemple, je veux tous les PDF qui parlent dans le corps du texte de l’exposition des enfants aux écrans qui sont présents sur les sites du gouvernement français. Je vais saisir la requête suivante : 

site:gouv.fr intext:écran exposition enfant filetype:pdf

Et voilà le résultat, pratique n’est-ce pas ? 

img_63cd77af77890

Trouver l’invisible avec Google

Vous le savez sans doute, ou peut-être pas, mais une grande partie du Web est invisible via les moteurs de recherches. C’est une zone cachée appelée le Dark Web. Mais ce n’est pas de ça dont nous allons parler.

Nous autres, les utilisateurs classiques d’Internet, nous utilisons les moteurs de recherche tels que Google, Bing et Cie pour trouver de l’information. Mais savez-vous que ces moteurs de recherche ne nous montrent pas tout ? Il existe une grande quantité de données qui nous est cachée, quand bien même les moteurs de recherche connaissent et exploitent ces mêmes données.

Et pourtant il existe des techniques et des méthodes pour trouver ces données cachées. Elles sont d’ailleurs utilisées par un grand nombre de professionnels : les enquêteurs, les journalistes, les spécialistes de la sécurité informatique, les utilisateurs avertis, et j’en passe.

Cette technique porte un nom : le Google Dorking ou Google Hacking.

Pour faire simple, ça veut dire “utiliser au maximum les possibilités des moteurs de recherche grâce à des commandes et des mots clefs qui permettent d’obtenir des résultats à la fois très ciblés et très précis”. Et parfois, on parvient même à trouver de l’information que l’on pensait introuvable via un simple moteur de recherche.

Et vous allez pouvoir constater qu’il n’y a pas besoin d’être un ingénieur informaticien pour accéder rapidement à de la donnée cachée voire même sensible. Il suffit tout simplement d’utiliser les opérateurs que nous venons de voir.

À notre époque, de nombreuses sociétés (toutes en vérité) dépensent des sommes considérables pour leur sécurité et pour éviter de se faire pirater. Et pourtant, de nombreux pirates commencent leur travail d’enquête via google, tout simplement. 

Ils utilisent pour cela les opérateurs de recherche avancés pour tenter de trouver des informations ou des documents qui n’étaient pas initialement prévus pour être rendus publics, mais qui sont accessibles, faute d’avoir été correctement protégés.

Un peu plus haut dans l’article, vous avez pu constater que j’ai trouvé l’identité d’un collégien, nom, prénom, année de son stage de 3eme, nom de son établissement, nom de l’établissement dans lequel il a effectué son stage, etc. Ça vous parait anodin ? Mais avec ces informations et quelques recherches ciblées, il est possible d’en apprendre beaucoup plus.

Les robots d’indexation fouille le réseau internet inlassablement et indexent tout ce qu’ils trouvent. Si les données ne sont pas correctement protégées, elles peuvent donc être très rapidement récupérées et exploitées, et parfois de façon malveillante…

Légal ? Pas légal ?

Les recherches Google sont totalement légales

Mais tout dépend de ce que vous en faites. L’excellent Youtubeur Michaël de Marliave (plus connu sous son pseudo Micode) a fait une vidéo très intéressante sur le sujet (que je vous recommande) et il expose avec son co-présentateur Matthieu Lambda le point de vue suivant : 

Une recherche Google, c’est un peu comme une maison. Ce n’est pas parce que tu passes devant une maison dont la porte est ouverte que tu as le droit d’y entrer, et encore moins de te servir de ce qu’il y a à l’intérieur.

Lorsque l’on fait une recherche sur Google on est sur Google. Tout va bien. Mais dès que vous cliquez sur un lien, potentiellement vous n’êtes plus chez Google, vous êtes chez quelqu’un. Et si vous téléchargez l’information, c’est ni plus ni moins du vol de cette information.

Michaël de Marliave (Micode) & Mathieu Lambda – _Underscore on Youtube

À partir de ce moment-là, si vous arrivez à un endroit où vous ne devriez pas être, le bon sens veut que vous rebroussiez chemin immédiatement.

Mais si, comme dans mon exemple, vous faites des recherches pour un travail universitaire, pour votre travail ou pour simplement trouver un exemple de rapport de stage pour votre enfant, vous en conviendrez, ça ne porte pas préjudice au collégien en question. Vous n’utiliserez sans doute jamais les informations que le document contient et vous n’avez probablement rien à faire de ces infos. Ce que vous vouliez, c’est simplement un modèle. Mission accomplie et aucun acte de malveillance à l’horizon.

Ne pas franchir le rubicon

Mais prenons maintenant une recherche de fichier PDF avec ce simple mot en paramètre : CONFIDENTIEL. Utilisons la requête : 

filetype:PDF “confidentiel”

Nous sommes d’accord, là vous commencez à chercher la merd* heu… à filer un mauvais coton. Mais nous sommes ici pour apprendre et c’est pour l’exemple.

Nous sommes également  d’accord qu’un tel document ne devrait pas être accessible simplement sur le net avec une recherche Google ? Et pourtant…

img_63cd77afc9a78
Attention à ne pas franchir la ligne rouge !

J’ai masqué les informations sensibles une fois encore mais me voici avec 709 000 PDF qui contiennent le mot Confidentiel et qui sont disponibles sur Internet. 

Et que dire du premier résultat qui sort ? Un document de 322 pages disponible sur un site du gouvernement ! 

Avertissement

Je vous déconseille carrément de télécharger un tel document car il est très clairement mentionné ici que ce document est établi à l’intention (notez la faute de français) de ses destinataires… Et vous n’en faites pas partie ! Vous vous exposez à des sanctions !

Pour le premier document, il ne fait aucun doute qu’il ne devrait pas se trouver là et que son propriétaire n’a pas pris les précautions nécessaires.

Ensuite, il est certain que dans les 700 000 documents disponibles, peu sont des documents réellement confidentiels. Ils contiennent quelque part le mot confidentiel et ça suffit pour sortir dans ce résultat de recherche.

Mais maintenant que notre curiosité est piquée… Si on allait regarder quels sont les documents confidentiels sur les sites du gouvernement ?

Pour cela, rien de plus simple, on va demander à Google de nous trouver des documents confidentiel sur les sites gouv.fr : 

site:gouv.fr “confidentiel”

Le résultat est immédiat, le chiffre est bas mais j’ai quand même 166 résultats dont un joli fichier Word.

img_63cd77bb8f8ab
Est-il encore utile de le préciser ? Ne téléchargez pas un tel fichier !

Pour aller plus loin

Il existe de nombreux sites qui traitent du dorking et vous pouvez continuer votre découverte si vous le souhaitez.

Pour cela, utilisez cette requête dans Google par exemple : 

allintext:google dorking

Vous contre le reste du monde

Nous l’avons vu, les internautes lambda (dont vous ne faites plus partie désormais), se contentent de taper quelques mots dans la zone de saisie du moteur de recherche et se “dépatouillent” avec la multitude de liens qui sont fournis en retour. 

Dorénavant, vous saurez faire des recherches plus efficaces et … Google va s’en inquiéter !

Et oui, si vous vous amusez avec les opérateurs (ce que vous n’allez pas manquer de faire j’en suis sûr en lisant cet article), Google va détecter une activité “pas ordinaire”. Et oui, vous utilisez le moteur de recherche à un autre niveau que la plupart des utilisateurs.

Pour s’assurer que ce n’est pas un robot qui utilise ces commandes, il est possible que Google vous demande de lui confirmer que vous êtes un humain.
Cette fenêtre va s’afficher  : 

img_63cd77bbb2342
Prouvez que vous êtes un humain !

Pas de panique, il suffit de lui confirmer que vous n’êtes pas un robot en cochant la petite case… Voilà tout.

Conclusion

Mon ambition avec ce tutoriel était de vous donner toutes les clefs pour faire des recherches efficaces et je pense vous avoir donné matière à rechercher tous azimuts 😉

N’hésitez pas à me dire en commentaire si vous avez trouvé ces informations utiles et si vous avez modifié votre façon de rechercher dans Google !

À bientôt, restez curieux !

Quelques liens intéressants : 

Trillions of Questions, No Easy Answers. Une vidéo réalisée par les équipes de Google pour vous permettre de mieux comprendre ce qu’est le moteur de recherche et vous faire découvrir les hommes et les femmes qui se cachent derrière Google. À regarder sur Youtube ici.

Un autre site de Google qui vous parle du moteur de recherche et qui vous explique comment tout ça fonctionne. C’est en français et c’est très agréable à consulter : https://www.google.com/search/howsearchworks/

Le Blog du Modérateur donne quelques stats intéressantes : https://www.blogdumoderateur.com/chiffres-google/

Cette publication a un commentaire

  1. ABA
    ABA

    merci beaucoup je suis très intéressée

Laisser un commentaire