Contribution extérieure

Arme n°02 : le filtrage par les algorithmes de Google

Depuis 20 ans, mon épouse et moi-même accompagnons les entreprises à améliorer leur référencement naturel, c’est-à-dire leur présence dans les résultats des moteurs de recherche. Aujourd’hui, cette expertise est appelée le « SEO » (Search Engine Optimization). Elle m’a conduit à m’intéresser de très près à la manière dont Google fonctionne et aux dernières évolutions du numéro un de la recherche d’information sur la toile.

La première chose à réaliser, c’est la domination de Google dans le paysage des moteurs de recherche. En Belgique, 95% des recherches mots clés sont effectuées sur Google(1). La principale alternative choisie par les utilisateurs est Bing, le moteur de recherche de Microsoft, utilisé par environ 3% des internautes. Yahoo! arrive en troisième position sur le podium. En d’autres termes, le moteur qui pèse lourdement sur l’accès à l’information, c’est bel et bien Google. C’est la raison pour laquelle il est au centre de la stratégie de visibilité des entreprises. Et c’est pour cette même raison que nous allons en faire le cœur de l’analyse qui suit.

Deuxième chose à savoir : les gens sont impatients et peu nombreux à effectuer des recherches approfondies. Les chiffres parlent d’eux-mêmes : les 4 premiers résultats proposés (souvent au départ de milliers de résultats potentiels) génèrent 81% de taux de clic(2). En d’autres termes, moins d’un utilisateur sur cinq explore le 5e résultat. Quelques pour cent à peine s’intéresseront à la seconde page de résultat.

Source de l’image : iProspect, via 1ere-position.fr

Que peut-on en conclure ? C’est que la sélection d’information qui va être proposée aux utilisateurs, résultat de l’algorithme de Google, va lourdement peser sur le façonnage des opinions. Les informations reléguées en seconde page ne toucheront qu’une audience très limitée.

« Quel est le meilleur endroit pour dissimuler un cadavre ? La seconde page de résultats de Google ! », exprime avec humour Olivier Andrieu, l’expert SEO francophone de loin le plus renommé.

Partant de ce constat, nous avons voulu observer quelle information rentre dans la « lucarne » du moteur de recherche américain dès lors que nous nous intéressons à la gestion de la crise sanitaire de la COVID-19. Sans prétendre mener ici une étude exhaustive à valeur scientifique, nous désirons effectuer quelques coups de sonde, qui vont nous permettre d’éclairer certaines réalités du moteur de recherche.

Google monopolise l’espace en réponse à la requête « Le vaccin est-il sûr ? ».
Prise d’écran datée du 02/07/2021.

Comme l’indique la prise d’écran ci-dessus, sur certaines requêtes clés, dans la première partie de l’écran (celle dont on sait qu’elle va monopoliser une très grande partie de l’attention), le moteur de recherche n’aiguille même pas vers des pages de résultats externes. Il livre directement l’information !

Lorsqu’on sait à quel point certains scientifiques et certains statisticiens demeurent plus que critiques sur l’origine, l’homogénéité, la consistance et la pertinence des données sources, que ce soit pour les morts attribués à la COVID que pour les fameux « cas négatifs » COVID basés sur des tests PCR calibrés et organisés de manière variable, on peut considérer que ce raccourci vers une seule source de données constitue une démarche plutôt audacieuse. Elle laisse à penser qu’il n’existe qu’une vérité chiffrée facile à obtenir alors que la réalité est infiniment plus complexe.

L’intelligence artificielle du moteur de recherche Google continue de progresser. La dernière version de son algorithme a été baptisée « MUM ». Grâce à un puissant travail sur la synonymie dans de nombreuses langues du monde, elle permet notamment de canaliser différentes requêtes vers une même page de résultats. Ce qui augmente encore le taux d’exposition à une même réponse ou à un même message mis en scène par le moteur. Récemment, Google a d’ailleurs communiqué qu’il testait son algorithme MUM sur les questions liées au vaccin(3).

Google en devient presque un média à part entière, comme en témoigne l’augmentation faramineuse des pages de résultats à zéro clic(4). Dans 65% des cas, les utilisateurs se contentent de l’information proposée par Google, sans creuser plus loin !

Or, Google n’est pas neutre sur la question de la vaccination. Le 15 avril dernier, la firme californienne a communiqué sa volonté de « participer aux efforts de vaccination dans le monde »(5). Cette aide s’est traduite par l’achat de 200.000 doses de vaccin, mais également par des subventions publicitaires. Dans ce contexte, il semble légitime de nous questionner sur la neutralité des algorithmes du moteur de recherche, lesquels ne sont pas publics.

Jusqu’où Google sera-t-il capable d’aller sous la pression des gouvernements ? La tendance est limpide : depuis 10 ans, les demandes d’information sur les utilisateurs venant des gouvernements n’ont cessé de grimper(6).

En 10 ans, la pression des gouvernements pour obtenir des données auprès de Google a plus que quadruplé. Source : fr.statista.com.

En avril dernier, Google a décidé de rendre publiques les données de géolocalisation dont il dispose. Ces données sont censées « fournir de précieux renseignements sur les mouvements des populations, et surtout, sur la fréquentation de différentes catégories d’endroit », indique le géant(7). Au total, 131 pays sont concernés.

Jusqu’à présent, ces données sont anonymes. C’est-à-dire qu’on peut y voir les déplacements de la population, sans savoir que c’est Monsieur Dupont ou Madame Tartempion qui se sont rendus à leur maison de campagne. Mais de là au traçage individuel, il n’y a qu’un pas. Prenez-en pour avertissement la déclaration de la Sécurité du Québec (SQ) qui se prépare à utiliser les téléphones cellulaires pour géolocaliser les citoyens qui refuseraient de se placer en isolement pendant la pandémie de coronavirus(8).

Mais l’influence de Google ne s’arrête pas là. Lorsque vous effectuez une recherche, le moteur vous suggère des requêtes qui, habituellement, correspondent aux requêtes populaires. En temps normal, le moteur de recherche essaye de vous rendre service en accélérant l’accès aux recherches les plus fréquentes. Cette fonctionnalité s’appelle « Google Suggest ».

Dans le cas qui nous occupe, nous avons tout de même été fort surpris, par exemple, de ne pas voir apparaître l’association entre l’ivermectine et la COVID, pourtant au cœur de l’actualité.

Ci-dessus, Google ne propose pas l’association entre ivermectine et COVID. La rosacée ou les poux lui font de l’ombre.
De fait, contre toute attente, cette association semble ne pas faire partie de la base de données des suggestions de Google.
Ci-dessus, Ecosia(9), un moteur de recherche alternatif qui investit dans des projets écologiques, propose de tout autres suggestions. L’association entre « ivermectina » et « covid » est ici présente, en réponse au besoin de recherche du moment.

À d’autres endroits, Google met en avant des « Questions fréquentes » autour du thème recherché. Ce qui semble bienveillant dans la forme. Cependant, les réponses pourront surprendre les esprits un tant soit peu critiques.

Par exemple, à la question « Les vaccins contre la COVID-19 sont-ils sûrs ? », Google répond en 8 lignes, qui s’appuient sur la réponse officielle de l’Agence européenne des médicaments. Beaucoup de langue de bois et pas la moindre indication sur le fait que, de manière très exceptionnelle et conditionnelle, ces vaccins soient mis sur le marché avant la fin des essais cliniques de phase 3. Ni aucun lien vers une analyse des effets secondaires ou du ratio bénéfice/risque.

Google s’appuie sur la communication très générique de l’Agence européenne des médicaments pour répondre à une question aussi concrète que brûlante : le degré de sécurité des vaccins contre la COVID-19.

Quant à l’efficacité des vaccins, au-delà de la question de leur sécurité, comment est-elle appréhendée par le principal fournisseur d’information dans le monde ?

Dans notre cas, c’est le site web LCI.fr qui arrive en tête des résultats, juste en dessous du carrousel d’actualités(10).

Le site LCI.fr est propulsé en tête des résultats sur la requête « Les vaccins sont-ils efficaces ? ». Date de la prise d’écran : 02/07/2021.

À l’analyse, nous observons que l’article qui est si bien positionné fait référence à « une étude britannique », dont il ne livre même pas les références précises.

Cet article a été choisi pour occuper la « pole position » de Google sur la requête « Les vaccins sont-ils efficaces ? ». Il ne contient même pas une référence scientifique précise. Aucun lien vers des ressources détaillées. Aucune bibliographie.

Cet article fait 582 mots. Ce qui semble bien frugal pour obtenir la « pole position » sur un thème complexe. Comment Google en arrive-t-il à ce type de situation ? Nous ne pouvons pas nous avancer dans une réponse précise, mais une chose est sûre : la pertinence et la consistance des premiers résultats proposés par Google sont hautement questionnables. Or, comme nous l’avons vu plus haut, ces premiers résultats vont conditionner la majeure partie de l’impression faite aux internautes.

Sur le moteur de recherche Bing, qui appartient à Microsoft, une recherche sur « Raoult » positionne Alain Delon, l’acteur de cinéma, comme grand censeur du débat scientifique. On croit rêver.

Date de la prise d’écran : 02/07/2021.

« Chercheur peut-être, médecin, je ne sais pas », tance vertement l’acteur Alain Delon à propos de Didier Raoult. Il est hallucinant de voir le précieux espace pixel de réponse à une recherche très actuelle envahi par des propos qui fleurtent avec la diffamation.

La réputation de Didier Raoult sur la première page du moteur Bing s’apparente à une campagne de dénigrement. Dans le carrousel d’actualités, Raoult est même associé à Bernard Tapie : « Deux pyromanes dans le brasier de la France », peut-on lire.

Aucun lien n’est proposé vers le principal concerné, qui alimente pourtant une chaîne vidéo très consistante à l’IHU Marseille. La page de résultats de Bing se résume en un procès unilatéral, qui ne donne pas la parole à l’accusé.

Notre propos n’est pas de prendre position, mais bien de prendre conscience d’un fait objectif : même une requête nominative concernant un des acteurs principaux du débat sur la COVID-19 génère des jugements de valeur, mais pratiquement aucun lien vers les personnes concernées, qui permettrait de se faire sa propre opinion. Le jugement sur la personne prend le pas sur les sources originales.

Le résultat se fait sentir dans l’opinion : la simple mention de Didier Raoult suffit à provoquer de brûlantes réactions, venant de personnes qui, parfois, ne l’ont jamais entendu s’exprimer.

Encore un point important, et une précaution à apporter à mon analyse : il faut savoir que, sur Google, les résultats peuvent varier d’un ordinateur à l’autre, en fonction de différents paramètres, comme la localisation géographique ou l’historique de recherche d’un utilisateur. Le moteur de recherche a tendance à vous proposer une information localisée, lorsque c’est possible, et à favoriser le type d’information que vous semblez apprécier ou consulter régulièrement. C’est ce qu’on appelle la « personnalisation des résultats de recherche ».

Le filtre géographique n’est pas des moindres. Par exemple, si je cherche « Dipali Ojha India », sur Google France, je tombe sur une page peu attractive, qui semble lister des profils de personnes correspondant au nom recherché. Mais aucune actualité n’est remontée.

En réponse à la requête « Dipali Ojha », la page de résultats sur Google France n’est pas très attractive.
En passant directement par Google Actualités, nous tombons sur une série d’articles, qui viennent étonnamment presque tous de médias hors Europe : Maroc, Mali, etc.
Sur le moteur alternatif DuckDuckGo(11), on sort du brouillard algorithmique : les informations clés sur le procès en cours apparaissent au grand jour.

Que faut-il en retenir comme point de vigilance ? La localisation de l’information, notamment sur Google France, peut vous faire complètement passer à côté d’informations cruciales, lorsqu’elles ne sont pas traitées par les médias européens. Tandis que l’utilisation de moteurs de recherche alternatifs à Google et Bing pourra vous surprendre, presque autant qu’un brouillard qui se dissipe pour laisser entrevoir un paysage d’information flambant neuf.

En l’occurrence, la plainte de l’association Indian Bar introduite contre le Dr. Soumya Swaminathan, Directrice scientifique de l’OMS, pour désinformation à propos de l’ivermectine, fait l’objet, à ce jour, d’un silence radio au sein des médias français, à l’exception de France Soir qui relaye l’information(12).

Le vice-secrétaire de la Santé a reconnu l’efficacité de l’ivermectine comme traitement contre la COVID et les experts médicaux du public et du privé l’ont aussi confirmé. La Haute Cour indienne a rendu un jugement en faveur de ce traitement. C’est bien la reconnaissance de l’ivermectine dans un pays qui a déjà généralisé son utilisation. Mais cette reconnaissance fait actuellement l’objet d’un grand silence dans l’arène médiatique européenne. Silence répercuté par le filtre géographique de Google.

Allez, on vous a laissé le meilleur morceau pour la fin. Du jamais vu en 20 ans de carrière d’analyse du moteur de recherche : le journal Le Monde, presque sans concurrence sur une requête concernant les décès liés aux vaccins. Certes, l’expression de recherche « dans le monde » fait écho à la marque du journal, mais dans bien d’autres contextes, Google gère parfaitement la polysémie.

Parmi les 8 premiers résultats, le journal Le Monde est cité 6 fois. Belle diversité des sources sur une matière polémique.

En conclusion, même si nous ne prétendons pas avoir réalisé ici une analyse exhaustive, nous avons observé que :

  1. Les tout premiers résultats de Google impactent drastiquement l’opinion.
  2. Ces tout premiers résultats manquent souvent de consistance scientifique.
  3. Le moteur Bing de Microsoft offre une arène à la calomnie.
  4. De plus en plus souvent, Google met en scène l’information, sans qu’il ne soit plus nécessaire de consulter des sources externes.
  5. Des informations cruciales sont totalement absentes du moteur local.
  6. Les suggestions de Google filtrent d’importantes informations.
  7. Google a explicitement et activement pris position en faveur des vaccins.
  8. Google relaye l’information officielle en priorité.
  9. Vos données personnelles, notamment de localisation, sont susceptibles d’être transmises aux États.
  10. Les algorithmes de Google ne sont pas rendus publics, mais ils conditionnent la réalité de l’accès à l’information.
  11. L’usage des moteurs de recherche se concentre à 95% sur Google.
  12. Les moteurs de recherche alternatifs (DuckDuckGo ou Ecosia, par exemple) métamorphosent, dans certains cas, le paysage de l’information.

Jean-Marc Hardy

  1. https://www.abondance.com/20181130–38484-infographie-les-parts-de-trafic-des-moteurs-de-recherche-dans-le-monde.html
  2. https://www.1ere-position.fr/definitions/ctr-clickthrough-rate/
  3. https://blog.google/products/search/how-mum-improved-google-searches-vaccine-information/
  4. https://www.abondance.com/20210324–44991-les-serp-a-zero-clic-progressent-encore-65-des-pages-de-resultats-ne-generent-aucun-clic-etude.html
  5. https://www.europe1.fr/economie/covid-19-google-veut-participer-aux-efforts-de-vaccination-dans-le-monde-4038886
  6. https://fr.statista.com/statistiques/631787/demande-d-information-du-gouvernement-emise-a-google-liee-aux-utilisateurs/
  7. https://www.lefigaro.fr/secteur/high-tech/google-va-publier-certaines-donnees-de-geolocalisation-20200403
  8. https://www.journaldemontreal.com/2020/04/03/la-sq-se-prepare-a-geolocaliser
  9. https://www.ecosia.org/
  10. https://www.lci.fr/sante/video-covid-19-variant-delta-ce-que-disent-les-chiffres-sur-l-efficacite-de-la-vaccination-2189987.html
  11. https://duckduckgo.com/
  12. https://www.francesoir.fr/politique-monde/livermectine-utilisee-en-inde-avec-succes-confirmee-comme-traitement-contre-la-covid