Comprendre la mise à jour Google BERT : sens de l’histoire ou véritable révolution ?

30 octobre 2019, révisé le 19 juin 2024

La communauté du SEO est en émoi depuis le 25 octobre dernier et l’annonce officielle de la part de Google de la mise à jour BERT présentée comme une des plus importantes de l’histoire du Search. 
Que signifie BERT ? Quels sont ses impacts sur les résultats de recherche ? Quelles modifications sur les techniques d’optimisation SEO ? Nos experts SEO à Lyon vous décryptent tout ça ! Tour d’horizon.

Google communique très rarement sur les mises à jour de son algorithme de recherche. La communauté SEO internationale ne pouvait donc que s’agiter quand Pandu Nayak, vice-président de Google en charge des activités de recherche, prit la parole vendredi dernier sur le blog officiel de Google pour annoncer une mise à jour majeure de son algorithme, appelée BERT
L’émotion (oui, on peut parler d’émotion !) est d’autant plus grande que BERT est présentée comme la plus grande amélioration du Search depuis 5 ans et comme l’un des plus grands bonds en avant de l’histoire de Google. Rien que ça !

Alors, c’est quoi BERT ?

BERT est l’acronyme de Bidirectional Encoder Representations from Transformers.
Il s’agit d’un algorithme d’apprentissage automatique (machine learning) basé sur un réseau de neurones appliqué au traitement du langage naturel (NLP – Natural Language Processing). Google avait commencé à communiquer sur le projet BERT dès novembre 2018. BERT s’inscrit dans la continuité de la mise à jour RankBrain lancé début 2015.

L’objectif de la mise à jour BERT est d’améliorer la compréhension des recherches effectuées par les internautes.
Concrètement, BERT va chercher à déterminer le sens et l’intention d’une requête en essayant de mieux comprendre les relations entre les mots au sein d’une même phrase (y compris les mots de liaison qui peuvent avoir une importance considérable) plutôt que d’analyser un à un les mots composant une requête.

Google fournit plusieurs exemples très parlants d’avant/après sur son blog.
Ainsi, dans l’exemple ci-dessous, avant BERT, Google fournissait un résultat opposé à ce qui était attendu car l’algorithme se concentrait sur les mots-clés principaux (parking, hill, curb) et omettait la négation. 

Une philosophie globale qui recherche le Juste Nécessaire

Par ailleurs, nous considérons que le principe de minimisation ne doit pas être perçu uniquement comme une contrainte juridique mais comme une philosophie qui doit animer la politique de gouvernance de la donnée d’une organisation.
La Data Minimisation est donc selon nous une démarche de frugalité et de sobriété numérique qui vise à limiter dans le temps la collecte et le stockage des données au “Juste Nécessaire”. 

La question est maintenant de savoir ce qu’est le “Juste Nécessaire” ? 

On trouve dans la philosophie du Lean Management une vision particulièrement pertinente du “Juste Nécessaire”. Selon Christian Hohmann, le Lean Management est “un système visant à générer la valeur ajoutée maximale, à moindre coût et au plus vite, ceci en employant les ressources justes nécessaires pour fournir au client ce qui fait de la valeur à leurs yeux.“  Le Lean Management a notamment comme objectif majeur d’éliminer toute forme de gaspillage : les fameux mudas (“gâchis” en japonais). 

Or, l’industrie de la donnée ne semble pas aujourd’hui s’inscrire dans une démarche d’éradication du gaspillage. Selon une étude de l’entreprise de logiciel californienne Veritas datant de 2016, 85 % des données collectées et stockées ne sont pas traitées ! Ces données qui ne sont pas exploitées à des fins analytiques sont ces fameuses dark data. Encouragées par la démocratisation des technologies Big Data et des infrastructures Cloud, les entreprises emmagasinent un volume gigantesque de données en se disant “on collecte et on verra bien ensuite ce qu’on en fait”. Et dans 85 % des cas, ils n’en font rien.
Dans ce modèle, la quantité l’emporte sur la qualité des données.

Quels sont les impacts sur les résultats de recherche ?

L’annonce officielle de Google n’est pas très claire et nous ne savons pas à date si BERT a été déployé récemment ou va l’être prochainement.
Si ce n’est pas le cas, ce n’est de toute façon qu’une question de jours ou de semaines.

Ce qui est sûr, c’est que BERT va impacter dans un premier temps 10% des recherches en langue anglaise selon Google. BERT sera ensuite progressivement appliqué automatiquement à d’autres langages. La puissance de l’algorithme associé au machine learning permet à Google de généraliser les apprentissages issus de la langue anglaise à d’autres langues sans passer par une phase d’adaptation aux spécificités linguistiques.

Néanmoins, avec seulement 10% des recherches concernées, ce n’est pas exactement ce qu’on peut appeler une révolution.
Mais il y a fort à parier que l’impact de BERT sera de plus en plus fort :

  • Comme le souligne Google dans son post, 15% des recherches effectuées quotidiennement (soit environ 450 millions) sont nouvelles. L’algorithme de réponse de Google doit donc sans cesse s’améliorer pour percer le sens précis de ces requêtes sans historique.
  • Sur le papier, BERT semble particulièrement adapté aux requêtes vocales, souvent complexes (une recherche avec la voix est forcément plus naturelle et donc plus longue car composée de plusieurs mots de liaison alors qu’un internaute utilisant un clavier aura tendance à raccourcir sa recherche et à gommer les mots de liaison). Le lancement de BERT est donc tout à fait cohérent avec la stratégie de Google qui place le Vocal Search au coeur de ses axes de développement pour les prochaines années. 
  • Grâce à l’apprentissage automatique et les milliards de données analysées, l’algorithme va forcément s’améliorer et pourra ainsi être appliqué à des requêtes plus courtes.

BERT pourrait en outre redistribuer les cartes dans les SERPs en permettant à des petits sites ultra pertinents et légitimes sur une thématique de tirer leur épingle du jeu. Dans une configuration classique, ces sites auraient des difficultés à concurrencer des sites ayant une ancienneté, une popularité et une autorité plus fortes. Google pourrait passer outre ces faiblesses s’il détecte une parfaite adéquation d’un contenu à la recherche.

Quels sont les impacts sur les techniques d’optimisation SEO ?

Comme l’indique Danny Sullivan dans un de ses tweets, il n’y a pour BERT aucune technique d’optimisation SEO spécifique (comme c’était déjà le cas pour RankBrain).

BERT pourrait néanmoins mettre à mal les techniques black ou grey hat de sur-optimisation SEO : création de pages sur-optimisées sur un mot-clé, bourrage de mots-clés, rédaction de contenu automatisé via le spinning…

En effet, si la vocation originelle de BERT est d’interpréter le sens des requêtes et non d’analyser le contenu d’une page, une meilleure compréhension du langage et du sens des recherches utilisateurs facilitera l’identification des contenus les plus pertinents et pénalisera mécaniquement les contenus de mauvaise qualité.

Mais les 90% des requêtes non concernées par BERT laissent un joli terrain de jeu aux techniques border-line et on peut faire confiance à la créativité sans limites des black hat pour faire perdurer le jeu du chat et de la souris.

Avec BERT, les fondamentaux du SEO restent donc inchangés. Ils seront même renforcés :

  1. Savoir identifier les mots-clés et intentions de recherche de vos cibles : sujets les plus recherchés, expressions utilisées, compréhension de l’intention de recherches…
  2. Etre en capacité de définir des contenus à très forte valeur ajoutée : ligne éditoriale, axes de différenciation, types de contenus (article de fond, étude de cas, fiche pratique…), formats (FAQ, webinar, podcasts, vidéos, infographies…)…
  3. Rédiger les contenus en restant le plus naturel possible : exploitation du champ sémantique d’une thématique, utilisation de variantes et de synonymes, répétition non abusive d’un mot-clé, bannissement des techniques de rédaction automatisées….
  4. Valoriser le contenu pour les robots des moteurs de recherche : structuration sémantique, microformats enrichis, cluster thématique, silong, maillage interne…
  5. Développer l’autorité d’un contenu : acquisition de liens externes, stratégie de viralité auprès des influenceurs et des réseaux sociaux…

Dans cette logique, les compétences data/IA/analytics occuperont une place de plus en plus stratégique dans la chaîne de valeur du contenu pour :

  • Identifier les thématiques et sujets à potentiel d’audience ;
  • Décortiquer les SERPs et les stratégies concurrentes ;
  • Comprendre les intentions de recherche ;
  • Fournir des insights rédactionnels ;
  • Mesurer l’impact business des contenus ;
  • Instaurer une démarche d’amélioration continue de la performance.

Alors véritable révolution ou sens de l’histoire ?

BERT est présenté comme une petite bombe mais son objectif est d’améliorer la compréhension des recherches des internautes. 
Ce n’est pas une révolution en soit, c’est même la vocation de Google depuis sa création en 1998 ! Et elle n’est pas prête de changer ! 

Car, qui dit meilleure compréhension des recherches = meilleure pertinence des résultats = meilleure audience = clics sur les liens commerciaux = $$$$$$.

D’ailleurs, si on s’amuse à relire les articles présentant la mise à jour RankBrain de 2015, on pourrait les re-publier aujourd’hui en remplaçant simplement RankBrain par BERT.  Les tenants et les aboutissants de ces 2 mises à jour majeures sont quasiment les mêmes !

Si révolution il y a, elle est avant tout technologique. Grâce à l’Intelligence Artificielle et au Machine Learning, Google met à profit les quantités astronomiques de données à sa disposition pour personnaliser les résultats selon :

  • le mot-clé tapé et la compréhension de l’intention de la recherche ; 
  • le profil de l’utilisateur (données socio-démographiques, historique de recherches, centres d’intérêts…)
  • le contexte de recherche (device, localisation géographique, heure, séquence de recherches…).


BERT n’est pas une révolution ou un changement de paradigme ; c’est une évolution attendue car l’algorithme de Google cherchera toujours à progresser pour satisfaire ses utilisateurs en leur fournissant les résultats les plus pertinents tout en s’adaptant aux évolutions des usages.

BERT s’inscrit donc totalement dans le sens de l’histoire et n’est qu’un chapitre de plus dans le roman que Google essaie d’écrire depuis 1998 : être l’ami (don’t be evil qu’ils disaient) qui vous apporte des réponses simples et naturelles.

Besoin d'un expert en SEO ?

Ces articles peuvent vous intéresser

  • SEO

Clustering de mots-clés : définition, bénéfices et mise en œuvre

  • Data
  • SEA
  • SEO

Comment estimer la valeur d’un site Internet dans le cadre de la cession d’une entreprise ?