Une multitude de documents Google divulgués nous ont donné un aperçu sans précédent de la recherche Google et ont révélé certains des éléments les plus importants utilisés par Google pour classer le contenu.
Ce qui s’est passé. Des milliers de documents internes divulgués, qui semblent provenir du Content API Warehouse interne de Google, ont été partagés avec Rand Fishkin, co-fondateur de SparkToro, plus tôt ce mois-ci.
- Poursuivez votre lecture pour découvrir ce que nous avons appris de Fishkin, ainsi que de Michael King, PDG d’iPullRank, qui a également examiné les documents (et prévoit de fournir prochainement une analyse plus approfondie pour Search Engine Land).
Pourquoi nous nous en soucions. Cette fuite nous donne un aperçu du fonctionnement de l’algorithme de classement de Google, ce qui est inestimable pour les référenceurs qui peuvent comprendre ce que tout cela signifie. En 2023, nous avons eu un aperçu sans précédent des facteurs de classement de Yandex Search via une fuite, qui a été l’une des plus grandes histoires de cette année-là.
Cette fuite de documents Google ? Ce sera probablement l’une des plus grandes histoires de l’histoire du référencement et de la recherche Google.
Qu’est-ce qu’il y a à l’intérieur. Voici ce que nous savons des documents divulgués par Fishkin et King :
- Actuel: La documentation indique que ces informations sont exactes en mars.
- Fonctionnalités de classement : 2 596 modules sont représentés dans la documentation API avec 14 014 attributs.
- Pondération : Les documents ne précisent pas comment les caractéristiques de classement sont pondérées – elles existent simplement.
- Twiddlers : Il s’agit de fonctions de reclassement qui « peuvent ajuster le score de recherche d’informations d’un document ou modifier le classement d’un document », selon King.
- Rétrogradations : Le contenu peut être rétrogradé pour diverses raisons, telles que :
- Un lien ne correspond pas au site cible.
- Les signaux SERP indiquent l’insatisfaction des utilisateurs.
- Avis sur les produits.
- Emplacement.
- Domaines de correspondance exacte.
- Porno
- Historique des modifications : Google conserve apparemment une copie de chaque version de chaque page qu’il a indexée. Cela signifie que Google peut « se souvenir » de chaque modification apportée à une page. Cependant, Google n’utilise que les 20 dernières modifications d’une URL lors de l’analyse des liens.
Les liens comptent. Choquant, je sais. Cette fuite confirme que la diversité et la pertinence des liens restent essentielles. Et le PageRank est toujours très présent dans les fonctionnalités de classement de Google. Le PageRank de la page d’accueil d’un site Web est pris en compte pour chaque document.
Les clics réussis comptent. Cela ne devrait pas être choquant, mais si vous souhaitez être bien classé, des éléments de la fuite indiquent clairement que vous devez continuer à créer du contenu et des expériences utilisateur de qualité. Google utilise diverses mesures, notamment badClicks, goodClicks, lastLongestClicks et unsquashedClicks. Comme le dit King :
- « [Y]tu dois conduire plus réussi clics en utilisant un ensemble plus large de requêtes et obtenez plus de diversité de liens si vous souhaitez continuer à vous classer. Conceptuellement, cela a du sens car un contenu très fort fera cela. En mettant l’accent sur la génération d’un trafic plus qualifié vers une meilleure expérience utilisateur, vous enverrez à Google le signal que votre page mérite d’être classée.
Les documents et témoignages du procès antitrust américain contre Google ont confirmé que Google utilise les clics dans le classement. En savoir plus sur notre couverture :
La marque compte. Ce que Fishkin a retenu de la fuite, c’est que la marque compte plus que toute autre chose :
- « S’il y avait un conseil universel que je donnerais aux spécialistes du marketing cherchant à améliorer considérablement leur classement et leur trafic dans les recherches organiques, ce serait : « Créez une marque notable, populaire et bien reconnue dans votre espace, en dehors de la recherche Google. »
Les entités comptent. Google stocke les informations sur l’auteur associées au contenu et tente de déterminer si une entité est l’auteur du document.
Autorité du site : Google utilise quelque chose appelé « siteAuthority ».
Données Chrome. Un module appelé ChromeInTotal indique que Google utilise les données de son navigateur Chrome pour le classement des recherches.
Listes blanches. Quelques modules indiquent que Google met sur liste blanche certains domaines liés aux élections et au COVID – isElectionAuthority et isCovidLocalAuthority. Bien que nous sachions depuis longtemps que Google (et Bing) disposent de « listes d’exceptions » lorsque « des algorithmes spécifiques ont un impact par inadvertance sur les sites Web ».
Les articles.
Le fuyard. Erfan AzimiPDG et directeur du référencement de l’agence de marketing numérique EA Eagle Digital, publié cette vidéo, revendiquant la responsabilité de la fuite des documents à Fishkin. Azimi n’est pas employé par Google, mais a déclaré avoir obtenu les documents d’un ancien Googleur.