Un exploit révèle comment et pourquoi Google classe le contenu

Un exploit découvert par Mark Williams-Cook a révélé plus de 2 000 propriétés utilisées par Google pour classer les requêtes et les sites Web, ainsi que des classifications spécifiques telles que la notation par consensus et les types de requêtes.

Pourquoi nous nous en soucions. Les découvertes de cet exploit nous donnent encore plus d’informations sur le fonctionnement de la recherche Google. Plus tôt cette année, nous avons beaucoup appris de l’énorme fuite de Content API Warehouse. Nous avons désormais obtenu des informations supplémentaires sur la notation, la classification, les scores de qualité du site, et bien plus encore.

Notation consensuelle. Google compte le nombre de passages de contenu qui sont en accord, contredisent ou restent neutres par rapport au « consensus général ». Google générera un score consensuel, ce qui aura probablement un impact sur votre classement sur une requête spécifique – en particulier les requêtes de démystification (par exemple, [Is the earth flat?]).

Classifications de requêtes. Google a classé presque toutes les requêtes en huit « classes sémantiques de requêtes raffinées » :

Bref fait
Bool (abréviation de Boolean – questions oui/non)
Autre
Instruction
Définition
Raison
Comparaison
Conséquence (Your Money Your Life, ou YMYL)

Ces classifications déterminent la manière dont Google ajuste son algorithme pour des types de requêtes spécifiques. Nous savons depuis 2019 que Google utilisait des poids de classement différents pour les requêtes de type YMYL.

Scores de qualité du site. Les résultats de Google sont influencés par scores de qualité du site. « Ils disposent d'un outil de prédiction du niveau de qualité du site », selon Williams-Cook. Ceux-ci sont calculés au niveau du sous-domaine, sur la base de :

Visibilité de la marque (par exemple, recherches de marque ou recherches incluant le nom de la marque).
Interactions des utilisateurs (par exemple, clics, y compris lorsque le site n'est pas classé en position 1.
Ancrez la pertinence du texte sur le Web.

Les sites qui n'atteignent pas un certain seuil (par exemple, 0,4 sur une échelle de 0 à 1) ne sont pas éligibles aux fonctionnalités de recherche (par exemple, les extraits en vedette, les gens demandent également).

Probabilité de clic. Google n'utilise pas le taux de clics directement dans le classement. Cependant, il semble que Google ait utilisé une « probabilité de clic » pour chaque résultat organique.

« Il semble donc que Google prenne en compte la probabilité que quelqu'un clique sur votre résultat. Cela changerait si nous modifiions le titre de la page. Ils disposent d'un outil qui peut vous donner des indications à ce sujet dans Google Ads Planner, car il vous indiquera un taux de clics estimé », a déclaré Williams-Cook.

À propos des données. Williams-Cook et son équipe ont analysé 2 téraoctets de données et plus de 90 millions de requêtes. Google a payé 13 337 $ à son équipe pour avoir découvert l'exploit.

La vidéo. C’est un incontournable pour les référenceurs. Améliorer votre référencement avec des modèles conceptuels – Mark Williams-Cook sur YouTube.

Creusez plus profondément :