Le référencement regorge de concepts et de mots à la mode – une cacophonie d'études de cas et de bonnes pratiques, comme une chorale d'enfants en vacances.
À quoi ressemble-t-il réellement dans la nature ? Quelles tendances pourrions-nous observer lorsque nous l’étudions à grande échelle ? Quel étrange mélange de curiosité et de masochisme consacrerait-il des mois de son temps à l’étudier ?
Salut. C'est moi. Je suis le chercheur.
Chaque année, des dizaines d’experts du secteur se réunissent pour analyser l’état du Web.
Il s'agit d'une entreprise colossale qui nécessite l'analyse de 83 To de données pour rédiger 21 chapitres.
Cette année, j'ai dirigé une équipe incroyable pour étudier le référencement sur 16,9 millions de pages, y compris les pages d'accueil et les pages internes du site Web, en utilisant les statistiques brutes et les tendances de HTTP Archive, Lighthouse, les données Crux et une touche de miracle.
Qu’est-ce que l’Almanach Web ?
Le Web Almanac est un rapport annuel qui fournit une analyse approfondie de l'état actuel du Web. C'est comme un contrôle annuel d'Internet.
Le projet vise à aider les développeurs Web, les concepteurs et autres professionnels de l'industrie à mieux comprendre les tendances, technologies et meilleures pratiques actuelles en matière de développement Web.
Sur une note plus humaine, nos vies modernes sont avant tout numériques. L’accès à Internet est nécessaire pour des aspects importants et critiques de nos vies.
Les Nations Unies ont même plaidé en faveur la connectivité en tant que droit de l'homme. Cet effort est le seul projet à documenter notre paysage numérique en évolution.
Qu’avons-nous appris ?
En bref? Beaucoup.
L'édition de cette année du chapitre SEO présente les dimensions et les mesures les plus approfondies et les plus explorées qui n'étaient pas disponibles dans les éditions précédentes.
Soixante-dix pages peuvent être un peu écrasantes à parcourir, alors voici cinq de mes petits plats à emporter préférés.
1. Plus de robots (.txt)
Nous utilisons robots.txt depuis des décennies. Cependant, le protocole n'a été officiellement standardisé qu'en septembre 2022 avec RFC9390.
Cette formalisation a conduit à une application plus stricte des normes techniques et à une meilleure adhésion au protocole.
Cette année, nous avons constaté une augmentation du nombre de réponses robots.txt réussies et une diminution des erreurs, ce qui indique une meilleure mise en œuvre du protocole robots.txt.
- Nous avons constaté des demandes réussies pour les fichiers robots.txt dans 83,9 % des requêtes effectuées sur mobile et 83,5 % sur ordinateur, contre 82,4 % et 81,5 % en 2022.
Nous devenons également plus précis dans nos déclarations robots.txt.
Des outils de référencement, comme AhrefsBot et MJ12Bot sont de plus en plus nommés dans les fichiers robots.txt.
Honnêtement, cela me semble logique. Si vous n'utilisez pas activement l'outil sur votre site, bloquez-le. Pas besoin de simplifier la recherche de concurrents au détriment des ressources de votre serveur.
Les robots d’exploration d’IA émergents, comme GPTBot, commencent également à apparaître dans les fichiers robots.txt, reflétant l’utilisation croissante de ces technologies. Il sera intéressant de voir comment ce fichier évolue au fur et à mesure contrôles proposés pour les robots d'exploration IA sont adoptées.

2. Directives robots : à la fois spécifiques et étrangement absurdes
C'était la première année que nous incluions meta robots directives dans le Web Almanac. Les directives Robots sont une approche spécifique à la page pour contrôler la manière dont les pages HTML individuelles doivent être indexées et servies, distincte des fichiers robots.txt.
Vous pouvez utiliser 24 valable robots règles directives pour contrôler l'indexation et la diffusion du contenu, c'est pourquoi il est si surprenant que les deux règles les plus utilisées en 2024 soient follow et index. Ce ne sont pas des directives valides et sont ignoré par Googlebot.
L’analyse des directives était délicate en raison du grand nombre de combinaisons. Chaque règle est associée à un nom. Le name valeur de la robots meta La balise spécifie à quel(s) robot(s) la règle s'applique. Nous avions 14 règles et 9 noms de robots dans notre ensemble de données.
Nous avons constaté que les référenceurs sont très intentionnels dans la sélection des règles par nom de bot.
- Le
noarchiveLa règle n'a aucun sens pour la plupart des robots et s'applique à seulement 1 % des pages lorsque le génériquerobotsle nom a été utilisé. - Bingbot doit son nom à
noarchiveune règle choquante dans 36 % des cas. Cela est probablement dû à la capacité de la balise à garder le contenu hors des réponses du chat Bing. - Googlebot-news était très probablement nommé d'après un
noindexrègle.


3. Moins de confusion canonique
Du contenu en double se produit. Nous avons acquis de nouvelles connaissances sur 40+ signaux que Google évalue entre les pages en double. Raison de plus pour poursuivre canoniquement !
- Cette année, l'utilisation canonique a augmenté de 65 % au total, mais plus remarquable encore, c'était la première année où la balise était appliquée de manière égale sur les ordinateurs de bureau et les mobiles.
- La majorité des sites implémentent des balises canoniques dans le HTML brut et le HTML rendu, avec moins de 1 % présentant une inadéquation entre les deux. Il y a toujours place à l'amélioration.
- Une page mobile sur 50 a vu sa balise canonique modifiée lors du rendu. Ces balises sont extrêmement utiles pour les référenceurs, à moins qu'elles ne confondent Google et soient ignorées.
4. Le rendu dynamique est en déclin
De retour lors de Google I/O 2018, des membres de l'équipe de recherche ont déclaré que Googlebot avait des difficultés à restituer JavaScript. L'année suivante, l'équipe a annoncé le Googlebot à feuilles persistantes, un robot d'exploration beaucoup plus performant fonctionnant sur le dernier moteur de rendu Chromium. Ils ont également partagé que le rendu dynamique n'était plus recommandé. (Deux fois la pile technologique, rien de amusant.)
Malgré le changement rapide, les sites se sont accrochés à leur rendu dynamique. En 2022, 13 % des pages avaient le vary L’en-tête de réponse HTTP permet de diffuser différents contenus en fonction de l’agent utilisateur demandeur.
- Cette année, nous avons finalement vu l’en-tête ignoble chuter de 92 % à 1 % des pages de bureau et 2 % des pages mobiles. Bon débarras.
5. Plus de sites sont moins mauvais
Vous vous souvenez de 2020 ? L'année des confinements liés au coronavirus, les appels Zoom « vous êtes en mode muet » et la réalisation des performances de votre site Web étaient horribles.
Lorsque Core Web Vitals (CWV) a été publié en 2020, seulement 20 % des sites ont réussi les évaluations de performances centrées sur l'utilisateur. Cependant, le pourcentage de sites passant le CWV augmente chaque année.
- En 2024, 48 % des sites mobiles et 54 % des sites desktop ont réussi l’évaluation ! Il s’agit d’une réalisation exceptionnelle si l’on considère les modifications apportées à l’interaction avec Next Paint remplaçant le délai de première entrée comme métrique d’interactivité. La plus grande peinture de contenu avait le taux de réussite le plus bas.


L'un de mes aspects préférés du Web Almanac est la possibilité de passer à un autre chapitre pour explorer les sujets plus en détail. Cette année Chapitre Performances décompose parfaitement les métriques par sous-parties et optimisations pour un aperçu satisfaisant de l'état des performances Web.
Contribuer à l'Almanach Web
Le Web Almanac est un projet bénévole. Lorsque le projet de l'année est annoncé, c'est le moment d'examiner les questions en suspens dans le Dépôt Github et levez la main pour indiquer où vous souhaitez contribuer. Chaque chapitre a plusieurs rôles à remplir et j'ai demandé à mon équipe de partager leurs expériences.
1. Auteurs
Experts en la matière et diriger l’orientation du contenu de chaque chapitre. Les auteurs sont responsables de la planification des grandes lignes du chapitre, de l’analyse des statistiques et des tendances et de la rédaction du rapport annuel.
Être auteur est un engagement important, en particulier sur des chapitres plus longs ou plus importants. (Si vous êtes nouveau et que vous souhaitez contribuer, recherchez la balise « bon premier numéro ».)
« Être l'auteur d'un chapitre aussi pertinent que le référencement dans WebAlmanac a été une expérience qui a changé ma vie. C'est parce que j'ai beaucoup appris (techniquement), mais encore plus grâce à la manière collaborative avec laquelle tout se fait. Au final, vous ressentez un immense sentiment de gratitude pour votre participation et l'impact que le travail de l'équipe aura sur la communauté web », a déclaré Mikael Araújo.
« Il est rare que vous ayez la chance de travailler avec un ensemble de données aussi volumineux, et c'est un honneur de pouvoir examiner ces données, les découper et contribuer à raconter une histoire sur la façon dont le Web est, comment ça change et dans une certaine mesure, c'est la santé », a déclaré Dave Smart.
2. Réviseurs
Experts en la matière et assistant les auteurs dans les révisions techniques pendant les phases de planification, d'analyse et de rédaction. Ils sont le ciment qui unit les auteurs et les analystes lorsque les yeux se croisent à cause de la fatigue de l’écran.
« Être réviseur est une excellente première étape dans le Web Almanac si vous n'avez jamais contribué auparavant et que vous êtes curieux de savoir combien de travail est impliqué dans la création de chaque chapitre (indice : c'est beaucoup !). Vous pouvez consacrer autant (ou aussi peu) de temps que vous le souhaitez. Et qui sait, vous pourriez devenir grand et vouloir écrire un chapitre l’année prochaine ! dit Barry Pollard.
3. Analystes
Des héros de chapitre méconnus chargés de rechercher les statistiques et les tendances utilisées tout au long de l'Almanach. Les analystes travaillent en étroite collaboration avec les auteurs et les réviseurs pendant la phase de planification pour donner des orientations sur les types de statistiques possibles à partir de l'ensemble de données, et pendant les phases d'analyse/écriture pour garantir que les statistiques sont utilisées correctement.
«C'était l'un des projets les plus stimulants et les plus amusants sur lesquels j'ai travaillé tout en apprenant à connaître d'autres acteurs de l'industrie. Sachez que c'est un travail d'amour et amusez-vous. N'hésitez pas à poser des questions si vous êtes bloqué », a déclaré Chris Nichols.
4. Éditeurs
Des rédacteurs techniques qui ont un penchant pour l’exactitude du contenu technique et non technique. Les éditeurs maîtrisent la langue anglaise et travaillent en étroite collaboration avec les auteurs pour aider à la rédaction du contenu et garantir que tout s'emboîte comme une unité cohérente.
« En plus de collaborer avec les meilleurs esprits travaillant sur le Web, en tant qu'éditeur, vous bénéficiez d'une vue d'en haut à 30 000 pieds des données et des études les plus intéressantes, ainsi que de leurs implications. Vous voyez les tendances positives et, parfois, négatives, et vous avez une idée de la santé globale du Web. C'est beaucoup de travail en tant qu'éditeur, et cela implique une tonne de vérification des faits et de détails, mais cela en vaut la peine à 100 % puisque vous travaillez aux côtés de leaders de l'industrie qui sont véritablement déterminés à rendre le Web meilleur pour tous, » dit Michael Lewittes.
5. Traducteurs
Des rédacteurs techniques qui aident à internationaliser l'Almanach et à le rendre accessible à la communauté Web à l'échelle mondiale. C'est sans aucun doute cool de voir votre travail traduit dans d'autres langues, mais contribuer à rendre cette recherche accessible à un public non anglophone nécessite un ensemble de compétences incroyables.
Si vous avez lu le chapitre de cette année et pensé à quelque chose que vous n'avez pas vu exploré ou à une nouvelle façon d'aborder les données, pensez contribuer à l'édition 2025 ! Vous apprendrez de nouvelles compétences et travaillerez avec des experts incroyables.
Les auteurs contributeurs sont invités à créer du contenu pour Search Engine Land et sont choisis pour leur expertise et leur contribution à la communauté de recherche. Nos contributeurs travaillent sous la supervision de la rédaction et la qualité et la pertinence des contributions pour nos lecteurs sont vérifiées. Les opinions qu'ils expriment sont les leurs.