Étude : 31 % des sites Web internationaux contiennent des erreurs hreflang

La mise en œuvre de hreflang peut être une tâche difficile pour de nombreux référenceurs. Les innombrables variations de syntaxe dans plusieurs langues peuvent être difficiles pour ceux qui ne comprennent pas plus d’une langue.

Il y a aussi la complexité supplémentaire de comprendre les nuances linguistiques spécifiques et le ciblage régional qui ne seraient généralement compris que par un locuteur natif ou quelqu’un qui a étudié la langue à fond.

Une implémentation incorrecte de hreflang peut entraîner de nombreuses complications (contenu dupliqué, indexation erronée et mauvaise visibilité SERP) préjudiciables aux performances SEO.

Il est impératif d’implémenter hreflang avec soin. Heureusement, hreflang est bien documenté et les problèmes connexes peuvent être identifiés grâce à divers outils de référencement.

Etude des erreurs hreflang

Pour déterminer à quel point les problèmes hreflang sont répandus et lesquels sont les plus courants, je me suis associé à NerdyDataqui m’a donné accès à leur base de données de sites Web contenant du code hreflang.

NerdyData a fourni une liste de 18 786 sites Web contenant au moins une instance de hreflang déclarant une alternative dans le code source. Ainsi, cette étude ne prend en compte que le hreflang implémenté dans le , et non via les sitemaps XML ou l’en-tête HTTP.

J’ai réalisé l’étude par :

  • Exécution de crawls dans Screaming Frog pour valider la présence de hreflang sur les pages d’accueil.
  • Suppression des redirections GEO-IP afin que la liste complète des URL se résolve en 200s.
  • Utiliser HreflangChecker.com et Visual SEO Studio pour traiter les URL par lots afin d’identifier les problèmes courants identifiés par les outils.

31,02 % des sites Web contiennent des directives hreflang contradictoires

Mes résultats montrent que 31,02 % des sites Web proposant plusieurs langues ont des directives hreflang contradictoires. Un hreflang conflictuel peut se produire lorsqu’une page Web contient plusieurs balises hreflang pour différentes langues et différents ciblages géographiques.

En termes simples, plusieurs URL ont été attribuées à une langue ou à une région particulière, envoyant des signaux déroutants aux moteurs de recherche. Par exemple:

Une telle confusion entraîne potentiellement des complications autour du contenu dupliqué et d’un classement et d’une indexation incorrects, ce qui rend difficile de bien se placer dans le SERP.

Même si les utilisateurs trouvent votre page Web parmi celles qui fonctionnent bien, ils souffriront d’une mauvaise expérience utilisateur s’ils reçoivent la mauvaise version de la page.

L’auto-référencement hreflang se produit lorsqu’une page inclut une balise hreflang pointant vers son URL.

Essentiellement, la page indique qu’elle est disponible dans plusieurs langues, y compris la langue d’origine de la page.

Bien qu’elle apparaisse initialement comme une tactique redondante, c’est une bonne pratique pour le référencement international. Malheureusement, 16,04 % des sites multilingues n’ont pas de balises hreflang auto-référencées.

Les moteurs de recherche peuvent mieux comprendre la relation entre différentes versions d’une même page lorsque des balises hreflang auto-référencées sont utilisées, y compris les pages disponibles dans différentes langues.

Étant donné que hreflang contribue comme l’un des quelque 20 signaux de canonisation, il s’agit d’un signal important à inclure.

47,95 % des sites Web n’utilisent pas x-default

L’attribut x-default signale aux moteurs de recherche qu’une page ne cible pas une langue ou un emplacement spécifique, la définissant comme une version linguistique par défaut de la page.

C’est particulièrement utile lorsqu’une page est disponible dans plusieurs langues mais ne fournit pas de contenu dans la langue préférée de l’utilisateur.

L’attribut x-default n’est pas nécessairement nécessaire dans hreflang. Jusqu’à 47,95 % des sites multilingues ne l’utilisent pas actuellement.

Cependant, il peut être avantageux de l’utiliser dans les cas où un utilisateur recherche une page dans une langue spécifique qui n’est pas disponible, car cela aide les moteurs de recherche à trouver la version la plus appropriée de la page à afficher.

Il est important de noter que l’attribut x-default ne doit être utilisé que si une autre langue n’est pas disponible. Lorsqu’il existe d’autres langues disponibles, chacune doit être spécifiée avec une balise hreflang.

De plus, x-default ne doit pas être utilisé sur des pages spécifiques à une langue ou à un emplacement particulier.

8,91 % des clusters hreflang contiennent au moins une instance de codes de langue non valides

Il est essentiel d’utiliser le format ISO-639-1 à deux lettres dans les attributs hreflang.

Malheureusement, il est courant que les codes de langue se trompent, ce qui entraîne de multiples problèmes pouvant affecter le ciblage international d’un site Web.

Mes recherches ont révélé que 8,91 % des sites ciblant plus d’une langue contiennent actuellement des codes de langue inconnus.

Il pourrait simplement s’agir d’une approche confuse pour combiner les codes de langue et de localisation, mais de nombreux problèmes communs pourraient en être la cause.

Certains codes de langue ne correspondent pas tout à fait à l’orthographe d’un pays.

Par exemple, vous pourriez vous attendre à ce que le code de langue du croate soit « cr », mais il s’agit en fait de « hr ». Comme le code n’est pas évident, il est facile de faire des erreurs lors de l’implémentation des codes de langue.

1,6 % des clusters hreflang contiennent au moins une instance de codes de région non valides

Contrairement à la statistique précédente, relativement peu de clusters hreflang contiennent des codes de région non valides.

Bien que l’utilisation des codes de région ISO-3166-1 à deux lettres ne soit pas obligatoire, cela aide à cibler la même langue entre deux pays ou plus avec des règles d’orthographe différentes. Cela fournit plus de contexte aux moteurs de recherche, en examinant l’emplacement et la langue de l’utilisateur.

Pour revenir à mon exemple précédent, vous devez utiliser le code « en-US » pour cibler les utilisateurs aux États-Unis. S’il est défini sur « en-GB », vous ne ciblerez que les utilisateurs basés au Royaume-Uni, en manquant entièrement votre public cible.

Les erreurs courantes ici incluent :

Ici, les entrées ciblent toutes l’anglais mais ont également l’intention de cibler le Royaume-Uni et l’Europe. Le Royaume-Uni et l’UE sont des codes invalides car il s’agit de GB (Grande-Bretagne), et vous ne pouvez pas cibler l’Europe en tant que continent.

Le ciblage espagnol peut également être problématique en Amérique latine, avec un cluster essayant de cibler es-la, es-lx et es-419 dans le but de cibler la région dans son ensemble alors que vous devriez cibler des pays individuels – ou laisser l’espagnol en général langue.

22,46 % des clusters hreflang contiennent des combinaisons langue-région irrégulières/inhabituelles

Il existe une gamme d’avantages à cibler les pays sans langue maternelle avec hreflang, l’un des principaux étant d’améliorer l’expérience utilisateur pour les locuteurs non natifs.

Par exemple, le néerlandais est la langue maternelle des Pays-Bas, mais un estimé 95% de la population parle aussi anglais. Il y a aussi autour 97 8000 ressortissants britanniques qui vivent aux Pays-Bas.

Avec un nombre aussi élevé d’anglophones, il est logique de cibler les utilisateurs aux Pays-Bas avec les pages de votre site Web en anglais.

Cependant, toutes les combinaisons n’ont pas de sens. Par exemple:

Bien que les trois exemples ci-dessus passent un test hreflang et soient techniquement précis, le nombre de locuteurs chinois en Zambie ne donnera probablement que peu ou pas de résultats avec cette version alternative.

La création de versions alternatives qui n’ont pas de sens crée une demande d’exploration supplémentaire et inutile et des versions que Google peut probablement considérer comme étant dupliquées, remplaçant les canoniques.

Les opinions exprimées dans cet article sont celles de l’auteur invité et pas nécessairement Search Engine Land. Les auteurs du personnel sont répertoriés ici.

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine