L’IA peut-elle effectuer efficacement une analyse technique du référencement ?

L’IA générative a fait des progrès significatifs dans divers domaines, dont le référencement.

Cet article explore une question cruciale : l’IA peut-elle effectuer efficacement une analyse technique du référencement à l’aide de données d’exploration brutes ?

Nous examinerons les capacités de ChatGPT pour interpréter les données d'exploration de Screaming Frog et générer des recommandations SEO.

Tirer parti de l’IA générative pour le référencement technique

Les articles de My Search Engine Land examinent souvent des applications techniques approfondies où le référencement et l'IA peuvent collaborer, ce qui entraîne une efficacité accrue. Par exemple, j'ai utilisé l'IA pour générer du texte alternatif à partir de fichiers image ou des descriptions de produits à partir de données PIM.

Cependant, de nombreux spécialistes du marketing sont moins techniques et peuvent avoir du mal à combiner l'API, Python et les feuilles de calcul d'OpenAI. Certains spécialistes du marketing préfèrent transmettre à l’IA les données technologiques et recevoir des informations humaines claires.

En tant que tel, j'ai pensé produire un article examinant l'efficacité de l'IA dans l'interprétation des données techniques de référencement. Même si vous ne communiquez pas avec des modèles d'IA via un accès API programmatique, de nombreux assistants d'IA (ChatGPT, Google Gemini) proposent des interfaces de discussion conviviales. Nous explorerons ChatGPT dans cet article.

Dernièrement, la capacité de ces interfaces de discussion basées sur l’IA s’est développée. Par exemple, ChatGPT d'OpenAI a récemment évolué de GPT-4 à GPT-4o. Le nouveau modèle GPT-4o s'accompagne de nombreux changements de fonctionnalités :

GPT-4o est beaucoup plus rapide que GPT-4. Il a un niveau de précision similaire à celui du GPT-4, tout en répondant à un rythme plus similaire à celui du GPT-3.5-Turbo.
GPT-4o dépend moins des plugins ou des GPT personnalisés pour accéder au contenu Web.
GPT-4o recherchera du contenu Web beaucoup plus fréquemment pour générer ses résultats, rendant le matériel produit « plus frais ».
Bien que cela soit vrai, le Web est mal organisé et regorge de fausses informations. Beaucoup pensent que le modèle de données raffiné de GPT-4, avec moins de requêtes Web, a en fait produit des résultats supérieurs à GPT-4o.
Il ne fait aucun doute que GPT-4o est au moins comparable à GPT-4. C'est beaucoup plus rapide et beaucoup plus interactif. Il peut fonctionner avec davantage de types de données jointes, produire davantage de types de médias et est compatible avec le Web.

GPT-4o étant désormais plus capable de rechercher du contenu Web, il pourrait être plus utile aux spécialistes du marketing, même à ceux qui manquent de compétences techniques. Cependant, des inquiétudes subsistent quant à sa capacité à accéder au Web, car les expériences passées avec des outils tels que Bard et Gemini de Google ont montré des résultats inférieurs.

Pour tester GPT-4o, nous lui fournirons des données techniques d'exploration SEO spécifiques au lieu de tâches d'analyse génériques. Cela nous aidera à voir à quel point ChatGPT s'est amélioré et s'il peut être utile pour l'analyse technique du référencement.

Analyser les données d'exploration de Screaming Frog pour obtenir des informations via ChatGPT

L'exportation « tout interne » de Screaming Frog constitue la base essentielle de la plupart des informations techniques en matière de référencement.

Cette exportation unique peut être pivotée de plusieurs manières pour commenter les problèmes de métadonnées, les conflits de balises canoniques, les problèmes de hreflang, etc.

L’IA va-t-elle s’attaquer à de tels problèmes ? L’IA va-t-elle halluciner ou mal diagnostiquer des problèmes là où aucun n’est présent ? Découvrons-le.

Nous utiliserons le site Web de la société Butcher's Dog Food comme banc d'essai pour ces tests. Il s'agit d'un fournisseur britannique d'aliments pour chiens et leur site est à peu près de la bonne taille pour les activités que nous proposons.

Tout d’abord, nous allons explorer Butchersdogfood.co.uk :

Données d'analyse de Butchersdogfood.co.uk

Plus de 3 000 adresses internes ont été découvertes. Maintenant, nous pouvons exporter la liste des adresses internes vers un fichier CSV :

Exportation des données d'exploration de Butchersdogfood.co.uk

Maintenant, nous pouvons transmettre le fichier CSV à GPT-4o et demander des recommandations. La plupart des gens n’écrivent pas d’invites aussi complexes que moi. Ils rédigent des invites plus courtes, puis les affinent. En tant que tel, je vais essayer de suivre ce comportement.

Importer les données d'exploration sur GPT-4o

La réponse contenait de nombreuses recommandations, mais la plupart étaient malheureusement génériques. Par exemple, des recommandations comme celle-ci :

« Plusieurs URL pointent vers des fichiers image (par exemple, PNG, JPEG). Assurez-vous que toutes les images sont optimisées pour une utilisation sur le Web afin de réduire les temps de chargement. Cela inclut la compression des images et l’utilisation des formats appropriés.

Cette recommandation est décevante car ChatGPT avait en fait accès aux données de temps de réponse et de taille de fichier selon les adresses d'image. La réponse aurait donc pu être plus précise.

Voici un autre exemple de conseils très génériques :

« Assurez-vous que les balises canoniques sont correctement implémentées pour éviter les problèmes de contenu en double. Chaque page doit avoir une balise canonique auto-référencée, sauf s'il s'agit d'un doublon délibéré.

Puisque ChatGPT a accès à la fiche technique, il devrait être capable de déterminer (approximativement) quelles URL sont les adresses principales et lesquelles ne le sont pas (paramètres dans la chaîne d'URL, etc.).

Ainsi, ChatGPT devrait être capable d'isoler les problèmes de balises canoniques plutôt que de donner des conseils généraux (et inutiles).

Poussons un peu plus fort :

Invites liées aux données d'exploration GPT-4o

Les conseils sont encore relativement vagues, même lorsque nous itérons et créons une invite plus détaillée. De nombreuses pages manquent toujours de balises canoniques, telles que les adresses d'images, qui ne prennent pas en charge HTML.

La réponse aurait dû être plus spécifique et détaillée, expliquant pourquoi certaines adresses avaient besoin de balises canoniques mais n'en avaient pas.

Dans le cadre de la réponse ci-dessus, des commentaires plus détaillés ont été fournis :

Recommandations relatives aux données d'exploration GPT-4o

Wow, ces recommandations sont un gâchis total.

D’une certaine manière, ils sont impressionnants même s’ils se trompent totalement. Je pourrais m'attendre à ce qu'une personne junior en référencement inexpérimentée qui a été jetée dans les profondeurs techniques du référencement fasse des recommandations similaires.

Le conseil serait erroné, mais il y a bel et bien des signes d’intelligence. Il faut se rappeler qu’il faut quand même un certain degré d’intelligence pour prendre la tangente et produire une analyse pertinente mais inexacte. L’œuvre est inutilisable, mais il existe des signes d’une véritable tentative.

En tant qu’humains, nous avons tendance à soumettre l’IA à des normes injustes. Si l’IA produit quelque chose qui est faux ou incorrect, nous disons qu’elle n’a pas réussi à parvenir à la compréhension humaine. Cependant, beaucoup d’entre nous (les vrais humains) n’y parviennent pas non plus, et cela arrive souvent.

Pour moi, la question est la suivante : l’IA a-t-elle échoué d’une manière qui démontre une tentative humaine pour accomplir la tâche ?

Je pense que les signes sont positifs pour l’avenir en termes d’applications pour des interactions IA accessibles (interface de chat). Mais pour l’instant, il serait désastreux de donner suite aux recommandations formulées.

Identifier une URL de redirection comme potentiellement importante (même s'il s'agit d'une adresse de redirection), puis supposer que le travail peut ou non devoir être effectué sur l'URL de destination finale est l'une des réflexions les plus floues que j'ai personnellement rencontrées.

Le seul point intéressant que ChatGPT a pu trouver est qu'un certain nombre d'adresses sur le site ont entraîné des redirections 301, et qu'il peut y avoir une architecture défectueuse :

La réponse ci-dessus a été donnée après notre tout premier message, avant que nous commencions à pousser l’IA à penser en termes plus spécifiques. C’était en fait la première recommandation donnée par ChatGPT, et à certains égards, elle est intéressante :

Adresses d'images redirigées à partir des données d'analyse

Il existe environ 100 adresses de redirection. Beaucoup d’entre elles sont des adresses d’images redirigées. Certaines semblent être autrefois de vraies pages ou peuvent être des redirections de type barre oblique. D'autres tournent autour de la pagination.

Il s’agissait d’une piste intéressante, mais la plupart des autres recommandations étaient génériques ou trompeuses. La tentative de ChatGPT de donner des conseils spécifiques était semi-intelligente, mais les suggestions auraient fait perdre du temps ou causé plus de problèmes.

Je attribuerais à ce travail une note D ou E, même si de nombreuses machines n'obtiendraient pas un score aussi élevé en matière de référencement technique à partir de fiches techniques plates. Je suis impressionné, mais je ne recommande pas encore d'utiliser l'IA pour ce niveau d'analyse technique du référencement.

Comparaison des informations sur l'IA avec l'audit technique d'Ahrefs

Ahrefs dispose d'un robot d'exploration de référencement sophistiqué basé sur le cloud. Bien que les données de Screaming Frog puissent être plus précises, Ahrefs fournit toujours des données solides et de meilleures informations. J'utilise les deux outils pour les audits de sites.

Si nous examinons les résultats d'une analyse technique SEO complète d'Ahrefs, nous pourrons alors être en mesure de déterminer à quel point GPT-4o est parvenu à trouver la vérité. Regardons l'aperçu d'Ahrefs :

Comparaison des informations sur l'IA avec l'audit technique d'Ahrefs

Wow, c'est une excellente note ! Bravo à l'équipe de Butcher's Dog Food.

Malgré la note élevée, certains problèmes persistent. C’est tout à fait normal et il n’y a généralement pas lieu de s’inquiéter.

Ce qui est intéressant ici, c'est que les problèmes restants concernent la redirection d'adresses et d'images, qui peuvent avoir des fichiers de taille trop importante. C’est intéressant car ce sont quelques-uns des principaux problèmes identifiés par notre assistant IA sur la base des données de Screaming Frog.

Qu'est-ce que cela signifie? L'IA avait-elle raison depuis le début, et peut-être avons-nous jugé ChatGPT trop sévèrement pour des recommandations « à consonance générique » qui étaient réellement exactes ?

Oui et non. Les humains ressentent souvent le besoin de défendre leur rôle contre les avancées technologiques, ce qui peut créer un préjugé à leur encontre. Ce biais est courant, même parmi ceux qui travaillent dans le domaine numérique.

Cependant, cette technologie ne constitue pas une menace immédiate pour les spécialistes techniques du référencement. Les conseils donnés n'étaient pas utilisables, mais les erreurs de l'IA étaient intelligentes, semblables à celles d'un humain inexpérimenté et prometteur.

L’objectif général des informations, comme les redirections et la compression d’images, était précis même si les conseils spécifiques ne l’étaient pas.

Le verdict final

GPT-4o est une grande amélioration par rapport à GPT-3.5-Turbo. Cependant, je ne suis pas convaincu qu'il y ait une amélioration significative (ou aucune) par rapport à GPT-4, qui semble moins halluciner.

Actuellement, je considère GPT-4o comme un bon compromis entre GPT-3.5-Turbo et GPT-4. Pour moi, les résultats de GPT-4 semblent supérieurs. Mais GPT-4o est aussi rapide que GPT-3.5-Turbo et est plus interactif.

Je suppose que le temps nous dira quel modèle les utilisateurs préféreront. Je suis prêt à attendre plus longtemps pour que GPT-4 produise une sortie supérieure, même si cette sortie est limitée via un modèle de données (organisé).

Les conseils de ChatGPT étaient médiocres. Il manquait des points clés et proposait des suggestions génériques et inutiles. Sa tentative de conseils spécifiques a également échoué.

Cependant, il y avait des signes d’intelligence dans ses erreurs, semblables à celles d’un humain inexpérimenté qui commettrait des erreurs. Cela montre un potentiel d’amélioration.

Pour l’instant, ne comptez pas sur cette technologie pour l’analyse technique du référencement, notamment via de simples interfaces de chat. Mais gardez un œil sur cela : une IA capable de fournir des informations précieuses est peut-être plus proche que nous ne le pensons.

Les auteurs contributeurs sont invités à créer du contenu pour Search Engine Land et sont choisis pour leur expertise et leur contribution à la communauté de recherche. Nos contributeurs travaillent sous la supervision de la rédaction et la qualité et la pertinence des contributions pour nos lecteurs sont vérifiées. Les opinions qu'ils expriment sont les leurs.