La «fuite» de Yandex révèle 1 922 facteurs de classement de recherche

Un ancien employé aurait divulgué un référentiel de code source Yandex, dont une partie contenait plus de 1 900 facteurs que les moteurs de recherche utilisent pour classer les résultats de recherche.

Pourquoi nous nous soucions. Cette fuite a révélé 1 922 facteurs de classement utilisés par Yandex dans son algorithme de recherche, au moins en juillet 2022. Peut-être Martin MacDonald l’a mis le mieux sur Twitter aujourd’hui : « Le piratage de Yandex est probablement la chose la plus intéressante qui soit arrivée dans le domaine du référencement depuis des années. »

Yandex n’est pas Google. Si vous envisagez de lire la liste complète des facteurs de classement Yandex, n’oubliez pas que Yandex n’est pas Google. Si vous voyez un facteur de classement répertorié par Yandex, cela ne signifie pas que Google donne à ce signal le même poids. En fait, Google peut ne pas utiliser tous les 1 922 facteurs répertoriés.

Cela dit, bon nombre de ces facteurs de classement peuvent être assez similaires. L’examen de ce document peut donc fournir des informations utiles pour mieux vous aider à comprendre comment les moteurs de recherche, tels que Google, fonctionnent d’un point de vue technologique.

La plus grande image. Le code est apparu sous forme de torrent sur un forum de piratage populaire, tel que rapporté par Ordinateur qui bipe:

… le bailleur a publié un lien magnétique qui, selon lui, sont des « sources Yandex git » composées de 44,7 Go de fichiers volés à l’entreprise en juillet 2022. Ces référentiels de code contiendraient tout le code source de l’entreprise en plus des règles anti-spam.

Yandex appelle cela une fuite. Parce que le code est apparu sur un forum de piratage populaire, on a d’abord pensé que Yandex avait été piraté. Yandex a nié cela et a fourni la déclaration suivante :

« Yandex n’a pas été piraté. Notre service de sécurité a trouvé des fragments de code d’un référentiel interne dans le domaine public, mais le contenu diffère de la version actuelle du référentiel utilisé dans les services Yandex.

Un dépôt est un outil pour stocker et travailler avec du code. Le code est utilisé de cette manière en interne par la plupart des entreprises.

Les référentiels sont nécessaires pour travailler avec du code et ne sont pas destinés au stockage des données personnelles des utilisateurs. Nous menons une enquête interne sur les raisons de la publication de fragments de code source au public, mais nous ne voyons aucune menace pour les données des utilisateurs ou les performances de la plate-forme.

Creusez plus profondément. Vous pouvez trouver plus de couverture de la fuite sur Techmème.

Liste des facteurs de classement Yandex. MacDonald a partagé la liste complète des 1 922 facteurs ici sur Web Marketing School. Je recommande fortement de le télécharger, car je m’attends à ce que Yandex essaie de nettoyer ces informations sur Internet. Il y a aussi version traduite sur Dropbox.

Alex Buraks a également un Fil Twitter analyser les différents facteurs de classement. Beaucoup sont ce que vous vous attendez à voir – PageRank, pertinence du texte, âge et fraîcheur du contenu, de nombreux facteurs de comportement de l’utilisateur final, fiabilité de l’hôte et de nombreux facteurs liés aux liens (par exemple, âge, pertinence, etc.)

Certains des facteurs de classement que les référenceurs trouvent surprenants : le nombre de visiteurs uniques, le pourcentage de trafic organique et le classement moyen du domaine dans les requêtes.


Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine