Qu'est-ce que 'Anna's Archive', le site qui succède à Z-Library et que Google vient pratiquement de supprimer de ses résultats

Il y a à peine trois ans, un nouveau nom commençait à circuler sur les forums de lecteurs et parmi les chercheurs à la recherche de livres hors du circuit commercial : Archives d'Anna. Pour beaucoup, il s’agissait simplement du site « héritier de Z-Library », la populaire bibliothèque numérique démantelée en 2022 suite à une opération du ministère américain de la Justice.

Cependant, ce qui a commencé comme un refuge alternatif pour accéder à des textes académiques et à des livres difficiles à trouver est devenu le plus grand métamoteur de recherche de contenus écrits de la planète… et la principale cible des attaques des défenseurs du droit d'auteur.

Hier on apprenait que Google venait de supprimer pas moins de 749 millions de liens de ses résultats. Archives d'Annace qui équivaut à 5 % de tous les liens supprimés du Web depuis 2011 pour des raisons de droits d'auteur.

Il s'agit de la suppression massive la plus importante jamais enregistrée sur un seul site Web, dépassant de loin les 4,2 millions d'URL supprimées au cours des années 2000. La Baie des Piratesle portail historique de partage de fichiers.

Un successeur né du vide laissé par Z-Library

Anna's Archive est née à l'automne 2022, quelques jours seulement après la chute de Bibliothèque Z. Sa fondatrice, connue uniquement sous le pseudonyme « Anna » ou « Anna Archivist », a présenté le projet comme un index gratuit et ouvert qui connectait les utilisateurs à des millions de livres, d'articles scientifiques et de matériel pédagogique, facilitant ainsi l'accès universel à la connaissance, en particulier pour ceux qui sont confrontés à des barrières économiques, juridiques ou géographiques.

Contrairement au bibliothèques fantômes Traditionnellement, le site n'héberge pas directement les fichiers, mais collecte plutôt des métadonnées et des liens provenant d'autres sources telles que Bibliothèque Genèse (LibGen), Sci-Hub, Archives Internet soit Projet Gutenberg.

En seulement trois ans, la plateforme a indexé plus de 52 millions de livres et 98 millions d’articles académiques, ce qui en fait le plus grand catalogue d’œuvres numériques jamais créé. Tout cela est soutenu par un modèle open source, décentralisé et réplicable, qui permet à quiconque de mettre en place une réplique du site ou d'utiliser son code pour des projets similaires.

Comment fonctionne ce gigantesque métamoteur de recherche

En termes techniques, Anna's Archive agit comme un moteur de recherche de métadonnées. Les utilisateurs peuvent saisir le titre, l'auteur ou l'ISBN d'une œuvre, et le système renvoie des liens vers différentes sources où le texte peut être trouvé, qu'il soit dans le domaine public ou protégé par le droit d'auteur.

Le site utilise des technologies de distribution redondantes et, dans certains cas, une intégration avec IPFS (InterPlanetary File System) pour garantir que son contenu reste accessible même en cas de crash.

Ainsi, même si certains pays – comme l'Allemagne ou les États-Unis – ont bloqué l'accès à leurs domaines principaux, le portail reste actif via des miroirs et des adresses alternatives (annas-archive.org, .li, .IL).

Pourquoi Google l'a supprimé (mais pas complètement)

À mesure que le succès d'Anna's Archive grandissait, la pression des grands éditeurs augmentait également. Des sociétés telles que Penguin Random House et John Wiley & Sons, ainsi que plus d'un millier d'auteurs et titulaires de droits, ont commencé à déposer des plaintes massives en vertu du Digital Millennium Copyright Act (DMCA).

Le résultat a été accablant : Google a désindexé 749 millions de liens appartenant aux trois domaines principaux d'Anna's Archive, sur un total de 784 millions signalés.

La société de moteurs de recherche elle-même reconnaît que le volume de requêtes liées à ce portail est écrasant, avec plus de 10 millions de nouvelles URL signalées chaque semaine.

L'objectif de cette campagne est clair : rendre difficile aux utilisateurs de trouver du matériel « piraté » via le moteur de recherche. Cependant, contrairement à ce qui s'était passé à l'époque avec Z-Library, le site web est toujours accessible (il suffit de taper son URL dans le navigateur). En fait, lorsque vous recherchez « Anna's Archive » sur Google, le domaine principal apparaît toujours dans les premiers résultats.

Débats éthiques

Le débat sur les archives d'Anna va bien au-delà de la violation du droit d'auteur. Ses partisans affirment qu’elle démocratise l’accès à l’éducation et à la recherche, en particulier dans les pays où le coût des livres universitaires est prohibitif. De plus, il préserve des œuvres hors circulation ou risquant de disparaître.

Ses détracteurs soulignent au contraire que le site facilite l'accès à des copies non autorisées, affectant économiquement les auteurs et les éditeurs. Sur le plan juridique, il opère dans une zone grise : en n'hébergeant pas directement les fichiers (bien que les liens pointent vers du matériel protégé), il évite en partie les accusations de « copie illégale » dans de nombreuses juridictions.

Mais avec l’essor de l’IA, une nouvelle source de conflit est également apparue : l’utilisation de ces bibliothèques par les sociétés d’intelligence artificielle. Anna's Archive a admis avoir donné accès à une trentaine de développeurs de modèles de langage (LLM) pour former leurs systèmes avec ses vastes archives, sonnant ainsi l'alarme dans le secteur de l'édition.