Reddit continuera d'empêcher Microsoft et d'autres moteurs de recherche et modèles d'IA d'explorer son contenu à l'aide du fichier robots.txt, à moins qu'ils ne parviennent à un accord de licence de contenu. C'est ce qu'a déclaré le PDG de Reddit, Steve Huffman, dans une nouvelle interview.
Pourquoi Reddit bloque les moteurs de recherche. Notant que cela a été « une vraie galère de bloquer ces entreprises », voici ce que Huffman a également déclaré au site d'actualités technologiques Le bord:
- « Sans ces accords, nous n'avons pas notre mot à dire ni nos connaissances sur la manière dont nos données sont affichées et à quoi elles servent, ce qui nous met désormais dans une position où nous bloquons les personnes qui n'ont pas voulu accepter la manière dont nous souhaitons que nos données soient utilisées ou non. »
- « Microsoft, Anthropic et Perplexity ont agi comme si tout le contenu sur Internet était libre d'utilisation. C'est là leur véritable position. »
- « Je pense que l’échange de valeur traditionnel des moteurs de recherche a changé. La recherche, la synthèse et la formation fusionnent, et l’échange de valeur entre l’exploration et le trafic en retour devient de plus en plus flou. »
Logiciel gratuit. Oui, Mustafa Suleyman, PDG de Microsoft AI, a effectivement qualifié le contenu Web de « logiciel gratuit », affirmant que n’importe qui peut le copier et l’utiliser :
- « … En ce qui concerne le contenu qui est déjà sur le Web ouvert, le contrat social qui s’applique à ce contenu depuis les années 90 est qu’il s’agit d’un usage équitable. N’importe qui peut le copier, le recréer, le reproduire. C’est du freeware, si vous voulez. C’est ce qui est convenu. »
Google n'est pas bloqué. Pendant ce temps, Reddit n'a pas bloqué Google. C'est parce que Google verse à Reddit 60 millions de dollars par an. Cet accord de licence de contenu a été annoncé en février.
Déclaration de Microsoft. Suite à l'annonce du blocage des moteurs de recherche par Reddit, un porte-parole de Microsoft a déclaré à Search Engine Land :
- « Microsoft respecte la norme robots.txt et nous respectons les instructions fournies par les sites Web qui ne souhaitent pas que le contenu de leurs pages soit utilisé avec nos modèles d'IA génératifs. Bing a arrêté d'explorer Reddit après avoir mis en œuvre son fichier robots.txt mis à jour le 1er juillet, qui interdit toute exploration de son site.«
Pourquoi nous nous en soucions. Reddit est dans une position de force, grâce à un accord de licence avec Google, sans parler de la quantité incroyable de visibilité organique et de trafic qu'il obtient en raison de sa prédominance dans les résultats de recherche Google. Cependant, d'autres producteurs et éditeurs de contenu auront probablement besoin de toute la visibilité et du trafic qu'ils peuvent obtenir des moteurs de recherche et de réponse IA en intégrant des stratégies d'optimisation générative des moteurs (GEO).