Bien que Google veuille que tout le contenu en ligne soit disponible pour la formation à l’IA, le New York Times veut clairement se retirer.
Le Times a modifié ses conditions de service, dans le but d’empêcher les entreprises d’intelligence artificielle d’utiliser le contenu de l’organisation médiatique pour former leurs systèmes.
Pourquoi nous nous soucions. De nombreux grands modèles de langage sont formés à l’aide du contenu du site Web (voir : Rechercher les 15,7 millions de sites Web dans l’ensemble de données C4 de Google). Alors que Google explore des alternatives ou des moyens supplémentaires de contrôler l’exploration et l’indexation au-delà de robots.txt, de nombreuses marques (par exemple, Reddit) indiquent clairement qu’elles ne veulent pas que leur contenu soit utilisé pour améliorer les produits et augmenter les bénéfices de Google, Microsoft et OpenAI – du moins pas sans compensation. Vous voudrez peut-être envisager d’ajouter des messages similaires liés à l’IA à la page des conditions de votre site Web.
Qu’est ce qui a changé. Le New York Times a mis à jour sa page de conditions de service le 3 août. Elle comprend des ajouts spécifiques à l’IA qui s’appliquent à son contenu (qu’il définit comme « y compris, mais sans s’y limiter, le texte, les photographies, les images, les illustrations, les dessins, les clips audio, clips vidéo, « look and feel », métadonnées, données ou compilations »).
Dans la rubrique « Utilisation interdite des services » :
- (3) utiliser le Contenu pour le développement de tout programme logiciel, y compris, mais sans s’y limiter, la formation d’un système d’apprentissage automatique ou d’intelligence artificielle (IA).
Les entreprises d’IA indemniseront-elles les éditeurs ? OpenAI et l’Associated Press ont signé un accord le mois dernier. OpenAI a autorisé les archives d’articles de presse de l’AP datant de 1985 pour la formation.
Google et le New York Times Co. ont déjà une activité lucrative »accord commercial» en place, mais cet accord consiste à travailler ensemble sur des « outils de distribution de contenu et d’abonnements ».
Microsoft promet également aux éditeurs une sorte de partage des revenus. Cependant, la plupart des avantages iront apparemment aux membres de son programme Start.